5 research outputs found

    Cross-Lingual Low-Resource Set-to-Description Retrieval for Global E-Commerce

    Full text link
    With the prosperous of cross-border e-commerce, there is an urgent demand for designing intelligent approaches for assisting e-commerce sellers to offer local products for consumers from all over the world. In this paper, we explore a new task of cross-lingual information retrieval, i.e., cross-lingual set-to-description retrieval in cross-border e-commerce, which involves matching product attribute sets in the source language with persuasive product descriptions in the target language. We manually collect a new and high-quality paired dataset, where each pair contains an unordered product attribute set in the source language and an informative product description in the target language. As the dataset construction process is both time-consuming and costly, the new dataset only comprises of 13.5k pairs, which is a low-resource setting and can be viewed as a challenging testbed for model development and evaluation in cross-border e-commerce. To tackle this cross-lingual set-to-description retrieval task, we propose a novel cross-lingual matching network (CLMN) with the enhancement of context-dependent cross-lingual mapping upon the pre-trained monolingual BERT representations. Experimental results indicate that our proposed CLMN yields impressive results on the challenging task and the context-dependent cross-lingual mapping on BERT yields noticeable improvement over the pre-trained multi-lingual BERT model.Comment: AAAI 202

    超高次元データ解析のための量子インスパイア主成分分析の開発

    Get PDF
    主成分分析は多変量データから重要な低次元成分を抽出する統計手法である.しかし,主成分分析のアルゴリズムは特異値分解に基づくため,次元数(変量の数)が数百万を超えるデータには,計算時間の問題からしばしば適用が困難となる.我々は近年発案された「量子インスパイアアルゴリズム」を用い,計算時間を次元数の対数オーダーに抑えつつ,主成分分析を近似するアルゴリズムを計算機実装した.本報告において,複数の人工データ・実データを用いてその計算時間と性能を評価した結果を紹介する.第44回量子情報技術研究会(QIT44

    超高次元データ解析のための量子インスパイア主成分分析・正準相関分析の開発

    Get PDF
    主成分分析・正準相関分析はともに多変量データから重要な低次元成分を抽出する統計手法である.しかし,これらのアルゴリズムは特異値分解に基づくため,次元数(変量の数)が数百万を超えるデータには,計算時間の問題からしばしば適用が困難となる.我々は近年発案された「量子インスパイアアルゴリズム」を用い,計算時間を次元数の対数オーダーに抑えつつ,主成分分析・正準相関分析を近似するアルゴリズムを計算機実装した.本報告において,複数の人工データ・実データを用いてその計算時間と性能を評価した結果を紹介する.また,量子インスパイアアルゴリズムを用いた高速計算は単なる計算時間の削減にとどまらず,新しいデータ解析の方法を提供する.例として,与えられた多変量データ内の変量同士で積をとり,それを新しい変量とみなすことで次元数を増加させ,得られた高次元データに我々の開発した量子インスパイア正準相関分析を適用した.この操作はデータの次元数を増加させるため,通常の正準相関分析では計算時間の肥大化により取り扱いが困難となる.MNISTデータセットを用いこれを行ったところ,提案法は線形のみの正準相関分析より多くの相関を抽出した.また抽出できた相関の量はカーネル正準相関分析,深層正準相関分析などの代表的な非線形手法と同程度であった.以上の結果は,量子インスパイアアルゴリズムが実データの解析において有用であり,従来では計算時間の問題から不可能であった超高次元データを扱う分野を開拓できる可能性を示している.第2回量子ソフトウェア研究発表

    Learning Translational and Knowledge-based Similarities from Relevance Rankings for Cross-Language Retrieval

    No full text
    corecore