- Publication venue
- 国立国語研究所
- Publication date
- 01/01/2020
- Field of study
Ibaraki UniversityIbaraki UniversityIbaraki UniversityIbaraki UniversityIbaraki University会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター文書分類のタスクを教師あり学習で解く場合、大量のラベル付きデータ(教師データ)が必要であり、このデータの構築コストが高いという問題がある。ただし、英語などのメジャーな言語に対しては、ラベル付けされたデータが既に存在していることも多い。この場合、英語側では分類器を学習できるため、その学習できた知識を、タスクの対象となっている言語側へ転移できれば、ターゲット言語での教師データを利用せずに、分類器を構築することができる。本論文ではそのような転移を行うためにBERTを用いる。具体的には、英語BERTを用いて英語の訓練文書をベクトル化し、それをもとに分類器を学習する。次に、ターゲット領域の文書となる日本語の文書を、日本語BERTを用いてベクトル化する。あらかじめ学習しておいた2言語間のBERTの変換器を用いて日本語の文書ベクトルを英語のベクトル空間に埋め込み、先の分類器によって識別する。これによって、ターゲット言語である日本語の訓練文書を利用せずに、日本語の文書の感情分析が可能となる
- Publication venue
- Publication date
- 12/05/2010
- Field of study
- Publication venue
- 臺北市:國立臺灣大學園藝學系暨研究所
- Publication date
- 26/07/2006
- Field of study
- Publication venue
- 臺北市:國立臺灣大學園藝學系暨研究所
- Publication date
- 26/07/2006
- Field of study
- Publication venue
- Publication date
- 12/05/2010
- Field of study
- Publication venue
- Publication date
- 12/05/2010
- Field of study
- Publication venue
- 復文書局
- Publication date
- 16/02/2011
- Field of study
- Publication venue
- Publication date
- 12/05/2010
- Field of study
- Publication venue
- 復文書局
- Publication date
- 16/02/2011
- Field of study
- Publication venue
- 臺中市:中華民國植物病理學會
- Publication date
- 13/10/2011
- Field of study