The dataset created from ACL, NAACL, and EMNLP, the major international conferences in Natural Language Processing. The dataset is splitted into train (80%), valid (10%), and test (10%) sets. Each file is a csv file and each column contains information on ‘file name and position of the sentence in the file’, ‘sentence to be judged’, ‘citation using literature tag required (binary)’ and ‘citation using URL required (binary)’. ``[REF_CITE]'' and ``[URL_CITE]'' denotes the position that needs citations using reference tags and URLs, respectively.自然言語処理分野の国際会議であるACL, NAACL, EMNLPの本会議論文から作成したデータセット.作成したデータを8:1:1でランダムに学習,検証,テストデータに分割している.各ファイルはcsvファイルであり各列は「ファイル名とそのファイル内での文の位置」「判定対象の文」「文献タグを用いた引用が必要か (2値)」「URLを用いた引用が必要か (2値)」の情報を含む.文献タグを用いた引用が行われていた位置を``[REF_CITE]'',URLを用いた引用が行われていた位置を``[URL_CITE]''で表している.datase
Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.