3 research outputs found

    RuSentNE-2023: Evaluating Entity-Oriented Sentiment Analysis on Russian News Texts

    Full text link
    The paper describes the RuSentNE-2023 evaluation devoted to targeted sentiment analysis in Russian news texts. The task is to predict sentiment towards a named entity in a single sentence. The dataset for RuSentNE-2023 evaluation is based on the Russian news corpus RuSentNE having rich sentiment-related annotation. The corpus is annotated with named entities and sentiments towards these entities, along with related effects and emotional states. The evaluation was organized using the CodaLab competition framework. The main evaluation measure was macro-averaged measure of positive and negative classes. The best results achieved were of 66% Macro F-measure (Positive+Negative classes). We also tested ChatGPT on the test set from our evaluation and found that the zero-shot answers provided by ChatGPT reached 60% of the F-measure, which corresponds to 4th place in the evaluation. ChatGPT also provided detailed explanations of its conclusion. This can be considered as quite high for zero-shot application.Comment: 12 pages, 5 tables, 3 figure

    A preliminary study in zero anaphora coreference resolution for Polish

    Get PDF
    A preliminary study in zero anaphora coreference resolution for PolishZero anaphora is an element of the coreference resolution task that has not yet been directly addressed in Polish and, in most studies, it has been left as the most challenging aspect for further investigation. This article presents an initial study of this problem. The preparation of a machine learning approach, alongside engineering features based on linguistic study of the KPWr corpus, is discussed. This study utilizes existing tools for Polish coreference resolution as sources of partial coreferential clusters containing pronoun, noun and named entity mentions. They are also used as baseline zero coreference resolution systems for comparison with our system. The evaluation process is focused not only on clustering correctness, without taking into account types of mentions, using standard CoNLL-2012 measures, but also on the informativeness of the resulting relations. According to the annotation approach used for coreference to the KPWr corpus, only named entities are treated as mentions that are informative enough to constitute a link to real world objects. Consequently, we provide an evaluation of informativeness based on found links between zero anaphoras and named entities. For the same reason, we restrict coreference resolution in this study to mention clusters built around named entities.聽Wst臋pne studium rozwi膮zywania problemu koreferencji anafory zerowej w j臋zyku polskimKoreferencja zerowa, w j臋zyku polskim, jest jednym z zagadnie艅 rozpoznawania koreferencji. Dotychczas nie by艂a ona bezpo艣rednim przedmiotem bada艅, gdy偶 ze wzgl臋du na jej z艂o偶ono艣膰 by艂a pomijana i odsuwana na dalsze etapy bada艅. Artyku艂 prezentuje wst臋pne studium problemu, jakim jest rozpoznawanie koreferencji zerowej. Przedstawiamy podej艣cie wykorzystuj膮ce techniki uczenia maszynowego oraz proces tworzenia cech w oparciu o analiz臋 lingwistyczn膮 korpusu KPWr. W przedstawionej pracy wykorzystujemy istniej膮ce narz臋dzia do rozpoznawania koreferencji dla pozosta艂ych rodzaj贸w wzmianek (tj. nazwy w艂asne, frazy rzeczownikowe oraz zaimki) jako 藕r贸d艂o cz臋艣ciowych zbior贸w wzmianek odnosz膮cych si臋 do tego samego obiektu, a tak偶e jako punkt odniesienia dla uzyskanych przez nas wynik贸w. Ocena skupia si臋 nie tylko na poprawno艣ci uzyskanych zbior贸w wzmianek, bez wzgl臋du na ich typ, co odzwierciedlaj膮 wyniki podane dla standardowych metryk CoNLL-2012, ale tak偶e na warto艣ci informacji, kt贸ra zostaje uzyskana w wyniku rozpoznania koreferencji. W nawi膮zaniu do za艂o偶e艅 anotacji korpusu KPWr, jedynie nazwy w艂asne traktowane s膮 jako wzmianki, kt贸re zawieraj膮 w sobie wystarczaj膮co szczeg贸艂ow膮 informacj臋, aby mo偶na by艂o powi膮za膰 je z obiektami rzeczywistymi. W konsekwencji dostarczamy tak偶e ocen臋 opart膮 na warto艣ci informacji dla podmiot贸w domy艣lnych po艂膮czonych relacj膮 koreferencji z nazwami w艂asnymi. Z t膮 sam膮 motywacj膮 rozpatrujemy jedynie zbiory wzmianek koreferencyjnych zbudowane wok贸艂 nazw w艂asnych
    corecore