104 research outputs found

    Rozpoznávání pojmenovaných entit pomocí neuronových sítí

    Get PDF
    Title: Neural Network Based Named Entity Recognition Author: Jana Straková Institute: Institute of Formal and Applied Linguistics Supervisor of the doctoral thesis: prof. RNDr. Jan Hajič, Dr., Institute of Formal and Applied Linguistics Abstract: Czech named entity recognition (the task of automatic identification and classification of proper names in text, such as names of people, locations and organizations) has become a well-established field since the publication of the Czech Named Entity Corpus (CNEC). This doctoral thesis presents the author's research of named entity recognition, mainly in the Czech language. It presents work and research carried out during CNEC publication and its evaluation. It fur- ther envelops the author's research results, which improved Czech state-of-the-art results in named entity recognition in recent years, with special focus on artificial neural network based solutions. Starting with a simple feed-forward neural net- work with softmax output layer, with a standard set of classification features for the task, the thesis presents methodology and results, which were later used in open-source software solution for named entity recognition, NameTag. The thesis finalizes with a recurrent neural network based recognizer with word embeddings and character-level word embeddings,...Název práce: Rozpoznávání pojmenovaných entit pomocí neuronových sítí Autor: Jana Straková Ústav: Ústav formální a aplikované lingvistiky Vedoucí doktorské práce: prof. RNDr. Jan Hajič, Dr., Ústav formální a apliko- vané lingvistiky Abstrakt: Obor rozpoznávání pojmenovaných entit v češtině (tj. úkol auto- maticky identifikovat a klasifikovat významné části textu, jako například jména lidí, míst a organizací) se významně rozvinul po vydání českého korpusu poj- menovaných entit, Czech Named Entity Corpus (CNEC). Tato doktorská práce předkládá autorské výsledky v oblasti rozpoznávání pojmenovaných entit, ze- jména v češtině. Publikuje práci a výzkum provedený v průběhu přípravy CNEC a později během jeho evaluace. Dále shrnuje autorské výsledky, které před- stavují nejlepší známé výsledky v rozpoznávání českých pojmenovaných entit. Na základě jednoduché neuronové sítě s výstupní funkcí softmax a standardní sadou klasifikačních rysů je popsána metodologie a výsledky, ze kterých později vznikl otevřený software pro rozpoznávání pojmenovaných entit, NameTag. Dok- torská práce je zakončena popisem rozpoznávače založeném na rekurentních neu- ronových sítích s embeddingy slov a embeddingy založenými na znacích, které představují výsledky současného výzkumu v oblasti neuronových sítí. Rozpozná- vač nevyžaduje tvorbu...Ústav formální a aplikované lingvistikyInstitute of Formal and Applied LinguisticsFaculty of Mathematics and PhysicsMatematicko-fyzikální fakult

    Variation in Egg Yolk Colour in Different Systems of Rearing Laying Hens

    Full text link
    A total of 72 laying hens (ISA BROWN hybrid combination) were divided into two groups. Thirty-six layers in the first group were reared on litter while the second group of layers was reared using the cage rearing system. Samples of eggs were collected from both groups for a period of seven months. Yolk colour was determined using a portable spectrophotometer using a newly developed method, which complied with the CIELAB system. Yolk colour indicator L* decreased for the rearing system on litter, i.e. egg yolk colour became darker in the course of the whole experiment (α = 0.05). Indicator a* showed a distinct increase in the case of the rearing system on litter, with the differences being significant (α = 0.05) over the last three months of the experiment. Differences for the whole experiment were highly conclusive (α = 0.01), as seen from the increasing red colour intensity. Similarly, indicator b* also increased, i.e. egg yolk was of more distinct yellow colour. In the case of the cage-rearing system, egg yolk colour indicators correlated well with egg weight indicators, as compared to the rearing system on litter. The rearing system on litter resulted in significantly increased intensity of orange colour compared to the cage rearing system

    Extending an Event-type Ontology: Adding Verbs and Classes Using Fine-tuned LLMs Suggestions

    Full text link
    In this project, we have investigated the use of advanced machine learning methods, specifically fine-tuned large language models, for pre-annotating data for a lexical extension task, namely adding descriptive words (verbs) to an existing (but incomplete, as of yet) ontology of event types. Several research questions have been focused on, from the investigation of a possible heuristics to provide at least hints to annotators which verbs to include and which are outside the current version of the ontology, to the possible use of the automatic scores to help the annotators to be more efficient in finding a threshold for identifying verbs that cannot be assigned to any existing class and therefore they are to be used as seeds for a new class. We have also carefully examined the correlation of the automatic scores with the human annotation. While the correlation turned out to be strong, its influence on the annotation proper is modest due to its near linearity, even though the mere fact of such pre-annotation leads to relatively short annotation times.Comment: Accepted to LAW-XVII @ ACL 202

    Evaluation of yield and alpha acid content in selected hop varieties

    Get PDF
    The stability of the agricultural and technological properties of hop varieties over the course of time and under changing climate is essential for both growers and brewers. This study is a typical case of monitoring 12 hop varieties selected from a collection of hop genetic resources, that were evaluated in the years 2009 to 2021. The assessed parameters were the hop yield and content of alpha acids with a focus on the variability/stability of this characteristics. Only the Pilgrim and Target hop varieties from England showed exceptional hop yield above 3 kg/plant. On the other hand, the lowest hop yield was obtained from the Saaz and Bramling Cross hop varieties, i.e. below 1.5 kg/plant. The lowest variability of hop yield - below 30% - was found in the Savinjski Golding, Bramling Cross and Saaz hop varieties. In contrast, the Bobek, Aurora, Pioneer and Phoenix hop varieties demonstrated the highest variability of hop yield, i.e. above 50%. Further, also Target and Phoenix have the highest content of alpha acids, namely 9.68% w/w and 9.56% w/w, respectively. The lowest content of alpha acids was determined in Saaz, which was the only hop variety with an alpha acid content below 3.0% w/w. The Premiant, Target and Aurora hop varieties exhibited a variability of alpha acid content below 20%. On the contrary, the Bobek and Pilgrim hop varieties had the highest variability of alpha acid content, namely above 30%.O

    Představy o budoucnosti u žáků odlišných středoškolských programů

    Get PDF
    České střední vzdělávání se vyznačuje vysokou diferenciací. Studijní programy gymnaziální vzdělávání, střední odborné vzdělávání s maturitou a střední odborné vzdělávání bez maturity se liší nejen cíli vzdělávání a vzdělávacím obsahem, ale i složením žáků a školním klimatem. Mezinárodní výzkumy ukazují, že navštěvovaný program má, stejně jako vrstevnický kolektiv a rodinné zázemí, velký vliv na představy mladých lidí o jejich budoucím životě. Tyto aspekty se v jednotlivých programech silně odlišují. Cílem této studie je zjistit, jak se liší představy o budoucím životě u českých žáků navštěvujících třetí ročníky středoškolského vzdělávání v různých středoškolských programech. K analýze byla využita data získaná od 1 151 gymnazistů, 2 216 žáků navštěvujících odborné studium s maturitou a 1 504 žáků navštěvujících odborné studium nematuritní v rámci reprezentativního šetření CLoSE v roce 2018. V rámci výzkumu byly zjišťovány kromě vědomostí a dovedností žáků jejich vzdělanostní aspirace, očekávané příjmy a představy o rozmanitých aspektech jejich budoucího života. Výzkum ukázal odlišné představy žáků různých programů z hlediska jejich vzdělanostních aspirací, očekávaného povolání a očekávaných příjmů. Studenti všech typů studia měli nicméně optimistické představy o svém budoucím životě, které se mezi jednotlivými programy lišily jen málo
    corecore