    Analógikus általánosítási folyamatok a gyereknyelvben = Analogical generalisation processes in language acquisition

    A lexikai tudás, vagyis a felnőtt nyelvtan által megengedett predikátum-argumentum struktúrák elsajátítását vizsgáltuk. A kutatás módszere a gyereknyelvi adatok elemzéséből nyert statisztikák összevetése különböző számítógépes tanulási mechanizmusok eredményeivel. A CHILDES adatbázisból elérhető és a projekt keretében készített magyar gyereknyelvi korpuszokat a kutatás céljaira kialakított annotációs rendszerben elemeztük az előforduló predikátum-argumentum szerkezetek helyessége szerint. Az elemzés eredményeként sekély U-görbét kaptunk, ami arra utal, hogy a kezdeti konzervatív tanulási mechanizmust felváltja egy analogikus általánosító mechanizmus, amely átmenetileg hibákhoz vezet. A gyerek nyelvelsajátítási mechanizmusainak szimulálására automatikus vonzatkeret-kinyerő alkalmazást hoztunk létre. Elsőként Brent által kidolgozott statisztikai gépi tanulási módszert adaptáltuk a magyar nyelvre. A tanulás a vonzatok morfológiai jegyei alapján történik annotált korpuszból. Brent módszere szigorú konzervatív tanulási algoritmus, ahol a vonzatkeretek elsajátítása kizárólag megfelelő pozitív input alapján történik, így nem kaptunk a gyereknyelvi adatokhoz hasonlítható U-görbét. Második lépésben a tanulási algoritmust úgy módosítottuk, hogy ne zárjuk ki az általánosítás illetve túláltalánosítás lehetőségét. Ez a modell közelebb áll a gyereknyelvben megfigyelt mintákhoz, de lényegesen több inputra van szükség. A cél-nyelvtan leszűkítésével eredményjavulást értünk el. | We looked into children's acquisition of predicate-argument structures. Our method involved the comparison of the results of the statistical analysis of child language corpora with the output of various machine-learning algorithms. A Hungarian child language corpus was constructed of new data and the data available from the CHILDES databank. The corpus was annotated using a grammar developed for the project, and the argument frames produced by the children were analysed for accuracy. The results showed a shallow U-shaped curve suggesting that an initial conservative learning strategy was followed by an analogical generalization mechanism, which resulted in a dip in performance. The mechanisms of child learning were modelled by a series of computational models of argument frame acquisition. Model 1 used Brent's statistical learning algorithm adapted to the Hungarian language. The learning mechanism relied on morphological cues extracted from a pre-annotated corpus. The model used a strictly conservative learning algorithm, where argument frames were added to the lexicon only if sufficient positive evidence was found. Model 1 failed to produce a U-shaped learning curve. Model 2 used a less conservative learning algorithm allowing for generalization and, thus, overgeneralisation. The output was closer to the patterns observed in child language, but the system required substantially more input. The model's performance was improved by reducing the target grammar

    A path from broader to narrower grammars: the acquisition of argument structure in English and Hungarian

    In recent years a growing number of theoretical and empirical studies of first language acquisition have cast doubt on the hypothesis that acquiring language is a deterministic process in which the role of experience is restricted to triggering innate principles of grammatical content. The aim of this thesis is to explore areas of language where input -based learning demonstrably plays a role and to find learning mechanisms that account for the construction of observed overgeneral grammars and the process of their restriction.The thesis is a comparative study of the acquisition of argument structure in English and in Hungarian. The detailed analysis of spontaneous speech samples of two -- year -old children reveals that the omission of subjects, objects and prepositions at the so- called telegraphic stage of English child language cannot be explained either by limitations in processing capacity or by postulating an incomplete Universal Grammar. It is suggested that children's implicit arguments and oblique noun phrases lacking case or prepositional marking need not be analysed as syntactically ill- formed, since they conform to permissible abstract structural configurations. The errors may instead be attributed to overgeneral or indeterminate rules of pragmatics, which are fuzzy and variable in the mature grammar.It is shown that the nature of the children's intake of the primary linguistic data is a good predictor of the nature and extent of overgeneralisation or indeterminacy and of the speed with which the rules are fine -tuned to match the target

    Gyermeknyelvi korpuszok és erőforrások

    Kognitív templátumok és a valóság illesztése környezeti hangokra utaló nyelvi megértés során

    A dolgozat a környezeti hangok hatását vizsgálja az absztrakt és a konkrét nyelvmegértése során. Egyes mondatok, mint például A riporter beharangozta a hírt, olyan kifejezéseket tartalmaznak, amelyek egy specifikus környezeti hangra utalnak valós hangesemény hiányában. Két kísérletben a résztvevők hangot kódoló mondatokat olvastak számítógép képernyőjén, miközben négy különböző típusú hangingert hallottak: például A sajtó a vészharangot kongatta absztrakt mondat olvasása közben egy kongruens hangot (’harang’), egy inkongruens hangot (’dob’), egy kategórián kívüli hangot (’nevetés’) hallottak, vagy hang nélkül olvasták amondatokat. A két kísérlet eredményei azt mutatják, hogy a hangeseményeket tartalmazó mondatok feldolgozása specifikus hangreprezentációk aktivációja nélkül történik

    Metaforikus kifejezések szerkezeti jellemzői

    A tanulmány a tág értelemben vett metaforikus kifejezések elfordulási jellemzit vizsgálja magyar írott és kvázi beszélt nyelvi korpuszban. Az elemzés célja olyan lexikális kifejezések vagy morfoszintaktikai konstrukciók kézi azonosítása, melyek a korpuszban elforduló szavak alapjelentésétl eltér jelentésére utalnak. A fő kérdések, melyekre választ keresünk a következk: (a) Javítható-e számotteven a gépi metaforaazonosítás teljesítménye, ha a metaforikus jelentést jelz kifejezést nem csak egymondatos ablakon belül, hanem annál távolabb is keressük? (b) Található-e olyan nyelvtani szerkezet vagy konstrukció, amely jellemz a metaforikus kifejezésekre, és amely figyelembe vétele megkönnyítheti a metaforák gépi azonosítását? és (c) Megfigyelhetk-e tipikus eltérések a fenti két tekintetben különböz szövegfajták között