14 research outputs found

    Próbák és példák a Magyar értelmező kéziszótár - 2. kiadás, 2003 - rejtett információinak feltárására

    Get PDF
    A tudásfeltárás, illetve ennek részeként az adatbányászat az információtechnológia divatos területei, melyek jellemzően az üzleti adatbázisok hasznosítására irányulnak, személete, eszköztára azonban - legalábbis részben - alkalmazható szótári adatbázisokra is. A VégSz.-ból nyomdatechnikai okok miatt kimaradt betűjegyben mért hosszúság, jelentésszám, etimológia, valamint szócikkfejben adott stílusminősités pótlásánál az ÉKsz.2 XML-változata segítségével teljesebb és korszerűbb adattábla hozható létre, ugyanis ez naprakész etimológiai információt nyújt a magyar szókészlet legtágabb köréről, valamint megtalálható benne a Magyar nemzeti szövegtár-beli abszolút gyakorisági érték is. Az így létrehozott relációs adatbázisból egyszerű lekérdezésekkel előállithatók a különféle etimológiájú, lexikai minősítésű, szófajú vagy jelentésszámú szóhalmazok szótári, valam int-jelentős újdonságként- szöveggyakorisági mutatói. Az adatbányászat eszköztárával feltárhatók a fenti paraméterek közt fennálló rejtett mintázatok asszociációs szabályok kinyerése útj án

    Tájékoztató bibliográfia "A helyesírás kézikönyvei" témában

    Get PDF

    Gondolatok a magyar helyesírásról egy új kézikönyv kapcsán II.

    Get PDF

    Az Osiris Helyesírás és az új helyesírási szabályzat

    Get PDF

    Online helyesírási szótár és megvalósítási nehézségei

    Get PDF
    A magyar társadalom helyesírás és nyelvhelyesség iránti igénye mármár szakmai közhelynek számít. A helyesírás számítógépes modellezésének eddigi gyakorlata azt mutatja, hogy egy online helyesírási szótár, nyelvi tanácsadó szolgáltatás triviálisan nem oldható meg csupán gépi erforrással, például egy nyelvtan mögött álló szótárral. A helyes alak felismeréséhez mindenképpen szükség van morfológiai elemzre, illetve az elemzés kimeneteként keletkez homonimák egyértelmsítésekor bizonyos mértékben a kérdez interaktivitására is. A morfológiai elemzést segíti a fként szemantikai szempontok alapján szerkesztett szótár, amelyben az egyes lexikai tételek több szempontból annotálva vannak (ehhez a szótárat különféle szemantikai kategóriák alapján egyértelmsítettük, valamint az interakciót elsegítend, egyszer mondatokkal rávezetjük a kérdezt az adódó lehetségek közti választásra). Sok esetben a morfológiai elemz és a szótár önmagában nem elegend a helyes alak kiválasztásához, így némely esetben a lokális szintaktikai környezet elemzését is fel kell vállalnunk. Az online helyesírási tanácsadó rendszer ersen formális felépítés. Hatékony mködése érdekében teljesen új – formális rendszert követ – alapokon kell leírnunk a helyesírás számos részrendszerét
    corecore