426 research outputs found

    Text mining with the WEBSOM

    Get PDF
    The emerging field of text mining applies methods from data mining and exploratory data analysis to analyzing text collections and to conveying information to the user in an intuitive manner. Visual, map-like displays provide a powerful and fast medium for portraying information about large collections of text. Relationships between text items and collections, such as similarity, clusters, gaps and outliers can be communicated naturally using spatial relationships, shading, and colors. In the WEBSOM method the self-organizing map (SOM) algorithm is used to automatically organize very large and high-dimensional collections of text documents onto two-dimensional map displays. The map forms a document landscape where similar documents appear close to each other at points of the regular map grid. The landscape can be labeled with automatically identified descriptive words that convey properties of each area and also act as landmarks during exploration. With the help of an HTML-based interactive tool the ordered landscape can be used in browsing the document collection and in performing searches on the map. An organized map offers an overview of an unknown document collection helping the user in familiarizing herself with the domain. Map displays that are already familiar can be used as visual frames of reference for conveying properties of unknown text items. Static, thematically arranged document landscapes provide meaningful backgrounds for dynamic visualizations of for example time-related properties of the data. Search results can be visualized in the context of related documents. Experiments on document collections of various sizes, text types, and languages show that the WEBSOM method is scalable and generally applicable. Preliminary results in a text retrieval experiment indicate that even when the additional value provided by the visualization is disregarded the document maps perform at least comparably with more conventional retrieval methods.reviewe

    Kim Il Sung as Machiavelli's New Prince : early development of North Korean regime

    Get PDF
    Tutkielma käsittelee Kim Il Sungin nousua Pohjois-Korean johtajaksi ja maan hallinnon varhaista kehitystä 1940 - 1950-luvuilla Neuvostoliiton ohjauksessa, ja päättyy ajallisesti Korean sodan lopputulemiin 1950-luvun puolivälissä. Tämän lisäksi se tarkastelee valtion ja hallinnon erikoislaatuisia piirteitä: Pohjois-Korean autokraattista systeemiä, eristäytyneisyyttä, yhteiskunnan hierarkkisia luokkia, sekä Kim dynastian persoonallisuuskulttia ja tutkii niiden alkuperää ja funktiota yhteiskunnassa. Tutkielma käsittelee osittain myös Korean varhaisempaa kehitystä Joseon dynastian loppupuolella ja siirtomaa-aikaa Japanin alaisuudessa, koska ne loivat otolliset olosuhteet Kim Il Sungin nousulle ja sosialistiselle vallankumoukselle Pohjois-Koreassa. Tutkielman päätarkastelukohde on Pohjois-Korean ensimmäinen diktaattori, Kim Il Sung, ja se, miten Neuvostoliitto käytti häntä itselleen hyödyllisen puskurivaltion pystyttämiseen Korean niemimaalle torjumaan Yhdysvaltojen ja Japanin muodostamaa uhkaa alueella. Tutkielmassa on käytetty teoriana Machiavellin ajatuksia politiikasta, mitkä on koostettu ”Ruhtinaasta” ja ”Valtiollisista mietelmistä”. Ruhtinas tarkastelee ja esittelee keinoja yksinvaltiuden saavuttamiseksi ja Valtiolliset mietelmät, kestävän valtion pystyttämisestä, johon valikoitiin kohdat, jotka käsittelevät, tai pitävät myös paikkansa autokratioissa. Tutkielman Pohjois-Koreaa käsittelevä aineisto koostuu englanninkielisestä tutkimuskirjallisuudesta, sekä länsimaisilta että aasialaisilta tutkijoilta, salauksesta poistetuista virallisista selonteoista ja muista tutkielmista, julkilausumista ja nettilähteistä. Machiavellia käsittelevä aineisto koostuu myös tutkimuskirjallisuudesta, Ruhtinaan ja Valtiollisten mietelmien useammasta englanninkielisestä käännöksestä, sekä nettilähteistä. Tutkielmassa tullaan siihen lopputulokseen, että Kim Il Sung omasi monia Ruhtinaassa ylistettyjä yksinvaltiaan ominaisuuksia, ja Neuvostoliiton ja tämän yhteistyö Pohjois-Korean itsenäisen ja kestävän valtion pystyttämiseksi noudattaa monia Machiavellin ohjenuoria sekä Ruhtinaassa että Valtiollisissa mietelmissä. Monet Pohjois-Korean hallinnon erityispiirteistä ovat myös loogisen kehityskulun tulosta, joista osa pohjaa vanhemmille korealaisille tendensseille (eristäytyminen, luokkayhteiskunta, monarkia). Osalla on juuret Korean historiassa, mutta ne ovat muuttuneet tavoilla, jotka tukevat nykyisen järjestelmän ja hallinnon vallassa pysymistä (monarkiasta absoluuttiseen monarkiaan, sosiaalisen hierarkian uudelleenjärjestys) ja joista Kim dynastian persoonallisuuskulttia voi pitää aidosti Pohjois-Korealaisena erityispiirteenä. Vaikka kultti on saanut vaikutteita monista lähteistä, se on systeeminä uniikki, jonka funktio on laillistaa ja kannatella Kim dynastian vallassa pysymistä

    Demonstraatiolaitokseen konseptisuunnitelma kalsiumkarbonaatin valmistamiseksi teräskuonasta ja hiilidioksidista

    Get PDF
    Steel is widely used construction material. It is part of every modern production line in a form or another. Steelmaking is one of the biggest causes of industrial carbon dioxide emissions. In 2015, 1621 million tons of raw steel was manufactured and steel industry caused almost 7 % of mankind’s CO2 emissions. Slag to PCC project aims to develop economically competitive method to reduce steel industries CO2 emissions. This is achieved by binding CO2 in to stable mineral form. In slag2PCC process CO2 is bound to calcium that is extracted from steelmaking slag. This process produces precipitated calcium carbonate. Slag2PCC project has been successful in bot laboratory and pilot scale and now next step is to upscaling of the process to demonstration scale. Demonstration plant is based on existing pilot plant. This thesis introduces the pilot plant and required improvements that this plant needs. This thesis goes through the technology research and concept design for demonstration plant. Thesis compiles guidelines for design parameters and material choices, design sketches and technology ratings based on literature, laboratory tests and interviews with consultants to ease the following design and manufacturing phases. This work introduces concept design work for mobile demonstration plant for calcium carbonate production from steelmaking slag and carbon dioxide that is assembled in shipping containers.Teräs on laajalti käytetty rakennusmateriaali, se on osana muodossa tai toisessa jokaisessa modernissa tuotantolinjassa. Vuonna 2015 raakaterästä valmistettiin 1621 miljoonaa tonnia ja terästeollisuus aiheutti lähes 7 % ihmisen hiilidioksidipäästöistä. Teräksen valmistus on yksi suurimmista teollisuuden hiilidioksidipäästöjen aiheuttajista. Slag2PCC projektin päämääränä on kehittää taloudellisesti kilpailukykyinen prosessi vähentämään terästeollisuuden hiilidioksidipäästöjä. Tämä tehdään sitomalla hiilidioksidi stabiiliin mineraalimuotoon. Slag2PCC prosessissa teräksen valmistuksessa syntyvä hiilidioksidi sidotaan teräskuonasta erotettuun kalsiumiin ja näin tuotettuun kalsiumkarbonaattiin. Slag2PCC projekti on edennyt menestyksekkäästi laboratorio- ja pilottivaiheen läpi ja seuraava askel on suuremman skaalan demonstraatiolaitoksen toteutus. Demonstraatiolaitoksen pohjana käytetään olemassa olevaa pilottilaitosta. Tässä työssä esitellään nykyinen pilottilaitos ja tarvittavat parannus toimenpiteet mitä laitokselle on tehtävä. Tässä työssä esitellään teknologiaselvitys ja konseptisuunnitelma demolaitoksen toteuttamista varten. Kirjallisuudesta, laboratoriotesteistä ja asiantuntiahaastatteluiden pohjalta on koostettu mitoitusohjeistuksia, konseptipiirroksia sekä materiaali- ja teknologiavalintoja helpottamaan tulevia demolaitoksen suunnittelu- ja toteutusvaiheita. Työssä esitellään mobiilin, laivakontteihin asennetun tuotantolaitoksen konseptisuunnitelma kalsiumkarbonaatin valmistamiseksi teräskuonasta ja hiilidioksidista. Laitoksen osafunktioille on tehty teknologia- ja laitevalinnat. Työssä on selvitetty ja esitetty laitoksen rakennusmateriaalien vaatimukset ja annettu sopivat materiaaliehdotukset. Työssä on lisäksi esitelty alustavia mitoituslaskelmia demonstraatiolaitoksen laitteiston jatkosuunnittelua ja tilausta varten

    Role of nutrients in regulation of the phytoplankton community in the Archipelago Sea, northern Baltic Sea

    Get PDF
    Siirretty Doriast

    Learning to lemmatize in the word representation space

    Get PDF
    Lemmatization is often used with morphologically rich languages to address issues caused by morphological complexity, performed by grammar-based lemmatizers. We propose an alternative for this, in form of a tool that performs lemmatization in the space of word embeddings. Word embeddings as distributed representations natively encode some information about the relationship between base and inflected forms, and we show that it is possible to learn a transformation that approximately maps the embeddings of inflected forms to the embeddings of the corresponding lemmas. This facilitates an alternative processing pipeline that replaces traditional lemmatization with the lemmatizing transformation in downstream processing for any application. We demonstrate the method in the Finnish language, outperforming traditional lemmatizers in example task of document similarity comparison, but the approach is language independent and can be trained for new languages with mild requirements.Peer reviewe

    Word Sense Disambiguation in Document Space

    Get PDF
    We introduce a method for word sense disambiguation that uses an existing topical document map crated with an unsupervised method (WEBSOM) on a very large document collection. Results on the SENSEVAL-2 corpus indicate that the method is statistically significantly better than the baselins and on par with supervised methods. The method uses the document map as a representation of the semantic space of word contexts. The assumption is that similar meanings of a word have similar contexts, which are located in the same are on the self-organized document map. The results confirm this assumption. The benefi of the proposed method is that a single general purpose representation of the semantic space can be used for all words and their word senses.Peer reviewe
    corecore