57 research outputs found

    Termien painotus lyhyissä dokumenteissa dokumenttien luokitteluun, avainsanojen louhimiseen ja kyselyjen laajentamiseen

    Get PDF
    This thesis focuses on term weighting in short documents. I propose weighting approaches for assessing the importance of terms for three tasks: (1) document categorization, which aims to classify documents such as tweets into categories, (2) keyword extraction, which aims to identify and extract the most important words of a document, and (3) keyword association modeling, which aims to identify links between keywords and use them for query expansion. As the focus of text mining is shifting toward datasets that hold user-generated content, for example, social media, the type of data used in the text mining research is changing. The main characteristic of this data is its shortness. For example, a user status update usually contains less than 20 words. When using short documents, the biggest challenge in term weighting comes from the fact that most words of a document occur only once within the document. This is called hapax legomena and we call it Term Frequency = 1, or TF=1 challenge. As many traditional feature weighting approaches, such as Term Frequency - Inverse Document Frequency, are based on the occurrence frequency of each word within a document, these approaches do not perform well with short documents. The first contribution of this thesis is a term weighting approach for document categorization. This approach is directed to combat the TF=1 challenge by excluding the traditional term frequency from the weighting method. It is replaced by using word distribution among categories and within a single category as the main components. The second contribution of this thesis is a keyword extraction approach that uses three levels of word evaluation: corpus level, cluster level, and document level. I propose novel weighting approaches for all of these levels. This approach is designed to be used with short documents. Finally, the third contribution of this thesis is an approach for keyword association weighting that is used for query expansion. This approach uses keyword co-occurrences as the main component and creates an association network that aims to identify strong links between the keywords. The main finding of this study is that the existing term weighting approaches have trouble performing well with short documents. The novel algorithms proposed in this thesis produce promising results both for the keyword extraction and for the text categorization. In addition, when using keyword weighting with query expansion, we show that we are able to produce better search results especially when the original search terms would not produce any results.Tämä väitös keskittyy termien painotuksen haasteisiin lyhyissä dokumenteissa. Ehdotan painotusmenetelmiä kolmeen eri osa-alueeseen: (1) dokumenttien kategorisointi, jossa pyritään luokittelemaan muun muassa Twitter viestejä, (2) avainsanojen louhinta, jossa tavoitteena on tunnistaa ja louhia dokumentin tärkeimmät sanat, ja (3) avainsanojen assosiaatiomallinnus, jonka tavoitteena on tunnistaa sanojen välisiä linkkejä ja hyödyntää niitä haun laajennoksessa. Koska tekstinlouhinta keskittyy nykyään käyttäjien luomiin dokumentteihin, kuten esimerkiksi sosiaaliseen mediaan, tekstinlouhinnassa käytetty tieto on muuttumassa. Suurin muutos on tekstin pituus, koska sosiaalisen median viestit ovat usein alle 20 sanaa pitkiä. Tästä seuraa painotuksen suurin haaste: sanat esiintyvät usein pelkästään kerran dokumentin sisällä. Me kutsumme tätä haastetta Term Frequency = 1 (Termi Frekvenssi = 1) tai TF=1 haasteeksi. Tämän haasteen vuoksi useat perinteiset menetelmät, kuten esimerkiksi TF-IDF, ei tuota hyviä tuloksia lyhyissä dokumenteissa. Tämän työn ensimmäinen kontribuutio on termien painotus menetelmä dokumenttien luokitteluun. Menetelmä perustuu sanan esiintymistiheyden korvaamiseen muilla komponenteille, kuten esimerkiksi sanan luokkakohtaisella jakaumalla. Työn toinen kontribuutio on menetelmä avainsanojen louhintaan joka perustuu sanojen hyvyyden arviointiin kolmella eri tasolla: korpus, klusteri ja dokumentti tasoilla. Kolmas kontribuutio keskittyy avainsanojen assosiaatiomallintamiseen. Tässä tavoitteena on löytää vahvasti toisiinsa liittyviä avainsanoja ja hyödyntää näitä linkkejä haun laajennoksessa. Tämän väitöskirjan tärkein löydös on se, että olemassa olevat ja hyväksi havaitut menetelmät jotka on luotu pitkille dokumenteille, eivät toimi lyhyiden dokumenttien kanssa optimaalisesti. Tässä väitöksessä esitetyt uudet menetelmät tuottavat lupaavia menetelmiä kaikilla kokeilluilla osa-alueilla

    Instructions for external emergency plan exercises

    Get PDF
    Enligt 48 § i räddningslagen (379/2011) och inrikesministeriets förordning om externa räddningsplaner ska räddningsverket med minst tre års mellanrum öva i objekt med risk för storolycka. Sådana objekt är t.ex. produktionsanläggningar för hantering och upplagring av farliga kemikalier, bangårdar, hamnområden, kärnkraftverk och deponier för utvinningsavfall. I Finland finns det ca 200 objekt som är skyldiga att göra upp en extern räddningsplan och öva regelbundet. Genom anvisningen förenhetligas och förtydligas planeringen, genomförandet, utvärderingen och rapporteringen av övningar som gäller externa räddningsplaner i objekt enligt 48 § i räddningslagen. I anvisningen kallas övningen på finska UPS-harjoitus (övning enligt extern räddningsplan). Räddningsverken ansvarar för uppgörandet av externa räddningsplaner och ordnandet av övningar enligt extern räddningsplan, detta i samarbete med verksamhetsidkaren. Regionförvaltningsverken har till uppgift att övervaka att skyldigheterna fullgörs. Finland har enligt Seveso III-direktivet och direktivet om hantering av avfall från utvinningsindustrin en skyldighet att rapportera om planerna och övningsverksamheten till Europeiska kommissionen. För att genomföra övningarna enligt externa räddningsplaner finns det flera skeden i processen. Övningsprocessen består av planering, beredning och genomförande av övningen samt av utvecklingsåtgärder. Syftet med anvisningen är att förenhetliga övningsverksamheten enligt räddningsverkens externa räddningsplaner och att förtydliga kraven på övningar

    Mobile video

    Get PDF
    Watching a video, or moving image, on a mobile phone became technically possible in Finland during the latter part of 2002. Our study looks for ideas about the kinds of situations in which such mobile video possibility can be of use. We gave a mobile phone with video capability to users who then watched mobile videos in different situations. They wrote down their evaluations about the meaningfulness of these situations in a diary. It appears that there are at least two kinds of situations in which the use of a mobile video phone seems natural. Firstly, users can entertain themselves in boring situations such as during a bus trip or queuing in a store. Secondly, a mobile video offers the opportunity to share experiences, for instance, watching a karaoke video or children's animated cartoons

    The leisure business and lifestyle

    Get PDF
    Tämä raportti on tiivistelmä Kuluttajatutkimuskeskuksen toteuttamasta vapaa-ajan klusterin tutkimuksesta, joka on osa Teknologian kehittämiskeskuksen TEKESin Suomessa koordinoimaa OECD:n Knowledge Intensive Service Activities (KISA) -tutkimushanketta. Suomessa hankkeen vapaaehtoiseksi liiketoiminta-alueeksi valittiin vapaa-aika. Tutkimuksessa kuvataan Suomen vapaa-ajan klusteria kuluttajamarkkinoiden näkökulmasta. Lähtökohta oli korostaa kuluttajanäkökulmaa elämystaloutta tarkasteltaessa. Vapaa-ajan klusteri on määritelty tässä aktiivisten kuluttajien vapaa-aikaan liittyvän yritystoiminnan alaksi. Aktiiviseen vapaa-aikaan ja harrastuksiin liittyvä liiketoiminta tarjoaa yrityksille mahdollisuuden siirtyä pois massatuotemarkkinoilta entistä vaativimmille ja erikoistuneemmille markkinoille. Aktiivinen vapaa-aika on kasvava liiketoiminta-alue, jossa Suomella on monia kansainvälisesti tunnettuja yrityksiä. Yrittäjille ja elinkeinoelämälle vapaa-ajan monimuotoisuus ja ihmisten autonomia oli kuitenkin vaikea haaste. Alan innovaatioiden erityisluonteen ja niiden teknologian kehitykselle asettamien vaatimusten tulisi olla myös jatkotutkimuksen aihe. Raportissa tuodaan esille se, miten kuluttajien vapaa-aikaan liittyvässä yritystoiminnassa on tärkeää ymmärtää kuluttajien elämäntapaa ja arjen käytäntöjä. Raportissa tällaista tiedon muotoa kutsutaan elämäntapatiedoksi (lifestyle knowledge). Elämäntapatiedon tuottamisessa erilaiset järjestöt ja alihankkijoina toimivat yritykset ovat keskeisessä roolissa. Muotoilutoimistot, mainostoimistot ja kuluttaja- ja markkinatutkimus tuottavat yritysten oman tuotekehityksen ja käyttäjätutkimuksen sekä median rinnalla tietoa kuluttajien elämäntavoista. Tutkimusta varten tehdyissä haastatteluissa kävi ilmi, että tällaisten kuluttajatietoa välittävien toimijoiden käyttöä voitaisiin Suomessa kehittää, ja yksittäisten tuotekehitysprojektien kannalta niillä voi olla myönteisiä vaikutuksia koko tuotekehitysprosessin ajan, ei pelkästään tuotteiden julkistamisen aikaan. Suomessa voidaan puhua useista toisiinsa liittyvistä pienistä vapaa-ajan klustereista. Yhtä vapaa-ajan klusteria maasta ei löydy. Klustereita erottavia tekijöitä ovat ainakin teollisuuden ja palvelutuotannon omistusrakenne, teollisen tuotannon ja palvelutuotannon eriytyminen sekä tuotteiden luonne. Olemme paikantaneet yritysten liikevaihdolla mitattuna noin 2-3 miljardin euron suuruiset liikunnan sekä kodin ja puutarhan klusterit. Nämä ovat esimerkkejä kuluttajalähtöisistä klustereista, jotka ovat rakentuneet laajojen kansalaispiirien harrastusten ja käytäntöjen varaan. Näille aloille Suomessa on syntynyt teollista toimintaa ja palveluita. Yritykset voivat luoda vapaa-ajan käytäntöjen varaan osaamista, joka on testattu kotimarkkinoilla

    Ulkoisten pelastussuunnitelmien harjoitusohje

    Get PDF
    Pelastuslain (379/2011) 48 § ja ulkoisia pelastussuunnitelmia koskevan sisäministeriön asetuksen mukaan pelastuslaitoksen tulee harjoitella vähintään kolmen vuoden välein suuronnettomuusvaarallisissa kohteissa, kuten vaarallisia kemikaaleja käsittelevät ja varastoivat tuotantolaitokset, ratapihat ja satamat sekä ydinvoi-malaitokset ja kaivannaisjätealueet. Suomessa on noin 200 kohdetta, joissa on velvoite laatia ulkoinen pelas-tussuunnitelma ja harjoitella säännöllisesti. Tämä ohje yhdenmukaistaa ja selventää pelastuslain 48 § mukaisten kohteiden ulkoisia pelastussuunnitelmia koskevien harjoitusten suunnittelua, toteuttamista, arviointia ja raportointia. Ohjeessa käytetään harjoituk-sesta termiä UPS-harjoitus. Ulkoisen pelastussuunnitelman laatiminen ja UPS-harjoitusten järjestäminen ovat pelastuslaitoksien vastuulla ja ne toteutetaan yhteistoiminnassa toiminnanharjoittajan kanssa. Aluehallintovirastojen tehtävänä on valvoa velvoitteiden toteutumista. Suomella on velvollisuus raportoida suunnitelmista ja harjoitustoiminnasta EU komissiolle sekä Seveso III -että kaivannaisjätedirektiivien perusteella. UPS-harjoitusprosessi sisältää useita eri vaiheita harjoituksen läpiviemiseksi. Harjoitusprosessi muodostuu harjoituksen suunnittelusta, valmistelusta, toteutuksesta ja kehittämistoimenpiteistä. Ohjeen tavoitteena on yhdenmukaistaa pelastuslaitoksien ulkoisia pelastussuunnitelmia koskevaa harjoitustoimintaa sekä selventää harjoitusten vaatimuksia

    Anvisning om övningar enligt externa räddningsplaner

    Get PDF
    Enligt 48 § i räddningslagen (379/2011) och inrikesministeriets förordning om externa räddningsplaner ska räddningsverket med minst tre års mellanrum öva i objekt med risk för storolycka. Sådana objekt är t.ex. produktionsanläggningar för hantering och upplagring av farliga kemikalier, bangårdar, hamnområden, kärnkraftverk och deponier för utvinningsavfall. I Finland finns det ca 200 objekt som är skyldiga att göra upp en extern räddningsplan och öva regelbundet. Genom anvisningen förenhetligas och förtydligas planeringen, genomförandet, utvärderingen och rapporteringen av övningar som gäller externa räddningsplaner i objekt enligt 48 § i räddningslagen. I anvisningen kallas övningen på finska UPS-harjoitus (övning enligt extern räddningsplan). Räddningsverken ansvarar för uppgörandet av externa räddningsplaner och ordnandet av övningar enligt extern räddningsplan, detta i samarbete med verksamhetsidkaren. Regionförvaltningsverken har till uppgift att övervaka att skyldigheterna fullgörs. Finland har enligt Seveso III-direktivet och direktivet om hantering av avfall från utvinningsindustrin en skyldighet att rapportera om planerna och övningsverksamheten till Europeiska kommissionen. För att genomföra övningarna enligt externa räddningsplaner finns det flera skeden i processen. Övningsprocessen består av planering, beredning och genomförande av övningen samt av utvecklingsåtgärder. Syftet med anvisningen är att förenhetliga övningsverksamheten enligt räddningsverkens externa räddningsplaner och att förtydliga kraven på övningar

    Effects of diet-induced obesity and voluntary wheel running on the microstructure of the murine distal femur

    Get PDF
    Background. Obesity and osteoporosis, two possibly related conditions, are rapidly expanding health concerns in modern society. Both of them are associated with sedentary life style and nutrition. To investigate the effects of diet-induced obesity and voluntary physical activity we used high resolution micro-computed tomography (μCT) together with peripheral quantitative computed tomography (pQCT) to examine the microstructure of the distal femoral metaphysis in mice. Methods. Forty 7-week-old male C57BL/6J mice were assigned to 4 groups: control (C), control + running (CR), high-fat diet (HF), and high-fat diet + running (HFR). After a 21-week intervention, all the mice were sacrificed and the left femur dissected for pQCT and μCT measurements. Results. The mice fed the high-fat diet showed a significant weight gain (over 70% for HF and 60% for HFR), with increased epididymal fat pad mass and impaired insulin sensitivity. These obese mice had significantly higher trabecular connectivity density, volume, number, thickness, area and mass, and smaller trabecular separation. At the whole bone level, they had larger bone circumference and cross-sectional area and higher density-weighted maximal, minimal, and polar moments of inertia. Voluntary wheel running decreased all the cortical bone parameters, but increased the trabecular mineral density, and decreased the pattern factor and structure model index towards a more plate-like structure. Conclusions. The results suggest that in mice the femur adapts to obesity by improving bone strength both at the whole bone and micro-structural level. Adaptation to running exercise manifests itself in increased trabecular density and improved 3D structure, but in a limited overall bone growthpeerReviewe
    corecore