612 research outputs found

    Detecting and Analyzing Text Reuse with BLAST

    Get PDF
    In this thesis I expand upon my previous work on text reuse detection. I propose a novel method of detecting text reuse by leveraging BLAST (Basic Local Alignment Search Tool), an algorithm originally designed for aligning and comparing biomedical sequences, such as DNA and protein sequences. I explain the original BLAST algorithm in depth by going through it step-by-step. I also describe two other popular sequence alignment methods. I demonstrate the effectiveness of the BLAST text reuse detection method by comparing it against the previous state-of-the-art and show that the proposed method beats it by a large margin. I apply the method to a dataset of 3 million documents of scanned Finnish newspapers and journals, which have been turned into text using OCR (Optical Character Recognition) software. I categorize the results from the method into three categories: every day text reuse, long term reuse and viral news. I describe them and provide examples of them as well as propose a new, novel method of calculating a virality score for the clusters

    Data exploration process based on the self-organizing map

    Get PDF
    With the advances in computer technology, the amount of data that is obtained from various sources and stored in electronic media is growing at exponential rates. Data mining is a research area which answers to the challange of analysing this data in order to find useful information contained therein. The Self-Organizing Map (SOM) is one of the methods used in data mining. It quantizes the training data into a representative set of prototype vectors and maps them on a low-dimensional grid. The SOM is a prominent tool in the initial exploratory phase in data mining. The thesis consists of an introduction and ten publications. In the publications, the validity of SOM-based data exploration methods has been investigated and various enhancements to them have been proposed. In the introduction, these methods are presented as parts of the data mining process, and they are compared with other data exploration methods with similar aims. The work makes two primary contributions. Firstly, it has been shown that the SOM provides a versatile platform on top of which various data exploration methods can be efficiently constructed. New methods and measures for visualization of data, clustering, cluster characterization, and quantization have been proposed. The SOM algorithm and the proposed methods and measures have been implemented as a set of Matlab routines in the SOM Toolbox software library. Secondly, a framework for SOM-based data exploration of table-format data - both single tables and hierarchically organized tables - has been constructed. The framework divides exploratory data analysis into several sub-tasks, most notably the analysis of samples and the analysis of variables. The analysis methods are applied autonomously and their results are provided in a report describing the most important properties of the data manifold. In such a framework, the attention of the data miner can be directed more towards the actual data exploration task, rather than on the application of the analysis methods. Because of the highly iterative nature of the data exploration, the automation of routine analysis tasks can reduce the time needed by the data exploration process considerably.reviewe

    Jätteenpolton parhaan käytettävissä olevan tekniikan (BAT) vertailuasiakirjan käyttö suomalaisessa toimintaympäristössä. Jätteenpolton BREF 2006

    Get PDF
    Jätteenpolton parhaan käytettävissä olevan tekniikan vertailuasiakirjan sisällöllisesti valmis luonnos julkaistiin viimevuoden kesällä ja EU:n komissio hyväksynee sen vuoden 2006 aikana. Tässä raportissa tarkastellaan vertailuasiakirjassa kuvattuja tekniikoita suomalaisen toimintaympäristön näkökulmasta. Kokonaiskuvan muodostamiseksiraportin alussa on käsitelty suomalaisen ja eurooppalaisen jätteenpolton taustaa ja tämän hetken käytäntöjä myös hieman tekniikkatarkasteluja laajemmin. Yleisen vertailun lisäksi raportissa on käyty tarkemmin läpi Suomen, Ruotsin,Italian ja Saksan jätteenpolttoa. Vertailuasiakirjassa esiteltyjä parhaita käytettävissä olevia tekniikoita on kuvattu tiivistetysti. Ennen varsinaista tekniikoiden käsittelyä on kokonaiskuvan muodostamiseksi esitelty myös jätteenpolton perusprosessit. Käsittelyssä on jätetty vähemmälle huomiolle asioita, joita voitaneen pitää suomalaisessa toimintaympäristössä itsestäänselvyyksinä tai joiden käyttö olosuhteissamme on epätodennäköistä. Toisaalta joitain suomalaiselle toimintaympäristölle ominaisia tai luonteeltaan uusia asioita on käyty läpi tarkemmin. Joissakin kohdissa on pyritty ottamaan myös hieman vertailuasiakirjaa laajempi näkökulma ja sisällyttämään käsittelyyn ympäristön-suojeluasetuksen mukaista parhaan käyttökelpoisen tekniikan arviointia. Parhaiden käytettävissä olevien tekniikoiden esittelyn jälkeen on tarkasteltu ja arvioitu eri menetelmien ja tekniikoiden soveltamismahdollisuuksia Suomessa. Raportin lopussa on esitelty myös muutamia vertailuasikirjassa mainitsemattomia uusia tekniikoita, joilla saattaa olla merkitystä jollain aikavälillä suomalaisessa toimintaympäristössä

    Juurisyyanalyysi (RCA) protokollan luominen Kaukaan tehtaalle

    Get PDF
    Opinnäytetyön aiheena oli tutkia Rotojet-pumpun vanhoja laiterikkoja ja luoda juu-risyyanalyysin toimintamalli laiterikon sattuessa. Esimerkkitapaukseksi opinnäytetyöhön valittiin kyseinen pumppu, koska siinä oli ollut lyhyen ajan sisällä paljon ongelmia ja tehtaalle oli tärkeää tämän laitteen toimintavarmuus. Analyysin ideana oli kerryttää tietoa tehtaalla käytettyyn SAP-tietojärjestelmään helpottamaan kunnossapidon työs-kentelyä. Aiemmin järjestelmään ei ole syötetty riittävästi tietoa, jota voitaisiin käyttää hyödyksi. Tästä syystä vanhoista tapahtuneista laiterikoista oli vaikea saada sellaista tietoa, jota tarvitaan esimerkkitapauksena käytetyn pumpun tietokannan luomiseen. Tietokantaan tehtiin juurisyyanalyysin esimerkkityö, johon liitettiin kaikki mahdollinen tieto kyseisen laitteen aikaisemmista ongelmista ja ohjeet kuinka itse analyysi pitää to-teuttaa. PowerPoint-ohjelmalla tehtiin ohjeet, jotka piti tehdä niin yksinkertaiseksi, että jokainen pystyisi tekemään sen. Samalla luotiin koulutusmateriaali, jolla pystytään kouluttamaan tehtaan toimihenkilöitä tekemään analyysi-ilmoitus oikeaoppisesti ja yh-tenäisesti. Työn tuloksena saatiin luotua Kaukaan tehtaan SAP-tietojärjestelmään toimintamalli miten menetellä jos päätetään aloittaa laiterikon sattuessa perussyyn selvittäminen. Pro-tokollan luominen auttaa tiedon kertyessä kunnossapitoa kohdistamaan resursseja pa-remmin ja sitä kautta säästetään kustannuksissa.I chose for the topic of my dissertation to examine the reasons behind malfunctions in Rotojet-pumps. My intention was to create how to using root cause -analysis which could be used if Rotojet -pump broke down. The reason I decided to focus on this specific pump was the large amount problems experienced while using them during a short period of time. The idea for analysis was to gather information and feed it into to the SAP-system in order to help a maintenance work of these pumps. I noticed there was lack of detailed information fed into SAP of previous defects which I could have used to create a comprehensive user guide for maintenance. Powerpoint was used to create comprehensive yet simplified manual for anyone to create a root cause analysis of defect. All the information of previous problems with machinery and how to create a root cause analysis were included in instructions. Important part of the process was to create education material for staff members in order to follow the correct standard procedure. We managed to establish how to use and detailed info was fed into SAP databases for the use of maintenance workers should they need to analyze the root cause for the pump failure. The creation of protocol/ procedure will help maintenance department to gather and use information in the future and therefore reduce the amount of resources required to tackle the same problems. This in turn will help cutting unnecessary costs

    Koppero : Leikkikalu -konsepti lasten kulttuuritapahtumaan

    Get PDF
    Opinnäytetyökseni suunnittelin pahvisen leikkikalun lapsille. Se on lapsen omaa mielikuvitusta kannattava, antaa lapselle mahdollisuuden itse osallistua ja vaikuttaa leikkikalun lopulliseen ulkonäköön. Pahvinen leikkikalu kiinnitetään lasten polkupyörään, muodostaen siitä oman näköisen menopelin. Pohjatyönä tuotesuunnittelulle olen tutustunut lastenkulttuuriin, lasten pahvisiin leikkirakennuksiin, lasten polkupyöriin ja niiden entisöintiin. Etsin tapahtuman, jonne leikkikalu tulisi käytännössä työpajaksi. Lopputyöni tulee olemaan osana ohjelmaa Skidit Festarit -nimisessä lasten kulttuuritapahtumassa Helsingissä 07.07.2013.For my Final Thesis I designed a toy for the children which is proving them to use own imagination. It gives free possiblities to create and affect to the final outlook of the toy. A cardboard toy can be fasten to the back of the children´s bike when it is becoming a movable toy. For the research I took a closer look in to the children´s culture, a cardboard playhouses, a bikes and renovating a children bike. I search a festival where I could bring the toy concretecally to use like a workshop. My final work will be part of the children´s culture festival called Skidit Festarit in 7th of July 2013

    Asiantuntijoiden motivaatio ja moderni palkitseminen : HR-päättäjien kokemukset asiantuntijoiden motivaatiota tukevan palkitsemisen kehitystrendeistä ja niiden taustalla vaikuttavista tekijöistä

    Get PDF
    Tässä tutkimuksessa tarkastellaan asiantuntijoiden motivaatiota, palkitsemista ja palkitsemisen kehitystrendejä, sekä organisaatioiden henkilöstöasioista vastaavien HR-päättäjien näkemyksiä ja kokemuksia niistä. Tutkimuksen tavoitteena on selvittää, miten moderni asiantuntijoiden motivaatiota paremmin tukeva palkitseminen koetaan satakuntalaisissa asiantuntijaorganisaatioissa. Lisäksi tarkastellaan, miten HR-päättäjät kokevat asiantuntijoiden motivaation, millaisia palkitsemisratkaisuja organisaatioissa on käytössä ja koetaanko niille kehitystarpeita. Tutkimuksen tutkimusote on laadullinen. Aineisto kerättiin kymmenellä teemahaastattelulla ja analysoitiin teoriaohjaavalla sisällönanalyysillä. Yhä useamman organisaation kilpailuetu rakentuu asiantuntijoiden tiedon varaan, mikä heijastuu kiinnostuksena asiantuntijuuteen. Kirjallisuuden mukaan asiantuntijoiden motivaatiossa korostuvat sisäiset motivaatiotekijät, mutta moderni motivaatiotutkimus tunnistaa motivaation olevan vahvasti yksilöllinen ilmiö, joten jokainen yksilö motivoituu eri tavoin. Motivaatiotutkimuksen edistyminen yhdessä organisaatioiden liiketoimintaympäristön muutosten ja asiantuntijuuden merkityksen korostumisen kanssa on johtanut palkitsemisen kehittämisen muutospaineisiin organisaatioissa. Empiirinen aineisto tukee laajasti aiemman kirjallisuuden havaintoja asiantuntijoiden motivaatiosta, palkitsemisesta ja palkitsemisen kehitystrendeistä. Moderni palkitseminen koetaan aikaisempaa yksilöllisemmäksi, yksilön suoriutumista painottavammaksi, joustavammaksi, spontaanimmaksi, oikea-aikaisemmaksi ja avoimemmaksi. Lisäksi siinä korostuvat oikeudenmukaisuus ja aineettomat palkitsemismuodot. Modernin palkitsemisen tavoitteena on tukea asiantuntijoiden motivaatiota, mutta myös luoda palkitsemisjärjestelmästä joustavampi, jolloin se palvelee paremmin organisaatioiden tarpeita muuttuvissa liiketoimintaympäristöissä. Organisaatioissa tunnistetaan kuitenkin haasteita palkitsemisen kehittämiselle, mitkä voivat toimia palkitsemisen kehittämistä hidastavina tai estävinä tekijöinä. Tutkimuksen tulokset osoittavat, että organisaatioissa ollaan matkalla kohti modernimpaa ymmärrystä asiantuntijan motivaatiosta ja palkitsemisesta. Modernin palkitsemisen elementit tunnistetaan laajasti organisaatioissa, mutta ne on omaksuttu vaihtelevassa mittakaavassa organisaation palkitsemisratkaisuun. Muutos kohti modernia palkitsemista on vielä kesken, mutta tapahtumassa

    Effects of moment of inertia on restricted motion swing speed

    Get PDF
    In many sports, the maximum swing speed of a racket, club, or bat is a key performance parameter. Previous research in multiple sports supports the hypothesis of an inverse association between the swing speed and moment of inertia of an implement. The aim of this study was to rigorously test and quantify this relationship using a restricted swinging motion. Eight visually identical rods with a common mass but variable moment of inertia were manufactured. Motion capture technology was used to record eight participants' maximal effort swings with the rods. Strict exclusion criteria were applied to data that did not adhere to the prescribed movement pattern. The study found that for all participants, swing speed decreased with respect to moment of inertia according to a power relationship. However, in contrast to previous studies, the rate of decrease varied from participant to participant. With further analysis it was found that participants performed more consistently at the higher end of the moment of inertia range tested. The results support the inverse association between swing speed and moment of inertia but only for higher moment of inertia implements

    Pienyrityksen arvonmääritys yrityskauppatilanteessa: menetelmät ja erityispiirteet

    Get PDF
    Tiivistelmä. Tämän pro gradu -tutkielman tavoitteena on tarkastella pienyrityksen arvonmääritystä yrityskaupassa, ja selvittää millaisia haasteita ja erityispiirteitä siihen liittyy. Lisäksi tutkielma pyrkii selvittämään, millaisia arvonmääritysmenetelmiä pienyritysten arvonmäärityksessä käytetään. Suomessa on tutkielman kirjoitushetkellä tuhansia yrityksiä, joilla on lähivuosina edessään omistajanvaihdos. Kyselyiden mukaan arvonmääritys koetaan omistajanvaihdoksissa suurena haasteena. Aikaisemmassa tutkimuksessa pääpaino on ollut suurempien yhtiöiden arvonmäärityksessä, ja pienyritysten osalta tutkimustyö on jäänyt vähemmälle huomiolle. Tutkimus toteutettiin laadullisena tutkimuksena, johon kerättiin aineisto puolistrukturoiduilla teemahaastatteluilla. Haastateltaviksi valittiin harkinnanvaraista otantaa käyttäen kokeneita yrityskauppojen sekä arvonmäärityksen asiantuntijoita. Aineisto analysoitiin vertailemalla siitä saatuja vastauksia aiempiin tutkimuksiin teemoittelua käyttäen. Näin saatiin muodostettua hyvä kokonaiskuva pienyrityksen arvonmäärityksestä. Tutkimuksen tuloksena löydettiin kattava kuvaus erilaisista pienyrityksen arvonmääritykseen liittyvistä erityispiirteistä, sekä siitä, miten nämä vaikuttavat arvonmääritykseen ja arvonmääritysmenetelmien soveltamiseen. Lisäksi saatiin laaja kuvaus erilaisista pienyrityksen arvonmäärityksessä käytettävistä menetelmistä. Tutkimuksessa havaittiin, että käytännön tason arvonmääritys eroaa huomattavasti teoriasta, ja että pienyrityksen arvonmäärityksessä käytetään käytännön tasolla melko yksinkertaisia menetelmiä. Tutkimuksessa myös nousi vahvasti esille arvonmäärittäjän ammattitaidon rooli, sekä kyky analysoida käytettävää dataa ja menetelmiä. Tutkimuksen tuloksia voivat hyödyntää esimerkiksi omistajanvaihdokseen tähtäävät yrittäjät, sekä arvonmäärityksiä tekevät tahot. Tuloksia hyödyntämällä voidaan ymmärtää paremmin pienyrityksen arvonmääritykseen vaikuttavia seikkoja ja niitä voidaan käyttää arvonmäärityksen laadun parantamiseksi

    Atmospheric Correction of a Seasonal Time Series of Hyperion EO-1 Images and Red Edge Inflection Point Calculation

    Get PDF
    While spaceborne satellite data has been extensively used to extract biophysical forest characteristics through reflectance features and indices, there are still many questions regarding seasonal changes in reflectance. Boreal forests have already seen changes in growth patterns from climate change, and the large scale monitoring of these forests is becoming more important. Understanding seasonal changes in reflectance in the boreal region will allow for the monitoring of seasonal biophysical changes using satellite imagery. For this monitoring to be possible the satellite imagery needs to be preprocessed and atmospherically corrected to create a time series of hemispherical-directional reflectance factors. The red edge is the abrupt change in reflectance between 680 and 740 nm seen in vegetation spectra. The red edge inflection point is the wavelength, at which the slope is steepest in the red edge. The red edge inflection point is sensitive to plant chlorophyll content and has been extensively used for estimating vegetation biophysical parameters including: leaf-area index, biomass and plant health levels. Hyperion is a narrowband imaging spectrometer aboard the Earth Observer-1 satellite. Hyperion captures data across 242 spectral bands covering a spectral range of 356 to 2577 nm resulting in a nominal spectral range of 10 nm. While the high spectral resolution of Hyperion makes it possible to calculate the REIP, there is no consensus on how this should be done, with different methods producing conflicting results. This study explains the preprocessing and atmospheric correction of a seasonal time series of five Hyperion EO-1 images (Provided courtesy of the USGS) from Hyytiälä, Southern Finland (61° 51 N, 24° 17 E). The time series ranges from 31.5.2010 to 12.8.2010, covering much of the growing season and the seasonal changes in reflectance. The first derivative, four-point linear interpolation, Lagrangian interpolation, and fifth-order polynomial fitting methods for calculating the REIP are looked at to determine their applicability for Hyperion imagery using this time series. Hyperion data requires considerable preprocessing before atmospheric correction can be done. In this study the preprocessing covered: destriping, desmiling, atmospheric correction and finally geocorrection. Atmospheric correction was done using both FLAASH and ATCOR, both of which are MODTRAN based absolute atmospheric correction algorithms. The final atmospherically corrected HDRF images were evaluated using in situ handheld spectrometer reference measurements of a grass field in the area. An average RMSE value of around 3% was achieved with both algorithms. The corrected Hyperion images were also compared against two MODIS products, which also showed good agreement. The aerosol retrieval however did not work with either algorithm, on any scene. The use of a sun photometer for aerosol level estimation was also not effective. Due to the dynamics of the red edge and expected seasonal red edge inflection point trends, the fifth-order polynomial fitting method was seen as the best method for calculating the red edge inflection point. The red edge inflection point did not correlate strongly with leaf area index overall, however there was a strong correlation with individual plots. A strong correlation was observed between Hyperion red edge inflection point and understory red edge inflection point, both overall and for individual plots.Kaukokartoitusmenetelmiä on pitkään käytetty metsän biofyysisten ominaisuuksien arvioinnissa, käyttäen hyväksi niiden heijastusominaisuuksia ja kasvillisuusindeksejä. Metsän heijastuksen muutokset kasvukauden aikana eivät kuitenkaan ole täysin ymmärrettyjä. Boreaalisten metsien kasvussa on havaittu muutoksia ilmastonmuutoksen myötä, minkä vuoksi niiden monitorointi on erityisen tärkeää. Kaukokartoitusaineistoon pohjautuvaan monitorointiin vaaditaan ymmärrystä metsien heijastusominaisuuksien muutoksista kasvukauden aikana. Tätä myöten käytettävän aineiston täytyy olla esikäsitelty ja ilmakehäkorjattu. Niin kutsuttu punainen reuna (red edge) on tyypillinen ominaisuus kasvillisuuden heijastuksessa, joka näkyy äkillisenä muutoksena heijastuksessa 680 ja 740 nm välillä. Punaisen reunan käännepiste (red edge inflection point) on se aallonpituus, jossa heijastuksen muutos on jyrkimmillään. Punaisen reunan käännepiste on herkkä klorofyllin määrälle kasvillisuudessa, ja sitä on käytetty arvioimaan kasvillisuuden biofyysisiä parametreja, kuten lehtialaindeksiä, biomassaa ja kasvillisuuden terveyttä. Hyperion on kapeakanavainen kuvaava spektrometri EO-1 satelliitissa. Hyperion mittaa aallonpituusalueen 356–2577 nm heijastusta 242 kanavalla, ja sensorin nominaalinen spektrinen resoluutio on 10 nm. Korkea spektrinen resoluutio mahdollistaa punaisen reunan käännepisteen laskemisen. Laskemiseen on kuitenkin useita menetelmiä, jotka tuottavat erilaisia tuloksia. Tämä Pro Gradu - tutkielma kattaa viiden Hyperion EO-1 kuvan esikäsittelyn ja ilmakehäkorjauksen. Kuvat ovat Hyytiälästä, Etelä-Suomesta (61° 51 N, 24° 17 E). Aikasarja alkaa 5. toukokuuta 2010 ja päättyy 11. heinäkuuta 2010, kattaen suurimman osan kasvukaudesta ja kasvillisuuden heijastuksen vaihtelusta. Seuraavia punaisen reunan käännepisteen laskentamenetelmien soveltuvuutta testattiin Hyperion-aineistolla: neljän pisteen lineaarinen interpolaatio, Lagrangian interpolaatio, ja viidennen asteen yhtälön sovittaminen. Hyperion-data vaatii paljon esikäsittelyä ennen kuin ilmakehäkorjaus voidaan suorittaa. Tässä tutkielmassa esikäsittely kattoi seuraavat vaiheet: spektrisen hymyn poisto, viivojen poisto, ilmakehäkorjaus, ja lopuksi geometrinen korjaus. Ilmakehäkorjaus toteutettiin käyttäen FLAASH ja ATCOR -algoritmeja, jotka ovat absoluuttisia ilmakehäkorjauksia ja käyttävät MODTRAN -algoritmia ilmakehän mallinnuksessa. Lopullisten, ilmakehäkorjattujen kuvien heijastusta verrattiin maastossa mitattuun tukiaineistoon. Maastoaineisto mitattiin tutkimusalueella sijaitsevalla ruohokentällä. Molemmat algoritmit tuottivat hyvän tuloksen, mutta kummankaan algoritmin automaattinen aerosolin määrän arviointi ei toiminut. Myöskään arviointi aurinkofotometrin avulla ei toiminut. Korjatut Hyperion-kuvat sopivat kuitenkin hyvin yhteen verrattaessa niitä kahteen MODIS-tuotteeseen. Punaisen reunan dynamiikan takia viidennen asteen yhtälön sovittaminen punaiseen reunaan todettiin parhaaksi menetelmäksi laskea punaisen reunan käännepiste. Hyperion-aineistosta johdettu punaisen reunan käännepiste ei korreloitunut voimakkaasti lehtialaindeksin kanssa, vaikka yksittäiset koealat korreloivatkin vahvasti. Sen sijaan Hyperion-aineiston punaisen reunan käännepisteen ja aluskasvillisuuden punaisen reunan käännepisteen välillä oli hyvin vahva korrelaatio
    corecore