79 research outputs found

    Decision making based on data-analysis methods

    Get PDF
    This technical report is based on four our recent articles:"Data fusion of pre-election gallups and polls for improved support estimates", "Analyzing parliamentary elections based on voting advice application data", "The Finnish car rejection reasons shown in an interactive SOM visualization tool", and "Network visualization of car inspection data using graph layout". Neural methods are applied in political and technical decision making. We introduce decision support schemes based on Self-Organizing Map (SOM) combined with other methods. Visualizations based on various data-analysis methods are developed. In political decision making we have examples from one parliamentary election and one presidential election utilizing opinion data collected beforehand. In technical decision making we concentrate on rejection reasons in car inspection data. This technical report is a summary of our recent non-nuclear studies

    Network visualization of car inspection data using graph layout

    Get PDF
    vo

    Predicting profitability of dairy farms with a learning ensemble model

    Get PDF

    Itseorganisoivan kartan ryvästys paljastaa maatilojen kannattavuusprofiilit

    Get PDF
    Suomen maa- ja puutarhatilojen kannattavuutta ja muita taloudellisia tekijöitä on tässä työssä analysoitu itseorganisoivan kartan ryvästykseen perustuen. Itseorganisoiva kartta on akateemikko Teuvo Kohosen 1980-luvulla kehittämä neuroverkkomenetelmä, jonka avulla suuri, moniulotteinen havaintoaineisto voidaan esittää havainnollisena kaksiulotteisena karttana. Menetelmän avulla aineistoja voidaan visualisoida tehokkaasti, ja visualisointien avulla aineistosta voidaan löytää useiden muuttujien välisiä epälineaarisia yhteyksiä. Tämän lisäksi itseorganisoivan kartan pohjalta aineistoja voidaan ryvästää eli klusteroida, ja tällä tavoin jakaa aineisto toisistaan poikkeaviin ryhmiin, jotka ovat kuitenkin sisäisesti suhteellisen homogeenisia. Tutkimuksessamme analysoimme kannattavuuskirjanpitoaineistoa vuodelta 2010, ja löysimme useita kiinnostavia yhteyksiä tarkkailtavien taloudellisten muuttujien välillä. Ryvästyksen avulla muodostimme erilaisten maatilojen taloudellisia profiileja. Löydösten merkityksellisyys varmistettiin tilastollisten testien avulla. Jaoimme kannattavuuskirjanpitotilat itseorganisoivan kartan ryvästyksen avulla kymmeneen seuraavanlaiseen ryhmään. 1. Suuret tilat, joilla on suuri viljelyala, matala pääoman tuotto ja kannattavuuskerroin sekä korkea velkarasite. 2. Keskikokoiset tilat, joilla on erittäin suuri velkarasite sekä matala omavaraisuusaste ja kannattavuuskerroin. 3. Tilat, joilla on hyvin pieni viljelyala, pieni tase, kokoluokkaan suhteutettuna paljon työtunteja, hyvin matala kokonaispääoman tuotto ja kannattavuuskerroin. Kasvihuonetilojen osuus tässä ryhmässä on suhteellisen suuri. 4. Suuret tilat, joilla on suuri viljelyala, korkea pääoman tuotto ja kannattavuuskerroin sekä keskitason velkarasite. 5. Keskikokoiset, korkeariskiset tilat, joilla on suuri viljelyala ja erityisen suuri vuokrattu viljelyala. Muut nautakarjatilat ovat tässä ryhmässä keskimääräistä paremmin edustettuina. 6. Keskikokoiset, pieniriskiset tilat, joilla on pieni velkarasite, erittäin korkea omavaraisuusaste, ja jotka ovat lähes pelkästään lypsykarjatiloja. 7. Pienet, matalariskiset tilat, jotka ovat useimmiten viljanviljelytiloja, ja joilla on hyvin pieni viljelyala ja velkarasite, pieni tase, hyvin vähän työtunteja ja eläimiä sekä hyvin matala kannattavuuskerroin. 8. Keskikokoiset, erittäin kannattavat tilat, joiden viljelyala on suurempi ja työtuntien määrä pienempi kuin muilla vastaavankokoisten tilojen ryhmillä. 9. Pienet tilat, joiden kannattavuuskerroin on korkea, ja jotka ovat suhteellisen harvoin lypsykarjatiloja, mutta melko usein viljanviljelytiloja. 10. Pienet korkeariskiset tilat, joiden kannattavuus on keskimääräinen ja vieraan pääoman takaisinmaksuaika melko lyhyt

    Scalable Crop Yield Prediction with Sentinel-2 Time Series and Temporal Convolutional Network

    Get PDF
    One of the precepts of food security is the proper functioning of the global food markets. This calls for open and timely intelligence on crop production on an agroclimatically meaningful territorial scale. We propose an operationally suitable method for large-scale in-season crop yield estimations from a satellite image time series (SITS) for statistical production. As an object-based method, it is spatially scalable from parcel to regional scale, making it useful for prediction tasks in which the reference data are available only at a coarser level, such as counties. We show that deep learning-based temporal convolutional network (TCN) outperforms the classical machine learning method random forests and produces more accurate results overall than published national crop forecasts. Our novel contribution is to show that mean-aggregated regional predictions with histogram-based features calculated from farm-level observations perform better than other tested approaches. In addition, TCN is robust to the presence of cloudy pixels, suggesting TCN can learn cloud masking from the data. The temporal compositing of information do not improve prediction performance. This indicates that with end-to-end learning less preprocessing in SITS tasks seems viable

    Uusi palvelu Taloustohtorissa - kasvihuonekaasupäästöjen laskenta

    Get PDF
    Maatalouden tuottamat kasvihuonekaasupäästöt raportoidaan YK:n Ilmastosopimuksen ja Kioton pöytäkirjan mukaisesti osana Suomen kokonaispäästöjä. Hallitustenvälisen ilmastonmuutospaneelin (IPCC) ohjeiden mukainen päästölaskenta on rakennettu niin, että maankäyttöä, maataloutta ja tilojen energiankäyttöä tarkastellaan erillään toisistaan. Yhteensä kaikki maatalousperäiset päästöt ovat noin 20% Suomen kokonaispäästöistä. Raportointisektorit ylittävä tarkastelu mahdollistaa maatilan tarkastelun kokonaisuutena.Luonnonvarakeskuksen (Luke) Taloustohtori-verkkopalvelu (www.luke.fi/taloustohtori) tarjoaa suuren määrän kannattavuuskirjanpitotilojen tietojen pohjalta laskettuja maa- ja puutarhatalousyritysten tulostietoja. Taloustohtori-järjestelmään rakennettiin verkkopalvelu, joka antaa kannattavuuskirjanpitotiloille mahdollisuuden tarkastella oman tilan kasvihuonekaasulaskelmia ja verrata tuloksia eri tilaryhmien keskiarvotuloksiin. Kuka tahansa pääsee tarkastelemaan tietojen pohjalta yleistettyjä keskiarvotietoja. Uusi verkkopalvelu sisältää maataloussektorin päästöt, turvepeltojen hiilidioksidipäästöt maankäytöstä ja tuotantoon liittyvän energiankäytön päästöt.Uudessa palvelussa kannattavuuskirjanpitotiloille lasketaan kasvihuonekaasupäästöt taannehtivasti vuodesta 2000 lähtien. Kannattavuuskirjanpidon raportointijärjestelmillä nämä tulokset painotetaan yleistettäväksi alueellisiksi keskiarvo- ja kokonaistuloksiksi, joten verkkopalvelu tarjoaa tietoa kaikille maatiloille ja myös maatalouspoliittiselle päätöksenteolle. Myös päästövähennysten taloudellisten vaikutusten tarkastelua voidaan kehittää, koska kannattavuuskirjanpitoaineisto sisältää sekä taloustiedot että tuotantotiedot.Kasvihuonekaasupäästöt lasketaan reaaliaikaisesti havainto- ja yrityskohtaisesta aineistosta. Suurin osa laskennassa tarvittavista tiedoista on Taloustohtorin tietokannassa. Kasvihuonekaasujen laskenta noudattaa IPCC:n 2006 Guidelines -ohjeistoa ja on yhdenmukainen Suomen kasvihuonekaasuinventaariossa käytettävien menetelmien kanssa. Kasvihuonekaasuinventaariossa käytettyjä menetelmiä yksinkertaistettiin hieman esimerkiksi käyttämällä keskiarvotietoja tietystä päästölähteestä perustuen raportoituihin päästöihin, jotta järjestelmän ylläpitotyömäärä pysyy kohtuullisena. Näin myöskään laskennassa tarvittava tietomäärä ei nouse kohtuuttoman suureksi.Laskennan lopputuloksena raportoidaan sekä tilakohtaisesti että alueellisesti 1. metaanipäästöt tuotantoeläimistä ja lannasta, 2. dityppioksidipäästöt lannasta ja maaperästä, 3. hiilidioksidipäästöt kalkituksesta, 4. hiilidioksidipäästöt eloperäisten peltojen maaperästä. 5. hiilidioksidipäästöt maatilan energiankäytöstä

    Common Genetic Variation Near Melatonin Receptor 1A Gene Linked to Job-Related Exhaustion in Shift Workers

    Get PDF
    Study Objectives: Tolerance to shift work varies; only some shift workers suffer from disturbed sleep, fatigue, and job-related exhaustion. Our aim was to explore molecular genetic risk factors for intolerance to shift work. Methods: We assessed intolerance to shift work with job-related exhaustion symptoms in shift workers using the emotional exhaustion subscale of the Maslach Burnout Inventory-General Survey, and carried out a genome-wide association study (GWAS) using Illumina's Human610-Quad BeadChip (n = 176). The most significant findings were further studied in three groups of Finnish shift workers (n = 577). We assessed methylation in blood cells with the Illumina HumanMethylation450K BeadChip, and examined gene expression levels in the publicly available eGWAS Mayo data. Results: The second strongest signal identified in the GWAS (p = 2.3 x 10E-6) was replicated in two of the replication studies with p Conclusions: These findings suggest that a variant near MTNR1A may be associated with job-related exhaustion in shift workers. The risk variant may exert its effect via epigenetic mechanisms, potentially leading to reduced melatonin signaling in the brain. These results could indicate a link between melatonin signaling, a key circadian regulatory mechanism, and tolerance to shift work.Peer reviewe

    Modernisation of agricultural statistics : Final report

    Get PDF
    The “Modernisation of agricultural statistics” project had three main goals: (1) modernisation of the statistical register of agricultural and horticultural enterprises (Mapu), (2) identification of new data sources that use agricultural statistics, and (3) the better utilisation of farm related geospatial data to define the location of farms. In addition, an international seminar was held in Poland during the project in cooperation with other countries carrying out a similar project and with representatives of Eurostat. The project was divided into work packages in accordance with the main goals. The first work package included the modernisation of Mapu. This work package was further divided into two main tasks based on data sources: administrative data and direct data collection. Before the concrete modernisation of systems and databases, we identified how well the definition of a farm used in Mapu corresponds with the definition of a farm used in EU statistics (Article 2 of regulation (EU) 2018/1019 on integrated farm statistics). In practice, the definition of a farm entity used in Mapu in accordance with the Integrated Administration and Control System (IACS) corresponds well with the definition used in EU statistics. The most significant difference is that Mapu mainly does not include fur farming, reindeer husbandry and beekeeping. Apart from fur farming, the significance of these sectors is low, and this project does not recommend that enterprises engaged in these sectors be added to Mapu. Fur farms are included in the Business Register of Statistics Finland, which can be used to produce statistics of fur farms. If statistical obligations related to fur farming expand later, for example, as a result of the SAIO regulation, adding fur farms to Mapu should be reassessed. Mapu’s databases and related data flows were modernised during the project. The removal of direct database rights to datasets of agricultural administration for reasons related to information security was a significant change regarding administrative data. The Hansolo loading platform was built as a new solution. The administrative data required for agricultural statistics is copied regularly in Hansolo, from which data is available for Mapu and agricultural statistics. In addition to databases and data flows, the data content was modernised. Adding the contact details and business ID of farm parties, such as farmers, to the data content was the most significant addition. The data system of the administrative body of rural industries, belonging to IACS, is the primary data source. Data about animals is obtained from animal registers. In other words, units (farms and horticultural enterprises) in Mapu are the same as units in IACS. Some data in Mapu can be obtained through direct data collection processes in conjunction with the survey for horticultural statistics. During this project, the data collection application, databases and data flows of this survey were modernised regarding all process phases, ranging from data collection to publication. As a new feature in data collection for horticultural statistics, farmers were able to log in to the online application through strong electronic identification using their banking codes, for example. As a result, it was not necessary to send usernames and passwords separately to respondents. In 2020, the data collection application was developed further by introducing an authorisation feature. In practice, this means that farmers can authorise another person to respond to the survey on their behalf. In the second work package, we identified the broader use of data about farm coordinates to define the location of farms in agricultural statistics. The aim is to present data on maps better than before, while considering the data privacy of individual farms. In the third work package, we examined what new data sources could be used more effectively than at present in agricultural statistics. According to the examination, data in the parcel databank about the use of crop protection products apparently represented the actual use of products better than data collected through the current data collection process. The use of parcel specific data obtained from farms for various purposes is developing and, as a result, parcel data may also become available as source material for statistics by new electronic means. In addition, we developed a method to calculate the field-specific monoculture area. Compared with the previous method version, the use of the QuantumGIS program was a new factor. It helped to accurately define the area used for a single crop in consecutive years, also when the crop was only grown in part of the parcel in question during the three years under examination. The method for calculating the monoculture area developed in this project will be used in the 2023 IFS data collection process to produce data about crop rotation. Considering the future of agricultural statistics, it will be interesting to see how new production sectors, such as insect farming, will possibly be included in the statistics. This also applies to questions related to production methods: in the future, food may be produced by enterprises other than conventional farms, such as by enterprises engaged in vertical farming. Environmental issues have steered agricultural activities in the past and will continue to do so during the next few years. For example, sequestering carbon in farmland may expand beyond perennial grasslands and fallows. Data production related to products sold, combined with statistics of environmental impact arising from agriculture, presents a challenge in agricultural statistics. Growing and new statistical needs, together with fewer resources, will steer statistical production during the next few years towards the use of new data sources and the identification of data production that is “sufficiently good” in terms of quality and finances. Modernisation of agricultural statistics co-funded by the Eurostat (Finland Grant agreement 2018.0212). This publication is the final report of the project (20.8.2020)
    corecore