Search CORE

53 research outputs found

Learning metrics and discriminative clustering

Author: Sinkkonen Janne
Publication venue: Teknillinen korkeakoulu
Publication date: 21/11/2003
Field of study

In this work methods have been developed to extract relevant information from large, multivariate data sets in a flexible, nonlinear way. The techniques are applicable especially at the initial, explorative phase of data analysis, in cases where an explicit indicator of relevance is available as part of the data set. The unsupervised learning methods, popular in data exploration, often rely on a distance measure defined for data items. Selection of the distance measure, part of which is feature selection, is therefore fundamentally important. The learning metrics principle is introduced to complement manual feature selection by enabling automatic modification of a distance measure on the basis of available relevance information. Two applications of the principle are developed. The first emphasizes relevant aspects of the data by directly modifying distances between data items, and is usable, for example, in information visualization with the self-organizing maps. The other method, discriminative clustering, finds clusters that are internally homogeneous with respect to the interesting variation of the data. The techniques have been applied to text document analysis, gene expression clustering, and charting the bankruptcy sensitivity of companies. In the first, more straightforward approach, a new local metric of the data space measures changes in the conditional distribution of the relevance-indicating data by the Fisher information matrix, a local approximation of the Kullback-Leibler distance. Discriminative clustering, on the other hand, directly minimizes a Kullback-Leibler based distortion measure within the clusters, or equivalently maximizes the mutual information between the clusters and the relevance indicator. A finite-data algorithm for discriminative clustering is also presented. It maximizes a partially marginalized posterior probability of the model and is asymptotically equivalent to maximizing mutual information.reviewe

Aaltodoc Publication Archive

Low-rank approximations of second-order document representations

Author: Klami Arto
Lagus Jarkko
Sinkkonen Janne
Publication venue: ACL
Publication date: 01/01/2019
Field of study

Document embeddings, created with methods ranging from simple heuristics to statistical and deep models, are widely applicable. Bag-of-vectors models for documents include the mean and quadratic approaches (Torki, 2018). We present evidence that quadratic statistics alone, without the mean information, can offer superior accuracy, fast document comparison, and compact document representations. In matching news articles to their comment threads, low-rank representations of only 3-4 times the size of the mean vector give most accurate matching, and in standard sentence comparison tasks, results are state of the art despite faster computation. Similarity measures are discussed, and the Frobenius product implicit in the proposed method is contrasted to Wasserstein or Bures metric from the transportation theory. We also shortly demonstrate matching of unordered word lists to documents, to measure topicality or sentiment of documents.Peer reviewe

Crossref

Helsingin yliopiston digitaalinen arkisto

Infinite factorization of multiple non-parametric views

Author: A. Gelman
A. Klami
A. Klami
A. Rodriguez
A. Vinokourov
Arto Klami
C. Archambeau
C. Rasmussen
D. Blackwell
D. Blei
D. Cohn
D. Lee
D. M. Blei
D. M. Roy
G. Englebienne
I. Rivals
I. S. Dhillon
Janne Sinkkonen
K. Barnard
M. Welling
Mark Girolami
N. Friedman
N. L. Johnson
R. M. Neal
S. Becker
S. Rogers
Samuel Kaski
Simon Rogers
T. Hofmann
Y. W. Teh
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 01/01/2010
Field of study

Combined analysis of multiple data sources has increasing application interest, in particular for distinguishing shared and source-specific aspects. We extend this rationale of classical canonical correlation analysis into a flexible, generative and non-parametric clustering setting, by introducing a novel non-parametric hierarchical mixture model. The lower level of the model describes each source with a flexible non-parametric mixture, and the top level combines these to describe commonalities of the sources. The lower-level clusters arise from hierarchical Dirichlet Processes, inducing an infinite-dimensional contingency table between the views. The commonalities between the sources are modeled by an infinite block model of the contingency table, interpretable as non-negative factorization of infinite matrices, or as a prior for infinite contingency tables. With Gaussian mixture components plugged in for continuous measurements, the model is applied to two views of genes, mRNA expression and abundance of the produced proteins, to expose groups of genes that are co-regulated in either or both of the views. Cluster analysis of co-expression is a standard simple way of screening for co-regulation, and the two-view analysis extends the approach to distinguishing between pre- and post-translational regulation

CUED - Cambridge University Engineering Department

Luonnon monet arvot ja niiden määrittäminen:hallitustenvälisen luontopaneelin (IPBES) raportin mukautus Suomen kansallisiin olosuhteisiin

Author: Aulake Marianne
Herzon Irina
Jokimaki Jukka
Kallio Kirsi Pauliina
Kotiaho Janne S.
Laine Ilona
Nieminen Tiina M.
Oksanen Elina
Pappila Minna
Paulomäki Hanna
Silfverberg Outi
Sinkkonen Aki
Sääksjärvi Ilari E.
Publication venue: Suomen luontopaneeli
Publication date: 01/01/2023
Field of study

Jukuri

LaCRIS - University of Lapland Current Research System

Jatkuvapeitteisen metsänkäsittelyn ympäristö- ja talousvaikutukset: Luontopaneelin yhteenveto ja suositukset luontopolitiikan suunnittelun ja päätöksenteon tueksi

Author: Bäck Jaana
Jokimäki Jukka
Kallio Kirsi Pauliina
Ketola Tarmo
Kotiaho Janne S.
Kulmala Liisa
Laine Ilona
Lehikoinen Aleksi
Nieminen Tiina M.
Oksanen Elina
Pappila Minna
Peura Maiju
Sinkkonen Aki
Sääksjärvi Ilari E
Tahvonen Olli
Publication venue: 'Baishideng Publishing Group Inc.'
Publication date: 31/01/2023
Field of study

UTUPub

Soiden ennallistamisen suoluonto-, vesistö- ja ilmastovaikutukset : Luontopaneelin yhteenveto ja suositukset luontopolitiikan suunnittelun ja päätöksenteon tueksi

Author: Ahlvik Lassi Mikael
Boström Christoffer
Bäck Jaana
Jokimäki Jukka
Kallio Kirsi Pauliina
Ketola Tarmo
Kotiaho Janne S.
Kulmala Liisa
Lehikoinen Aleksi
Nieminen Tiina M.
Oksanen Elina
Pappila Minna
Pöyry Juha
Saarikoski Heli
Sinkkonen Aki
Sääksjärvi Ilari
Publication venue: Suomen Luontopaneeli
Publication date: 01/01/2021
Field of study

Suomen alkuperäisestä 10,4 miljoonan hehtaarin suoalasta yli puolet on ojitettu metsä- ja maatalouden sekä turvetuotannon tarpeisiin. Etelä-Suomessa ojitus on ollut voimakkainta: keskimäärin noin 75 prosenttia ja monin paikoin vielä suurempi osa soista on ojitettu. Suot ovat Euroopan luontotyypeistä kaikkein uhanalaisin luontotyyppiryhmä ja Suomella on erityisvastuu soiden suojelusta. Kaikkiaan 54 prosenttia Suomen 50 suoluontotyypistä on uhanalaisia ja lisäksi 20 prosenttia on silmällä-pidettäviä. Ensisijaisesti Suomen soilla elävistä lajeista 11 prosenttia eli yhteensä 120 lajia on uhanalaisia. Uhanalaisilla lajeilla ja luontotyypeillä on korkea riski hävitä Suomesta. Mittava ojitus näkyy suolajiston ja -luontotyyppien uhanalaisuuden lisäksi myös vesistöhaittoina, soilta hävinneenä hiilivarastona ja muina heikentyneinä ekosysteemipalveluina. Uutena uhkana suoluonnolle on rahkasammaleen kuoriminen suon pinnasta. Soita ennallistetaan eli palautetaan kohti luonnontilaa ojia tukkimalla ja patoamalla sekä vesiä uudelleen ohjailemalla ja poistamalla ylimääräistä puustoa. Ennallistamisella pyritään ensisijaisesti suoluontotyyppien tilan parantamiseen ja suolajiston palauttamiseen. Tutkimusten valossa ennallistaminen johtaa suon oleellisten ekologisten toimintojen palautumiseen nopeasti, pääsääntöisesti vajaassa vuosikymmenessä. Lajiston palautuminen vaikuttaa lupaavalta, mutta on toimintojen palautumista hitaampaa. Kaikki ennallistamisen vaikutukset eivät ole myönteisiä lyhyellä aikavälillä. Soiden ennallistaminen lisää metaanipäästöjä, jonka seurauksena kokonaiskasvihuonekaasupäästöt voivat kasvaa seuraavan 10–20 vuoden aikana. Pitkällä aikavälillä päästöt alkavat kuitenkin usein vähentyä ja etenkin rehevät suot ennallistuvat hiilinieluiksi. Karuilla suoluontotyypeillä ilmastovaikutus voi olla pitkään kielteinen. Vesistöjen ravinne-kuormitus voi kasvaa etenkin rehevien soiden ennallistamisen seurauksena, mutta haitallinen vaikutus on pääsääntöisesti lyhyt, ja jo vuosikymmenen kuluttua ennallistettu suo puhdistaa valuma-alueen vesiä ja toimii luonnontilaisen suon tavoin tasaten valumia. Ennallistaminen on tärkeä työkalu historiallisten luontohaittojen korjaamisessa ja luonnon monimuotoisuuden turvaamisessa. Ennallistamisen hyödyissä ja haitoissa on joitakin tietopuutteista johtuvia epävarmuuksia, mutta vaikuttaa siltä, että soiden pitkäjänteinen ennallistaminen on kokonaisuuden kannalta suoluonnolle, vesistöille ja ilmastolle parempi ratkaisu kuin ennallistamatta jättäminen. Luontopaneeli korostaa, että nimenomaan soiden ennallistamiskysymyksessä on tärkeää ymmärtää, että hiilensidontaa ja ilmaston-muutosta hillitseviä ratkaisuja voidaan tehdä monilla erilaisilla soista riippumattomilla keinoilla, mutta suoluontotyyppien erityispiirteet ja lajisto eivät ole turvattavissa ilman soiden ennallistamista. Ennallistamisen lisäksi luonnontilaisen kaltaisena säilyneen suoluonnon lisäsuojeluun tulee panostaa merkittävästi. Suomen Luontopaneeli on laatinut tämän yhteenvedon suositukset luontopolitiikan suunnittelun ja päätöksenteon tueksi perustuen asettamansa asiantuntijatyöryhmän kattavaan vertaisarvioituun selvitykseen soiden ennallistamisen suoluonto-, vesistö- ja ilmastovaikutuksista1. nonPeerReviewe

Jyväskylä University Digital Archive

LaCRIS - University of Lapland Current Research System

Helsingin yliopiston digitaalinen arkisto

Isogeometrinen analyysi rakennetekniikassa: taivutetun palkin mallinnus

Author: Sinkkonen Janne
Publication venue
Publication date: 04/05/2015
Field of study

Aaltodoc Publication Archive

Numerical analysis of Saimaa canal lock gates

Author: Sinkkonen Janne
Publication venue
Publication date: 11/12/2017
Field of study

Aaltodoc Publication Archive