23 research outputs found

    Modeling and Publishing Legislation and Case Law as Linked Open Data

    Get PDF
    Viranomaiset julkaisevat oikeudellista tietoa verkossa avoimesti usein ihmisluettavissa PDF- ja HTML-muodoissa. Kuitenkin tiedonhaun tehostamiseksi ja tiedon ymmärtämisen helpottamiseksi tarvitaan älykkäitä palveluita sekä älykästä tietomallinnusta. Lisäksi lainsäädännön kansainvälistyessä eri organisaatioilla on tarve edistää oikeudellista tiedonvaihtoa yli kansallisten rajojen, mikä edellyttää aineistojen esitystavan yhtenäistämistä. Tässä diplomityössä tutkitaan, miten linkitetyn datan teknologioilla voidaan mallintaa ja julkaista lainsäädäntö sekä oikeuskäytäntö siten, että julkaisu palvelee laajasti eri oikeudellisen tiedon käyttötapauksia. Työ sisälsi RDF-tietomallien ja datamuunnoksen kehittämisen, datan rikastamisen sekä ohjelmointirajapintojen ja sovellusprototyyppien toteuttamisen. Lopputuloksena syntyi Semanttinen Finlex -palvelu, jossa Suomen lainsäädäntö sekä korkeimman oikeuden ja korkeimman hallinto-oikeuden ratkaisut on julkaistu keskeisiltä osin linkitettynä avoimena datana noudattaen eurooppalaisia tunniste- ja metatietostandardeja.Governments publish legal information openly online usually in the form of human readable PDF and HTML documents. However, to facilitate search and understanding of legal information intelligent services and intelligent data modeling are required. Moreover, as law becomes international the authorities have a growing need for enhancing information exchange which calls for standardized ways of presenting information. This thesis examines how Linked Data technologies can be applied to modeling and publishing legislation and case law to support different use cases extensively. The work involved development of RDF data models and data conversion, data enriching and implementation of application programming interfaces and application prototypes. The end result is Semantic Finlex, a legal Linked Open Data service that hosts central part of the Finnish legislation, judgments of the Supreme Court and judgments of the Supreme Administrative Court published using European standards for identifiers and metadata schemas

    Automatic Annotation Service APPI : Named Entity Linking in Legal Domain

    Get PDF
    Texts referencing court decisions and statutes can be difficult to understand without context. It can be time consuming and expensive to find related statutes or to learn about context specific terminology. As a solution, we utilized a named entity linking tool for extracting information and tailored it into a service, Appi, that can automatically annotate legal documents to provide context to the readers. The service can identify and link named entities and references to legal texts to corresponding vocabularies and data sources by combining statistics- and rule-based named entity recognition with named entity linking. The results provide users with enhanced reading experience with contextual information and the possibility to access related materials, such as statutes and court decisions.Peer reviewe

    An Anonymization Tool for Open Data Publication of Legal Documents

    Get PDF
    Publisher Copyright: © 2022 Copyright for this paper by its authors.The EU General Data Protection Regulation (GDPR) requires anonymization of documents containing personal data, such as court decisions, for public use. Doing this manually is costly and time-consuming but can be automated by applying Natural Language Processing (NLP) methods. This paper introduces the ANOPPI tool developed for (semi-)automatic anonymization of Finnish texts. The tool can be used both as a web application and programmatically through a REST API. Evaluation shows that ANOPPI performs well with different types of documents, however, further improving the performance of the named entity recognition and disambiguation methods would enhance the usefulness of the software. The tool is being published as open source for public use by the Ministry of Justice in Finland. A use case of ANOPPI is to publish court decisions on the Web in the LawSampo semantic portal for human close reading and as Linked Open Data for data analysis in legal informatics.Peer reviewe

    LawSampo Portal and Data Service for Publishing and Using Legislation and Case Law as Linked Open Data on the Semantic Web

    Get PDF
    Publisher Copyright: © 2022 Copyright for this paper by its authors.This paper argues for the idea of publishing legislation and case law as Linked Open Data (LOD) on the Semantic Web, to cater several user groups, including the general public, legislators, lawyers, researchers of legal informatics, and application developers. To support the argument, the proof-of-concept system LawSampo - Finnish Legislation and Case Law on the Semantic Web is introduced, including a semantic portal and a LOD service. Based on the Sampo Model, the main novelty of LawSampo is the provision of heterogenous distributed legal data through multiple application perspectives for faceted searching and exploring the data and for data analysis in legal informatics.Peer reviewe

    Innovatiiviset julkiset hankinnat – määrittely, mahdollisuudet ja mittaaminen

    Get PDF
    Innovatiivisilla julkisilla hankinnoilla voidaan luoda kysyntää yritysten kehittämille uusille tuotteille ja palveluille ja niiden avulla voidaan parantaa julkisten palveluiden tuottavuutta ja vaikuttavuutta. Julkisten hankintojen huomattava mittakaava, 35 miljardia euroa vuodessa, tarjoaa lukuisia mahdollisuuksia löytää parempia ratkaisuja yhteiskunnallisiin tarpeisiin ja vauhdittaa innovatiivisten ratkaisujen kehittämistä, kaupallistumista ja leviämistä. Tässä selvityksessä tarkastellaan innovatiivisten julkisten hankintojen mahdollisuuksia eri toimialoilla ja eri tyyppisissä hankinnoissa. Johtamisen ja seurannan mahdollistamiseksi esitetään ehdotus innovatiivisten hankintojen määritelmästä, joka korostaa sekä hankinnan kohteena olevan ratkaisun uutuutta että uuden ratkaisun käyttöönoton avulla saavutettavia vaikutuksia julkisten palveluiden kehittämiseen. Raportissa tehdään myös katsaus tulos- ja vaikuttavuuslähtöisten hankintojen käytäntöihin, esimerkkeihin ja toteutusmahdollisuuksiin. Lopuksi tarkastellaan innovatiivisten hankintojen yhteiskunnallisen vaikuttavuuden sekä yritysvaikutusten arvioinnin problematiikka

    Turvepeltolohkojen määrittely ja tunnistaminen : Maatalousmaiden turvetieto (MaaTu) -hankkeen raportti

    Get PDF
    Viljellyt turvemaat ovat kasvihuonekaasujen lähde ja tärkeässä roolissa maataloussektorin kasvihuonekaasupäästöjen vähentämisessä. Päästöjä vähentävien toimenpiteiden kohdentamiseksi turvemaat olisi pystyttävä tunnistamaan peltolohkokohtaisesti. Tämän raportin tavoitteena on selvittää kriteerejä turvepeltolohkon tunnistamiseen ja määrittelyyn Suomessa siten, että määritelmä on yhtenevä hallitusten välisen ilmastopaneelin (IPCC) käyttämän määritelmän kanssa. Raportti koostuu kirjallisuuskatsauksesta turvemaan määritelmiin kansainvälisesti ja Suomessa, sekä analyyseistä turpeen esiintymisestä ja ominaisuuksista Suomen maatalousmailla ja peltolohkoilla. Raportti tuotettiin osana Maatalouden turvetieto (MaaTu) -hanketta (2021–2023), jossa tuotetaan tarkennettu koko maan kattava paikkatietoaineisto turvemaiden esiintymisestä ja paksuudesta. Tuotettava paikkatietoaineisto kuvataan ja julkaistaan hankkeen muissa julkaisuissa. Kirjallisuuskatsauksen perusteella turvemaiden määritelmät ja käytetty terminologia vaihtelevat eri maiden ja luokittelujärjestelmien välillä. Suomalaisissa luokittelujärjestelmissä turvemaat on määritelty eloperäinen maalaji -luokkaan, joka sisältää myös muita maalajeja, kuten lieju- ja multamaat. Kansainvälisesti käytetty World Reference Base for Soil Resources (WRB) -luokittelujärjestelmä tarjoaa kansainvälisesti käytettävän yhtenevän Histosol-määritelmän, jonka alle turvemaat voidaan luokitella. Myös IPCC noudattaa tätä määritelmää. Histosol-määritelmä poikkeaa jonkin verran Suomessa yleisimmin käytetystä määritelmästä turvemaalle. Histosol-määritelmässä orgaanisen kerroksen vähimmäispaksuus on 0,4 m kun suomalaisissa määritelmissä turvemaan vähimmäispaksuudeksi on useimmiten katsottu 0,3 m. Vastaavasti Histosol-määritelmässä orgaanisen materiaaliksi luokitellaan orgaanista hiilen määrillä ≥20 %, kun Suomalaisissa määritelmissä turpeeksi luokitellaan orgaanisen aineen määrillä ≥ 40 %, joka vastaa 23,2 % orgaanista hiiltä (muuntokerroin 1.724). Korvaamalla Histosol-määritelmän raja-arvot suomalaisilla raja-arvoilla päästään kuitenkin hyvin lähelle IPCC:n noudattamaa määritelmää orgaanisille maille (Histosol) ja vältytään rinnakkaisten ja ristiriistaisten luokittelujärjestelmien syntyminen Suomessa. Turvepeltolohkomääritelmä edellyttää myös turpeen vähimmäisalan kriteeriä peltolohkolla, sillä analyysit osoittivat, että turvekerroksen paksuus vaihtelee peltolohkoilla ja turvetta esiintyy usein vain osalla lohkoa. Suomalaisen luokittelujärjestelmän lieju ja multamaa eivät kuulu Histosol-luokkaan vähäisemmän orgaanisen hiilen määrän vuoksi ja ne voidaan luokitella Umbric tai Histic Gleysol -luokkiin. Analyysit osoittivat myös, että turvemaiden tunnistamisessa olisi huomioitava pintamaan lisäksi syvemmät maakerrokset. Peltojen muokkauskerroksessa orgaanisen hiilen määrä havaittiin olevan keskimäärin 28–37 % alhaisempi ja turpeen maatuneisuus korkeampaa kuin syvemmissä kerroksissa. Tämä saattaa johtaa virheelliseen maalajiluokitteluun, jos luokittelu tehdään pelkästään pintamaan ominaisuuksien määrittelyn perusteella. WRB-järjestelmän Histosol-määritelmässä orgaanisen kerroksen ei tarvitse alkaa heti maanpinnasta, mikä sulkee pois vastaavan luokitteluvirheen. Maatalousmaiden turvekerros ohentuu viljelykäytössä. Ennen pitkää turvekerros kuluu loppuun ja turveaineistoja täytyy päivittää. Valtakunnallisesti turvepeltojen turvekerroksen keskimääräiseksi paksuudeksi arviotiin 120 cm (vaihtelu maakunnittain 96–163 cm) ja turvekerroksen havaittiin ohenevan keskimäärin 1,2 cm vuodessa (keskihajonta 0,6 cm/v). Turpeen esiintyminen peltomailla on näin ollen hyvin vaihteleva ilmiö ja turvepelto on ehtyvä luonnonvara

    Turvemaiden digitaalinen kartoitus ja turvepeltolohkojen tunnistaminen

    Get PDF
    Maatalouden turvemaiden ilmasto- ja vesistöpäästöjen vähentäminen edellyttää turvepeltolohkojen tunnistamista, mutta maaperätieto ei ole ollut riittävän tarkkaa tähän tarkoitukseen. Raportissa esitellyn työn tavoitteena oli tuottaa tarkennettua paikkatietoa turvemaiden esiintymisestä ja paksuudesta turvepeltolohkojen tunnistamiseksi. Uusi paikkatietoaineisto turvemaiden esiintymisestä ja paksuudesta luotiin hyödyntämällä koneoppimismallinnusta. Mallinnus tehtiin Random Forest -menetelmällä. Turpeen esiintymistä selittäviksi aineistoiksi valmisteltiin 117 kpl koko maan kattavia satelliitti- ja lentoalustoilta mitattuja kaukokartoitusaineistoja ja geologista paikkatietoaineistoa. Koneoppimismallin opettamista ja testausta varten koottiin 3,5 miljoonaa maaperähavaintoa, josta 70 % käytettiin mallin opetukseen ja 30 % mallin riippumattomaan testaukseen. Mallinnuksessa ennustettiin turvepaksuusluokkien ≥ 10 cm, ≥ 30 cm, ≥ 40 cm ja > 60 cm esiintymistä 50 m × 50 m rasteriresoluutiossa ja ennusteet tuotettiin maankäyttömuodosta riippumatta kaikille maa-alueille. Malliennusteiden tarkkuus oli korkea. Turvepaksuusluokat pystyttiin erottelemaan muista maalajeista ja turvepaksuusluokista 89–96 % tarkkuudella. Tarkkuudet olivat korkeimmillaan ohuissa turvepaksuusluokissa ja hieman heikompia paksuissa luokissa. Maatalousmailla vähintään 30 cm paksun turvemaan alaksi arvoitiin 273 000 ha, mikä on noin 11 % maatalousmaa-alasta. Tästä pinta-alasta 73 % turvekerros oli > 60 cm. Saamamme arvio maatalousmaiden turvemaiden (≥ 30 cm) pinta-alasta on 8 600 ha suurempi kuin mitä mittakaavaltaan 1:200 000 maaperäkartasta voidaan arvioida. Peltolohkokohtainen tarkastelu osoitti, että turve-ennusteet mahdollistavat turvealan ja -paksuuden arvioimisen yksittäisillä peltolohkoilla. Esimerkiksi turvepeltolohkot, joilla on vähintään 50 % alastaan ≥30 cm paksu turvekerros, tunnistettiin yli 90 % tarkkuudella. Uusi paikkatietoaineisto Turpeen paksuus 1.0/2023 tarkentaa aikaisempaa tietoa turvemaiden esiintymisestä ja paksuudesta koko maassa. Aineiston luokittelutarkkuus ja alueellinen erottelukyky ovat olemassa olevia maaperäkartta-aineistoja parempia ja sen avulla tunnistetaan aikaisemmin kartoittamattomia turvemaita. Yleistarkkuusmetriikat raportoidaan jokaiselle luokittelulle erikseen ja epävarmuuksien hajautuminen on esitetty Random Forest -puiden yksimielisyyden avulla rasterisolukohtaisesti. Uudet turve-ennusteet tuovat uusia mahdollisuuksia maaperään ja maankäyttöön liittyvien toimintojen suunnittelun, ohjaukseen ja vaikutusten arviointiin, sekä tutkimukseen
    corecore