8 research outputs found

    A Low-cost, High-coverage Legal Named Entity Recognizer, Classifier and Linker

    Get PDF
    International audienceIn this paper, we try to improve Information Extraction in legal texts by creating a legal Named Entity Recognizer, Classifier and Linker. With this tool, we can identify relevant parts of texts and connect them to a structured knowledge representation, the LKIF ontology.More interestingly, this tool has been developed with relatively little effort, by mapping the LKIF ontology to the YAGO ontology and through it, taking advantage of the mentions of entities in the Wikipedia. These mentions are used as manually annotated examples to train the Named Entity Recognizer, Classifier and Linker.We have evaluated the approach on holdout texts from the Wikipedia and also on a small sample of judgments of the European Court of Human Rights, resulting in a very good performance, i.e., around 80% F-measure for different levels of granularity. We present an extensive error analysis to direct further developments, and we expect that this approach can be successfully ported to other legal subdomains, represented by different ontologies

    Machine learning in predictive analytics on judicial decision-making

    Get PDF
    Legal professionals globally are under pressure to provide ‘more for less' – not an easy challenge in the era of big data, increasingly complex regulatory and legislative frameworks and volatile financial markets. Although largely limited to information retrieval and extraction, Machine Learning applications targeted at the legal domain have to some extent become mainstream. The startup market is rife with legal technology providers with many major law firms encouraging research and development through formal legal technology incubator programs. Experienced legal professionals are expected to become technologically astute as part of their response to the ‘more for less' challenge, while legal professionals on track to enter the legal services industry are encouraged to broaden their skill sets beyond a traditional law degree. Predictive analytics applied to judicial decision-making raise interesting discussions around potential benefits to the general public, over-burdened judicial systems and legal professionals respectively. It is also associated with limitations and challenges around manual input required (in the absence of automatic extraction and prediction) and domain-specific application. While there is no ‘one size fits all' solution when considering predictive analytics across legal domains or different countries' legal systems, this dissertation aims to provide an overview of Machine Learning techniques which could be applied in further research, to start unlocking the benefits associated with predictive analytics on a greater (and hopefully local) scale

    Mejora del acceso a Infoleg mediante técnicas de procesamiento automático del lenguaje

    Get PDF
    En este artículo presentamos una aproximación para la detección Automática de Entidades en textos legales, y su aplicación al corpus InfoLeg. La aproximación se basa en diversas técnicas de Extracción de Información, entre ellas Aprendizaje Automático a partir de ejemplos y reglas creadas manualmente. Presentamos un análisis de los diferentes tipos de entidades que se encuentran en los textos, sus realizaciones lingüísticas y sus di ficultades para el análisis automático. El diseño de la solución se basa en las di ficultades propias de estas entidades. En la fase actual de desarrollo de la aproximación hemos anotado manualmente una porción del corpus y hemos desarrollado reglas para anotar casos sencillos automáticamente. Hemos entrenado y evaluado una aproximación basada en aprendizaje automático para casos sencillos, con resultados muy prometedores.Sociedad Argentina de Informática e Investigación Operativ

    Mejora del acceso a Infoleg mediante técnicas de procesamiento automático del lenguaje

    Get PDF
    En este artículo presentamos una aproximación para la detección Automática de Entidades en textos legales, y su aplicación al corpus InfoLeg. La aproximación se basa en diversas técnicas de Extracción de Información, entre ellas Aprendizaje Automático a partir de ejemplos y reglas creadas manualmente. Presentamos un análisis de los diferentes tipos de entidades que se encuentran en los textos, sus realizaciones lingüísticas y sus di ficultades para el análisis automático. El diseño de la solución se basa en las di ficultades propias de estas entidades. En la fase actual de desarrollo de la aproximación hemos anotado manualmente una porción del corpus y hemos desarrollado reglas para anotar casos sencillos automáticamente. Hemos entrenado y evaluado una aproximación basada en aprendizaje automático para casos sencillos, con resultados muy prometedores.Sociedad Argentina de Informática e Investigación Operativ

    Mejora del acceso a Infoleg mediante técnicas de procesamiento automático del lenguaje

    Get PDF
    En este artículo presentamos una aproximación para la detección Automática de Entidades en textos legales, y su aplicación al corpus InfoLeg. La aproximación se basa en diversas técnicas de Extracción de Información, entre ellas Aprendizaje Automático a partir de ejemplos y reglas creadas manualmente. Presentamos un análisis de los diferentes tipos de entidades que se encuentran en los textos, sus realizaciones lingüísticas y sus di ficultades para el análisis automático. El diseño de la solución se basa en las di ficultades propias de estas entidades. En la fase actual de desarrollo de la aproximación hemos anotado manualmente una porción del corpus y hemos desarrollado reglas para anotar casos sencillos automáticamente. Hemos entrenado y evaluado una aproximación basada en aprendizaje automático para casos sencillos, con resultados muy prometedores.Sociedad Argentina de Informática e Investigación Operativ

    Unsupervised and supervised text similarity systems for automated identification of national implementing measures of European directives

    Get PDF
    The automated identification of national implementations (NIMs) of European directives by text similarity techniques has shown promising preliminary results. Previous works have proposed and utilized unsupervised lexical and semantic similarity techniques based on vector space models, latent semantic analysis and topic models. However, these techniques were evaluated on a small multilingual corpus of directives and NIMs. In this paper, we utilize word and paragraph embedding models learned by shallow neural networks from a multilingual legal corpus of European directives and national legislation (from Ireland, Luxembourg and Italy) to develop unsupervised semantic similarity systems to identify transpositions. We evaluate these models and compare their results with the previous unsupervised methods on a multilingual test corpus of 43 Directives and their corresponding NIMs. We also develop supervised machine learning models to identify transpositions and compare their performance with different feature sets
    corecore