3,055 research outputs found

    Multilingual Models for Compositional Distributed Semantics

    Full text link
    We present a novel technique for learning semantic representations, which extends the distributional hypothesis to multilingual data and joint-space embeddings. Our models leverage parallel data and learn to strongly align the embeddings of semantically equivalent sentences, while maintaining sufficient distance between those of dissimilar sentences. The models do not rely on word alignments or any syntactic information and are successfully applied to a number of diverse languages. We extend our approach to learn semantic representations at the document level, too. We evaluate these models on two cross-lingual document classification tasks, outperforming the prior state of the art. Through qualitative analysis and the study of pivoting effects we demonstrate that our representations are semantically plausible and can capture semantic relationships across languages without parallel data.Comment: Proceedings of ACL 2014 (Long papers

    "Not not bad" is not "bad": A distributional account of negation

    Full text link
    With the increasing empirical success of distributional models of compositional semantics, it is timely to consider the types of textual logic that such models are capable of capturing. In this paper, we address shortcomings in the ability of current models to capture logical operations such as negation. As a solution we propose a tripartite formulation for a continuous vector space representation of semantics and subsequently use this representation to develop a formal compositional notion of negation within such models.Comment: 9 pages, to appear in Proceedings of the 2013 Workshop on Continuous Vector Space Models and their Compositionalit

    Learning Bilingual Word Representations by Marginalizing Alignments

    Full text link
    We present a probabilistic model that simultaneously learns alignments and distributed representations for bilingual data. By marginalizing over word alignments the model captures a larger semantic context than prior work relying on hard alignments. The advantage of this approach is demonstrated in a cross-lingual classification task, where we outperform the prior published state of the art.Comment: Proceedings of ACL 2014 (Short Papers

    Distributed Representations for Compositional Semantics

    Full text link
    The mathematical representation of semantics is a key issue for Natural Language Processing (NLP). A lot of research has been devoted to finding ways of representing the semantics of individual words in vector spaces. Distributional approaches --- meaning distributed representations that exploit co-occurrence statistics of large corpora --- have proved popular and successful across a number of tasks. However, natural language usually comes in structures beyond the word level, with meaning arising not only from the individual words but also the structure they are contained in at the phrasal or sentential level. Modelling the compositional process by which the meaning of an utterance arises from the meaning of its parts is an equally fundamental task of NLP. This dissertation explores methods for learning distributed semantic representations and models for composing these into representations for larger linguistic units. Our underlying hypothesis is that neural models are a suitable vehicle for learning semantically rich representations and that such representations in turn are suitable vehicles for solving important tasks in natural language processing. The contribution of this thesis is a thorough evaluation of our hypothesis, as part of which we introduce several new approaches to representation learning and compositional semantics, as well as multiple state-of-the-art models which apply distributed semantic representations to various tasks in NLP.Comment: DPhil Thesis, University of Oxford, Submitted and accepted in 201

    A Deep Architecture for Semantic Parsing

    Full text link
    Many successful approaches to semantic parsing build on top of the syntactic analysis of text, and make use of distributional representations or statistical models to match parses to ontology-specific queries. This paper presents a novel deep learning architecture which provides a semantic parsing system through the union of two neural models of language semantics. It allows for the generation of ontology-specific queries from natural language statements and questions without the need for parsing, which makes it especially suitable to grammatically malformed or syntactically atypical text, such as tweets, as well as permitting the development of semantic parsers for resource-poor languages.Comment: In Proceedings of the Semantic Parsing Workshop at ACL 2014 (forthcoming

    The aqueous corrosion of borosilicate glasses studied in operando by in situ fluid-cell Raman spectroscopy

    Get PDF
    Die Eigenschaften von Gläsern hängen vor allem von deren chemischen Zusammensetzung ab und sind aufgrund der großen Zusammensetzungsvielfalt sehr variabel, was eine Vielzahl von Anwendungsmöglichkeiten eröffnet. Borosilikatgläser sind insbesondere wegen ihrer hohen chemischen Beständigkeit weit verbreitet. Sie werden beispielsweise zur Immobilisierung von hochradioaktiven Abfällen aus der Wiederaufbereitung von Brennelementen, oder als Behälterglas zur Lagerung von Chemikalien verwendet. Dort, wie auch in vielen weiteren technischen Anwendungsfällen, ist eine hohe chemische Beständigkeit wichtig, um eine Verschlechterung der Materialeigenschaften oder Verunreinigung von Behälterinhalten zu verhindern. Allerdings sind Gläser metastabil und anfällig für Korrosion in Kontakt mit wässrigen Lösungen oder Wasserdampf. Um eine optimale Glasauswahl für unterschiedliche Anwendungen zu treffen, bei der Entwicklung von neuen Gläsern eine hohe chemische Beständigkeit zu erreichen oder die Langzeitbeständigkeit belastbar zu simulieren, ist das Verständnis über den Korrosionsmechanismus, die zugrundeliegenden Reaktionen, die Transportprozesse sowie mögliche Rückkopplungen unerlässlich. Auch wenn Glaskorrosion bereits seit vielen Jahrzehnten untersucht wird, gibt es bisher keinen Konsens über einen allgemeingültigen Glaskorrosionsmechanismus, der alle Beobachtungen, insbesondere die Entstehung von komplexen chemischen und strukturellen Mustern in den Korrosionsprodukten, erklären kann. Die bedeutendsten Beobachtungen und die nach aktuellem Kenntnisstand wesentlichen Reaktionen, Prozesse und deren Abhängigkeiten, welche für Rückkopplungseffekte verantwortlich sind, insbesondere in Bezug auf das grenzflächengekoppelte Lösungs-Fällungs-Modell (interface-coupled dissolution-precipitation, ICDP), werden in dieser Arbeit dargelegt und diskutiert. Um den Korrosionsmechanismus und auch die Rückkopplungen zwischen Glasauflösung, Präzipitation von Korrosionssäumen sowie dem Transport von Stoffen zwischen Reaktionsfront und der Umgebungslösung im Kontakt mit der Probe experimentell zu untersuchen, wurde die in situ-Flüssigzellen-Raman-Spektroskopie angewendet, welche für Langzeitexperimente weiterentwickelt wurde. Mit dieser innovativen Anwendung der Raman-Spektroskopie ist es möglich, die Glaskorrosion in situ mit einer Mikrometerauflösung und in Echtzeit, in operando, zu untersuchen. Damit konnte erstmals die Korrosion von einem Referenzglas (International Simple Glass, ISG) in regelmäßigen Messsequenzen über mehrere Monate untersucht werden. Dabei wurde die Entstehung von kristallinen Korrosionsprodukten (Kosnarite) an der Oberfläche der in saurer Lösung korrodierten ISG-Probe und eine strukturelle Reifung eines Korrosionssaumes, der primär aus amorphem Kieselgel basiert, mit der Zeit beobachtet. Unter stark alkalischen Bedingungen in einer Carbonat-reichen Lösung konnte des Weiteren die Präzipitation von Zeolithen in operando beobachtet werden. Die Variation der chemischen Zusammensetzung und Struktur des Korrosionssaums zeigt, dass die hydrochemischen Bedingungen an der Reaktionsfront, wo das Korrosionsprodukt präzipitiert, dynamisch sein müssen. Des Weiteren wurden erstmals Korrosionsexperimente mit einem ternären Natrium-Borosilikatglas (TBG) unter Durchflussbedingungen in Kombination mit der in situ-Flüssigzellen-Raman-Spektroskopie durchgeführt. So konnten Abhängigkeit von der Lösungsaustauschrate und -zusammensetzung untersucht werden und die Entstehung mehrerer Lagen aus strukturell unterschiedlicher, amorpher Kieselerde erstmals in Echtzeit beobachtet werden. Ergänzend zu den experimentellen Untersuchungen wurde ein eindimensionales numerisches Reaktions-Transport-Modell mit der Finite Volumen-Methode entwickelt, das auf dem ICDP-Mechanismus basiert. Die räumliche Auflösung des Finite Volumen-Modells wurde bewusst an die Auflösung der In situ-Raman-Spektroskopie angepasst. So ist es möglich, die Ergebnisse aus den Experimenten und den numerischen Simulationen direkt miteinander zu vergleichen und beide Ansätze iterativ weiterzuentwickeln

    Teaching Machines to Read and Comprehend

    Full text link
    Teaching machines to read natural language documents remains an elusive challenge. Machine reading systems can be tested on their ability to answer questions posed on the contents of documents that they have seen, but until now large scale training and test datasets have been missing for this type of evaluation. In this work we define a new methodology that resolves this bottleneck and provides large scale supervised reading comprehension data. This allows us to develop a class of attention based deep neural networks that learn to read real documents and answer complex questions with minimal prior knowledge of language structure.Comment: Appears in: Advances in Neural Information Processing Systems 28 (NIPS 2015). 14 pages, 13 figure
    • …
    corecore