    An Ontology-Based Information Extraction (OBIE) Framework for Analyzing Initial Public Offering (IPO) Prospectus

    With the large amounts of information associated with the Initial Public Offering (IPO) process, an intelligent tool is needed for assisting the decision-making activities for both the investors and the underwriters. Even though a large body of related studies exists in extant literature, minimum attention has been devoted to the aspect of understanding hidden semantics within the informative contents of IPO prospectus. In this paper, we present a framework for processing the textual content of IPO prospectus based on an emerging technique named Ontology Based Information Extraction (OBIE). Preliminary results indicates that the framework is capable of meeting the design requirements identified. Moreover, lessons learned during the design and implementation span technical and organizational considerations and can serve as guidance for future research and development in related areas

    Term Extraction and Disambiguation for Semantic Knowledge Enrichment: A Case Study on Initial Public Offering (IPO)

    Domain knowledge bases are a basis for advanced knowledge-based systems, manually creating a formal knowledge base for a certain domain is both resource consuming and non-trivial. In this paper, we propose an approach that provides support to extract, select, and disambiguate terms embedded in domain specific documents. The extracted terms are later used to enrich existing ontologies/taxonomies, as well as to bridge domain specific knowledge base with a generic knowledge base such as WordNet. The proposed approach addresses two major issues in the term extraction domain, namely quality and efficiency. Also, the proposed approach adopts a feature-based method that assists in topic extraction and integration with existing ontologies in the given domain. The proposed approach is realized in a research prototype, and then a case study is conducted in order to illustrate the feasibility and the efficiency of the proposed method in the finance domain. A preliminary empirical validation by the domain experts is also conducted to determine the accuracy of the proposed approach. The results from the case study indicate the advantages and potential of the proposed approach

    Listalleottoesitteen teko ja viestittäminen yhtiön tilasta: viimeaikaiset listautumiset Helsingin pörssiin

    Tässä tutkielmassa tutkin seitsemää listalleottoesittettä yhtiöistä, jotka ovat listautuneet Helsingin pörssiin vuonna 2017. Listalleottoesite on potentiaaliselle sijoittajalle kattava paketti yhtiöstä, josta hänellä voi olla vähän tietoa ennestään. Näin listalleottoesitteen merkitys listautumisessa yrityksen informoinnissa korostuu. Tutkielma keskittyy johdon päätöksentekoon, kuinka, mitä ja miten halutaan kertoa yrityksen nykytilasta, jotta mahdollisimman moni potentiaalinen sijoittaja lähtisi yrityksen omistajaksi. Toteutus tehtiin tutkimalla valikoitua yritysjoukkoa sekä niiden listalleottoesitteitä. Syvällisempää merkitystä saatiin haastattelemalla kahta yrityksen johtohenkilöä yrityksistä, joita käsitellään tutkielmassa. Aikaisempi kirjallisuus ja tutkimus painottavat listalleottoesitteen tärkeyttä mahdollisen sijoituspäätöksen tekemisessä. Se sisältää kattavasti tietoa yrityksestä niin taloudellisten kuin ei-taloudellisten tunnuslukujen osalta. Paljon on tutkittu listalleottoesitteiden sisältöä sekä sen vaikutusta mm. alihinnoitteluun ja yrityksen markkina-arvoon listautumisen jälkeen, mutta vähemmän huomiota on saanut tutkimus yritysjohdon näkemyksistä, miten he haluavat kertoa yrityksestä listalleottoesitteessä. Tässä yhteydessä Weickin (1988) sensemakingteorian mukaisesti yrityksen johto toteuttaa sensemakingia listautumisen informoinnissa. Tutkielman tavoitteena on saada ymmärrystä siitä, mikä on johdon päätöksentekoprosessi tunnuslukujen valinnassa. Toisekseen tutkitaan, miten johto pyrkii vaikuttamaan luottamuksen rakentamiseen sijoittajille pörssilistautumisen alkuvaiheessa. Tulokset osoittavat, että johto kokee listautumisprosessin aikaa vievänä, jossa eri sidosryhmien, kuten pankkiirien, neuvonantajien ja lakimiesten roolit ovat tärkeitä. Listautumisesitettä varten johto joutuu muokkaamaan hyvin vähän nykyisiä tunnuslukuja, ja käytettävät tunnusluvut listalleottoesitteissä ovat karkeampia kuin johdon seuraamat tunnusluvut. Tutkielma osoittaa, että johto kokee suurempaa epävarmuutta tulevaisuuden ennusteissa sekä tulevaisuuden viestinnässä kuin informoinnissa yrityksen tilasta listautumisen aikana. Tutkielman tuloksista voidaan myös päätellä, että johto joutuu perustelemaan vielä listautumisen jälkeen raadollisessa pörssimaailmassa, jossa osakkeen hinta on uskottavuuden mittari, heidän toimintaansa, jotta sijoittajat ymmärtävät esimerkiksi pidempiaikaisten investointien vaikutuksia yhtiön liiketoimintaan

    Automated energy compliance checking in construction

    Automated energy compliance checking aims to automatically check the compliance of a building design – in a building information model (BIM) – with applicable energy requirements. A significant number of efforts in both industry and academia have been undertaken to automate the compliance checking process. Such efforts have achieved various levels of automation, expressivity, representativeness, accuracy, and efficiency. Despite the contributions of these efforts, there are two main gaps in existing automated compliance checking (ACC) efforts. First, existing methods are not fully-automated and/or not generalizable across different types of documents. They require different degrees of manual efforts to extract requirements from text into computer-processable representations, and matching the concept representations of the extracted requirements to those of the BIM. Second, existing methods only focused on code checking. There is still a lack of efforts that address contract specification checking. To address these gaps, this thesis aims to develop a fully-automated ACC method for checking BIM-represented building designs for compliance with energy codes and contract specifications. The research included six primary research tasks: (1) conducting a comprehensive literature review; (2) developing a semantic, domain-specific, machine learning-based text classification method and algorithm for classifying energy regulatory documents (including energy codes) and contract specifications for supporting energy ACC in construction; (3) developing a semantic, natural language processing (NLP)-enabled, rule-based information extraction method and algorithm for automated extraction of energy requirements from energy codes; (4) adapting the information extraction method and algorithm for automated extraction of energy requirements from contract specifications; (5) developing a fully-automated, semantic information alignment method and algorithm for aligning the representations used in the BIMs to the representations used in the energy codes and contract specifications; and (6) implementing the aforementioned methods and algorithms in a fully-automated energy compliance checking prototype, called EnergyACC, and using it in conducting a case study to identify the feasibility and challenges for developing an ACC method that is fully-automated and generalized across different types of regulatory documents. Promising noncompliance detection performance was achieved for both energy code checking (95.7% recall and 85.9% precision) and contract specification checking (100% recall and 86.5% precision)

