7 research outputs found

    RDB to RDF 변환을 위한 의미 정보 보존 맵리듀스 처리

    Get PDF
    학위논문 (석사)-- 서울대학교 대학원 : 전기·컴퓨터공학부, 2015. 8. 김형주.Today, most of the data on the web is stored in relational databases, which is called deep web. Semantic web is a movement to the next generation of the web, where all data are augmented with well-defined semantics and linked together in machine-readable format. RDB2RDF approaches have been proposed and standardized by W3C, which publishes relational data to semantic web by converting relational data into RDF formatted data. We propose a system that automatically transforms relational data into RDF data and creates OWL ontology based on the schema of database. Some approaches have been proposed, but most of them did not fully make use of schema information to extract rich semantics, nor did they experimented on large databases for performance. We utilize Hadoop framework in transformation process, which enables distributed system for scalability. We present mapping rules that implements augmented direct mapping to create local ontology with rich semantics. The results show that our system successfully transforms relational data into RDF data with OWL ontology, with satisfactory performance on large-sized databases.Abstract i Introduction 3 Related Work 7 2.1 Semantic ETL Systems 7 2.2 Hadoop MapReduce 8 2.3 Mapping Approaches 9 Mapping Rules 14 3.1 General Rule 1 19 3.2 General Rule 2 20 3.3 General Rule 3 20 3.4 General Rule 4 21 3.5 General Rule 5 21 3.6 Constraint Rule 1 22 3.7 Constraint Rule 2 22 3.8 Constraint Rule 3 23 3.9 Constraint Rule 4 24 3.10 Constraint Rule 5 24 3.11 Constraint Rule 6 25 3.12 Discussion 26 Our Approach 28 4.1 Preprocessing 28 4.1.1 Schema Caching Method 30 4.1.2 Relational Data 32 4.2 Hadoop Algorithm 33 Experiment 36 5.1 Ontology Extraction 37 5.2 Performance 38 5.3 Scalability 41 Conclusion 42 Reference 44 Appendix 46Maste

    한국 IPO 기업을 중심으로

    No full text
    학위논문(석사) - 한국과학기술원 : 금융공학프로그램, 2021.8,[iv, 49 p. :]본 논문은 나이브 베이지안(Naïve Bayesian) 머신 러닝 알고리즘을 활용하여 유가증권시장 및 코스닥시장에 신규 상장된 기업이 제출한 투자설명서에 대하여 텍스트 분석을 수행하였다. 투자설명서 중 투자위험요소에 대해 보수주의를 측정하였고, 그것이 상장 후 주가성과와 영업 성과에 미치는 영향을 알아보았다. 분석 결과 IT산업에 해당하는 기업의 경우, 투자위험요소가 부정적으로 기재된 기업일수록 공모가 대비 3거래일 종가 및 20거래일 종가로 측정한 단기 초과수익률이 높게 나타날 가능성이 있음을 확인하였다. 한편, 투자위험요소 어조의 부정적인 정도는 상장 후 자산총이익률(ROA)로 측정한 영업성과와 장기주가성과에 대해서는 통계적으로 유의한 설명력을 제공하지 못했다.한국과학기술원 :금융공학프로그램

    An analysis on the application of CD-ROMs for English teaching in Korean elementary schools

    No full text
    corecore