19 research outputs found
고유명사 정규화 기법을 이용한 지식 그래프 구축
학위논문(박사) -- 서울대학교대학원 : 공과대학 산업공학과, 2023. 2. 조성준.Text mining aims to extract the information from documents to derive valuable insights. The knowledge graph provides richer information from various documents. Past literature responded for such needs by building technology trees or concept network from the bibliographic information of the documents, or by relying on text mining techniques in order to extract keywords and/or phrases. In this paper, we propose a framework for building a knowledge graph using named entities. The knowledge graph construction framework in this paper satisfies the following conditions: (1) extracting the named entity in the completed form, (2) Building datasets that can be trained and be evaluated by the named entity normalization models in various domains such as finance and technical documents in addition to bio-informatics, where existing NEN research has been active, (3) creating the better performing named entity normalization model, and (4) constructing the knowledge graph by grouping named entities with the same meaning that appear in various forms.텍스트 마이닝은 다양한 인사이트를 얻기 위해 문서에서 정보를 추출하는 것을 목표로 한다. 문서의 정보를 표현하는 방식 중 하나인 지식 그래프는 다양한 문서에서 더욱 풍부한 정보를 제공한다. 기존 연구들은 텍스트 마이닝 기법을 이용하여 문서의 정보들로 기술 트리 또는 개념 네트워크를 구축하거나 키워드 및 구문을 추출하였다. 본 논문에 서는 고유명사를 이용하여 지식 그래프를 구축하기 위한 프레임워크를 제안한다. 본 논문의 지식 그래프 구축 프레임워크는 다음과 같은 조건을 만족한다. (1) 고유명사를 사람이 이해하기 쉬운 형태로 추출한다. (2) 기존 고유명사 정규화 연구가 활발했던 생물정보학 외에 금융 문서, 반도체 관련 특허 문서에서 추출한 고유명사로 고유명사 정규화 데이터셋을 구축한다. (3) 더 나은 성능의 고유명사 정규화 모델을 구축한다. (4) 다양한 형태의 동일한 의미를 가진 고유명사를 그룹화하여 지식 그래프를 구축한다.Chapter 1 Introduction 1
Chapter 2 Literature review 5
2.1 Named entity normalization dataset 5
2.2 Named entity normalization 6
2.3 Knowledge graph construction 9
Chapter 3 Dictionary construction for named entity normalization 11
3.1 Background 11
3.2 Dictionary construction methods 12
3.2.1 Finance named entity normalization dataset 12
3.2.2 Patent named entity normalization dataset 18
3.3 Chapter summary 24
Chapter 4 Named entity normalization model using edge weight updating neural network 26
4.1 Background 26
4.2 Proposed model 28
4.2.1 Ground truth entity graph construction 31
4.2.2 Similarity-based entity graph construction 32
4.2.3 Edge weight updating neural network training 35
4.2.4 Edge weight updating neural network inferencing 38
4.3 Experiment results 39
4.3.1 Datasets 39
4.3.2 Experiment settings: named entity normalization in bioinformatics 40
4.3.3 Experiment Settings: Named Entity Normalization in Finance 42
4.4 Results 44
4.4.1 Quantitative Analysis: Bioinformatics 45
4.4.2 QuantitativeAnalysis:Finance 46
4.4.3 QualitativeAnalysis 47
4.5 Chapter summary 51
Chapter 5 Building knowledge graph using named entity recognition and normalization models 53
5.1 Background 53
5.2 Proposed model 55
5.2.1 Named entity normalization 56
5.2.2 Construction of the semiconductor-related patent knowledge graph 61
5.3 Experiment results 62
5.3.1 Comparison models 62
5.3.2 Parameters ettings 64
5.4 Results 64
5.4.1 Quantitative evaluations 64
5.4.2 Qualitative evaluations 70
5.4.3 Knowledge graph visualization and exemplary investigation 71
5.5 Chapter summary 75
Chapter 6 Conclusion 77
6.1 Contributions 77
6.2 Future work 78
Bibliography 79
국문초록 92
감사의 글 93박
GML Conversion and Database Management of S-57 Electronic Navigational Charts
Electronic Navigational Charts (ENC’s) are digital charts encoded in S-57 format, which contain navigational informations such as coastlines, depth areas, and nautical marks. Although they have been successfully used for safe navigation of ships, they have limited usages and applications because of their specialized data format and access systems. To cope with such drawbacks, S-57 ENC’s need to be transformed into more generalized format such as Geography Markup Language (GML). The transformed GML ENC’s can be kept in a database for efficiency, and can be accessed through Internet for usability. This thesis proposes a new method for transforming the S-57 ENC’s into GML for and managing the XML database on GML. S-57 ENC’s are first translated into GML data, and then stored in a XML database. On the database, users can query for their needs. To validate the feasibility of the proposed method, a prototype system is developed, and then several test runs are conducted. The system can provide users with easy access to marine informations contained in ENC’s. It also provides accessibility and efficiency, by virtue of GML and database, respectively.제 1 장 서론 = 1
제 2 장 관련 연구 = 3
2.1 S-57 전자해도 = 3
2.2 GML S-57 응용 스키마 = 9
2.3 XML 데이터베이스 = 13
2.4 XML 질의어 = 15
제 3 장 전자해도 변환 및 데이터베이스 설계 = 19
3.1 S-57 전자해도의 GML 변환 = 21
3.2 GML 전자해도의 데이터베이스 저장 = 25
3.3 GML 전자해도의 사용자 인터페이스 = 27
제 4 장 시스템의 구현 = 34
4.1 구현 환경 = 34
4.2 구현된 시스템 = 35
제 5 장 결론 = 41
참고문헌 = 4
열린충남 64호-[특집]행복한 충남, 문화융성을 위한 지역문화전략의 방향
들어가며
누구나 지금의 세계와 한국상황을 위기적 상황이자 전환의 시대로 진단한다. 독신 가정의 증가, 장기화된 경기 침체, 대규모 청년 실직, 저출산, 고령화 등으로 인해 인간 관계가 약해져 가는 사회'를 지칭하는 "무연(無緣)사회", "스마트폰에 집착하면서 세상과 관계를 맺는게 아니라 사이버네트워크에 집착하는 사회"를 일컫는 "자폐사회" 등 사회적 병리현상을 진단하고 있다.
-이후 생략들어가며
문화융성은 문화적 가치가 모든 부문에서 기본원리로 작동되는 사회
국민통합과 창조경제를 이끄는 견인차, 문화융성
지역문화융성의 성패는 사회적자본과 시민사회 형성을 위한 창조인력양성에 달려있
열린충남 60호-[특집]도민참여와 소통을 위한 충남형 거버넌스 구축 과제
충남도청이전은 격한 사회갈등을 수반하지 않은 조용한 공간의 변화이지만 큰 사회문화적 변화의 출발점이 될 것이다.
올해 말부터 충남도청을 위시하여 대전에 있던 충남교육청, 충남경찰청 등 공공기관들이 속속들이 홍성, 예산지역에 걸쳐서 건설되고 있는 내포신도시로 입주하게 된다. 충남도청은 1930년대에 공주에서 경부선과 전라선이 교차하는 대전으로 옮긴지 80년이 지나 다시 충남 땅으로 돌아오게 되었다. 1930년 공주에서 대전으로 충남도청이 이전할 때 공주유지와 시민들의 반대가 엄청 심했던 것으로 알려져 있다.
-이후 생략N/
Photoemission Study on Strain-Induced Low-Dimensional Structures of GeSi
MasterThe main challenge of the semiconductor industry is to fabricate progres-sively-smaller devices. IBM researchers succeeded in miniaturizing semicon-ductors by developing silicon/germanium alloys (Sige) in the mid-1990s. Now-adays, SiGe is a vital material for wireless technology which demands low power and low noise.Reflecting interests in miniaturization, especially in low-dimensional structure of the materials, a number of scientists have studied the electronic properties of such materials. For instance, a 1-dimensional atomic indium chain on Si(111) surface, which can be made by self-assembly, is a well-known low-dimensional material having physically novel properties. In this research, first I confirmed the possibility of using Ge_x Si_(1-x)(111) as a substrate on which to construct low-dimensional structures like Si(111). Then I fabricated stripe-shaped atomic wires on Si(111)4×1-In surfaces and studied their electronic properties. Lastly, I compared the results with those of the Saranin group.반도체 산업에서 실리콘과 게르마늄은 그 산업을 이끄는 핵심적인 역할 물질로서 존재해왔다. 최근의 전자산업에서의 화두는 이 물질들을 기반으로 하여 어떻게 하면 저전력의 소형 반도체 기기들을 만드느냐에 초점을 맞추어 연구가 진행되어 오고 있다. IBM에서는 이미 1980년대에 이러한 화두에 입각하여 기존의 기술로 소형화를 이루는데 한계가 왔음을 직시하고 다른 물질을 찾거나 합금 기술을 이용하여 이 한계를 벗어나고자 하였다. 당시 IBM의 연구원 이었던 Meyerson은 실리콘과 게르마늄을 합금하여 당면한 문제를 해결하려 노력하였고, 마침내 1990년대 중반에 기존의 실리콘 기반 반도체 부품들보다 월등한 성능으로 획을 그으면서 시장을 장악하였다. 현재는 안정성, 속도, 낮은 가격면에서 유무선 통신 산업에 사용되고 있는데, 특히 작은 사이즈와 저전력을 필요로 하는 WiFi, 휴대폰, GPS 등에 적용되고 있다. 이러한 전자산업의 관심사를 반영하여 물리학계에서도 저차원의 물질들이 갖는 전기적인 특성들을 연구하기 위해서 박차를 가하고 있으며, 실제로 1차원의 원자선들을 만들거나 2차원의 원자막을 형성하여 해당 물질의 물리적인 특성들을 연구해오고 있다. 이 논문에서는 위의 관심사들을 반영하여 Si(111)위에 Ge 원자막을 형성하여 DAS 모델의 구조를 따르는 기판을 형성하고, 해당 기판의 표면에 변형(strain)에 따른 전자구조를 Si(111)과 비교하였다. 또, 순수한 Si(111)에서의 표면 재구성(reconstruction)을 확인하여 Ge_x Si_(1-x)(111) 기판이 기존 실리콘 기판 위에서 만들 수 있던 저차원 구조들을 동일하게 만들 수 있음을 확인하였다. 또한, Si(111)에서와 같이 Saranin 연구단에서 했던 주사터널현미경 실험을 기초로 인듐과 게르마늄 합성의 1차원 원자구조를 형성하여 Si(111)4×1-In 의 실험 재현을 시도하였다. 그러나 결과는 Saranin 의 결과와 다르게 페르미 준위에 걸쳐있는 페르미 끝(edge)은 존재하지 않았다. 위쪽을 향해 있는 Ge_x Si_(1-x)(111)7×3-In 밴드가 표면 밴드인지를 명확하게 하기 위해서는 가속기와 같이 빛의 에너지를 조절할 수 있는 ARPES 실험실에서의 추가적인 실험을 필요로 한다
The significance of interleukin-1α, interleukin-2β, and interleukin-8 in aural cholesteatoma
학위논문(박사)--서울대학교 대학원 :의학과 이비인후과학전공,1995.Docto
A Spread Spectrum Clock Generator using Phase/Frequency Boosting with a peak power reduction 14.6dB, RMS jitter 1.45ps and power 4.8mW/GHz for USB 3.0
1
