19 research outputs found
Entity Resolution Approach of Data Stream Management Systems
Owing to the technological advancements in Semantic Web and sensor networks, a large amount of data has been produced in association with the open data policy. However, data stream management systems that process stream data have focused on the processing of a large amount of data with little priority on data identification, integration, and external linkage. Furthermore, entity resolution is focused mainly on static database-based technologies. In this study, a real-time stream data processing architecture that can perform the integration and entity resolution of streaming-type heterogeneous input data and interlink with external data is designed. To achieve this goal, a light adapter to integrate heterogeneous data into standard scheme and blocking technique to reduce comparison candidates are applied. The implemented data adapters shows 4 times higher throughput than open source data parsers and the entity resolution results with streaming data shows similar performance with the static data sets. The proposed streaming data entity resolution architecture is expected to form the basis of data integration research that can integrate various information sources of data efficiently, enrich internal data
Construction of bioinformatics service system
funder : 국무조정실agency : 국무조정실- 바이오인포매틱스 연구 지원을 위한 시스템 도입 및 운영 서비스 체제 구축 /
- KISTI 생물정보센터의 와 를 생물정보 연구 16-node Compaq SMP Cluster와 48-node PC Cluster
에 효과적으로 사용하기 위한 바이오인포매틱스 서비스 지원 시스템을 구축함
- 관리자 지원 시스템 사용자 지원 시스템 생물정보 도구의 세 부분이 서로 밀접하게 연계된 통합 시스템을 구축함으로써 시스템 관리자와 사용자에게 최대한의 편의를 제공
- MRTG 기능을 확장하여 바이오인포매틱스 시스템과 같은 특정 시스템의 이용현황을 분석할 수 있는 소프트웨어를 설계하고 개발
- MRTG 기존의 에서 측정데이터의 저장에 활용하지 않았던 데이터베이스를 이용하여 데이터를 보관하고 저장할 수 있는 체계 구축
- 한국형 유전질환 DB OMIK(Online Mendelian Inheritance in Korea)의 개선을 위해 국내외 의학문헌에 보고된 한국인 환자대상 유전질환 논문들을 총망라하여 277건을 새로 추가
- OMIK 시스템 개선을 위해 입력 브라우징 통계 및 업데이트 등 기존 화면 수정 개선 및 인터페이스 개선III. Content and scope of the study
o Introduction and administration of bioinformatics computing
resources
.Planning, assessment, selection and test for system introduction
.Operation and administration of system resources
.Development of manage
o Establishment of bioinformatics databases and software system
.Building up databases and software system
.Update and upgrade of databases and software system
.System integration
o Establishment of web- based service system
.Building up web- based system
.Development web interfaces syste
Query Language Automatic Input System Using Topic Information And Method Thereof, And Media That Can Record Computer Program Sources For Method Therof
Query Language with title, writer, abstract information Automatic Input System And searching result offer Method Thereof, And Media That Can Record Computer Program Sources For Method Therof
Translation of technical terminologies between English and Korean based on textual big data
A number of web applications provide completely automated machine translation services, allowing users
to easily translate information of interest. However, these services still generate inaccurate results when
translating technical terminologies. Therefore, we propose a new method that collects reliable pairs of
English뻂orean technical terms and translates the given English terminology to Korean. To collect the
pairs, we utilize textual big data, such as Korean academic papers, and develop a new statistical model to
determine appropriate characteristics. Our method is evaluated in terms of the reliability of English뻂orean
pairs and the precision of translation. We thus confirm that our method can produce highly reliable data and
can positively influence the translation quality of technical terminologies. Copyright 2014 John Wiley Sons, Ltd
Query Language Expansion System Using Vocabulary Networks And Method Thereof, And Media That Can Record Computer Program Sources For Method Therof
Development of Information Technology Based Lifeinformatics Systems
funder : 과학기술부agency : 과학기술부agency : Ministry of Science & Technology본 연구개발의 목적은 국내 생명공학 연구진흥을 위한 바이오인포매틱스 주요 기술의 국산화 및 바이오인포매틱스 연구개발에 대한 기반 인프라를 조성하는 것으로서, 기술자립에 이바지하며, 기반 기술을 통해 새로운 유전자 또는 신약후보물질 발견에 밑거름이 되어 제약 및 생명공학 분야의 발전에 기여한다.
이를 위해 본 연구 기관에서는 " 생명정보 시스템 개발" 이라는 연구 과제에서 다음과 같은 연구 성과를 얻었다.
(1) 생명정보 검색시스템 (Bio-KRISTAL) 개발
(2) 색인기반 단백질서열정보검색시스템 개발
(가) ProSeS(Protein Sequence Search 시스템: 색인기반 단백질서열 분석시스템) 구축
(나) ProNGF (Protein N-Gram Frequency: 단백질 N-Gram 빈도 데이터베이스) 구축
(3) 색인기반 단백질서열분류시스템 구축
(가) ProSLP (Protein Subcellular Localization Prediction: 단백질 세포내 위치예측) 데이터베이스 구축
(나) ` ProFaC (Protein Family Classification: 단백질서열 기능분류) 서비스 시스템 개발
(4) 신호전달 DB 구축 및 네비게이션 시스템 개발
(5) Protein Side Chain Interaction 계산 프로그램 개발
또한, 기본 연구에 전념할 수 있는 대학 뿐 아니라, 응용기술을 개발할 수 있는 기업들과의 협동연구를 적극적으로 추진하여 기반기술 및 응용기술 보유에도 성과를 거두었다.Our contribution aims at localizing essential lifeinformatics technologies in order to develop our domestic biotechnology R&D capacity, and at building up an infrastructure for research and development in lifeinformatics. With these research projects, we can replace foreign protein-related search systems and analysis softwares by our products. Also, with the accumulation of the essential lifeinformatics technologies, we can pioneer new applications of biotechnology and lifeinformatics, and assist biotechnology-related researchers in discovering new proteins or candidates for new medicines so that we can contribute greatly toward the advance of medicine and biotechnology
