6 research outputs found
데이터 마이닝을 이용한 증권사 위탁고객 이탈모형 구축
고객관리의 중요성이 비스니스 이슈로 떠오르고 있다. 어디서 고객의 데이터를 얻고 어떻게 저장할 것인가 또한 저장된 데이터로 무엇을 할 것이며 어떻게 고객관리에 활용할 것인가 에 대한 질문에 상당수의 기업들이 고민을 하고 있다.
고객관리가 우수한 기업은 고객정보에 관한 하나 하나의 작은 데이타들을 수집해 전체 조직에 걸쳐 활용 가능하도록 고객에 대한 통합정보로 구축할 수 있는 조직이다. 특히 고객과 기업이 1대 1로 상호작용하는 전자경제(eEconomy)에서 고객에 대한 통찰은 기업의 운영을 결정할 수 있는 중요요인으로써 그 중요성이 증대되고 있다.
기업 내·외부의 데이터를 전체조직의 관점에서 데이터베이스 시스탬을 구축한후, 수집된 대용량의 데이터베이스를 가공하여 기업경영에 결정적인 영향을 미칠 수 있는 지식을 발견하기 위한 일련의 작업과정 (박찬욱, 1999)라고 정의할 수 있는 데이터마이닝 을 실시하여 기업의 고객에 대한 통찰을 지원하여 기업의 고객관리 및 관계 결정에 대한 기반을 얻을 수 있다.
데이터마이닝을 통한 분석적인 접근방법은 기존의 마케팅이 갖고 있는 많은 문제점을 해결할 수 게 되었다. 데이터마이닝을 바탕으로 성공적인 CRM(Customer Relationship management) 도입을 통해 기업들은 기존고객의 충성도 증가, 신규고객의 유치실적 증가, 기존 및 신규고객의 만족도 향상, 그리고 경영에 있어서의 효율성 및 효과성의 증진 등을 기대할 수 있게 된 것이다.
본 연구에서는 최근 새로운 매체의 등장으로 방대한 양의 고객데이터관리 및 CRM의 필요성이 중요시되고 있는 증권사의 종업원, 경영자 뿐만 아니라 기업 활동에 관계되는 모든 이해관계자들에게 해당기업의 고객의 이탈유형 및 이탈가능성을 조기에 발견하게 함으로써 적절한 마케팅 대책및 기획을 지원하기 위해 데이터마이닝을 이용하여 이탈모형을 구축하였다.
모형의 실험을 위하여 약 5,000명의 증권고객 데이터를 가지고 데이터마이닝 기법중 인공신경망(artificial neural network)과 의사결정나무(desicision tree)를 사용하여 고객이탈모형을 구축 실험하였다.논문초록
1. 서론 = 9
1.1 연구 목적 및 배경 = 9
1.2 연구 범위 및 논문 구성 = 11
2. 금융계의 경제현황과 고객이탈 방지를 위한 데이터마이닝 = 12
3. 데이터 마이닝 = 12
3.1 데이터 마이닝 개념 = 12
3.2 데이터 마이닝 단계 = 12
3.3 데이터 마이닝 특징 = 16
3.4 인공신경망 모형 = 17
3.4.1 인공신경망 모형의 개념 = 17
3.4.2 인공신경망 모형의 구조 = 19
3.4.3 인공신경망 모형의 장점 = 21
3.4.4 인공신경망 모형의 단점 = 23
3.4.5 인공신경망 모형의 응용분야 = 24
3.5 의사결정나무 모형 = 26
3.5.1 의사결정나무 모형의 개념 = 26
3.5.2 의사결정나무 모형의 형성 = 26
4. 위탁고객의 이탈 사례분석 = 29
4.1 이탈사례분석의 목적 = 29
4.2 이탈모형과 변수생성 = 29
4.3 데이터 분석 Process와 데이터분할 = 30
4.4 의사결정나무모형 분석결과 = 31
4.5 인공신경망 모형 분석결과 = 35
4.6 의사결정나무 모형과 인공신경망모형 분석결과 = 38
5. 결론 = 43
참고문헌
부
A Review of Test Methods for Microarray data using R
Microarray는 염기서열을 알고 있는 DNA를 일정 크기의 유리 슬라이드에 배열(array)해 놓고 sample DNA와 결합(hybridization)을 시켜 유전자(gene)들의 발현도(expression level)를 알아보는 실험이다. 수십 개에서 수십만 개의 유전자 조각들을 하나의 작은 고형체 기판 위에 놓기 때문에 전체에 대한 정보를 한 번의 실험에서 얻을 수 있다는 장점이 있다. 이 유전자들을 유전자마다 유의한 차이가 있는지 알아보기 위해서 Microarray에 있는 유전자만큼의 검정을 하게 된다. 수천 번 또는 수만 번의 통계적 검정을 시행하면 오류가 누적되어 전체 오류의 확률은 상당히 커지게 된다. 이러한 문제를 보완하기 위해 SAM(Significance Analysis of Microarrays)을 이용하여 검정을 하였다. 실제 데이터를 가지고 일반적인 t-test와 Bonferroni correction을 사용하면 어떠한 유전자도 유의한 차이가 있다고 할 수 없었고 SAM을 사용하였을 때 더 좋은 결과를 얻을 수 있었다.;A DNA microarray (also commonly known as gene or genome chip, DNA chip, or gene array) is a collection of microscopic DNA spots, commonly representing single genes, arrayed on a solid surface by covalent attachment to a chemical matrix. DNA arrays are different from other types of microarray only in that they either measure DNA or use DNA as part of its detection system. Qualitative or quantitative measurements with DNA microarrays utilize the selective nature of DNA-DNA or DNA-RNA hybridization under high-stringency conditions and fluorophore-based detection. DNA arrays are commonly used for expression profiling, i.e., monitoring expression levels of thousands of genes simultaneously, or for comparative genomic hybridization. Microarrays can measure the expression of thousands of genes to identify changes in expression between different biological states. Methods are needed to determine the significance of these changes while accounting for the enormous number of genes. We describe a method, Significance Analysis of Microarrays (SAM), that assigns a score to each gene on the basis of change in gene expression relative to the standard deviation of repeated measurements.논문개요 = viii
I. 서론 = 1
II. Preprocessing of Microarray = 3
A. Microarray 기본 원리와 실험 과정 = 3
B. Preprocessing = 5
1. Image analysis and Data import = 6
2. Background adjustment = 7
가. RMA convolution = 8
나. MAS 5.0 background = 9
다. Ideal mismatch = 9
3. Normalization = 10
가. Scaling = 11
나. Non-linear methods = 11
다. Quantile normalization = 11
라. Cyclic loess = 12
마. Contrast normalization = 12
바. vsn = 13
4. Summarization = 13
가. expresso = 13
나. threestep = 14
다. RMA = 14
라. GCRMA = 15
마. affypdnn = 16
5. Quality Assessment = 17
III. 검정 = 18
A. FWER(Family-wise Error Rate) = 18
B. FDR(False Discovery Rate) = 19
C. SAM(Significance Analysis of Microarrays) = 19
IV. 실제 검정 = 21
V. 결론 = 24
참고문헌 = 25
Abstract = 2
