8 research outputs found

    (A) study on the prediction of Korean firms' bankruptcy using various statistical techniques

    No full text
    학위논문(석사) - 한국과학기술원 : 금융공학프로그램, 2020.2,[ii, 35 p. :]기업의 부도를 예측하는 것은 지난 수십년 동안 많은 감독기관들, 경제학자들과 금융 전문가들로 부터 상당한 관심을 끌었다. 그러나 대부분의 연구들은 로지스틱 회귀 분석과 선형판별분석과 같 은 단순한 분류기에 의존해왔다. 본 연구는 한국의 기업 부도 사례를 바탕으로 가장 단순한 분류 기(로지스틱, 프로빗, 선형판별분석 등)부터 심층신경망, 서포트벡터머신, 그라이디언트 부스팅과 같은 최신 분류기까지의 성과를 비교한다. Jones et al(2015)의 연구 결과와 일관되게 로지스틱, 선형판별분석과 같은 꽤 단순한 분류기들도 한국 시장에서 부도 예측을 상당히 잘한다는 것을 확 인할 수 있었다. 그러나 부도 예측에 있어서 최신 분류기를 사용할 것을 권고한다. 그 이유는 다음과 같다. (1) 횡단면 분석과 종단면 분석 모두에서 다른 분류기들보다 우수한 예측력을 보인다. (2) 데이터 가공, 변수 선택 등에 대해 연구자의 최소한의 간섭만 요구하기 때문에 모델 구현이 상대적으로 쉽고 실용적이다. (3) 기초 모델 구조는 복잡할 수 있지만, 최신 분류기들은 상대적 변수 중요도와 같은 측정기준을 통해 상당히 양호한 수준의 해석성을 가진다.한국과학기술원 :금융공학프로그램

    Improving I/O efficiency in Hadoop-based Massive Data Analysis programs

    No full text
    Apache Hadoop has been a popular parallel processing tool in this era of big data. While practitioners have rewritten many conventional analysis algorithms to make them accustomed to Hadoop, the I/O inefficiency of Hadoop-based programs has been repeatedly reported in the literature. In this article, we address the problem of I/O inefficiency in Hadoop-based massive data analysis by introducing our efficient modification of Hadoop. We first incorporate a columnar data layout into the conventional Hadoop framework without any modification of the Hadoop internals. We also provide an indexing capability into Hadoop to save many I/Os while processing not only selection predicates but also star-join queries which are frequently used in many analysis tasks

    An efficient predicate indexing method over continuous data streams

    No full text
    학위논문(석사) - 한국과학기술원 : 전산학전공, 2008. 8., [ iv, 42p. ]경매, 주식 거래, 네트워크 통계 등의 응용에서는 많은 수의 범위 질의가 연속 데이터 스트림에 대해 이루어진다. 이 질의들을 연속 스트림 상에서 효율적으로 처리하기 위해서 일반적으로 술어 색인이 이용된다. 기존에 많은 술어방식이 제안되었지만 모두 스트림 환경에 적합하지는 않다. IBS-tree는 스트림 환경에 적합한 술어 색인 방법 중 하나이다. 하지만 IBS-tree는 트리의 각 노드마다 불필요한 등호 검사를 수행하기 때문에 질의의 수가 늘어남에 따라 검색 성능이 나빠질 수 있다. 이 문제점을 해결하기 위하여 본 논문에서는 등호 검사를 트리로부터 분리하고 이를 위해 해시 테이블을 사용하여 검색 성능을 향상시킨 PRINS(PRedicate INdex over Streams)라는 술어 색인 방법을 제안한다. 등호 검사의 분리는 트리의 각 노드에서의 비교 횟수를 줄이고 트리의 높이가 낮아지도록 한다. 본 논문에서는 한 입력값에 대한 비교 횟수의 기대값을 통해 두 방법의 검색 비용 식을 구하여 분석하였다. 이 비용 식을 통해 PRINS의 검색 성능이 IBS-tree보다 좋다는 것을 보였다. 또한 실험을 통해 이를 확인하였다.한국과학기술원 : 전산학전공
    corecore