8 research outputs found
초미세 회로 설계를 위한 인터커넥트의 타이밍 분석 및 디자인 룰 위반 예측
학위논문 (박사) -- 서울대학교 대학원 : 공과대학 전기·컴퓨터공학부, 2021. 2. 김태환.타이밍 분석 및 디자인 룰 위반 제거는 반도체 칩 제조를 위한 마스크 제작 전에 완료되어야 할 필수 과정이다.
그러나 트랜지스터와 인터커넥트의 변이가 증가하고 있고 디자인 룰 역시 복잡해지고 있기 때문에 타이밍 분석 및 디자인 룰 위반 제거는 초미세 회로에서 더 어려워지고 있다.
본 논문에서는 초미세 설계를 위한 두가지 문제인 타이밍 분석과 디자인 룰 위반에 대해 다룬다.
첫번째로 공정 코너에서 타이밍 분석은 실리콘으로 제작된 회로의 성능을 정확히 예측하지 못한다. 그 이유는 공정 코너에서 가장 느린 타이밍 경로가 모든 공정 조건에서도 가장 느린 것은 아니기 때문이다. 게다가 칩 내의 임계 경로에서 인터커넥트에 의한 지연 시간이 전체 지연 시간에서의 영향이 증가하고 있고, 10나노 이하 공정에서는 20%를 초과하고 있다. 즉, 실리콘으로 제작된 회로의 성능을 정확히 예측하기 위해서는 대표 회로가 트랜지스터의 변이 뿐만아니라 인터커넥트의 변이도 반영해야한다. 인터커넥트를 구성하는 금속이 10층 이상 사용되고 있고, 각 층을 구성하는 금속의 저항과 캐패시턴스와 비아 저항이 모두 회로 지연 시간에 영향을 주기 때문에 대표 회로를 찾는 문제는 차원이 매우 높은 영역에서 최적의 해를 찾는 방법이 필요하다. 이를 위해 인터커넥트를 제작하는 공정(백 엔드 오브 라인)의 변이를 반영한 대표 회로를 생성하는 방법을 제안하였다. 공정 변이가 없을때 가장 느린 타이밍 경로에 사용된 게이트와 라우팅 패턴을 변경하면서 점진적으로 탐색하는 방법이다. 구체적으로, 본 논문에서 제안하는 합성 프레임워크는 다음의 새로운 기술들을 통합하였다: (1) 라우팅을 구성하는 여러 금속 층과 비아를 추출하고 탐색 시간 감소를 위해 유사한 구성들을 같은 범주로 분류하였다. (2) 빠르고 정확한 타이밍 분석을 위하여 여러 금속 층과 비아들의 변이를 수식화하였다. (3) 확장성을 고려하여 일반적인 링 오실레이터로 대표회로를 탐색하였다.
두번째로 디자인 룰의 복잡도가 증가하고 있고, 이로 인해 표준 셀들의 인터커넥트를 통한 연결을 진행하는 동안 디자인 룰 위반이 증가하고 있다. 게다가 표준 셀의 크기가 계속 작아지면서 셀들의 연결은 점점 어려워지고 있다. 기존에는 회로 내 모든 표준 셀을 연결하는데 필요한 트랙 수, 가능한 트랙 수, 이들 간의 차이를 이용하여 연결 가능성을 판단하고, 디자인 룰 위반이 발생하지 않도록 셀 배치를 최적화하였다. 그러나 기존 방법은 최신 공정에서는 정확하지 않기 때문에 더 많은 정보를 이용한 회로내 모든 표준 셀 사이의 연결 가능성을 예측하는 방법이 필요하다. 본 논문에서는 기계 학습을 통해 디자인 룰 위반이 발생하는 영역 및 개수를 예측하고 이를 줄이기 위해 표준 셀의 배치를 바꾸는 방법을 제안하였다. 디자인 룰 위반 영역은 이진 분류로 예측하였고 표준 셀의 배치는 디자인 룰 위반 개수를 최소화하는 방향으로 최적화를 수행하였다. 제안하는 프레임워크는 다음의 세가지 기술로 구성되었다: (1) 회로 레이아웃을 여러 개의 정사각형 격자로 나누고 각 격자에서 라우팅을 예측할 수 있는 요소들을 추출한다. (2) 각 격자에서 디자인 룰 위반이 있는지 여부를 판단하는 이진 분류를 수행한다. (3) 메타휴리스틱 최적화 또는 베이지안 최적화를 이용하여 전체 디자인 룰 위반 개수가 감소하도록 각 격자에 있는 표준 셀을 움직인다.Timing analysis and clearing design rule violations are the essential steps for taping out a chip. However, they keep getting harder in deep sub-micron circuits because the variations of transistors and interconnects have been increasing and design rules have become more complex. This dissertation addresses two problems on timing analysis and design rule violations for synthesizing deep sub-micron circuits.
Firstly, timing analysis in process corners can not capture post-Si performance accurately because the slowest path in the process corner is not always the slowest one in the post-Si instances. In addition, the proportion of interconnect delay in the critical path on a chip is increasing and becomes over 20% in sub-10nm technologies, which means in order to capture post-Si performance accurately, the representative critical
path circuit should reflect not only FEOL (front-end-of-line) but also BEOL (backend-of-line) variations. Since the number of BEOL metal layers exceeds ten and the layers have variation on resistance and capacitance intermixed with resistance variation on vias between them, a very high dimensional design space exploration is necessary to synthesize a representative critical path circuit which is able to provide an accurate performance prediction. To cope with this, I propose a BEOL-aware methodology of synthesizing a representative critical path circuit, which is able to incrementally explore, starting from an initial path circuit on the post-Si target circuit, routing patterns (i.e., BEOL reconfiguring) as well as gate resizing on the path circuit. Precisely, the
synthesis framework of critical path circuit integrates a set of novel techniques: (1) extracting and classifying BEOL configurations for lightening design space complexity, (2) formulating BEOL random variables for fast and accurate timing analysis, and (3) exploring alternative (ring oscillator) circuit structures for extending the applicability of this work.
Secondly, the complexity of design rules has been increasing and results in more design rule violations during routing. In addition, the size of standard cell keeps decreasing and it makes routing harder. In the conventional P&R flow, the routability of pre-routed layout is predicted by routing congestion obtained from global routing, and then placement is optimized not to cause design rule violations. But it turned out to be inaccurate in advanced technology nodes so that it is necessary to predict routability with more features. I propose a methodology of predicting the hotspots of design rule violations (DRVs) using machine learning with placement related features and the conventional routing congestion, and perturbating placed cells to reduce the number of DRVs. Precisely, the hotspots are predicted by a pre-trained binary classification model and placement perturbation is performed by global optimization methods to minimize the number of DRVs predicted by a pre-trained regression model. To do this, the framework is composed of three techniques: (1) dividing the circuit layout into multiple rectangular grids and extracting features such as pin density, cell density, global routing results (demand, capacity and overflow), and more in the placement phase, (2) predicting if each grid has DRVs using a binary classification model, and (3) perturbating the placed standard cells in the hotspots to minimize the number of DRVs predicted by a regression model.1 Introduction 1
1.1 Representative Critical Path Circuit . . . . . . . . . . . . . . . . . . . 1
1.2 Prediction of Design Rule Violations and Placement Perturbation . . . 5
1.3 Contributions of This Dissertation . . . . . . . . . . . . . . . . . . . 7
2 Methodology for Synthesizing Representative Critical Path Circuits reflecting BEOL Timing Variation 9
2.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Definitions and Overall Flow . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Techniques for BEOL-Aware RCP Generation . . . . . . . . . . . . . 17
2.3.1 Clustering BEOL Configurations . . . . . . . . . . . . . . . . 17
2.3.2 Formulating Statistical BEOL Random Variables . . . . . . . 18
2.3.3 Delay Modeling . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.4 Exploring Ring Oscillator Circuit Structures . . . . . . . . . . 24
2.4 Experimental Results . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.5 Further Study on Variations . . . . . . . . . . . . . . . . . . . . . . . 37
3 Methodology for Reducing Routing Failures through Enhanced Prediction on Design Rule Violations in Placement 39
3.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Overall Flow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3 Techniques for Reducing Routing Failures . . . . . . . . . . . . . . . 43
3.3.1 Binary Classification . . . . . . . . . . . . . . . . . . . . . . 43
3.3.2 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3.3 Optimization . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.4 Placement Perturbation . . . . . . . . . . . . . . . . . . . . . 47
3.4 Experiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.4.1 Experiments Setup . . . . . . . . . . . . . . . . . . . . . . . 51
3.4.2 Hotspot Prediction . . . . . . . . . . . . . . . . . . . . . . . 51
3.4.3 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.4.4 Placement Perturbation . . . . . . . . . . . . . . . . . . . . . 57
4 Conclusions 61
4.1 Synthesis of Representative Critical Path Circuits reflecting BEOL Timing Variation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Reduction of Routing Failures through Enhanced Prediction on Design Rule Violations in Placement . . . . . . . . . . . . . . . . . . . . . . 62
Abstract (In Korean) 69Docto
Effect of Lock-up Control Strategy on Vehicle Fuel Economy
학위논문(석사)--아주대학교 대학원 :기계공학과,2005자동변속기 장착 차량은 이전의 수동변속기에 비해 변속 시점을 적절하게 제어함에도 불구하고 수동변속기 장착 차량보다 연비가 안 좋은 것으로 평가 받는다. 이는 토크컨버터에서의 동력 손실에 의한 영향이다. 이러한 손실을 줄이기 위해서는 고속에서의 적절한 직결영역 설정이 필요하다. 직결영역 설정에 따라 차량의 연비 차이가 존재하므로 차량의 운전성을 해치지 않는 범위에서 가장 좋은 연비를 갖는 최적의 직결영역 설정이 중요하다.
2.4L 차량으로 3, 4단에서 엔진 회전수가 1200(rpm)일 때 직결되는 경우와 4단 1200(rpm)에서 직결되는 경우로 나누어 샤시 동력계에서 FTP-75 모드를 따라 주행한 결과 3, 4단에서 직결한 경우가 약 2.75%의 연비 이득을 얻을 수 있었다. 차량의 데이터를 취득하여 분석한 결과, 토크컨버터에서의 손실이 2.0(%) 열세, 불완전 연소에 의한 손실이 1.66(%) 열세, 엔진 제동효율 측면에서 1.6(%) 우세한 순서로 차량 연비 특성을 결정하는데 기여하였다. 직결영역을 4단 1400(rpm) 이상으로 제한한 경우 토크컨버터에서의 임펠러와 터빈이 거의 직결되지 않았고 주행 시 비직결로 인한 엔진 회전속도가 높게 형성되어 엔진 총 사이클이 증가하여 연료소모가 높게 나타났다. 그리고 높은 엔진 회전 속도는 엔진의 마찰 손실을 추가적으로 가져왔다. 감속 직결제어는 연료소모를 줄이는 동시에 차량 관성에너지를 회생하여 엔진의 회전 속도를 유지하는데 이용되었다.
차량의 실 주행 데이터를 적용하여 2.0L 차량을 모델링하고 FTP-75 모드를 시뮬레이션 한 결과 엔진 회전속도가 1200(rpm)일 때 직결하고 900(rpm)까지 감속직결을 적용할 경우 직결하지 않은 경우보다 6.9(%)의 연비 향상을 얻을 수 있었다. 직결되는 영역을 1200(rpm) 이하로 설정할 때에는 변속 후 가속되는 과도구간이기 때문에 연비 특성이 0.09% 나빠졌다. 따라서 시뮬레이션을 통하여 연비 특성이 좋은 영역을 설정하는 것은 시간과 노력을 줄일 수 있는 효과적인 방법이라 판단된다.목차Ⅲ
그림차례ⅴ
표차례Ⅶ
기호설명Ⅷ
1. 서론 = 1
1.1 연구 배경 및 목적 = 1
1.2 연구 내용 = 2
2. 차량 모델링과 연비관련 인자에 대한 모델링 = 4
2.1 차량에 대한 모델링 = 4
2.1.1 엔진부 = 7
2.1.2 동력전달부 = 10
2.2 마찰토크, 질량관성 모멘트 측정을 위한 수식화 = 13
2.2.1 엔진의 총 마찰토크 및 질량관성 모멘트 = 13
2.2.2 동력전달부의 마찰토크 및 질량관성 모멘트 = 14
3. 실험장치 및 방법 = 18
3.1 실험장치 = 18
3.2 실험방법 = 21
4. 직결영역 변화에 따른 연비 기여도 분석 = 24
4.1 직결영역의 구분 = 24
4.2 마찰토크 및 질량관성모멘트의 측정 = 27
4.2.1 엔진부의 총 마찰토크 및 질량관성모멘트 측정 = 27
4.2.2 동력전달부의 마찰토크 및 질량관성모멘트 측정 = 29
4.3 연비 기여도 분석 = 30
4.3.1 엔진마찰 손실 = 32
4.3.2 토크컨버터 손실 = 35
4.4 제어특성 비교 = 37
5. 최적의 직결영역을 찾기 위한 차량 모델링 및 시뮬레이션 = 43
5.1 차량 모델링 = 43
5.2 연비 개선을 위한 최적의 직결영역 설정 = 45
6. 결론 = 49
7. 참고문헌 = 51
ABSTRACT = 52MasterTorque converter efficiency increases with a speed ratio until it reaches the coupling point. To avoid efficiency drop after the coupling point, the lock-up clutch is usually adopted in modern system. However, the driveability can be also affected by the Lock-up control. Therefore, the lock-up control strategy should be decided in view of vehicle fuel economy and driveability.
Experiments are conducted to compare fuel economy of FTP-75 mode on two different lock-up conditions; (A) Lock-up on at engine speed of 1,200(rpm) and above for 3^(rd) & 4^(th) gear, (B) Lock-up on at engine speed of 1400rpm and above for 4^(th) gear only.
As a result, case A had better fuel economy about 2.75(%) than case B for FTP-75 mode. The analysis of experimental data, showed that the reason of the fuel economy difference is derived from the reduction of torque converter loss(2.0%), improvement of combustion efficiency(1.7%), improvement of engine brake efficiency(1.6%). The reason are as follows; Engine speed of case B is higher than that of case A and fuel consumption get also larger as total engine cycle increase. In addition, higher engine speed causes additional engine friction loss.
Simulation(CRUISE, AVL) study is also carried out in order to estimate the effect of Lock-up control strategy for vehicle fuel economy. The fuel economy simulation result agrees with the measured fuel economy within error of 2(%). The improved Lock-up control strategy is proposed by simulation
역전사-중합효소연쇄반응(RT-PCR)을 이용 혈청으로부터 HIV-1 Viral RNA 검사에 관한 연구
학위논문(석사)--서울대학교 보건대학원 :보건학과 인구학전공,1997.Maste
A Case-control Study of Sasang Constitution and Relative Risk of Stroke
역학통계학과/석사[한글]전 세계적인 추세인 인구 노령화와 이에 따라 증가하는 뇌졸중은 중요한 보건문제로 대두되고 있다. 뇌졸중은 사람의 체질에 따라 차이가 있으며, 뇌졸중의 발생도 체질적 불균형에서 그 원인을 찾을 수 있다.이 연구는 사상체질검사지로 분류된 체질에 따라 뇌졸중의 발생위험에 차이가 있는가를 알아보고, 사상체질을 포함한 뇌졸중 발병위험을 예측할 수 있는 회귀모형과 뇌졸중 위험군을 조기에 파악할 수 있는 최적의 의사결정 모형을 개발하는데 있다.연구방법은 뇌졸중 환자등록사업에 포함되어 사상체질설문검사를 시행한 환자군과 건강인 대조군을 1:1 단순 무작위 층화추출하여 수행한 환자대조군 연구이다. 연구자료는 연구 참여를 자발적으로 동의한 환자를 대상으로 서면 동의서를 받고 증례기록지를 표준작업지침서에 의거하여 작성하여 환자군의 자료를 취득하였다. 환자군은 서울, 경인지역의 3개 대학부속병원에 입원하여 생애 처음으로 뇌졸중으로 진단받은 발병 2주(14일)이내의 급성기 뇌졸중 환자를 대상으로 하였다. 대조군은 경기도 소재 대학부속병원에 검진을 위하여 방문하여 사상체질검사를 포함한 종합검진을 시행한 사람중 건강상의 이상을 느끼거나 의사의 권유로 검사를 시행한 사람을 제외하고, 검진사유가 정기적으로 검사 받기 때문이거나 직장의 단체검진 혹은 가족 및 친지의 권유 때문이라고 답한 사람들로 하였다. 검진결과 혹은 검진후 뇌졸중환자로 확인된 경우는 제외하였다.연구대상자는 환자군 331명, 대조군 331명으로 총 662명이며, 수집된 자료의 분석은 뇌졸중 발생위험요인들의 단일변량 분석으로 질적변수에 대해서는 카이제곱검정 또는 Fisher's exact test를 시행하고, 양적변수에 대해서는 독립 t검정을 시행하였다. 사상체질과 뇌졸중 발생위험요인의 분석은 로지스틱 회귀분석을 시행하여 비교위험도를 구하고, 교호작용을 확인하였다. Hosmer-Lemeshow 검정값을 이용하여 적합한 회귀모형을 구축하고, 또한 CART(Classification and regression tree) 알고리즘을 이용한 의사결정나무분석을 통하여 뇌졸중 발생을 결정하는 통계학적 분류 모형을 구축하였다.로지스틱회귀모형을 통하여 연령과 성별을 통제한 상태에서 사상체질분류에 따른 뇌졸중 발생 비교위험도는 태음인에 비하여 소양인일 경우 뇌졸중 발생 비교위험도가 1.75배 높았으며 통계학적으로 유의하였다(OR=1.75, 95% CI 1.23-2.49). 하지만 과거 비만도와 허리둘레, 고혈압과 당뇨의 과거력, 과거의 음주와 흡연 등을 고려하면 더욱 좋은 모형이 되며, 이때의 회귀모형에서 구해진 태음인에 비하여 소양인일 경우의 뇌졸중 발생 비교위험도는 6.34배이었으며(OR=6.34, 95% CI 3.08-13.04), 모델의 적합도를 보는 Hosmer & Lemeshow 테스트 결과도 적합하였다(X2=3.63, P-value=0.89).CART알고리즘의 의사 결정나무 모형을 통해 뇌졸중 발생을 결정하는 통계학적 분류 모형을 구축한 결과 가장 우선적으로 관여하는 변수는 심혈관질환 위험요인에 관한 과거력 유무(고혈압, 고지혈증, 당뇨병, 허혈성심질환, 일과성뇌허혈발작중 하나라도 있는 경우)였으며, 과거력이 없는 군에서는 소양인이냐 그렇지 않느냐로 가장 크게 대별되었으며, 소음인과 태음인에서는 음주여부가 그 다음 관여하는 분류변수였고, 소양인에서는 과거 규칙적인 운동여부가 그 다음 관여하는 분류변수이었다. CART 의사결정나무모형의 오분류율은 0.274이었다.본 연구를 통하여 사상체질에 따라 뇌졸중 발병위험의 차이가 있음을 알았고, 다른 심혈관질환 위험인자를 함께 가지고 있는 경우 교호작용으로 위험도가 크게 증가하며, 사상체질을 포함한 뇌졸중 예측모형을 개발할 수 있다는 가능성을 본 것은 연구의 의의라고 할 수 있다.
[영문]Aging population is a global trend, and increasing cases of stroke is becoming an important public health issue. Stroke may be different by constitution of a person, and the cause of stroke may be found in constitutional imbalance.The objectives of this case-control study were to investigate whether the relative risk of stroke can be different depending on Sasang constitutions classified by Sasang constitution questionnaire, to grasp interaction effects between Sasang constitution and the other risk factors, and to build the logistic regression model which can predict the risk factors of stroke including Sasang constitution and the best decision model which can detect risky group of stroke at early stage.This study was accomplished by comparing the patient group who are registered with 'storke patients registration enterprise' and filled out the Sasang constitution questionnaire, and the healthy comparison group by simple random extraction method. The data of patient group was attained by a Case Report Form based on Standard Operating Procedures, aimed to survey patients with Informed Consent, who volunteered to participate in this study.In this case, the group of patients with strokes are those whom are diagnosed, first time in their life, as acute strokes within 2 weeks(14 days) from the outbreak of illness. The comparison group are limited only among those who visited the hospital and conducted the general examination including the Sasang constitution exam and answered the reasons for taking a medical examination are a periodical check, a group-check from work or an inducement of member of family. Those who did the examination due to simple feeling of illness in health condition or an inducement of a doctor were excluded. Those who are diagnosed as a stroke with a medical examination result or after a checking-up are excluded.From October 2005 through March 2007 (18 months), the total number of subject is 662; 331 cases of stroke patients group and 331 of healthy control group. The statistical analysis was accomplished by conducting Chi-square test or Fisher's exact test on the quality variable for the univariate analysis of risk factor of stroke and conducting independent t-test for the quantity variable.The analysis between Sasang constitution and the risk factor of stroke was accomplished by conducting Logistic regression analysis in order to get the odds ratio and confirming the interaction effects. The suitable regression model was built by using the Hosmer and Lemeshow's goodness of fit test, and the best statistical classification model which decides a stroke was established by decision tree analysis using the CART algorithm.The main results of this study is as follows;In a condition that age and gender were controled by logistic regression analysis, the relative risk of stroke by Sasang constitution classification was obtained; Soyangin‘s risk ratio was 1.75 times higher than Taeumin's, and it was statistically significant (OR=1.75, 95% CI 1.23-2.49).However, consideration of body mass index(BMI), waist circumference, past history of hypertension and diabetes, history of drinking and smoking makes even better model. According to that model, Soyangin‘s risk ratio of stroke goes up 6.34 times higher than Taeumin‘s (OR=6.34, 95% CI 3.08-13.04), and the result of Hosmer & Lemeshow goodness of fit test which determines the suitable degree of the model was appropriate (X2=3.63, P-value=0.89).According to decision tree analysis of CART algolithm, the most overriding variable was the history of risk factor of cardiovascular disease (one of followings is included ; hypertension, hypercholesterolemia, diabetes, ischemic heart disease, and transient ischemic attack). And, among the group without past history, they were divided the most if they were Soyangin or not. The next overriding variable was drinking history among Soeumin and Tarumin. Among Soyangin, the next overriding variable was regular exercise or not. The misclassification rate of CART algolithm was 0.274 though.By the result of this study, we found out the risk of stroke can be different depending on Sasang constitution, and the risk highly rises due to interaction effects with risk factor of cardiovascular disease, and most importantly, finding a possibility to develop the specific predicting model for stroke including Sasang constitution is significant object of this study.ope
심전도 기반 관상동맥 죽상경화증 탐지를 위한 인공신경망 개발
학위논문(석사)--아주대학교 일반대학원 :의학과,2021. 2죽상경화에 의해 관상동맥의 내부 지름이 좁아지면 심장 근육으로의 혈류 공급에 장애가 생겨 협심증, 심근경색과 같은 허혈성 심질환이 발생할 수 있다. 관상동맥 석회화는 죽상경화증의 표지자로 사용되고 있고, 이는 관상동맥 CT 혈관촬영술에서 관상동맥석회화수치로 측정할 수 있다. 관상동맥 석회화가 발견되었을 경우, 질병의 진행을 막기 위해 예방적 치료 및 추가적인 침습적 검사를 고려할 수 있다. 하지만 관상동맥 CT 혈관촬영술은 고비용이기 때문에 일상적으로 시행되기는 어렵다. 상대적으로 저렴하고 비침습적이며 방사선 피폭이 발생하지 않고 건강검진 등에서도 자주 시행되는 심전도 검사만으로 관상동맥 석회화 정도를 탐지할 수 있다면 더 많은 관상동맥 죽상경화증 환자가 조기 진단 및 치료를 받을 수 있을 것이다. 따라서 본 연구에서는 심전도만을 활용해서 관상동맥 석회화를 탐지하는 인공지능 모델을 개발하고자 하였다.
본 연구에서는 아주대학교병원 전자의무기록 데이터베이스에 저장되어 있는 관상동맥 CT 혈관촬영술 판독문에 정규표현식을 적용하여 관상동맥석회화수치를 총 13,683건 추출하였다. 만 18세 이상의 환자들 중 해당 판독문들과 60일 전후로 측정된 해당 환자의 표준 12 유도 심전도를 총 8,178건 추출한 후 해당 관상동맥석회화수치로 라벨링하였다. 심전도의 원본 파형만을 인공지능 모델 훈련에 입력변수로 사용하였다. 표준 12 유도 심전도 중 직교축에 가장 근접한 3개의 유도인 I, II ,V2 만을 입력으로 사용하였다. 또한 데이터 증대를 위해 10초 길이의 심전도를 2.5초씩 분할하여 사용하였다.
본 연구의 주요 결과변수는 관상동맥석회화수치 400 이상 또는 미만으로 정의하였다. 그리고 임상증상이 생기기 전의 환자들만을 대상으로도 분석을 진행하고자 관상동맥 CT 혈관촬영술 및 심전도가 응급실에서 처방되거나 측정되지 않은 경우(이차분석 데이터셋 1), 관상동맥 CT 혈관촬영술은 건강검진에서 시행되었고 심전도는 응급실에서 처방되거나 측정되지 않은 경우(이차분석 데이터셋 2)에 대해서도 각각 모델을 구축하여 이차분석을 진행하였다.
본 연구에서는 residual network 기반의 인공신경망을 구축하였다. k-fold group cross validation을 진행하여 모든 fold의 평균 성능을 도출하였다.
전체 데이터셋의 샘플수는 8,178건, 환자수는 5,765명, 이차분석 데이터셋 1의 샘플수는 6,976건, 환자수는 5,372명, 이차분석 데이터셋 2의 샘플수는 2,336건, 환자수는 1,996명이다. 전체 데이터셋을 사용한 모델의 평균 AUROC는 0.7940.028, 이차분석 데이터셋 1을 사용한 모델의 평균 AUROC는 0.7940.024, 이차분석 데이터셋 2를 사용한 모델의 평균 AUROC는 0.7330.032였다. Threshold가 0.5일 때, 전체 데이터셋을 사용한 모델의 accuracy, sensitivity, specificity는 각각 0.7980.039, 0.5570.092, 0.8300.054, 이차분석 데이터셋 1을 사용한 모델에서는 각각 0.7640.121, 0.6900.156, 0.7650.139, 이차분석 데이터셋 2을 사용한 모델에서는 각각 0.7150.146, 0.5600.213, 0.7250.166였다. Sensitivity가 0.8이 되도록 threshold를 조정하였을 때, 전체 데이터셋을 사용한 모델의 accuracy, specificity는 각각 0.6600.044, 0.6420.048, 이차분석 데이터셋 1을 사용한 모델에서는 각각 0.6600.027, 0.6430.030, 이차분석 데이터셋 2를 사용한 모델에서는 각각 0.5500.107, 0.5310.112였다.
최근에 인공지능을 활용하여 기존에 인간의 눈으로는 판독할 수 없었던 미세한 심전도상의 변화까지도 탐지하는 연구들이 발표되었다. 본 연구도 이러한 새로운 발견들의 일환으로 수행되었다. 본 연구모델은 심전도만을 입력으로 하기 때문에 임상에서의 적용이 용이하다. 이차분석 데이터셋 2가지에 대해서도 높은 성능이 유지되었다는 사실은 본 연구모델이 임상 증상이 생기기 전에 관상동맥 죽상경화증을 조기 탐지하는 선별검사로써 활용될 수 있음을 시사한다. 또한, 여러 연구에 따르면 관상동맥석회화수치가 높을수록 coronary event의 발생률이 높아지므로, 본 연구모델은 이러한 coronary event의 예측인자로 활용될 수 있다.I 서론 1
A. 연구의 배경 및 필요성 1
B. 관련 연구 6
C. 연구의 목적 9
II 연구대상 및 방법 11
A. 심전도 데이터 11
B. CT 관상동맥 혈관촬영술 데이터 13
C. 데이터 추출 및 라벨링 15
D. 입력 및 결과 변수 정의 16
E. 인공신경망 구축 및 모델 훈련 18
1. 데이터 전처리 18
2. 데이터 증대 20
3. 인공신경망 구조 21
4. 하이퍼파라미터 튜닝 25
5. 모델 훈련 26
6. 프로그래밍 언어 28
F. 성능 평가 29
G. Institutional Review Board 32
Ⅲ 결과 33
A. 데이터셋 특성 33
B. 모델 성능 37
Ⅳ 고찰 45
Ⅴ 결론 49
참고문헌 50MasterCoronary artery atherosclerosis can cause serious complications like angina pectoris or myocardial infarction. Coronary artery calcium score (CACS), which can be measured from coronary CT angiography (CCTA) is a hallmark of atherosclerosis. If coronary artery calcification is detected, prophylactic treatment and additional invasive testing may be considered to prevent disease progression. However, CCTA is costly and cannot be routinely taken. More patients with coronary artery atherosclerosis will be able to receive early diagnosis and treatment if high CACS can be accurately predicted solely by electrocardiograms (ECGs) which is cost-effective, non-invasive, radiation-free and frequently performed during health check-ups. Therefore, in this study, we aimed at developing an artificial intelligence model that detects coronary artery calcification using only ECG signals.
In this study, a total of 13,683 CACS were extracted by applying regular expression to the coronary artery CCTA readings stored in the electronic medical record database of Ajou University Hospital. Among patients 18 years of age or older, 8,178 standard 12-lead ECGs were extracted in the period of 60 days around those readings and labeled with the corresponding CACS. Only the raw waveform of the ECG was used as input for model training. Among the 12 leads, the 3 leads closest to the orthogonal axis (leads I, II, V2) were used as input. Moreover, the 10-second ECGs were divided into 2.5 second intervals for data augmentation.
The primary outcome of this study was defined as CACS400. Additionally, we performed two secondary analyses in order to assess the model’s performance among subclinical patients. Secondary analysis dataset 1 was defined as ECGs from patients of whom CCTA and ECG were not prescribed or measured in the emergency room and secondary analysis dataset 2 was defined as ECGs from patients of whom CCTA was taken at a health checkup and ECG was not prescribed or measured in the emergency room. Models were trained for each of the two secondary analysis datasets.
The artificial neural network built in this study is based on residual networks. K-fold group cross validation was performed and the average performance of all folds was derived.
The total study population consists of 8,178 ECGs from 5,765 patients, the secondary dataset 1 consists of 6,976 ECGs from 5,372 patients and the secondary dataset 2 consists of 2,336 ECGs from 1,996 patients. The AUROC was 0.7940.028 for the model trained with total study population, 0.7940.024 for the model trained with secondary analysis dataset 1 and 0.7330.043 for the model trained with secondary analysis dataset 2. At threshold=0.5, accuracy, sensitivity, specificity were 0.7980.039, 0.5570.092, 0.8300.054 for the model trained with total study population, 0.7640.121, 0.6900.156, 0.7650.139 for the model trained with secondary analysis dataset 1 and 0.7150.146, 0.5600.213, 0.7250.166 for the model trained with secondary analysis dataset 2. When the threshold was adjusted so that sensitivity=0.8, accuracy, specificity were 0.6600.044, 0.6420.048 for the model trained with total study population, 0.6600.027, 0.6430.030 for the model trained with secondary analysis dataset 1 and 0.5500.107, 0.5310.112 for the model trained with secondary analysis dataset 2.
Recently, studies have been published that utilize artificial intelligence (AI) to detect even minute changes in ECGs that were previously unreadable by human eyes. This study was conducted in concordance with these new discoveries. The AI model constructed in this study is easily applicable in clinical practice since only the ECG is used as input. The fact that high performance was maintained for the models constructed with the two secondary analysis datasets suggests that these models can be used as a screening test for early detection of coronary atherosclerosis before clinical symptoms develop. Moreover, the results from several studies indicating that higher CACS leads to higher incidence of coronary events suggest that our model can be used as a predictor of such coronary events
