10 research outputs found
A Study on the Understanding of the Number Concept of the AI Model for Math Word Problem Solving
학위논문(석사) -- 서울대학교대학원 : 융합과학기술대학원 지능정보융합학과, 2023. 8. 권가진.문장형 수학 문제 자동 풀이 연구는 1960년부터 지속적으로 연구되어 온 흥미로운 분야(Wilks, 1976)이다. AI의 발전함에 따라 문장형 수학 문제를 풀기 위해 AI를 사용하려는 시도가 늘고 있다. 그러나 최근 문장형 수학 문제 풀이 모델이 문제를 이해하고 추론을 통해 문제를 푸는 것이 아닌 문제에 등장하는 숫자를 적절히 조합하여 답을 도출한다는 문제가 제기(Patel et al., 2021)됨에 따라 모델의 문장형 수학 문제 이해 여부가 불분명해졌다. 수학 문제를 이해하기 위해서는 문제에 등장하지 않는 문제에 등장하는 숫자의 이해는 선행되어야 하므로, 본 논문에서는 수학 문제 풀이 모델이 문제 풀이 과정에서 숫자의 이해를 돕는 두 가지 연구를 수행한다.
Study 1은 명시적 자질 추출 방식을 제안한다. 기존 BERT 계열의 사전학습 언어 모델을 사용한 연구는 수학 문제를 푸는 과정에서 숫자 정보를 제한적으로 사용하기 때문에 수학 문제에 등장하는 숫자의 대소관계를 파악하기 어려웠다. 이 방식은 숫자 토큰을 문제 풀이에 활용할 수 있도록 하는 방식으로, 자연어 이해 계열 모델 중 SVAMP 데이터셋에서 최고 성능을 보이는 deductive reasoner 모델에 적용해 본 결과 최대 2.8%의 성능 향상을 보였다. 위 실험의 결과로 자연어 이해 모델이 수학 문제를 풀 때, 문제에 등장하는 숫자 토큰을 사용하는 것이 대소관계 파악에 도움을 주어 모델의 정답률을 증가시킬 수 있다는 가능성을 확인하였다.
Study 2는 GPT 계열 사전학습 언어 모델의 구현체인 GPT-3.5-turbo에서 여러 토큰으로 구성된 숫자의 대소관계를 파악할 때, 자릿수 개념을 완벽하게 이해하지 못하고 있다는 문제를 실험을 통해 보여주고 이를 보완하는 전략을 제안한다. 이 실험의 결과로는 기존 GPT-3.5-turbo를 사용한 프롬프트 전략의 최고 성능 대비 3.1% (in CoT)와 2.06% (in PoT)의 정답률 상승을 보였다. 위 실험의 결과로 자연어 생성 모델이 수학 문제를 풀 때, 숫자의 자릿수 개념을 추가해 준다면 숫자 토큰의 대소관계 파악에 도움을 주어 정답률이 증가할 수 있다는 가능성을 확인하였다.The field of math word problem solving, an intriguing area of study since the 1960s, has been consistently researched. As AI advances, attempts to use AI for solving sentence-type mathematical problems have been increasing. However, recent concerns that the math word problem-solving models do not actually understand and solve the problem through reasoning but derive answers by appropriately combining the numbers appearing in the problem have brought ambiguity to the understanding of these models. To comprehend mathematical problems, understanding the numbers that appear in the problem is a prerequisite, and thus this paper conducts two studies to aid in the understanding of numbers during the problem-solving process.
Study 1 proposes an explicit feature extraction method to address the issue arising from the limited use of number tokens in the problem-solving process of pre-trained BERT-series language models. This method aids in understanding the magnitude of the numbers that appear in the problem. Furthermore, the application of this explicit feature extraction method has shown a 2.8% performance improvement in the natural language understanding model among those in the SVAMP dataset, surpassing the performance of the previous best-performing model. These results confirm the potential of using the number tokens that appear in the problem to help comprehend the magnitude, which can subsequently increase the accuracy of the model.
Study 2 demonstrates the problem that the implementation of the pre-trained GPT-series language model, gpt3.5-turbo, fails to fully comprehend the concept of digit position when discerning the magnitude of numbers comprised of multiple tokens. It proposes a strategy to supplement this issue. The result of this experiment showed a 2.06% increase in accuracy compared to the best performance of the previous prompt strategy using gpt3.5-turbo. These results confirm the potential that if the concept of digit position is incorporated when natural language generation models solve math word problems, it can aid in understanding the magnitude of number tokens, which can then increase the accuracy rate.제 1 장 서론 1
1.1 연구의 배경 1
1.2 연구의 내용 3
1.2.1 Study 1: 자연어 이해 모델에서 숫자의 이해 3
1.2.2 Study 2: 자연어 생성 모델에서 숫자의 이해 4
제 2 장 관련 연구 6
2.1 트랜스포머 구조를 활용한 사전학습 언어 모델 6
2.1.1 트랜스퍼 러닝 6
2.1.2. 트랜스포머의 구조 7
2.1.3 자연어 이해 모델 9
2.1.4 자연어 생성 모델 10
2.2 문장형 수학 문제 자동풀이 11
2.2.1 자연어 이해 모델을 사용한 문장형 수학 문제 풀이 11
2.2.2 자연어 생성 모델을 사용한 문장형 수학 문제 풀이 14
제 3 장 연구 방법 19
3.1 실험 환경 19
3.1.1 실험 데이터셋 및 구현 세부사항 20
3.2 Study 1: 자연어 이해 모델에서 숫자의 이해 21
3.2.1 명시적 자질 추출 방식의 제안과 활용 방법 21
3.2.2 Elastic transformer 구조 24
3.2.3 Deductive reasoner 모델에서의 명시적 자질 추출 방식 적용 25
3.3 Study 2: 자연어 생성 모델에서 숫자의 이해 26
3.3.1 여러 토큰으로 이루어진 숫자의 정렬 실험 26
3.3.2 숫자 표현의 영어 표현 대체 실험 28
3.3.3 십진수 개념 추가 실험 29
제 4 장 실험 결과 및 분석 31
4.1 Study 1: 자연어 이해 모델에서의 숫자의 이해 31
4.1.1 명시적 자질 추출 방식 적용 실험 31
4.2 Study 2: 자연어 이해 모델에서의 숫자의 이해 32
4.2.1 여러 토큰으로 이루어진 숫자의 정렬 실험 32
4.2.2 숫자 표현의 영어 표현 대체 실험 및 십진수 개념 추가 실험 33
제 5 장 결론 및 한계점 35
ABSTRACT 44석
Regeneration of Urban Village through Using Shared Space - Focusing on Sansae-village, Eunpyeong-gu, Seoul -
학위논문 (석사)-- 서울대학교 환경대학원 : 환경조경학과, 2014. 8. 성종상.도시 전면철거에 의한 공동주택 위주의 주택공급은 주거지 유형의 획일화를 가져왔으며 동시에 지역마다 고유하게 형성되어 온 서민주거문화를 찾아보기 어렵게 하고 있다. 결국 아파트 중심의 재생방식인 뉴타운 지구의 해체는 다른 방식의 재생방법을 고려하게 만들었다.
하지만 공공 주도의 도시 단독·다세대 주택의 재정비사업은 해당 지역과 주민들에 대한 이해가 부족하고, 지역과 잘 어울리지 않은 컨텐츠의 도입과 무분별한 시설의 건립으로 지역의 실정을 고려하지 못한 유지와 관리 방안이 난무해왔다. 또한 집합주거나 계획된 공동체 마을은 주민들 간의 자연스러운 친목 관계 형성을 위한 공유 공간이 마련되어 있지만 기존의 도시 단독·다세대 주택지역 공유 공간의 부재로 공동체 의식이 향상되는 계기를 마련하기 어려운 실정이다.
반면, 공유 공간은 함께 소속해 있는 공동체의식 향상과 외부인과 구별을 가능하게 하며 거주자 간 상호교류를 증대시키는 기능이 있다. 하지만 공유 공간을 활용한 재생방법을 전문적으로 다루기에는 주민들의 역량이 부족할 가능성이 크며, 기존의 전문가 집단 또한 이러한 사업을 추진함에 지속적인 운영 관리측면에서 전문적인 깊이가 미흡할 수 있다. 이러한 공유 공간의 특징 및 유형분류를 토대로 마을 공유 공간의 현황을 파악하고 주민들의 의견과 공유 공간과의 물리적, 비 물리적인 관계를 통해 공간 계획 방안의 지표로 사용하여 산새마을의 현황문제를 반영한 계획전략을 도출하고, 마을과 현재 관계를 맺고 있는 가능성이 있는 주체들을 찾아 가능한 시나리오를 제안하였다.
대규모 뉴타운 사업이 예정되어 지자체와 사회적 기업, 주민들의 협력으로 마을 내 공유 공간이 형성되는 등, 주민 주도형 재생사업이 추진되고 있는 은평구 산새마을은 마을의 사유지를 공공에서 매입하고 주민 협의체의 자율적인 운영 및 관리를 통해 공유 공간으로 만드는 과정을 취하고 있다.
본 연구의 대상인 기성 저층주거지역과 밀접한 관계를 맺고 있고 기존과 다른 방식의 재생방법을 고민한 것 또한 연구의 의의가 있으며, 구체적으로 공유공간에 대한 의미정립과 대상에 대한 성격규정, 그리고 실제 마을 주민들이 인식하고 있는 공유공간에 대한 가치를 인터뷰를 통해 발굴해 낸 것은 자칫 사라질 수 있는 산업화 시기의 우리나라의 생활사가 지역재생에 어떻게 기여를 하고 있는가에 대해 다시 한 번 되돌아보았다는 점에서 시사점이 있다.목차
제1장 서론
제1절 연구의 배경 및 목적
1. 연구의 배경
2. 연구의 목적
제2절 연구의 범위 및 방법
1. 연구의 범위
2. 연구의 방법
3. 연구의 구성
제2장 이론적 고찰
제1절 도시·지역재생 패러다임의 변화
1. 도시·지역 재생의 개념
2. 지역재생 패러다임의 변화
3. 도시·지역 재생에 관한 고찰
제2절 공유 공간의 개념 및 정의
1. 공유 공간의 개념
2. 공유 공간의 특성
3. 공유 공간의 영역
4. 도시기성마을의 공유 공간의 유형
5. 공유 공간에 관한 선행 연구 고찰
제3절 소결
제3장 산새 마을의 공유 공간
제1절 대상지 개요
1. 대상지 선정 배경
2. 일반현황
3. 대상지 분석의 방향
제2절 산새마을의 역사적 맥락
1. 산새마을의 역사
2. 산새마을 공간 시기적 변화
제3절 산새마을 공유 공간 유형에 따른 현황 분석
1. 공공 공간의 공유 공간
2. 사적 공간의 공유 공간
제4절 분석의 종합
제4장 공유 공간을 활용한 산새마을 재생 방안
제1절 계획의 기본방향
1. 계획의 목표
2. 전략
3. 공유 공간 활용을 통한 마을 재생의 전제
제2절 기본 구상
1. 개선전략의 수립
2. 공간 구상
3. 실행 방안 구상
제3절 재생 시나리오 작성 및 실행 계획
1. 공간·시설 개선 계획
2. 관리·운영 실행 계획
3. 전체 시나리오
제5장 결론
1. 연구의 결론
2. 연구의 의의 및 한계
참고문헌
AbstractMaste
(A)Study on the method to control the MILC behavior of amorphous Si thin film by doping and electric field effect and its mechanism
학위논문(박사)--서울대학교 대학원 :재료공학부,2004.Docto
지방 조직 유래 줄기세포 배양액이 인간 모낭 세포에 미치는 영향
학위논문 (석사)-- 서울대학교 대학원 : 의학과 면역학 전공, 2011.8. 김규한.Maste
A basic reproduction number estimate of COVID-19 : A systematic review and meta-analysis
In December 2019, pneumonia of unknown cause occurred in Wuhan, China. Pneumonia of unknown cause was named novel coronavirus infection (COVID-19). When a new infectious disease spreads, it is important to calculate the correct transmissibility and implement effective preventive measures, quarantine, and non-pharmaceutical intervention (NPI) and so on. There are several scales to evaluate the infectivity of an infectious agent, and among them, the basic reproduction number (R0) is widely used to explain the initial infectivity. The basic reproduction number is a number indicating how many people are infected on average from the initial patient (index case) when there is no case of acquiring immunity. It was intended to present an estimate of the basic reproduction number of COVID-19 through systematic literature review and meta-analysis. For literature search, Pubmed and Scopus were used, and the search terms ‘R0’, ‘COVID-19’ and ‘basic reproduction number’ were combined with AND or OR, and the final search was completed on March 14, 2021. As the selection criteria in the literature, a study that reported the R0 value with a 95% confidence interval, a study that reported the R0 value from the beginning of the COVID-19 outbreak to the period before or minimized quarantine measures, a study that calculated the R0 value from the epidemiological investigation of the actual confirmed patient, not in a hypothetical situation. Literature selection was carried out in two stages. In the primary selection/exclusion process, 1,394 documents judged to be irrelevant were excluded by reviewing the titles and abstracts of the searched studies, and the number of documents selected in the first stage was 156. In the second selection/exclusion process, full texts were reviewed, and finally 30 articles that met all criteria were selected. 63 R0 values were identified in 30 literatures, and these values were calculated from the data on the incidence of patients at the beginning of the epidemic in each country. The R0 estimate was 3.15(95% confidence interval: 2.89 – 3.44, p < 0.01). As a result of the heterogeneity test between studies, it could be seen that there was a high degree of heterogeneity between studies. To investigate the cause of the high heterogeneity, subgroup analysis and meta-regression analysis were performed. For subgroup analysis, it was divided into five continents as follows. Africa (2.320) < South America (2.322) < Asia (2.78) < Europe (3.95) < North America (4.14) were confirmed to have R0 values for each continent. In addition, meta-regression analysis was performed by grouping the median age into one subgroup in units of 10 years. It was confirmed that an increase of about 0.635 in R0 with an increase of 1 in the median age interval may have acted as a factor of heterogeneity between studies. To confirm publication bias, funnel plot and Begg and Egger's test were used, and based on the statistical significance of funnel plot and Egger test, it could be interpreted as having publication bias. Taken all findings together, COVID-19 can be predicted that a single COVID-19 confirmed patient could spread the virus to an average of 3.15 people if there are no precautions or implementation of minimal precautions such as social distancing, wearing masks or self-isolation. As time passes, more and more countries and papers that calculate the R0 value using various mathematical modeling techniques are being published. A more accurate R0 value can be presented if the newly reported R0 value is added and analyzed again. In addition, it is necessary to further study the generation time and window period, which are concepts that are more necessary to evaluate the infectivity of an infectious agent. And as the COVID-19 vaccination rate is increasing worldwide, further research is needed on the antibody formation and efficacy of COVID-19 vaccines.
2019년 12월 중국, 우한에서 원인 불명의 폐렴이 발생하였다. 이 원인 불명의 폐렴은 신종 코로나바이러스 감염(COVID-19)으로 명명되었다. 새로운 감염병이 유행하면 정확한 감염력(transmissibility)을 계산하여 효과적인 방역 대책과 검역, NPI(non-pharmaceutical intervention) 등을 시행하는 것이 중요하다. 감염원의 감염력을 평가하는 척도는 여러 가지가 있고, 그 중 기초감염재생산수(R0, basic reproduction number)가 초기 감염력을 설명하는데 많이 사용된다. 기초감염재생산수 값은 면역 획득 사례가 없는 경우, 한 명의 초기 환자(index case)가 평균적으로 몇 명을 감염시키는지 나타내는 수치이다. COVID-19의 기초감염재생산수 값을 체계적 문헌고찰 및 메타분석을 통해 추정값을 제시하고자 하였다. 문헌 검색은 Pubmed와 Scopus을 이용하였으며, 검색어로는‘R0’, ‘COVID-19’, ‘basic reproduction number’를 AND 혹은 OR로 조합하였으며, 2021년 3월 14일 최종 검색을 완료하였다. 문헌의 선택기준으로는 R0값을 95% 신뢰구간과 함께 보고한 연구, COVID-19 유행 초기부터 방역 조치 시행 전 혹은 최소화된 방역 조치만 시행한 기간으로 R0 값을 예측한 연구, 가상의 상황으로 예측한 R0 값이 아닌 실제 확진자 역학조사로부터 계산된 R0 값으로 하였다. 문헌 선택은 총 두 단계로 나누어 실시하였으며, 1차 선택/배제 과정에서는 검색된 연구들의 제목과 초록을 검토하여 관련성이 없다고 판단되는 1,394개의 문헌들을 배제하였고, 1차 선정된 문헌의 개수는 156개였다. 2차 선택/배제 과정에서는 전문(full text)을 검토하였고, 최종적으로 모든 기준을 충족하는 30개의 문헌을 선택하였다. 30개의 문헌에서 63개의 R0 값을 확인할 수 있었고, 이는 각국에서 유행 초기의 환자 발생 자료로부터 계산된 값이다. R0 추정값은 3.15(95% 신뢰구간 : 2.89 – 3.44, p < 0.01)의 값을 확인할 수 있었다. 연구들 간의 이질성 검정 결과, 연구들 간의 높은 이질성이 있는 것을 볼 수 있었다. 높은 이질성의 원인을 알아보기 위해 하위그룹 분석과 메타 회귀분석을 시행하였다. 하위그룹 분석을 위해 다음과 같이 다섯 개의 대륙으로 구분하였다. 아프리카 (2.320) < 남아메리카 (2.322) < 아시아 (2.78) < 유럽 (3.95) < 북아메리카 (4.14)의 대륙별 R0 값을 갖는 것을 확인할 수 있었다. 또한, 중위 연령을 10세 단위로 하나의 군(subgroup)으로 묶어서 메타 회귀분석을 시행하였다. 중위 연령 구간의 1 증가에 따른 R0의 약 0.635만큼의 증가가 연구들 간 이질성의 요인으로 작용했을 수 있음을 확인할 수 있었다. 출판 비뚤림을 확인하기 위해 funnel plot과 Begg과 Egger의 검정법으로 확인하였고, funnel plot과 Egger test의 통계적 유의성에 근거해서 출판 편향이 있는 것으로 해석할 수 있었다. 연구 결과를 종합해 볼 때, COVID-19는 사회적 거리두기나 마스크 착용, 자가 격리와 같은 예방 조치가 없거나 최소한의 예방 조치만 시행할 경우, 한 명의 코로나 바이러스 확진자가 평균적으로 3.15명에게 바이러스를 전파할 수 있음을 예측할 수 있다. 시간이 지나면서 더욱 많은 나라와 다양한 수학적 모델링 기법을 이용하여 R0 값을 계산한 논문들이 출간되고 있는데, 새로 보고되는 R0 값을 추가하여 다시 분석한다면 더욱 정확한 R0 수치를 제시할 수 있을 것으로 생각한다. 또한, 감염원의 감염력을 평가하는데 더 필요한 개념인 세대기(generation time)와 잠복기(window period) 등을 더 연구할 필요가 있고, COVID-19 백신 접종율이 전 세계적으로 높아지고 있으므로, COVID-19 백신의 항체 형성율 및 효능에 대한 추가적인 연구가 필요할 것으로 판단된다.open석
투명 생분해 폴리에스터의 합성 및 열특성 개선에 대한 연구
학위논문(박사) - 한국과학기술원 : 생명화학공학과, 2016.8
,[vii, 93 p. :]In this dissertation, various types of polyesters were synthesized and characterized to make transparent biodegradable polyester.
In chapter 2, the effect of various monomers on thermal properties and crystallization of co-polyesters was investigated. CHDM showed large effect on Tg enhancement. As a result, by incorporating CHDM into PEST, we synthesized amorphous co-polyesters with high Tg.
In chapter 3, We studied properties of PECST. It was characterized mainly in terms of thermal properties. As CHDM content was increased in PECST, Tg was also gradually increased. So, Tg of PEC30ST70 was . A thin film made of PEC30ST70 was highly transparent. And tensile modulus and flexural modulus of PEC30ST70 were much lower than that of PLA, which means it is more flexible than PLA. Finally, PEC30ST70 showed about 49% biodegradability after 50 days in biodegradability test under compost condition.
In chapter 4, the effect of Isosorbide (IS) was investigated. It showed extraordinary effect on thermal properties enhancement. So, as a result, PEI30ST70 showed very high Tg of $74.2 ^\circ C . PEI30ST70 was also proved biodegradable by showing 38% biodegradability after 50 days. It was also shown that this co-polyester had more flexible property than PLA.
Thus, in conclusion, two types of novel biodegradable polyesters, PEC30ST70 and PE30IST70, were synthesized and characterized in this study. And in the light of this study, PEC30ST70 and PE30IST70, owing to their transparency, biodegradability, thermal stability and flexibility, could be attractive materials for packaging applications.한국과학기술원 :생명화학공학과
