34 research outputs found
Analysis of Articles Related to Quantum Mechanics by Using Topic Modeling: Focus on Comparing LDA, CTM, STM Models
이 연구는 토픽 모델링을 이용하여 2004년 1월부터 2019년 5월까지 Phy.org에 올려진 양자역학 관련기사 154건을 분석한 것이다. 이를 위해 DTM을 만들었으며, 기사에 나타난 단어들의 빈도수, 엔그램을분석하였다. 토픽 모델링 분석은 LDA 모형과 CTM 모형, STM 모형을 통해 수행하였는데 가능도를통한 추정에 따라 LDA 모형과 CTM 모형에서는 토픽의 수를 10개로 가정하였으며, STM 모형에서는 토픽의 수를 30개로 가정하고 분석하였다. 먼저, LDA 모형분석 수행 결과 quantum mechanic research 토픽에 많은 문서가 할당되었다는 것을 찾을 수 있었다. CTM 모형분석에서는 LDA 모형에서 quantum mechanic research에 할당되었던 문서의 토픽이 세부적으로 분류된 점을 확인하였다. STM 모형분석은메타데이터를 통하여 변수로 설정한 것을 기준으로 통계적으로 유의한 발현 가능성을 확인할 수 있었다.N
Developing Big Data Governance Model for the Management of Science Academic Achievement
학위논문(박사) -- 서울대학교대학원 : 사범대학 과학교육과(물리전공), 2021.8. 송진웅.Recent intelligent information technologies such as artificial intelligence, IoT, and Big Data are expected to have an impact on the structural changes of industry and on society at large. In particular, data that serves as the foundation for such technological advancements is drastically increasing in quantity with the advent of the smart digital era and improvements in information processing speeds for computers. Thus, we are nearly on the verge of the era of Big Data. Big Data is expected to be used as an engine of national growth by serving as an important resource capable of creating new opportunities, competitiveness, and wealth in transcendence of a single level of information.
Changes in data values are also occurring in the field of education. The introduction of an intelligent learning system based on smart education pursues innovations in education environment, methods, content, and evaluation, with efforts being made to apply Big Data analysis technologies to the field of education. However, a large amount of data is accumulating in real time while failing to function in organic combination, with the analysis and use of this data being passive as a result of issues related to the protection of personal information. This reveals the need for a new system of application and verification befitting the efficient management and circumstances of Big Data.
Meanwhile, academic improvement through the management of academic achievement is one goal for schools. In particular, the science subject is an object of attention as a subject included in the Programme for International Student Assessment(PISA) overseen by the OECD. However, recently the National Assessment of Educational Achievement in South Korea has revealed a lower level of achievement for the science subject in comparison with other curricula. Its role as a core curriculum in an era of cutting edge technology is being overshadowed due to the decline in academic performance resulting from the recent increase in online classes.
Thus, out of a sense of critical awareness as demonstrated above, the present study proposes a Big Data governance model for managing academic achievement in science. In particular, prior to designing a Big Data governance model, the study built a machine learning model that predicts academic achievement in science by using currently available Big Data. On this basis, the study then discusses the possibility of efficiently managing academic achievement in science and expanding its scope. The present study was conducted largely in the form of research 1 and research 2.
Research 1 predicted the rate of students falling under below basic academic proficiency for the science subject in the National Assessment of Educational Achievement by using publicly disclosed school data that contains key information regarding school levels. The algorithms used in the analysis were Random Forest and XGboost, with the preprocessing tasks of masking, factorization, regularization, and binarization conducted. Subsequently, the study conducted data integration and visualization by using a data warehouse and then established 53 variable that were capable of being used in the final analysis through variable selection.
The results of using Random Forest confirmed, in the early model, a high level of importance for variables related to dropout risk factors, after-school activities, and the outcomes of transitioning to upper-level educational institutions. Furthermore, these included variables such as the number of students entering science high schools and the number of expenditures for teaching aids and equipment related to science, which are variables related to science education. The task of optimizing parameters that were to be included in the final model made use of a grid search method, with the number of trees set at 1,000, node size at 5, and variable size at 5. As a result, variables related to science education appeared as having a higher level of importance than they did in the early model. The model also included variables related to science labs along with teaching aids and equipment for science, confirming how scientific experiment activities themselves and school infrastructure served as important factors for predicting academic achievement in science. Additionally, similar to the outcomes of the early model, the model invariably included variables related to the outcomes of transitioning to upper-level educational institutions. These may point to how conditions related to educational environment, as indicated by these outcomes, may serve as key variables.
Next, the results using XGboost revealed how variables related to after-school activities and libraries held a high level of importance in the early model. Although variables related to science education certainly maintained somewhat of a high level of importance, these were less emphasized than the prior Random Forest model. Nevertheless, the study determined that points where variables related to libraries held a high level of importance shared context, to a certain extent, with points where school infrastructure impacted academic achievement in science. The results of grid search set the number of iterations at 1,000, subsample rate at 0.7, learning rate at 0.15, gamma value at 3, and tree depth at 10 for the final model. However, there were few huge improvements in terms of importance over the early model, and the role of variables related to science education was not that crucial.
Furthermore, the prediction accuracy of the two models was only somewhat predictive with percentages of 76% and 67% respectively. As a result, the study determined there would be a limit with regard to managing academic achievement in science at school levels related to educational accountability within the data scope capable of currently being collected. However, as variables with a high level of importance were commonly observed in each of the models, the study determined it would be possible to omnidirectionally manage academic achievement in science through Big Data if the data was systematically collected on such a basis.
Research 2 attempted to propose a model capable of further expanding and systematically managing the key factors explored in research 1. To this end, the study examined the current status of Big Data infrastructure for domestic education and selected educational Big Data with significant outcomes for the management of academic achievement in science. During this process, the study divided categories according to school, teacher, and student levels and offered data capable of serving as input variables and dependent variables by distinguishing them. Major input variables include publicly-disclosed school information, EduFine, data provided by TIMSS(Trends in International Mathematics and Science Study) and PISA, the Korean Education and Employment Panel(KEEP), and the Korean Education Longitudinal Study(KELS), while dependent variables include the National Assessment of Educational Achievement, the College Scholastic Ability Test(CSAT), and science subject data from TIMSS and PISA. In addition, the research proposed smart science laboratory data and adaptive learning system data embedded with IoT technology which contains the need for real-time prescriptions and strengthens the educational characteristics of variables related to science experiments, which are none other than the results of research 1.
Based on the discussion above, a Big Data governance model for managing academic achievement in science derived a 3D cube model shape(model 2.0) consisting of educational Big Data patterns, levels of application, and governance issues through the review of availability and logic with regard to model 1.0. Subsequently, educational Big Data patterns were positioned on the x-axis of the model and constituted the assessment of academic achievement in science, school infrastructure, smart science laboratories, and adaptive learning system data. The levels of applying educational Big Data were positioned on the y-axis of the model and were divided into regional levels, school and class levels, and learner levels. Thus, the study proposed which method of applying each educational Big Data pattern, previously categorized, would be efficient and reasonable. Representing educational Big Data governance issues, the z-axis included institutions and infrastrucuture toward the systematic management of academic achievement in science in the Big Data era.
In order to verify the validity of model 2.0 proposed in the present study, 7 experts were selected, who assessed 8 items―validity, explanability, understandability, usefulness, universality, the logic of the development process, the representative nature of the terms, and the processability of the information. Model 3.0 was formed after content pointed out as weaknesses were improved based on the 1st assessment results, after which a 2nd assessment was performed. Consequently, scores for all items were assessed as high, with content validity index(CVI) and inter-rater agreement(IRA) also assessed as high, thereby revealing a high level of validity for the model. However, a portion of the model was revised to finalize model 4.0 in order to comprehensively apply the contents of the z-axis and contents that failed to be incorporated from governance issues. Furthermore, the possibility of developing the present research model was confirmed by exploring a plan for science learning cooperatives from a distributed cognitive perspective, by exploring the potential for adapted support and learning, and by exploring indicators for Korean Science Education Standards(KSES).
Lastly, implications for science education, offered through a Big Data governance model, are as follows. First, the main participants of education must engage in flexible thinking so that the potential for expanding scope, derived from the Big Data governance model, can be incorporated into science education. Second, it is necessary to establish a plan capable of activating data-based education policy design through the present research model. Third, the technological capacity of the main participants of education, who actually implement the Big Data-based science classes, must be taken into account. Fourth, the management of academic achievement in science must lead to the reduction of educational inequality and the implementation of accountability. Fifth, the present model must be used as a plan that can resolve the issue of decreased basic academic proficiency in the science subject.최근 인공지능, IoT, 빅데이터 등의 지능정보기술이 산업의 구조적인 변화와 사회 전반에 걸쳐 영향을 미칠 것으로 전망되고 있다. 특히, 이러한 기술 발전의 기반이 되는 데이터는 스마트 디지털 시대가 도래하고 컴퓨터의 정보처리 속도가 향상되면서 그 양이 급격하게 늘어나는 상황이다. 바야흐로 빅데이터(Big Data)의 시대에 접어든 것이다. 빅데이터는 하나의 정보 수준을 초월하여 새로운 기회, 경쟁력, 부를 창출할 수 있는 중요 자원이 되어 국가 성장 동력에 활용될 것으로 예상된다.
데이터의 가치 변화는 교육 분야에서도 예외가 아니다. 스마트 교육에 기반한 지능형 학습체제의 도입으로 교육 환경, 방법, 내용 및 평가의 혁신을 추구하고 있으며, 빅데이터 분석 기술을 교육 분야에 접목하기 위해 노력하고 있다. 그러나 현재 많은 양의 데이터가 유기적으로 결합하여 작동하지 못하고 실시간으로 쌓이고만 있으며, 개인정보 보호와 관련된 문제 때문에 분석과 활용에도 소극적이다. 이는 빅데이터의 효율적인 관리와 상황에 맞는 적용 및 검증의 새로운 체계가 필요함을 보여준다.
한편, 학업성취도 관리를 통한 학력 향상은 학교가 달성해야 할 목표 중 하나이다. 특히, 과학 과목은 대표적으로 경제개발협력기구(OECD)에서 주관하는 국제학업성취도평가에 포함되는 과목으로서 주목의 대상이다. 하지만 근래에 우리나라 국가수준 학업성취도 평가에서 타 교과와 비교할 때 과학 과목은 낮은 성취수준을 보이고 있으며, 최근 비대면 수업 방식의 증가로 인한 학력저하로 첨단기술 시대의 핵심 교과목으로서의 역할이 무색해지고 있다.
위와 같은 문제의식으로부터, 본 연구는 과학 학업성취도 관리를 위한 빅데이터 거버넌스 모델을 제안하고자 하였다. 특히, 빅데이터 거버넌스 모델을 설계하기 전 현재 활용할 수 있는 빅데이터로 과학 학업성취도를 예측하는 기계학습 모형을 구축하고, 이를 기반으로 과학 학업성취도의 효과적인 관리 가능성과 외연 확장에 대하여 논의하였다. 본 연구는 크게 연구 1과 연구 2로 구성되어 진행되었다.
연구 1에서는 대표적인 학교 수준 정보를 담고 있는 학교정보공시 데이터를 활용하여 국가수준 학업성취도 평가의 과학 과목 기초학력 미달 비율을 예측하였다. 분석에 사용한 알고리즘은 Random Forest와 XGboost 였으며, 마스킹, 요인화, 정규화 및 이진화 과정의 전처리를 거쳤다. 그 후, 데이터 웨어 하우스를 활용한 데이터 통합과 시각화를 수행하였으며, 변수 선택을 통하여 최종 분석에 활용할 수 있는 53개의 변수를 선정하였다.
Random Forest 활용 결과, 초기 모형에서 학교 이탈 요인과 방과 후 활동, 상급학교 진학 결과와 관련된 변수들이 높은 중요도를 가지고 있음을 확인하였다. 또한, 과학교육과 관련된 변수인 과학고 진학 학생 수, 과학교구 기자재 구입 지출 건수와 같은 변수도 일부 포함되었다. 최종 모형에 포함될 파라미터 최적화 작업은 그리드 서치의 방법을 활용하였고 트리 개수 1000, 노드 크기 5, 변수 크기 5로 결정되었다. 그 결과, 초기 모형보다 과학교육과 관련된 변수들이 높은 중요도 값을 가진 것으로 나타났으며, 과학실 및 과학교구 기자재와 관련된 변수도 모두 포함되어 과학 실험활동 자체와 학교 인프라는 과학 학업성취도를 예측하는 데 중요한 요인임을 확인하였다. 아울러 초기 모형 결과와 유사하게 상급학교 진학 결과와 관련된 변수도 변함없이 포함되어 있었는데, 진학 결과가 말해주는 교육 환경과 관련된 여건도 주요 변수라는 의미로 볼 수 있다.
다음으로 XGboost 활용 결과, 초기 모형에서는 방과후 활동 및 도서관과 관련된 변수들이 높은 중요도를 가지고 있었다. 물론 과학교육과 관련된 변수들 또한 다소 높은 중요도를 가지고 있었으나 앞선 Random Forest 모형과 달리 덜 강조되었다. 하지만 도서관과 관련된 변수가 높은 중요도를 가지는 지점은 학교 인프라가 과학 학업성취도에 영향을 미치는 것과 어느 정도 맥락을 같이한다고 판단하였다. 그리드 서치 결과 최종 모형은 반복 횟수 1000, 하위샘플비율 0.7, 학습률 0.15, 감마 3, 트리깊이 10으로 결정되었다. 하지만 초기 모형보다 중요도 측면에서 크게 개선된 점이 많지 않았으며, 과학교육과 관련된 변수의 역할도 그리 결정적이지 못한 것으로 나타났다.
그리고 두 모형의 예측 정확도는 각각 76%, 67%로 어느 정도의 예측력만 있었고 이로 인하여 현재 수집 가능한 데이터 범위에서 교육의 책무성과 관련된 학교 수준의 과학 학업성취도 관리에는 한계가 있을 것으로 판단하였다. 그러나 각 모형별로 높은 중요도를 가지는 변수들이 공통적으로 관찰되었으므로 이를 기반으로 데이터를 체계적으로 수집한다면 빅데이터를 통한 과학 학업성취도의 전방위적 관리 가능성을 지니고 있다고 판단하였다.
연구 2에서는 연구 1에서 탐색한 주요 요인을 보다 확장하고 체계적으로 관리할 수 있는 모델을 제안하고자 하였다. 이를 위해, 국내의 교육 빅데이터 인프라 현황을 알아보았으며, 그중 과학 학업성취도 관리에 유의미한 결과를 가진 교육 빅데이터를 선별하였다. 이 과정에서 학교, 교사, 학생 수준으로 범주를 나누고 입력변수와 종속변수가 될 수 있는 데이터를 구분하여 제시하였다. 대표적으로 입력변수로는 학교정보공시, 에듀파인, TIMSS(Trends in International Mathematics and Science Study) 및 PISA(Programme for International Students Assessment) 제공 데이터, 한국고용패널, 한국교육종단연구 데이터를 활용할 수 있으며, 종속변수로는 국가수준 학업성취도 평가, 대학수학능력시험, TIMSS 및 PISA의 과학 과목 데이터를 활용할 수 있을 것으로 판단하였다. 이외에도 연구 1에서의 결과인 과학 실험과 관련된 변수의 교육적 특성을 강화하고 실시간 처방의 필요성이 담긴 IoT 기술이 내재된 스마트 과학 실험실 데이터와 적응형 학습 시스템 데이터를 추가로 제안하였다.
앞선 논의를 바탕으로 과학 학업성취도 관리를 위한 빅데이터 거버넌스 모델은 교육 빅데이터 유형, 적용수준, 거버넌스 이슈로 이루어진 3차원 큐브 모형 형태(모델 2.0)를 모델 1.0에 대한 활용성 및 논리성 검토로 도출하였다. 이후 교육 빅데이터 유형은 모델에서 x축에 위치하고 있으며, 이를 과학 학업성취도 평가, 학교 인프라, 스마트 과학 실험실, 적응형 학습 시스템 데이터로 구성하였다. 교육 빅데이터 적용수준은 모델의 y축에 위치하고 있으며, 지역 수준, 학교 및 학급 수준, 학습자 수준으로 나누어 기존에 분류한 각각의 교육 빅데이터 유형이 어떠한 방식으로 적용되는 것이 효율적이고 합리적인지를 제시하였다. z축은 교육 빅데이터 거버넌스 이슈로 빅데이터 시대 과학 학업성취도의 체계적인 관리를 위한 제도와 기반체계를 포함하도록 하였다.
본 연구에서 제안한 모델 2.0의 타당성을 검증받기 위해 선정한 7명의 전문가를 대상으로 타당성, 설명성, 이해성, 유용성, 보편성, 개발과정의 논리성, 용어의 대표성, 정보의 가공성의 8개 항목에 대한 평가를 받았다. 1차 평가 결과를 바탕으로 약점으로 지적된 내용을 개선하여 모델 3.0을 구성하였고 2차 평가를 수행하였다. 그 결과 모든 항목에서의 점수가 높게 평가되었으며, 내용타당도 지수(CVI)와 평가자 간 일치도 지수(IRA)도 높게 평가되어 모델의 높은 타당성을 보여주었다. 하지만 거버넌스 이슈에서 반영하지 못한 내용과 z축 내용의 포괄적인 적용을 위해 일부 모델을 수정하여 모델 4.0을 확정하였다. 또한 분산인지 관점에서의 과학 학습 협력체 방안과 맞춤형 지원 및 학습의 가능성 그리고 미래세대 과학교육표준 지표 탐색으로 본 연구 모델의 발전 가능성을 확인하였다.
마지막으로 빅데이터 거버넌스 모델을 통해 제시하는 과학교육에의 시사점은 다음과 같다. 첫째, 빅데이터 거버넌스 모델에서 파생된 외연 확장 가능성을 과학교육이 반영할 수 있도록 교육 주체들은 유연한 사고를 가져야 한다. 둘째, 본 연구 모델을 통하여 데이터 기반 교육정책 설계를 활성화할 수 있는 방안이 필요하다. 셋째, 빅데이터 기반 과학 수업을 실행하는 교육 주체들의 기술적 역량을 고려해야 한다. 넷째, 과학 학업성취도의 관리가 교육 불평등 해소와 책무성의 이행으로 이어져야 한다. 다섯째, 과학 과목 기초학력 저하의 문제를 해결할 수 있는 방안으로 본 모델이 활용되어야 한다.1. 서 론 1
1.1 연구의 동기와 목적 1
1.2 연구 문제 6
1.3 연구 과정의 개요 7
1.4 용어의 정의 9
1.5 연구의 제한점 11
2. 선행연구 분석과 이론적 논의 13
2.1 빅데이터 13
2.1.1 빅데이터의 개념과 특성 14
2.1.2 빅데이터의 분석 절차 및 방법 17
2.1.3 교육 빅데이터의 정의와 범주 20
2.1.4 교육 빅데이터의 종류와 현황 22
2.1.5 교육 빅데이터 활용 시스템 구축사례 24
2.1.6 빅데이터 거버넌스 (빅데이터의 관리 체계) 28
2.2 과학 학업성취도 32
2.2.1 과학 학업성취도 연구 동향 데이터 분석 33
2.2.2 과학 학업성취도와 국가수준 학업성취도 평가 39
2.3 머신러닝 43
2.3.1 머신러닝의 기본 용어 및 개념 43
2.3.2 머신러닝 예측모형의 성능 평가 45
2.3.3 머신러닝 주요 알고리즘: 지도학습 48
3. 연구 1: 머신러닝 알고리즘을 통한 학교 수준 과학 학업성취도 예측 가능성 탐색 55
3.1 연구의 필요성 55
3.2 연구의 내용 및 범위 57
3.3 연구 방법 61
3.3.1 데이터의 전처리 과정 62
3.3.2 시각화 모듈 활용 64
3.3.3 변수 선택 64
3.3.4 알고리즘 선택 65
3.3.5 모형 학습과 평가 및 해석 66
3.4 연구 결과 67
3.4.1 빅데이터 수집·저장 및 전처리 결과 67
3.4.2 시각화 모듈 활용 결과 74
3.4.3 변수 선택 결과 81
3.4.4 알고리즘 선택 및 모형 학습 결과 83
3.5 정리 및 시사점 97
4. 연구 2: 과학 학업성취도 관리를 위한 빅데이터 거버넌스 모델의 제안 및 타당화 101
4.1 연구의 필요성 101
4.2 연구 방법 103
4.2.1 모델 제안 및 수정 105
4.2.2 전문가 타당성 평가 107
4.3 연구 결과 111
4.3.1 국내의 교육 빅데이터 현황 및 과학 학업성취도 관리에 효용적인 교육 빅데이터 탐색 111
4.3.2 과학 학업성취도 관리에 필요한 추가 데이터 구성요소 118
4.3.3 과학 학업성취도 관리를 위한 빅데이터 거버넌스 모델 제안 123
4.3.4 과학 학업성취도 관리를 위한 빅데이터 거버넌스 모델의 활용 및 발전 가능성 148
4.4 정리 및 시사점 160
5. 결론 및 제언 167
5.1 결과 정리 167
5.2 결론 170
5.3 제언 172
참고문헌 177
부 록 204박
Exploring the Trend of Research on Science Self-Efficacy through Bibliometric Information Analysis
본 연구는 과학 자기효능감과 관련된 국제 연구 동향을 계량서지 정보 분석을 통하여 파악하고 향후 이루어질 과학 자기효능감 연구에 대한 시사점을 제공하고자하였다. 이를 위하여 우선, Clarivate Analysis의 WoS에서 과학 자기효능감 관련 연구 논문 210편을 추출하였으며, R-Studio에서 제공하는 bibliometrix 패키지를 활용하여 분석하였다. 연구 결과, 과학 자기효능감과 관련하여 과학교육 분야의 대표적인 학술지에 게재되는 추세가 2010년대에 들어와서 급격하게 늘어난 것을 확인하였다. 또한, 추출한 논문에서는 Bandura의 문헌을 가장 많이 인용하고 있었으며, Betz & Hackett(1983)의논문이 가장 많이 인용되고 있었다. 네트워크 분석은인용한 문헌, 키워드 발생, 공저자 네트워크를 확인하였는데 각 클러스터의 중심되는 특징을 파악하였으며, 연구자들의 다양한 그룹이 한정된 네트워크를 가진 것으로 분석되었다. 저자들 간의 역사적인 연계성은 크게두 갈래로 나누어지는데 과학 자기효능감의 연구 대상에 있어 학생뿐만 아니라 교사가 중심이 되는 갈래가있음을 확인하였다. 키워드 플러스를 통한 매핑은 기본및 전문 테마를 구별하게 하였다. 본 연구를 통하여 과학 자기효능감의 다양한 분야와의 통섭적인 접근 및 연구 집단의 협력적인 태도, 종단적인 효과에 대한 연구의 필요성을 생각해볼 수 있었으며 향후 연구를 진행함에 있어 시사점을 도출할 수 있다N
Study on the Application of Quantitave Economic Modeling for Energy Policy Analysis
Since the first oil embargo (1973), there have been developed many different types of energy-economy interaction models based upon various aspects of energy impact mechanism. We will propose to develop an integrated energy-economy interaction analysis system for less developed countries energy policy analysis, especially for investment analysis toward constructing energy-saving industry infrastructure ; which is based on the motivation of combined energy models by John P. Weyant. This modeling system can cover the economic growth, inter-industry transactions including production features, and process analysis of energy sector in the total network scheme of general equilibrium, so that it can give many political implications as well as the modeling concept to be used for analyzing various political issues and making decisions related to national energy environment
An Exploration of the Level of Understanding for Energy Concepts demonstrated by Science-gifted Elementary School Students
본 연구는 초등 과학영재 학생들의 에너지 개념 연상에 대한 기초 조사와 에너지 개념이해수준을측정하기 위하여 수행되었다. 연구 대상은 과학영재교육원의 영재학생으로 선발되어 수업에 참여하고있는 60명의 초등학생으로 하였다. 연구 결과, 에너지 개념에 대하여 연상되는 것으로 전기 및 전자제품을가장 많이 선택하였으며, 자연환경 및 자원과 운송수단, 추상적 개념 등이 뒤를 따랐다. 또한, 학생들의 에너지 개념이해수준을 측정하여 4개의 단계로 분류하였는데, 1수준에 6명(10%), 2수준에 25명(42%), 3수준에 21명(35%), 4수준에 8명(13%)이 분류되었다. 본 연구를 통해 초등 과학영재 학생들의 에너지개념 이해정도를 명확하게 파악하여 향후 에너지 개념 학습의 효과적인 교수 전략이나 교육과정 구성에반영되어야 할 것이다.
This study was conducted as a basic investigation of the concept of energy and to measure the level of understanding of the concept of energy in Science-gifted elementary school students.
The subjects of the study were 60 elementary school students participating in classes after having been selected as gifted students at an institute for Science-gifted students. The research results show that the students chose electric and electronic products the most as associations related to energy concepts, followed by the natural environment and resources, means of transportation, and abstract concepts. Furthermore, the study measured the level of understanding of energy concepts demonstrated by dividing the students into four levels, with 6 students (10%) classified as level 1, 25 students (42%) as level 2, 21 students (35%) as level 3, and 8 students(13%) as level 4. The results of this study will be applied to form effective teaching strategies or curricula for energy concept learning in the future by clearly identifying the level of understanding regarding energy concepts on the part of Science-gifted elementary school students.N
Analysis of Utilization and Assessment of Predicting Models for YouTube Science Channel -Focusing on using Social big data analysis and Machine learning-
본 연구에서는 유튜브 과학 채널에 대한 대중들의 관심과 이용실태 및 특성을 알아보기 위하여 구독자 수와 동영상 수가 많은 두 개의 채널을 선정하고, 소셜 빅데이터 분석의 관점에서 연구를 수행하였다. 또한, 머신 러닝을 이용하여 유튜브 채널 판별에 대한 예측 모형의 평가로 대중들의 반응에 대한 체계적인 탐색 가능성을 살펴보았다. 연구 결과, 1분과학이 과학쿠키보다 조회수, 좋아요수, 싫어요수, 댓글수의 유튜브 지표에서 모두 평균이 높았다. 하지만, 조회수가 좋아요수로 귀결되는 추세선 분석 결과는 과학쿠키가 1분과학보다 높은 수준을 가지는 것으로 나타났다. 또한, 대중들이 많은 좋아요수를 통해 관심을 보인 동영상의 주제는 우주와 양자역학에 관련된 주제였다. 채널을 개설한 이후부터 분석한 댓글 추이도 위의 2가지 주제의 동영상이 주목을 받거나 업로드가 되었던 시기에 눈에 띄는 변화를 보였다. 머신 러닝을 이용한 유튜브 채널 판별의 예측 모형 분석결과는 SVM의 시그모이드형 커널 함수가 90.06%의 정확도를 보여 가장 성능이 우수한 모형이었다. 그리고 랜덤 포레스트 모형, 로지스틱 회귀분석도 각각 89.96%, 88.20%의 높은 정확도를 가진 것으로 나타났다. 의사결정 나무 모형과 knn 분석의 정확도는 앞선 모형들과 비교하였을 때 다소 낮은 편이었으나, 인공 신경망 모형은 다양한 조합의 활성 함수와 은닉 노드의 개수 변화에도 불구하고 모형의 성능이 개선되지 않았다. 본 연구의 결과를 토대로 빅데이터 분석과 머신 러닝을 활용하여 대중들의 관심사를 신속하게 파악하고 그 관심이 높아지고 있는 분야에 대한 교육이 이루어져야 할 것이다.N
Analysis of Reference Data in Science Guidebooks for Elementary Teachers Developed for 2015 Revised Curriculum - Focusing on Physics Section for the Third-Sixth Grade -
This study analyzed reference data for the physics section in science guidebooks for the third-sixth grade in elementary schools, according to the 2015 revised curriculum. It analyzed the reference data by categorizing them in terms of subjects, objectives and presentation forms and the visual data used in the reference data by categorizing their types. The findings show that the ratio of the science knowledge type was highest (53.8%) among the subjects of reference data in guidebooks for the science section, followed by the application to real life, and then, supplementary inquiry experiments and activities. The ratios of other types such as advanced science, environment, scientists and science history were, however, less than 1%, so they need to be improved. The ratio of knowledge provision was highest (40.5%) among the objectives of reference data but the ratios of conceptual supplementation and deepening were similar in ratio. Meanwhile, While the expository type (88.4%) accounted for most of the present forms of reference data, and photographs and illustrations (93.6%) also accounted for most of visual data suggested with reference data. Thus more various types of presentation forms and the extension of visual data seemed to be needed. This study is expected to provide some suggestions for the meaningful use of reference data in guidebooks for teachers and for the development of science guidebooks for teachers in elementary schools.N
