8 research outputs found
도메인 적대적 학습을 통해 학습된 강건한 음악 표현을 사용한 멀티미디어 콘텐츠에서의 음악 자동 태깅
학위논문(석사) -- 서울대학교대학원 : 융합과학기술대학원 지능정보융합학과, 2023. 8. 이교구.Music auto-tagging plays a vital role in music discovery and recommendation by assigning relevant tags or labels to music tracks. However, existing models in the field of Music Information Retrieval (MIR) often struggle to maintain high performance when faced with real-world noise, such as environmental noise and speech commonly found in multimedia content like YouTube videos.
In this research, we draw inspiration from previous studies focused on speech- related tasks and propose a novel approach to improve the performance of music auto-tagging on noisy sources. Our method incorporates Domain Adversarial Training (DAT) into the music domain, enabling the learning of robust music representations that are resilient to the presence of noise. Unlike previous speech-based research, which typically involves a pretraining phase for the feature extractor followed by the DAT phase, our approach includes an additional pretraining phase specifically designed for the domain classifier. By this additional training phase, the domain classifier effectively distinguishes between clean and noisy music sources, enhancing the feature extractors ability not to distinguish between clean and noisy music.
Furthermore, we introduce the concept of creating noisy music source data with varying signal-to-noise ratios. By exposing the model to different levels of noise, we promote better generalization across diverse environmental conditions. This enables the model to adapt to a wide range of real-world scenarios and perform robust music auto-tagging.
Our proposed network architecture demonstrates exceptional performance in music auto-tagging tasks, leveraging the power of robust music representations even on noise types that were not encountered during the training phase. This highlights the models ability to generalize well to unseen noise sources, further enhancing its effectiveness in real-world applications.
Through this research, we address the limitations of existing music auto-tagging models and present a novel approach that significantly improves performance in the presence of noise. The findings of this study contribute to the advancement of music processing applications, enabling more accurate and reliable music classification and organization in various industries.음악 자동 태깅(Music auto-tagging)은 음악 오디오에 관련 태그(tag) 또는 레이블(label)을 할당하여 음악 검색 및 추천에 중요한 역할을 한다. 그러나 음악 정보 검색(MIR) 분야의 기존 모델은 유튜브 비디오와 같은 멀티미디어 콘텐츠에서 일반적으로 발견되는 환경 소음 및 음성과 같은 실제 소음에 직면할 때 성능 저하를 마주한다.
본 연구에서는 강건한 음성 표현 학습 방법 중점을 둔 이전 연구에서 영감을 얻어, 소음(noise)이 많은 소스에서 음악 자동 태깅의 성능을 향상시키기 위한 새로운 접근 방식을 제안한다. 우리의 방법은 도메인 적대적 훈련(domain adversarial training, DAT)을 사용하여 소음의 존재에 탄력적인, 강건한 음악 표현을 학습할 수 있도록 한다. 일반적으로 특징 추출기(feature extractor)에 대한 사전 훈련 단계에 이어 DAT 단계를 포함하는 이전의 음성 기반 연구와 달리, 우리의 접근 방식은 도메인 분류기를 위해 특별히 설계된 추가적인 사전 훈련 단계를 포함한다. 이 학습 단계를 통해 도메인 분류기는 깨끗한 음악 소스와 시끄러운 음악 소스를 효과적으로 구별하여 특징 추출기의 깨끗한 음악과 시끄러운 음악을 구별하지 않는 능력을 향상시킨다.
또한, 우리는 다양한 신호 대 잡음 비(signal-to-noise ratio, SNR)로 소음이 많은 음악 소스 데이터를 생성하는 개념을 소개한다. 모델을 다양한 수준의 소음에 노출시킴으로써 다양한 환경 조건에서 더 나은 일반화(generalization)를 촉진한다. 이를 통해 모델은 광범위한 실제 상황과 소리에 적응하고, 강력한 음악 자동 태깅을 수행할 수 있다.
우리가 제안한 구조는 음악 자동 태깅 작업에서 탁월한 성능을 보여주며, 훈련 단계에서 마주치지 않은 소음 유형에 대해서도 강건한 음악 표현을 추출한다. 이는 마주하지 않았던 소음에 대해서 잘 일반화할 수 있는 모델의 능력을 강조하여, 실제 상황에서의 효과를 더욱 향상시킨다.
이 연구를 통해 기존 음악 자동 태깅 모델의 한계를 해결하고 소음이 있는 상황에서 성능을 크게 향상시키는 새로운 접근 방식을 제시한다. 본 연구의 결과는 음악 정보 검색 분야의 발전에 기여하여 다양한 산업에서 보다 정확하고 신뢰할 수 있는 음악 분류 및 구성을 가능하게 한다.Abstract i
Contents iii
List of Tables vi
List of Figures vii
1 Introduction 1
1.1 Motivation 1
1.2 Problem Definition 4
2 Background 6
2.1 Basic Concepts 6
2.1.1 Music Representation Learning 6
2.1.2 Robust Music Representation Learning 8
2.1.3 Music Auto-tagging 10
2.1.4 Domain Adversarial Training 11
2.2 Related Work 14
2.2.1 Music Representation Learning for Auto-tagging 14
2.2.2 Recent Methods for Music Enhancement 16
2.2.3 Improving Robustness for Speech Representation via Domain Adversarial Training 19
3 Method 21
3.1 Model Structure 21
3.1.1 Feature Extractor 21
3.1.2 Domain Classifier 23
3.1.3 Label Predictor 24
3.2 Domain Adversarial Training for Clean Source Domain and Noisy Target Domain of Music 24
3.2.1 Pretraining Feature Extractor 24
3.2.2 Pretraining Domain Classifier 26
3.2.3 Domain Adversarial Training for Finetuning Feature Extractor and Training Label Predictor 27
3.3 Objective Function 28
4 Experiment 30
4.1 Dataset 30
4.1.1 Music Dataset 30
4.1.2 Noise Dataset 32
4.1.3 Data Configuration 33
4.2 Implementation Detail 37
4.3 Hyperparameter Settings and Learning Strategies 40
4.4 Results 41
5 Conclusion 47
5.1 Overview 47
5.2 Future Work and Limitation 48
Abstract (In Korean) 54석
박현기의 초기 작품에 나타난 탈평면적 경향에 대한 연구
학위논문 (석사)-- 서울대학교 대학원 : 미술대학 협동과정미술경영, 2018. 8. 정영목.본 논문은 박현기(1942-2000)의 1974년부터 1985년까지 제작된 초기 작품을 중심으로 분석한 연구이다. 박현기는 한국 비디오 아트의 선구자라고 불리며 미술사적으로 중요한 위치에 있음에도 불구하고, 그에 대한 연구는 비교적 적게 진행되었으며 연구의 범위 또한 비디오 작업 부분에 편중되어 있었다. 이에 따라 박현기의 작품세계에 대한 해석의 범위를 넓히고자 연구를 시작하게 되었으며, 그의 작품세계 중에서도 비디오뿐만 아니라 오브제, 환경, 행위와 같은 다양한 탈평면 미술 경향을 시도해 보았던 1974년부터 1985년까지의 초기 실험 단계에 집중했다.
이를 위해 먼저 박현기 작품의 형성 배경이 되는 1970년대부터 1980년대까지의 한국미술의 상황에 대해 살펴보았다. 앵포르멜 이후 1960년대 말 한국화단에서는 회화라는 평면에서 벗어나 새로운 미술을 수용하고자 하는 움직임이 시작되었다. 본격적으로 1970년대부터 몇몇 실험적인 소그룹들에 의해 오브제, 환경, 행위 등의 탈평면적 미술 경향이 새롭게 시도 되었고, 그러한 경향은 1980년대까지 이어졌다. 그리고 1970년대 초중반부터 대구화단에서도 《대구현대미술제》를 중심으로 미술의 탈평면적 경향이 새롭게 모색되기 시작하였는데, 이는 1980년대까지 이어져 대구를 기반으로 초기 시기 작가 활동을 한 박현기에게 영향을 미쳤다.
이러한 배경을 바탕으로 본문에서는 1974년부터 1985년까지의 박현기의 초기 작품을 크게 세 가지 경향으로 나누어 살펴보았다. 작품이 제작된 시기 순으로 오브제, 환경, 행위에 해당하는 작품을 면밀히 살펴봄으로써, 결과적으로 박현기가 말하고자 했던 불완전한 지각과 인식에 대한 문제에 대해 고찰해 본 것이다. 따라서 본 연구는 박현기의 작품세계를 보다 다양하게 고찰해보았다는 점에 의의를 두고자 한다.
주요어 : 박현기, 탈평면적 경향, 오브제, 환경, 행위, 대구현대미술제 1 장 서론 1
제 1 절 연구 배경 및 목적 1
제 2 절 연구 내용 2
제 3 절 선행 연구 3
제 2 장 박현기의 작품 형성 배경 6
제 1 절 1970-80년대 탈평면적 경향 6
1. 오브제 11
2. 환경 16
3. 행위 20
제 2 절 대구미술과 박현기 25
1. 1970-80년대 탈평면적 경향 25
2. 박현기의 활동 30
제 3 장 박현기의 초기 작품 분석 36
제 1 절 오브제 36
제 2 절 환경 44
제 3 절 행위 53
제 4 장 결론 61
참고문헌 64
도판목록 72
도 판 77
Abstract 92Maste
Predictors of Long-Term mortality after acute exacerbation in patients with chronic obstructive pulmonary disease
만성폐쇄성폐질환(chronic obstructive pulmonary disease, COPD)은 점진적으로 진행하고 폐의 비정상적인 염증상태를 수반하며 완전히 가역적이지 않은 기류제한을 특징으로 하는 질병상태를 말한다. 만성폐쇄성폐질환은 높은 사망률을 보이는 질환이며 이 질환의 사회경제적 부담은 점차 증가하고 있다. 따라서 만성폐쇄성폐질환의 사망을 예측할 수 있는 인자를 찾아 질환의 초기부터 관리하는 것이 이 질환의 사망률을 낮출 수 있는 중요한 요인이 될 수 있다. 본 연구에서는 만성폐쇄성폐질환의 급성 악화로 1회 이상의 입원을 경험했던 환자들을 대상으로 장기간 사망의 예측인자를 알아보고자 하였다.
본 연구는 1994년부터 2005년까지 이대목동병원에 급성 악화로 1회 이상 입원치료를 받았던 만성폐쇄성폐질환 환자 중 추적 관찰 기간이 6개월 이상이었던 48명의 환자를 대상으로 하여 사망의 예측인자를 조사하였으며, 다음과 같은 결과를 얻었다.
1. 총 48명의 대상 환자 중 생존자군(survivors)은 31명, 사망자군(non-survivors)은 17명으로, 사망률은 35.4%였다.
2. 사망자군은 생존자군에 비해 키가 유의하게 컸고(p<0.05), 중환자실 입원 경력이 유의하게 높았다(p<0.05).
3. 전체 대상자의 평균 1초간 노력성호기량(forced expiratory volume in a second, FEV1)은 1.00L로 정상 예측치의 46%였으며, 안정시 FEV1, 노력성폐활량(forced vital capacity, FVC)은 사망자군에서 생존자군에 비해 다소 낮았으나 통계적으로 유의한 차이는 없었다.
4. 안정시 심초음파 검사 결과 사망자군은 생존자군에 비해 심장박동수가 유의하게 빨랐고(p<0.01), 우심실수축기압이 유의하게 높았다(p<0.05).
5. Cox 다중회귀분석을 이용한 생존분석 결과, 분당 100회 이상의 심장박동수(p=0.005, 상대위험도 10.27, 신뢰구간 2.01-52.38)와 35mmHg 이상의 우심실수축기압(p=0.038, 상대위험도 5.69, 신뢰구간 1.11-29.30)이 사망의 독립적인 위험인자였다.
결론적으로 안정 상태에서의 심장박동수 및 우심실수축기압이 만성폐쇄성폐질환에서 사망을 예측할 수 있는 인자로 밝혀져, 급성 악화로 입원했던 만성폐쇄성폐질환 환자를 추적 관찰할 때 안정시의 심장박동수와 심초음파를 통한 우심실수축기압 측정이 예후 예측에 도움이 될 것이다.;Background/Aims : Chronic obstructive pulmonary disease(COPD) is a major cause of morbidity and mortality, and is an important socioeconomic problem. Despite high morbidity and mortality of COPD, a little is known about the mortality and related determinants in patients with COPD. The aim of this study was to investigate the mortality-predictive factors for patients admitted to the hospital with acute exacerbation of COPD and followed up for more than 6-months.
Methods : We reviewed the medical records of cases that admitted with acute exacerbation of COPD to the Ewha Womans University Mokdong hospital between May 1994 and July 2004. Among them, patients who were followed up during more than 6-months were included. We excluded patients who had tuberculosis scar or pleural thickening or bronchiectasis in chest radiography.
Results : Fourty-eight patients were included and mortality was 35.4%(17/48). Mean follow-up duration was 49 months. Non-survivors were taller than survivors(165.3±6.3cm vs. 159.4±9.1cm, p=0.024) and mean creatinine level was lower in non-survivors than survivors(0.79±0.22mg/dL vs. 0.94±0.25mg/dL, p=0.047). The rate of ICU admission was higher in non-survivors than survivors(70.6% vs. 38.7%, p=0.035). Heart rate(100±20/min vs. 79±14/min, p=0.002) and right ventricle systolic pressure in stable state(45±14mmHg vs. 33±7mmHg, p=0.032) were significantly higher in non-survivors than in survivors. In multivariate Cox regression analysis, heart rate of 100/min or more(RR, 10.27; 95% CI,2.01-52.38) and right ventricle systolic pressure of 35mmHg or more(RR, 5.69; 95% CI, 1.11-29.30) were independently associated with mortality.
Conclusion : Heart rate and right ventricle systolic pressure in stable state could identify COPD patients with high mortality during long-term follow-up after hospitalization related to acute exacerbation.논문개요 = vi
I. 서론 = 1
II. 연구대상 및 방법 = 2
III. 결과 = 5
IV. 고찰 = 16
V. 결론 = 20
참고 문헌 = 21
Abstract = 2
