• 제목/요약/키워드: 사전훈련

검색결과 350건 처리시간 0.031초

한국어 자연어생성에 적합한 사전훈련 언어모델 특성 연구 (A Study of Pre-trained Language Models for Korean Language Generation)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.309-328
    • /
    • 2022
  • 본 연구는 자연어처리의 분석목적과 추론데이터 성격에 적합한 한국어 사전훈련 언어모델의 특성을 실증분석했다. 이를 위해 자연어생성이 가능한 대표적 사전훈련 언어모델인 BART와 GPT 모델을 실험에 사용했다. 구체적으로 한국어 텍스트를 BART와 GPT 모델에 학습한 사전훈련 언어모델을 사용해 문서요약 생성 성능을 비교했다. 다음으로 추론데이터의 특성에 따라 언어모델의 성능이 어떻게 달라지는지 확인하기 위해 6가지 정보전달성과 4가지 창작물 유형의 한국어 텍스트 문서에 적용했다. 그 결과, 모든 문서유형에서 인코더와 디코더가 모두 있는 BART의 구조가 디코더만 있는 GPT 모델보다 더 높은 성능을 보였다. 추론데이터의 특성이 사전훈련 언어모델의 성능에 미치는 영향을 살펴본 결과, KoGPT는 데이터의 길이에 성능이 비례한 것으로 나타났다. 그러나 길이가 가장 긴 문서에 대해서도 KoGPT보다 KoBART의 성능이 높아 다운스트림 태스크 목적에 맞는 사전훈련 모델의 구조가 자연어생성 성능에 가장 크게 영향을 미치는 요소인 것으로 나타났다. 추가적으로 본 연구에서는 정보전달성과 창작물로 문서의 특징을 구분한 것 외에 품사의 비중으로 문서의 특징을 파악해 사전훈련 언어모델의 성능을 비교했다. 그 결과, KoBART는 어미와 형용사/부사, 동사의 비중이 높을수록 성능이 떨어진 반면 명사의 비중이 클수록 성능이 좋았다. 반면 KoGPT는 KoBART에 비해 품사의 비중과 상관도가 낮았다. 이는 동일한 사전훈련 언어모델이라도 추론데이터의 특성에 따라 자연어생성 성능이 달라지기 때문에 다운스트림 태스크에 사전훈련 언어모델 적용 시 미세조정 외에 추론데이터의 특성에 대한 고려가 중요함을 의미한다. 향후 어순 등 분석을 통해 추론데이터의 특성을 파악하고, 이것이 한국어 생성에 미치는 영향을 분석한다면 한국어 특성에 적합한 언어모델이나 자연어생성 성능 지표 개발이 가능할 것이다.

도메인 적응 사전 훈련 (Domain-Adaptive Pre-training, DAPT) 한국어 문서 요약 (Domain-Adaptive Pre-training for Korean Document Summarization)

  • 장형국;장현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.843-845
    • /
    • 2024
  • 도메인 적응 사전 훈련(Domain-Adaptive Pre-training, DAPT)을 활용한 한국어 문서 요약 연구에서는 특정 도메인의 문서에 대한 이해도와 요약 성능을 향상시키기 위해 DAPT 기법을 적용했다. 이 연구는 사전 훈련된 언어 모델이 일반적인 언어 이해 능력을 넘어 특정 도메인에 최적화된 성능을 발휘할 수 있도록 도메인 특화 데이터셋을 사용하여 추가적인 사전 훈련을 진행한다. 구체적으로, 의료, 법률, 기술 등 다양한 도메인에서 수집한 한국어 텍스트 데이터를 이용하여 모델을 미세 조정하며, 이를 통해 얻은 모델은 도메인에 특화된 용어와 문맥을 효과적으로 처리할 수 있음을 보여준다. 성능 평가에서는 기존 사전 훈련 모델과 DAPT를 적용한 모델을 비교하여 DAPT의 효과를 검증했다. 연구 결과, DAPT를 적용한 모델은 도메인 특화 문서 요약 작업에서 성능 향상을 보였으며, 이는 실제 도메인별 활용에서도 유용할 것으로 기대된다.

CSCL 환경에서 사전훈련과 협력 스크립트 유형이 협력능력과 공유정신모형에 미치는 영향 (The effect of Pre-training and Collaboration script types on Collaboration skills and Shared meatal model in CSCL)

  • 김수현
    • 한국산학기술학회논문지
    • /
    • 제13권11호
    • /
    • pp.4984-4993
    • /
    • 2012
  • 본 연구는 협력능력에 대한 사전훈련과 협력 스크립트의 상호작용이 협력능력과 공유정신모형 형성에 미치는 영향을 알아보았다. K대 '교육방법 및 교육공학'을 수강하는 96명에게 사전훈련과 서로 다른 협력스크립트를 제공하고, 각 집단 별로 협력학습과정에서 이루어지는 메시지와 협력학습 후 개념도를 분석하였다. 연구 결과, 첫째 사전훈련과 협력 스크립트의 상호작용에 따른 협력 능력에는 유의미한 차이가 없었으나, 협력 스크립트 유형은 협력능력에 유의미한 영향을 미치는 것으로 나타났다. 둘째, 협력에 대한 사전 훈련과 협력 스크립트의 상호작용에 따른 공유정신모형 형성에는 유의미한 차이가 없었으나, 협력 스크립트 유형은 공유정신모형에 유의미한 영향을 미치는 것으로 나타났다. 이 연구는 CSCL 환경에서 효과적인 협력학습활동을 위한 전략 제시라는 점에서 의의가 있다.

재난안전 현장훈련시스템에 관한 연구 (A Study of Disaster Preparation Training System for the Industry)

  • 김건헌
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2022년 정기학술대회 논문집
    • /
    • pp.179-180
    • /
    • 2022
  • 본 논문에서는 재난안전 대비 현장훈련시스템을 개발하기 위하여 현황을 분석하는 것이 목적이다. 현재 일반적으로 이뤄지고 있는 훈련은 실제 재난상황을 고려하지 않은 형식적인 훈련으로 재난유형 및 발생상황에 부적합한 훈련장소 및 시간에 실시하고 있다. 현재는 사전 공개된 훈련시나리오에 따른 연출된 보여 주기식 훈련으로 실제 재난상황이 발생할 때 의사결정 권한을 가진 지휘권자가 훈련에 불참하는 조직문화가 가장 먼저 해결되어야 하는 것으로 나타났다. 대형재난에 대한 대응능력을 강화하고 재난으로부터 국민을 보호하기 위한 안전훈련이 범국가적으로 진행되는 가운데 '안전한국훈련'을 에너지부분에서도 전국적으로 실시하고 있다. 미국, 일본의 재난대응훈련의 특징은 우리나라와 같이 평가지표 틀에 맞춘 시나리오를 개발하지 않고 있으며 시나리오 구성도 세분화하지 않고 단지 상황 설정과 대응 메시지, 돌발 메시지 등으로 위기대응 능력을 평가하고 있다는 것이다. 에너지산업 현장용 재난대비 훈련시스템 개발 및 구축은 국가안전 관리 측면에서도 매우 중요하다. 국가 차원의 종합 재난대응 및 인프라 제공을 위한 다수의 정보화사업이 추진되고 있으나 재난 정보를 활용한 사전 예방, 신속한 상황 전파, 정보공동 활용 및 대응 미진에 대한 종합적 진단이필요하다.

  • PDF

딥러닝 기반 집-나무-사람 검사 분석 모델의 개발 (Development of Deep Learning-Based House-Tree-Person Test Analysis Model)

  • 조승제;조건우;김영욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.558-561
    • /
    • 2021
  • 심리학에서 사람의 심리 상태를 알아보기 위해 사용되는 검사 방법 중, 집-나무-사람 검사(HTP Test)는 피실험자가 그린 집, 나무, 사람을 포함하는 그림을 사용하여 피실험자의 심리를 분석하는 투영 검사법이다. 본 논문에서는 딥러닝 모델을 이용해 HTP Test 에 사용되는 그림을 분석하는 시스템을 제안하며, 성능 평가를 통해 심리학에서의 딥러닝 모델 적용 가능성을 확인한다. 또한 그림 데이터 분석에 적합한 사전 훈련 모델을 개발하기 위해, ImageNet 과 스케치 데이터셋으로 사전 훈련하여 성능을 비교한다. 본 논문에서 제안하는 시스템은 크게 감정 분석을 위한 이미지 객체 추출부, 추출된 객체로 피실험자의 감정을 분류하는 감정 분류부로 구성되어 있다. 객체 추출과 이미지 분류 모두 CNN(Convolution Neural Network) 기반의 딥러닝 모델을 사용하며, 이미지 분류 모델은 서로 다른 데이터셋으로 모델을 사전 훈련한 후, 훈련 데이터셋으로 전이 학습하여 모델의 성능을 비교한다. 그림 심리 분석을 위한 HTP test 스케치 데이터셋은, HTP Test 와 동일하게 피실험자가 3 개 클래스의 집, 나무, 사람의 그림을 그려 자체 수집하였다.

에너지 산업현장에서의 재난안전 현장훈련시스템에 관한 연구 (A Study of Disaster Preparation Training System for the Energy Industry)

  • 박남희;여욱현
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2016년 정기학술대회
    • /
    • pp.195-197
    • /
    • 2016
  • 본 논문에서는 재난안전 대비 현장훈련시스템을 개발하기 위하여 현황을 분석하는 것이 목적이다. 현재 일반적으로 이뤄지고 있는 훈련은 실제 재난상황을 고려하지 않은 형식적인 훈련으로 재난유형 및 발생상황에 부적합한 훈련장소 및 시간에 실시하고 있다. 현재는 사전 공개된 훈련시나리오에 따른 연출된 보여 주기식 훈련으로 실제 재난상황이 발생할 때 의사결정 권한을 가진 지휘권자가 훈련에 불참하는 조직문화가 가장 먼저 해결되어야 하는 것으로 나타났다. 대형재난에 대한 대응능력을 강화하고 재난으로부터 국민을 보호하기 위한 안전훈련이 범국가적으로 진행되는 가운데 '안전한국훈련'을 에너지부분에서도 전국적으로 실시하고 있다. 미국, 일본의 재난대응훈련의 특징은 우리나라와 같이 평가지표 틀에 맞춘 시나리오를 개발하지 않고 있으며 시나리오 구성도 세분화하지 않고 단지 상황 설정과 대응 메시지, 돌발 메시지 등으로 위기대응 능력을 평가하고 있다는 것이다. 에너지산업 현장용 재난대비 훈련시스템 개발 및 구축은 국가안전 관리 측면에서도 매우 중요하다. 국가 차원의 종합 재난대응 및 인프라 제공을 위한 다수의 정보화 사업이 추진되고 있으나 재난 정보를 활용한 사전 예방, 신속한 상황 전파, 정보 공동 활용 및 대응 미진에 대한 종합적 진단이 필요하다.

  • PDF

행동-감정 반영 중심의 공감 기술 증진 부모훈련이 자폐스펙트럼 장애 아동의 사회기술과 일상생활기능에 미치는 효과 (The Effectiveness of a Behavior-Emotion Centered Sympathy Skills Parenting Training for Autism Spectrum Disorder to Improve Social Skills and Daily living functions)

  • 정희승
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
    • /
    • pp.397-398
    • /
    • 2015
  • 본 연구의 목적은 행동-감정 반영 중심의 공감기술 증진 부모훈련이 자폐스펙트럼 장애 아동의 사회기술과 일상생활 기능에 미치는 효과를 알아보고자 하는 것이다. 연구대상자는 만 3세-7세의 남녀 35명이 참여하였고, 부모훈련은 주 2회씩 총 10회기를 실시하였다. 부모훈련의 내용구성은 사전검사와 전문가를 통한 내용타당도 검증을 실시한 후에 적용하였고, 자료처리는 SPSS 18.0을 이용하였다. 부모교육 프로그램의 전과 후의 효과를 검증하기 위해서 통제집단 사전사후검사설계를 하였다. 효과검정은 ANCOVA를 하였다. 연구결과 부모훈련실시 후, 자페스펙트럼장애아동의 사회기술과 일상생활기능을 증진시키는데 효과가 있었다. 결론적으로 행동-반영중심의 공감기술증진 부모훈련은 자폐스펙트럼장애 아동의 사회기술과 일상생활 기능 증진에 효과가 있었다.

  • PDF

다중 댐 유역에 대한 강우예측모델 개발을 위한 전이학습 기법의 적용 (Application of transfer learning to develop radar-based rainfall prediction model with GAN(Generative Adversarial Network) for multiple dam domains)

  • 최수연;김연주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.61-61
    • /
    • 2022
  • 최근 머신러닝 기술의 발달에 따라 이를 활용한 레이더 자료기반 강우예측기법이 활발히 개발되고 있다. 기존 머신러닝을 이용한 강우예측모델 개발 관련 연구는 주로 한 지역에 대해 수행되며, 데이터 기반으로 훈련되는 머신러닝 기법의 특성상 개발된 모델이 훈련된 지역에 대해서만 좋은 성능을 보인다는 한계점이 존재한다. 이러한 한계점을 해결하기 위해 사전 훈련된 모델을 이용하여 새로운 데이터에 대해 모델을 훈련하는 전이학습 기법 (transfer learning)을 적용하여 여러 유역에 대한 강우예측모델을 개발하고자 하였다. 본 연구에서는 사전 훈련된 강우예측 모델로 생성적 적대 신경망 기반 기법(Generative Adversarial Network, GAN)을 이용한 미래 강우예측모델을 사용하였다. 해당 모델은 기상청에서 제공된 2014년~2017년 여름의 레이더 이미지 자료를 이용하여 초단기, 단기 강우예측을 수행하도록 학습시켰으며, 2018년 레이더 이미지 자료를 이용한 단기강우예측 모의에서 좋은 성능을 보였다. 본 연구에서는 훈련된 모델을 이용해 새로운 댐 유역(안동댐, 충주댐)에 대한 강우예측모델을 개발하기 위해 여러 전이학습 기법을 적용하고, 그 결과를 비교하였다. 결과를 통해 새로운 데이터로 처음부터 훈련시킨 모델보다 전이학습 기법을 사용하였을 때 좋은 성능을 보이는 것을 확인하였으며, 이를 통해 여러 댐 유역에 대한 모델 개발 시 전이학습 기법이 효율적으로 적용될 수 있음을 확인하였다.

  • PDF

지각 훈련을 통한 한국어 폐쇄음 음향 신호 가중치의 L2 학습 (Learning acoustic cue weights for Korean stops through L2 perception training)

  • 오은진
    • 말소리와 음성과학
    • /
    • 제13권4호
    • /
    • pp.9-21
    • /
    • 2021
  • 본 연구는 한국어 평음과 기음 대조에 초점을 맞춘 지각 훈련을 통해 한국어 학습자들이 L2 폐쇄음을 대조하는 음향 신호의 지각 가중치를 모국어 값의 방향으로 개선하는지 고찰하였다. 중국어가 모국어인 한국어 학습자 19명과 지각 훈련을 진행한 한국어가 모국어인 교사 2명이 실험에 참가하였다. 사전 테스트 결과에 따라 훈련 집단과 비훈련 집단으로 나누었고, 훈련 집단만 5일 동안 지각 훈련을 진행하였다. 폐쇄음 신호의 지각 가중치를 추정하기 위해 음향 신호를 체계적으로 조작한 자극으로 사전 및 사후 테스트를 시행했다. 개별 학습자들의 테스트 결과에 대해 이분형 로지스틱 회귀 분석을 시행해, 말소리 대조를 지각하는 데에 해당 음향 신호를 사용한 가중치를 추정하는 지각 β 계수 값을 계산하였다. 두 폐쇄음을 구별하는 주요 신호인 F0의 지각 계수에 대해, 훈련 집단은 사전 테스트 대비 사후 테스트에서 평균 0.451의 통계적으로 유의미한 증가를 보인 반면 비훈련 집단은 유의미하지 않은 0.246의 증가를 나타냈다. 그러나 지각 훈련 후 F0 사용의 변화 패턴이 개별 학습자들 간에 다양하게 나타났다.

참조화자로부터 추정된 적응적 혼성 사전분포를 이용한 MAPLR 고속 화자적응 (Rapid Speaker Adaptation Based on MAPLR with Adaptive Hybrid Priors Estimated from Reference Speakers)

  • 송영록;김형순
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.315-323
    • /
    • 2011
  • 본 논문은 maximum a posteriori linear regression (MAPLR) 기반의 고속 화자적응 성능을 개선하기 위하여 사전분포를 추정하는 두 가지 방식을 제안한다. 일반적으로 MAPLR 방식에서 사용되는 변환행렬의 사전분포는 화자독립모델을 구성하는 훈련 화자들로부터 추정되어 모든 화자들에게 동등하게 적용된다. 본 논문에서는 새로운 화자에게 보다 더 적합한 사전분포를 적용하고자 적응 데이터를 이용하여 새로운 화자의 음향특성과 가까운 참조화자 집단을 선택한 후 참조화자 집단으로부터 사전분포를 추정하는 방법을 제안한다. 또한, 블록 대각 형태의 변환행렬의 사전분포를 추정하는 경우 사전분포의 평균행렬과 공분산행렬을 동일한 훈련 화자들로부터 얻어진 두 가지 형태의 변환행렬집단으로부터 각각 추정하는 방법을 제안한다. 제안된 방법의 성능 평가를 위하여 고립단어 인식실험을 통해 적응 단어의 개수에 따른 단어 인식률을 평가한다. 실험결과, 적응 단어 수가 매우 적을 때 기존의 MAPLR 방식에 비하여 통계적으로 유의미한 성능향상이 얻어짐을 보여준다.