• 제목/요약/키워드: 언어 연수

검색결과 62건 처리시간 0.022초

정답과 구절의 공동 주의 집중 계층을 이용한 한국어 질문 생성 (Korean Question Generation Using Co-Attention Layer of Answer and Passage)

  • 김진태;노형종;이연수;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.315-320
    • /
    • 2019
  • 질문 생성이란 구절이 입력되면 구절에서 답을 찾을 수 있는 질문을 자동으로 생성하는 작업으로 교육용 시스템, 대화 시스템, QA 시스템 등 다양한 분야에서 중요한 역할을 한다. 질문 생성에서 정답의 단어가 질문에 포함되는 문제점을 해결하기 위해 구절과 정답을 분리한다. 하지만 구절과 정답을 분리하게 되면 구절에서 정답의 정보가 손실되고, 정답에서는 구절의 문맥 정보가 손실되어 정답 유형에 맞는 질문을 생성할 수 없는 문제가 발생된다. 본 논문은 이러한 문제를 해결하기 위해 분리된 정답과 구절의 정보를 연결시켜주는 정답과 구절의 공동 주의 집중 계층을 제안한다. 23,658개의 질문-응답 쌍의 말뭉치를 이용한 실험에서 정답과 구절의 공동 주의 집중 계층이 성능 향상에 기여해 우수한 성능(BLEU-26.7, ROUGE-57.5)을 보였다.

  • PDF

대화 시스템의 개체 생략 복원을 위한 유효 발화문 인식 (Valid Conversation Recognition for Restoring Entity Ellipsis in Chat Bot)

  • 소찬호;왕지현;이충희;이연수;강재우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.54-59
    • /
    • 2019
  • 본 논문은 대화 시스템인 챗봇의 성능 향상을 위한 생략 복원 기술의 정확률을 올리기 위한 유효 발화문 인식 모델을 제안한다. 생략 복원 기술은 챗봇 사용자의 현재 발화문의 생략된 정보를 이전 발화문으로부터 복원하는 기술이다. 유효 발화문 인식 모델은 현재 발화문의 생략된 정보를 보유한 이전 발화문을 인식하는 역할을 수행한다. 유효 발화문 인식 모델은 BERT 기반 이진 분류 모델이며, 사용된 BERT 모델은 한국어 문서를 기반으로 새로 학습된 한국어 사전 학습 BERT 모델이다. 사용자의 현재 발화문과 이전 발화문들의 토큰 임베딩을 한국어 BERT를 통해 얻고, CNN 모델을 이용하여 각 토큰의 지역적인 정보를 추출해서 발화문 쌍의 표현 정보를 구해 해당 이전 발화문에 생략된 개체값이 있는지를 판단한다. 제안한 모델의 효과를 검증하기 위해 유효 발화문 인식 모델에서 유효하다고 판단한 이전 발화문만을 생략 복원 모델에 적용한 결과, 생략 복원 모델의 정확률이 약 5% 정도 상승한 것을 확인하였다.

  • PDF

대규모 언어 모델 기반 대학 입시상담 챗봇 (College Admissions Counseling ChatBot based on a Large Language Models)

  • 이세훈;이웅회;김지웅;노연수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.371-372
    • /
    • 2023
  • 본 논문에서는 대규모 언어 모델(Large Language Models)을 기반으로 한 입학 상담용 챗봇을 설계하였다. 입시 전문 LLM은 Polyglot-ko 5.8B을 베이스 모델로 대학의 입시 관련 데이터를 수집, 가공한 후 데이터 증강을 하여 파인튜닝 하였다. 또한, 모델 성능 향상을 위해 RLHF의 후 공정을 진행하였다. 제안 챗봇은 생성한 입시 LLM을 기반으로 웹브라우저를 통해 접근하여 입시 상담 자동 응답 서비스를 활용할 수 있다.

  • PDF

가정환경 특성과 연령에 따른 지능검사 소검사에서의 수행 (Performance in subtests of Intelligence Scale Based on HOME environment Stimuli and Age)

  • 김연수
    • 한국융합학회논문지
    • /
    • 제10권6호
    • /
    • pp.251-257
    • /
    • 2019
  • 본 연구의 목적은 가정환경의 자극 특성과 연령에 따른 웩슬러 아동용지능검사의 소검사별 수행을 알아보는데 있었다. 이를 위하여 만 6-16세 아동 청소년 128명을 대상으로 훈련받은 검사자가 K-WISC-IV를 실시하였으며 아동의 어머니에게 가정의 물리적, 정서적 특성에 대한 HOME를 실시하였다. 연령에 따라 만 6-10세와 11-16세 집단별로 분석한 결과 두 연령집단 모두 전체 지능 및 언어이해 지표와 가정환경자극 간 유의미한 정적 상관이 발견되었다. 6-10세 집단의 경우 가정환경자극의 하위영역 중 언어적 자극 및 학습자료가 언어이해, 작업기억, 지각추론, 전체 지능과 유의미한 관련성이 있었으며, 11-16세 집단의 경우, 자기조력 장려 및 학습자료가 전체지능, 언어이해, 작업기억 지표와 유의미한 정적 상관이 있었다. 본 연구의 주요 결과가 논의되었으며, 향후 지능검사의 개정을 반영한 새로운 소검사의 수행과 가정환경자극 간 관련성이 연구되어야 할 필요성이 제시되었다.

초등 과학영재 수업에서의 언어적 상호작용 사례 분석 (Case Analysis of Verbal Interaction of Science-Gifted Elementary Students in Their Science Classes)

  • 김동현;김효남
    • 한국과학교육학회지
    • /
    • 제31권8호
    • /
    • pp.1145-1157
    • /
    • 2011
  • 본 연구의 목적은 초등 과학영재 수업에서 나타나는 언어적 상호작용의 특징을 살펴보고 현장에서 언어적 상호작용 전략을 수립하는데 도움을 주고자 하는 것이다. 이를 위해 지역 교육지원청 영재교육원 수업 3곳의 총 27차시 수업에 참여하여 녹화하였으며, 전사 및 코딩의 과정을 거쳐 분석하였다. 분석에 사용된 분석틀은 Sinclair와 Coulthard(1975)의 이론에 근거한 정민수 등(2007)의 분석틀에서 교사 피드백 부분을 김영순(2010)의 분석틀로 일부 수정한 언어적 상호작용 분석틀이었다. 분석 후 분석결과 확인 및 언어적 상호작용에 대한 인식을 알아보고자 수업자와의 설문조사를 실시하였다. 연구 결과, 초등 과학영재 수업에서 가장 많이 나타난 IRF 패턴 유형은 관리적 질문-단답형 응답 유형이었다. 이러한 결과의 원인을 수업 외적인 측면으로 인식하고 있었다. 또한 수업 사례를 통해 과학영재의 창의적 사고를 이끌어 내는데 효과적인 몇 가지 패턴 유형을 확인하였는데, 이를 통하여 언어적 상호작용 전략은 막연히 개방적 질문, 지연적 피드백을 따로 구분하여 각각 좋다는 인식보다 학습 내용의 난이도 및 학생의 수준 등을 고려하여 상황에 적합한 패턴 전략으로 적용되어야 한다는 것을 알 수 있었다. 교사 3명은 평소 초등 과학영재 수업에서의 언어적 상호작용 전략에 대하여 막연히 편안한 분위기, 개방적 질문과 지연적 피드백 정도로 인식하거나 전략이 아예 없는 것으로 나타났다. 앞으로 초등과학영재 담당 교사들의 언어적 상호작용 전략에 대한 연수 등 다양한 전문성 향상 기회가 마련되어야할 것으로 사료된다.

디지털 시대의 융·복합 교육을 위한 영어영재 교사교육 방안 (Way of Training English Teacher's of Verbally Talented Children for convergence-based Education in the Digital Age)

  • 박진규
    • 한국융합학회논문지
    • /
    • 제7권6호
    • /
    • pp.185-192
    • /
    • 2016
  • 본 논문은 영재 영어교육을 담당하는 영어교사들이 갖추어야 할 영어교육과 영재교육의 지식과 그 구체적인 내용을 다루고 있다. 먼저, 지나치게 원어민 중심, 속진 중심 영어전용 교육 중심의 영어교육과 영어교사 교육에 내재된 문제점을 분석하고 그 문제점에 대한 해결책을 모색한다. 다음으로 영재교육이 가지고 있는 문제점을 분석하고 그 문제점에 대한 해결책을 모색한다. 먼저 이 두 분야의 문제점을 바탕으로 영재 영어교육에 대한 방향을 제시하고 그 방향에 따른 영재 영어교사 연수의 방향을 제시한다. 지나치게 영어 하나에 초점을 둔 현재의 영재 영어교육에 대한 비판을 바탕으로 이중언어 중심의 내용중심과 사고력을 배양할 수 있는 융 복합 기반의 표현중심 영재 영어교육을 해야 하고 그에 맞는 영재 영어교사교육을 해야 할 것이다.

입력 문장 Noising과 Attention 기반 비교사 한국어 문체 변환 (Attention-based Unsupervised Style Transfer by Noising Input Sentences)

  • 노형종;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.434-439
    • /
    • 2018
  • 문체 변환 시스템을 학습하는 데 있어서 가장 큰 어려움 중 하나는 병렬 말뭉치가 부족하다는 것이다. 최근 대량의 비병렬 말뭉치만으로 문체 변환 문제를 해결하려는 많은 연구들이 발표되었지만, 아직까지도 원 문장의 정보 보존(Content preservation)과 문체 변환(Style transfer) 모두를 이루는 것이 쉽지 않은 상태이다. 특히 비교사 학습의 특성상 문체 변환과 동시에 정보를 보존하는 것이 매우 어렵다. Attention 기반의 Seq2seq 네트워크를 이용할 경우에는 과도하게 원문의 정보가 보존되어 문체 변환 능력이 떨어지기도 한다. 그리고 OOV(Out-Of-Vocabulary) 문제 또한 존재한다. 본 논문에서는 Attention 기반의 Seq2seq 네트워크를 이용하여 어절 단위의 정보 보존력을 최대한 높이면서도, 입력 문장에 효과적으로 Noise를 넣어 문체 변환 성능을 저해하는 과도한 정보 보존 현상을 막고 문체의 특성을 나타내는 어절들이 잘 변환되도록 할 뿐 아니라 OOV 문제도 줄일 수 있는 방법을 제안한다. 우리는 비교 실험을 통해 본 논문에서 제안한 방법들이 한국어 문장뿐 아니라 영어 문장에 대해서도 state-of-the-art 시스템들에 비해 향상된 성능을 보여준다는 사실을 확인하였다.

  • PDF

한국어 모바일 대화형 에이전트 시스템 (A Korean Mobile Conversational Agent System)

  • 홍금원;이연수;김민정;이승욱;이주영;임해창
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.263-271
    • /
    • 2008
  • 본 논문에서는 한국어 정보처리 기술을 사용한 모바일 환경의 대화형 에이전트 시스템에 대해 논한다. 대화형 에이전트 시스템 구축의 목적은 인간 사용자와 시스템 에이전트간의 자연어 인터페이스를 제공하여 보다 편리한 상호작용을 가능하게 하는 데 있다. 모바일 환경의 대화형 에이전트를 구축하기 위해서는 구어체 발화에 특화된 다양한 언어 처리 및 언어 이해 요소들이 필요하다. 본 시스템은 입력 문장의 오류처리, 형태소 분석 및 품사 태깅, 양태 분석, 논항 인식 및 의미프레임 생성, 그리고 유사 발화 검색 및 응답 생성으로 구성된다. 주어진 사용자 발화에 적절한 응답을 생성하기 위해서 본 시스템은 사용자 발화와 예제 발화 간의 어휘적, 통사/구문적, 의미적 유사도 정보를 활용하여 예제기반 응답 검색을 수행한다.

  • PDF

한국어 수사구조 분류체계 수립 및 주석 코퍼스 구축 (Building an RST-tagged Corpus and its Classification Scheme for Korean News Texts)

  • 노은정;이연수;김연우;이도길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-38
    • /
    • 2016
  • 수사구조는 텍스트의 각 구성 성분이 맺고 있는 관계를 의미하며, 필자의 의도는 논리적인 구조를 통해서 독자에게 더 잘 전달될 수 있다. 따라서 독자의 인지적 효과를 극대화할 수 있도록 수사구조를 고려하여 단락과 문장 구조를 구성하는 것이 필요하다. 그럼에도 불구하고 지금까지 수사구조에 기초한 한국어 분류체계를 만들거나 주석 코퍼스를 설계하려는 시도가 없었다. 본 연구에서는 기존 수사구조 이론을 기반으로, 한국어 보도문 형식에 적합한 30개 유형의 분류체계를 정제하고 최소 담화 단위별로 태깅한 코퍼스를 구축하였다. 또한 구축한 코퍼스를 토대로 중심문장을 비롯한 문장 구조의 특징과 분포 비율, 신문기사의 장르적 특성 등을 살펴봄으로써 텍스트에서 응집성의 실현 양상과 구문상의 특징을 확인하였다. 본 연구는 한국어 담화 구문에 적합한 수사구조 분류체계를 설계하고 이를 이용한 주석 코퍼스를 최초로 구축하였다는 점에서 의의를 갖는다.

  • PDF

점막하구개열 수술 후 지속된 구개인두부전에 대한 수축근 구개인두성형술 증례 (A Case of Sphincter Pharyngoplasty for Persistent Velopharyngeal Insufficiency After Submucosal Cleft Palate Surgery)

  • 이윤형;최연수;김성열;최정석
    • 대한후두음성언어의학회지
    • /
    • 제33권3호
    • /
    • pp.188-192
    • /
    • 2022
  • Velopharyngeal insufficiency (VPI) is a phenomenon that can occur due to anatomical or neurological causes of the soft palate. VPI can make the patient difficult to articulate through hypernasality and nasal emission. There has been needed the customized treatment, as VPI can occur for many causes. We present the case of 21-year-old male who took palate plastic surgery 20 years ago for congenital submucosal cleft palate. As he had poor contraction of both lateral side of velopharynx, he was diagnosed with coronal type VPI. Through sphincter pharyngoplasty, he can obtain improvement of articulation accuracy. We would like to share this challenged case.