• 제목/요약/키워드: 질문기

검색결과 205건 처리시간 0.025초

KorQuAD를 활용한 한국어 오픈도메인 질의응답 시스템 (Korean Open Domain Question Answering System Using KorQuAD)

  • 조상현;김민호;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.321-325
    • /
    • 2019
  • 오픈 도메인 질의응답이란, 질문을 줬을 때 그 질문과 연관성이 높은 문서를 검색하고 검색된 문서에서 정답을 추출하는 태스크이다. 본 논문은 기계 독해 데이터인 KorQuAD를 활용한 오픈도메인 질의응답 시스템을 제안한다. 문서 검색기를 이용하여 질문과 관련 있는 위키피디아 문서들을 검색하고 검색된 문서에 단락 선택 모델을 통해서 문서 질문과 연관성이 높은 단락들을 선별하여 기계 독해 모델에서 처리해야 할 입력의 수를 줄였다. 문서 선별모델에서 선별된 여러 단락에서 추출된 정답 후보에서 여러 가지 정답 모형을 적용하여 성능을 비교하는 실험을 하였다. 본 논문에서 제안한 오픈도메인 질의응답 시스템을 KorQuAD에 적용했을 때, 개발 데이터에서 EM 40.42%, F1 55.34%의 성능을 보였다.

  • PDF

인공지능 문장 분류 모델 Sentence-BERT 기반 학교 맞춤형 고등학교 통합과학 질문-답변 챗봇 -개발 및 1년간 사용 분석- (A School-tailored High School Integrated Science Q&A Chatbot with Sentence-BERT: Development and One-Year Usage Analysis)

  • 민경모;유준희
    • 한국과학교육학회지
    • /
    • 제44권3호
    • /
    • pp.231-248
    • /
    • 2024
  • 본 연구에서는 오픈소스 소프트웨어와 인공지능 문서 분류 모델인 한국어 Sentence-BERT로 고등학교 1학년 통합과학 질문-답변 챗봇을 제작하고 2023학년도 1년 동안 독립형 서버에서 운영했다. 챗봇은 Sentence-BERT 모델로 학생의 질문과 가장 유사한 질문-답변 쌍 6개를 찾아 캐러셀 형태로 출력한다. 질문-답변 데이터셋은 인터넷에 공개된 자료를 수집하여 초기 버전을 구축하였고, 챗봇을 1년 동안 운영하면서 학생의 의견과 사용성을 고려하여 자료를 정제하고 새로운 질문-답변 쌍을 추가했다. 2023학년도 말에는 총 30,819개의 데이터셋을 챗봇에 통합하였다. 학생은 챗봇을 1년 동안 총 3,457건 이용했다. 챗봇 사용 기록을 빈도분석 및 시계열 분석한 결과 학생은 수업 중 교사가 챗봇 사용을 유도할 때 챗봇을 이용했고 평소에는 방과 후에 자습하면서 챗봇을 활용했다. 학생은 챗봇에 한 번 접속하여 평균적으로 2.1~2.2회 정도 질문했고, 주로 사용한 기기는 휴대폰이었다. 학생이 챗봇에 입력한 용어를 추출하고자 한국어 형태소 분석기로 명사와 용언을 추출하여 텍스트 마이닝을 진행한 결과 학생은 과학 질문 외에도 시험 범위 등의 학교생활과 관련된 용어를 자주 입력했다. 학생이 챗봇에 자주 물어본 주제를 추출하고자 Sentence-BERT 기반의 BERTopic으로 학생의 질문을 두 차례 범주화하여 토픽 모델링을 진행했다. 전체 질문 중 88%가 35가지 주제로 수렴되었고, 학생이 챗봇에 주로 물어보는 주제를 추출할 수 있었다. 학년말에 학생을 대상으로 한 설문에서 챗봇이 캐러셀 형태로 결과를 출력하는 형태가 학습에 효과적이었고, 통합과학 학습과 학습 목적 이외의 궁금증이나 학교생활과 관련된 물음에 답해주는 역할을 수행했음을 확인할 수 있었다. 본 연구는 공교육 현장에서 학생이 실제로 활용하기에 적합한 챗봇을 개발하여 학생이 장기간에 걸쳐 챗봇을 사용하는 과정에서 얻은 데이터를 분석함으로써 학생의 요구를 충족할 수 있는 챗봇의 교육적 활용 가능성을 확인했다는 점에 의의가 있다.

오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구 (A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries)

  • 안애림;이서진;최동현;김응균;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

도서관 독서치료사의 독서치료 경험 분석 (An Analysis on Bibliotherapy Experiences of Bibliotherapists in Library)

  • 임성관
    • 한국도서관정보학회지
    • /
    • 제47권2호
    • /
    • pp.417-436
    • /
    • 2016
  • 본 연구는 도서관에서 독서치료 프로그램을 진행하는 독서치료사들의 경험을 알아보는데 목적이 있다. 이를 위하여 질적 연구 방법 중 포커스 그룹 인터뷰 방식을 사용하였다. 연구 참여자는 독서치료사로 활동하고 있는 12명으로, 이들을 대상으로 각각 6명씩 2개의 포커스 그룹 인터뷰를 진행하였다. 인터뷰는 Krueger와 Casey(2000)가 제시한 질문 방식을 수정하여 도입 질문, 소개 질문, 주요 질문, 마무리 질문의 4가지 종류로 정하여 개방형 질문 방식으로 진행하고, Morgan과 Scannell(1998)이 제시한 분석 방법을 사용하여 분석하였다. 그 결과 도서관 독서치료사로서 치료과정에서의 경험에 대해 7개의 주제, 26개의 범주, 84개의 개념이 도출되었다. 본 연구는 치료과정에서 나타나는 도서관 독서치료사의 어려움을 관찰하고 개선점을 마련함으로써 각 치료 프로그램들이 더욱 효과적일 수 있도록 함은 물론, 도서관과 독서치료사 모두 성장을 기할 수 있도록 하는데 의미가 있다.

클래스 임베딩과 주의 집중 순환 신경망을 이용한 자주 묻는 질문의 자동 분류 (Automatic Classification of Frequently Asked Questions Using Class Embedding and Attentive Recurrent Neural Network)

  • 장영진;김학수;김세빈;강동호;장현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.367-370
    • /
    • 2018
  • 웹 또는 모바일 사용자는 고객 센터에 구축된 자주 묻는 질문을 이용하여 원하는 서비스를 제공받는다. 그러나 자주 묻는 질문은 사용자가 직접 핵심어를 입력하여 검색된 결과 중 필요한 정보를 찾아야 하는 어려움이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 사용자 질의를 입력 받아 질의에 해당하는 클래스를 분류해주는 문장 분류 모델을 제안한다. 제안모델은 웹이나 모바일 환경의 오타나 맞춤법 오류에 대한 강건함을 위해 자소 단위 합성곱 신경망을 사용한다. 그리고 기계 번역 이외에도 자연어 처리 부분에서 큰 성능 향상을 보여주는 주의 집중 방법과 클래스 임베딩을 이용한 문장 분류 시스템을 사용한다. 457개의 클래스 분류와 769개의 클래스 분류에 대한 실험 결과 Micro F1 점수 기준 81.32%, 61.11%의 성능을 보였다.

  • PDF

2.45GHz 마이크로파 무선데이터 인식 시스템 개발 (Development of 2.45GHz Microwave Identification System)

  • 윤동기;박양하;김관호;이영철
    • 한국통신학회논문지
    • /
    • 제24권7B호
    • /
    • pp.1342-1350
    • /
    • 1999
  • 본 논문에서는 2.45GHz 비접촉식 마이크로파 무선인식시스템을 개발하고 특성을 분석하였다. 응답기와 질문기 사이에 9,600bps 전송속도로 데이터 인식을 통하여 통신절차와 에러검출 보정방식 및 송.수신회로 범용소자를 이용하여 설계.제작하였고, 송.수신안테나와 응답기 전원제어를 위한 제어 프로토콜을 추가하여 시스템의 신뢰성을 향상시켰다. 실험결과, 응답기는 3.6V의 전원 공급시 15$\mu\textrm{A}$의 저전류 소모를 보였으며 최대, 80km/h의 이동속도에 대한 데이터 전송 성공률은 초대 인식거리 10m에서 90%이상의 결과를 얻었다.

  • PDF

애착의 평가 (THE MEASUREMENT OF ATTACHMENT)

  • 이경숙
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제15권1호
    • /
    • pp.28-39
    • /
    • 2004
  • 본 글에서는 애착유형과 정도를 측정하는 심리학적 평가도구들에 대해 발달연령적 접근으로 살펴보았으며 각 도구들의 신뢰성, 타당성과 관련된 연구들을 고찰하였다. 영유아기의 애착평가도구로는 낯선상황절차(SSP), 애착Q-Set(AQS)을, 유아/아동기 도구로는 $3{\sim}4$세 유아용 애착평가도구인 Cassidy-Marvin의 애착유형체계, Crittenden의 PAA, Main과 Cassidy의 애착유형평가와 인형놀이기법을 이용한 MSSB와 애착유형별 가족그림분석을 소개하였다. 아동/청소년기 도구로는 부모와 또래와의 애착을 재는 자기보고식 질문지인 IPPA를, 청소년기/성인기 도구로는 성인애착면접(AAI)과 성인들간의 낭만적 애착을 재는 ASQ를 소개하였다.

  • PDF

지구상에 스티로폴 포장재의 사용 규제는 없어 (No bans on EPS Packin in the world)

  • 한국발포스티렌재활용협회
    • 환경사랑
    • /
    • 통권61호
    • /
    • pp.4-6
    • /
    • 2011
  • 스티로폴(EPS) 포장재를 사용하여 수출하는 기업들로부터 해당 수출지역에 스티로폴 포장재 사용에 대한 규제가 있는가를 묻는 질문을 가끔 받는다. 관련 국제기구들에 문의한 결과 어느 지역에도 스티로폴 포장재 사용에 관한 규제가 없는 것으로 확인 되었다.

  • PDF