• 제목/요약/키워드: 질문분석

검색결과 1,740건 처리시간 0.034초

오픈 도메인 질의응답을 위한 질문-구절의 밀집 벡터 표현 연구 (A Study on the Dense Vector Representation of Query-Passage for Open Domain Question Answering)

  • 정민지;이새벽;김영준;허철훈;이충희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.115-121
    • /
    • 2022
  • 질문에 답하기 위해 관련 구절을 검색하는 기술은 오픈 도메인 질의응답의 검색 단계를 위해 필요하다. 전통적인 방법은 정보 검색 기법인 빈도-역문서 빈도(TF-IDF) 기반으로 희소한 벡터 표현을 활용하여 구절을 검색한다. 하지만 희소 벡터 표현은 벡터 길이가 길 뿐만 아니라, 질문에 나오지 않는 단어나 토큰을 검색하지 못한다는 취약점을 가진다. 밀집 벡터 표현 연구는 이러한 취약점을 개선하고 있으며 대부분의 연구가 영어 데이터셋을 학습한 것이다. 따라서, 본 연구는 한국어 데이터셋을 학습한 밀집 벡터 표현을 연구하고 여러 가지 부정 샘플(negative sample) 추출 방법을 도입하여 전이 학습한 모델 성능을 비교 분석한다. 또한, 대화 응답 선택 태스크에서 밀집 검색에 활용한 순위 재지정 상호작용 레이어를 추가한 실험을 진행하고 비교 분석한다. 밀집 벡터 표현 모델을 학습하는 것이 도전적인 과제인만큼 향후에도 다양한 시도가 필요할 것으로 보인다.

  • PDF

오픈도메인 질의문 자동 분류를 위한 주석 말뭉치 구축 연구 (A study on the Construction of Annotated corpora for the Automatic Classification of Open Domain Queries)

  • 안애림;이서진;최동현;김응균;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-314
    • /
    • 2019
  • 본 연구는 오픈도메인 자연어 질의문 유형을 '질문 초점(Question Focus)'에 따라 분류하고, 기계학습 기반 질의문 유형 분류기의 성능 향상을 위한 주석 말뭉치 구축을 목표로 한다. 오픈도메인 질의문 분석을 통해 의문사 등의 키워드 기반 질의문 유형 분류의 한계를 설명하고, 질의문 내의 비명시적인 의미자질을 고려한 질문 초점 기반 질의문 유형 분류 기준을 정의하였다. 이 기준에 따라 구축된 112,856 문장의 주석 말뭉치를 기계학습(CNN) 기반 문장 분류 시스템의 학습 데이터로 사용하여 실험한 결과 F1-Score 97.72%성능을 보였다. 또한 이를 카카오 오픈도메인 질의응답시스템에 적용하여 질의문 확장을 위한 의미 자질로 사용하였고 그 결과 전체 시스템 성능을 1.6%p 향상시켰다.

  • PDF

텍스트마이닝을 활용한 웹사이트 FAQ 개선방안: S대학교 사례를 중심으로 (Improvement Plan of Web Site FAQ using Text Mining : Focused on the S University Case)

  • 안수현;조정현;이상준
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.361-362
    • /
    • 2018
  • 본 연구는 대학 웹페이지의 Q&A(질의응답) 게시판에 게재된 비정형화 된 데이터를 수집한 후 텍스트마이닝과 네트워크 분석을 활용하여 자주 등장하는 키워드 간 연관 패턴을 파악하고자 한다. 분석결과를 바탕으로 FAQ(자주하는 질문) 게시판을 구성한다면 반복적인 질문에 대한 민원을 간소화함으로써 수요자의 편의성과 행정의 효율성 향상에 기여하고 나아가 원활한 양방향 소통이 가능할 것으로 기대한다.

  • PDF

중학교 태양계 단원 수업에서 교사와 학생 사이의 교실담화 사례분석 (The Case Analysis of Classroom Discourse Between Teacher and Students in Middle School Science Class of the Solar System)

  • 조은영;한신
    • 과학교육연구지
    • /
    • 제39권1호
    • /
    • pp.113-131
    • /
    • 2015
  • 이 논문은 중학교 지구과학 수업에서의 교사-학생 간 교실 상호작용 유형을 분석하여 지구과학 전공 교사와 비전공 교사의 담화 유형 차이를 확인하고, 교사의 질문 유형과 담화 양상 사이의 관계를 알아보는 것을 목적으로 하였다. 이를 위해 서울의 3개 중학교에 근무하는 4명의 과학 교사 수업을 연구 대상으로 하였으며, 두 단계로 자료를 분석하였다. 첫 번째 단계로 교사와 학생의 상호작용을 Mortimer & Scott(2003)의 틀을 사용하여 담화 유형을 범주화 하였다. 두 번째 단계에서는 교사의 질문 유형과 담화 양상 사이의 관계를 알아보기 위해 McNeill & Pimentel(2009)의 분석틀을 이용하여 교사의 질문을 4가지 유형의 질문으로 분류하여 분석하였다. 연구 결과, 중학교 지구과학 수업에서 모든 교사가 상호작용적이며 권위적인 담화를 가장 많이 사용하였다. 그리고 담화 양상은 교사의 질문 유형 보다는 학생의 반응에 대한 피드백과 더 관계있는 것으로 나타났다. 즉, 교사가 학생의 반응에 긍정적인 수용의 태도로 지연 피드백을 사용할 때 대화적 담화가 더 잘 나타났다.

  • PDF

대한소아과학회 홈페이지의 모유수유 상담내용 분석 (Analysis of online breast-feeding consultation on the website of the Korean Pediatric Society)

  • 김정윤;황승재;박현경;이하백;김남수
    • Clinical and Experimental Pediatrics
    • /
    • 제51권11호
    • /
    • pp.1152-1157
    • /
    • 2008
  • 목적: 우리나라는 조제분유가 시판된 후, 상승 추세에 있기는 하지만 아직 비교적 낮은 모유수유율을 나타내고 있다. 이에 대한소아과학회는 모유수유에 대한 올바른 정보를 일반인들에게 제공하고 자라나는 어린이의 건강을 증진시키는데 앞장서기 위해 홈페이지에 온라인 모유수유 상담실을 운영하였고, 상담 내용을 분석하여 모유수유 중 실제로 부딪히는 문제점을 알고자 하였다. 방 법: 2004년 8월 1일부터 2007년 7월 31일까지 대한소아과학회 모유수유 상담실(www.pediatrics.or.kr)에 방문한 1001명의 질문자가 게재한 1021개의 문의건수를 후향적으로 검토하였다. 질문종류는 대 항목 3개와 소 항목 14개로 구분하였으며, 질문 답변에 대한 조회수 100회 이상의 관심질문에 대하여 분석하였다. 2004년 8월 1일부터 2007년 7월 31일까지 전체적으로 분석하였고, 2004년 8월 1일부터 2005년 7월 31일까지를 1차 연구기간으로 2005년 8월 1일부터 2007년 7월 31일까지를 2차 연구기간으로 각각 구분하여 비교하였다. 결 과: 총 1021건의 질문 중 대 항목 별 분석으로는 모유수유방법 413건(40.3%), 수유모 문제점 315건 (30.8%), 수유 아기 문제점 293건 (28.8%)로 모유수유방법에 대한 내용이 가장 많았다. 모유수유방법 중에는 수유방법(62%)에 대한 질문이 가장 많았고, 수유모 문제점에서는 모유량(27%), 수유 아기 문제점에서는 아기의 대소변(46%)에 대한 질문이 가장 많은 분포를 나타냈다. 소 항목 별 분석으로는 수유방법(22.2%), 아기의 대소변(13.1%), 모유량(8.5%)의 순으로 수유방법에 대한 질문이 가장 많았다. 맞벌이 부부의 증가로 직장 여성이 증가함에 따라 직장복귀 후 모유수유에 대한 질문이 1차 연구에 비해 2차 연구에서 2배 이상 증가하였다. 결 론: 지난 3년간의 상담 사례 분석을 통해 향후 상담실 운영의 토대를 마련하여 모유수유에 대한 관심 증가와 수유모의 궁금증 해결에 많은 도움이 된 것으로 사료된다. 맞벌이 부부와 직장여성의 증가와 같은 사회적 환경 변화에도 불구하고 모유수유에 대한 관심은 증가되고 있어서 향후 올바른 모유수유 문화 정착을 기대할 수 있을 것이다.

어휘 빈도를 활용한 지식 검색에서의 답변 추천 시스템 (Answer Recommendation for Knowledge Search using Term Frequency)

  • 이호창;탁현기;이현아
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.315-317
    • /
    • 2012
  • 지식iN 등의 지식검색 서비스는 잘못된 답변으로 인한 낮은 신뢰성과 다수의 중복 답변 등의 문제점을 가진다. 질의문 '세상에서 가장 큰 나라'에 대해서 관련된 모든 질문과 답변을 제시하지 않고 질의문과 관련된 다수의 답변을 분석하여 답변 '러시아'를 추천하여 제시할 수 있다면 지식검색의 효용성과 신뢰성이 크게 향상될 수 있다. 본 논문에서는 질문-답변의 유형을 단어, 글, 도표, 목록의 네가지로 분류하고, 그 중 단어 유형에 대한 답변 추천 방법을 제시한다. 질의문에 대해 검색된 질문을 군집화하고, 질문에 대한 답변들에 대해서 TF, IDF, 어휘간 거리 정보를 다양하게 결합하여 어휘의 점수를 계산한다. 각 군집에서 가장 높은 점수를 가지는 어휘를 해당 군집에서 가장 중요한 어휘로 보고 추천 정답으로 제시한다. 단어 유형인 질문 100개에 대한 네이버 지식iN에 대한 시스템 평가에서 추천된 상위 1위에 대해서는 68%의 정답률을, 상위 5위까지에 대해서는 89%의 정답률을 보였다.

학문 목적 교양 한국어 수업에서의 교사 질문 분석 연구 -문제 중심 수업을 중심으로- (A Study on the Analysis of Teachers' Questions in the Korean Classroom for Academic Purposes-Focusing on Problem-Based Instruction)

  • 공하림
    • 한국어교육
    • /
    • 제29권3호
    • /
    • pp.1-24
    • /
    • 2018
  • The purpose of this study was to analyze teachers' questions in the actual general Korean classroom for academic purposes and identify types of questions. The results of the question analysis by type identified 713 teacher's questions in total: echoic questions made up 41% while epistemic questions were 19.3% and expended question turned out to make up 39.7%. 'Comprehension check questions' were 29%, which was a major part in the echoic question. 'Referential questions' were a major part in the epistemic question. Also, the research discovered that 'knowledge integration' questions held the largest majority in expended questions. Since the teacher-led lecture was often conducted in the problem-presentation stage, the percentage of Echoic question was high; and moreover, the problem-solving stage promoted to come up with more improved solutions of the problem. In the outcome and presentation stage, it was discovered that the questions aimed to check understanding of content in the subject and expand thoughts. Therefore, it is necessary to develop strategies for teacher's questions by phase and further conduct research on the interaction between learners and teacher's questions in the future.

삼각함수의 모델링에서 그래픽 과정이 학생들의 질문 생성과 수학적 아이디어 교환에 미치는 효과 (The Effects of Graphics Representation of Trigonometry Modelling on Question Generating and Idea Sharing)

  • 윤재연;신현성
    • 한국학교수학회논문집
    • /
    • 제24권2호
    • /
    • pp.217-241
    • /
    • 2021
  • 본 연구에서는 삼각함수의 모델링을 통한 그래픽 과정의 효과를 알아보기 위한 실험연구로 실험과정의 분석을 질적연구 방법으로 처리했다. 이를 위해 수학적 모델링의 절차를 세분하여 기존의 모델에 두 단계, 즉, 질문의 생성과 아이디어 교환을 강조하는 놀이실험단계와 컴퓨터 그래픽 과정의 단계를 추가했다. 실험은 고등학교 2학년을 대상으로 실험반(TMG) 26명이 참여했고, 데이터의 질적분석을 위해 활동지, 면담 및 실험과정의 관찰자료를 분석하였다. 국내외 대부분의 연구가 통계적 방법을 이용한 양적 분석 방법이기 때문에 교사들에게는 모델링 수업에 큰 도움을 주지 못한다. 연구결과로 (1) 기존의 수학적 모델링의 절차에 두 개의 단계를 추가하여 보다 세분화한 모델링의 과정은 질문생성, 아이디어교환, 동료들과 소통 등에서 긍정적인 결과를 볼 수 있었다. (2) 실험학교의 수학과 수업에 컴퓨터 그래픽을 포함한 테크놀로지의 도입은 양과 수(Quantity) 교육에 매우 적절함을 보여주었다.

사서교육전공 석사과정 졸업생의 학습경험에 대한 질적 연구 (A Qualitative Study Focusing on the Learning Experience of Graduate Students with Master's Degree in Educational School Librarianship)

  • 임성관
    • 한국문헌정보학회지
    • /
    • 제55권2호
    • /
    • pp.201-225
    • /
    • 2021
  • 본 연구는 사서교육전공 학생들의 석사과정 중 학습경험이 어떤 의미와 본질을 지녔는지 탐색하는데 목적이 있다. 연구 목적 달성을 위해 K대학교 석사과정을 졸업한지 2년 이내인 전공생 12명을 대상으로 도입 질문, 소개 질문, 주요 질문, 마무리 질문의 4가지 종류로 정한 개방형 질문 방식의 포커스 그룹 인터뷰를 진행한 뒤 답변 내용을 분석하여, 석사과정에서의 학습경험에 대해 9개의 주제, 35개의 범주, 104개의 개념을 도출하였다. 각 영역별 주요 분석 결과를 살펴보면, 석사과정 진학 동기는 임용고시 응시를 위한 조건인 사서교사 자격 취득을 위해서가 가장 많았으며, 학습경험에 대한 만족도는 10점 만점 중 평균 7.66점이었다. 또한 석사과정 동안 가장 불만족스러웠던 부분은 학교도서관 운영과 사서교사 임용고시에 도움 되지 않는 교과목과 수업 내용이었기 때문에, 향후 발전을 위해서는 반드시 개선이 필요하다고 응답하였다.

예상치 못한 질문이 진술의 세부정보와 확인 가능한 사실의 양에 미치는 영향 (The effects of asking unexpected questions on general details and verifiable details)

  • 문혜민;조은경
    • 한국심리학회지:법
    • /
    • 제11권3호
    • /
    • pp.349-370
    • /
    • 2020
  • 예상치 못한 질문을 통해 효과적인 거짓말 탐지가 가능하다고 알려져 있으나 최근 거짓말 판별에 사용되고 있는 확인 가능한 사실(verifiable details)에 있어 예상치 못한 질문의 효과를 검증한 연구는 많지 않다. 따라서 본 연구에서는 예상치 못한 질문이 진실 진술자와 거짓 진술자가 언급하는 세부정보의 양과 확인 가능한 사실의 수에 미치는 효과를 확인하고자 하였다. 진실 조건의 참가자(40명)는 교내의 카페에 다녀왔고, 거짓 조건의 참가자(40명)는 정해진 장소에서 준비된 과제를 수행한 뒤 카페에 다녀왔다고 거짓말을 하였다. 모든 참가자는 면담에서 2개의 예상한 질문('자세히 말하기', '장소 묘사')과 2개의 예상치 못한 질문('거꾸로 말하기', '증명 요구')에 답하였다. 종속변인은 세부정보의 양과 확인 가능한 사실의 개수였다. 그 결과, 질문 유형과는 관계없이 진실 진술자가 거짓 진술자보다 유의미하게 더 많은 세부정보를 말하였다. 확인 가능한 사실의 개수에 있어서는 진실 진술자와 거짓 진술자 간의 유의미한 차이는 없었다. 그리고 세부정보의 양(71.3%)이 확인 가능한 사실의 수(53.8%)보다 더 정확하게 진실 진술자와 거짓 진술자를 판별하였다. 또한, 거짓 진술자들은 '자세히 말하기' 질문에 비해 '증명 요구' 질문을 받았을 때 더 많은 단어를 말하였으나 세부정보는 더 많이 언급하지 못하였다. 마지막으로 본 연구의 의의와 한계에 대해 논의하였으며 향후 연구 방향에 대해 제언하였다.

  • PDF