• Title/Summary/Keyword: 정보 질문

Search Result 874, Processing Time 0.028 seconds

Question Analysis of the Collaborative Digital Reference Service at the National Library of Korea (협동 디지털참고서비스의 질문 분석: 국립중앙 도서관의 '사서에게 물어보세요'를 중심으로)

  • Chang, Hye Rhan;Yi, Kyung Suk
    • Journal of the Korean Society for information Management
    • /
    • v.31 no.4
    • /
    • pp.7-28
    • /
    • 2014
  • This study analyses the questions addressed to the collaborative digital reference service run by the National Library of Korea. The data consist of 661 question entries to the 'Ask a Librarian' service during first 6 months in 2014. Each entry includes average 1.17 questions, and 77.82% of the total questions are real reference in nature. Questions are analyzed by classification division, context of the questioner, desired end product, activities of librarians, and the resources used to respond them. Each category is subdivided and analyzed in detail. Results revealed interesting findings and problems, and suggestions for further endeavor are provided.

Detection of Similar Answers to Avoid Duplicate Question in Retrieval-based Automatic Question Generation (검색 기반의 질문생성에서 중복 방지를 위한 유사 응답 검출)

  • Choi, Yong-Seok;Lee, Kong Joo
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.1
    • /
    • pp.27-36
    • /
    • 2019
  • In this paper, we propose a method to find the most similar answer to the user's response from the question-answer database in order to avoid generating a redundant question in retrieval-based automatic question generation system. As a question of the most similar answer to user's response may already be known to the user, the question should be removed from a set of question candidates. A similarity detector calculates a similarity between two answers by utilizing the same words, paraphrases, and sentential meanings. Paraphrases can be acquired by building a phrase table used in a statistical machine translation. A sentential meaning's similarity of two answers is calculated by an attention-based convolutional neural network. We evaluate the accuracy of the similarity detector on an evaluation set with 100 answers, and can get the 71% Mean Reciprocal Rank (MRR) score.

Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment (기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가)

  • Lim, Joon-Ho;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

User Perception of Olfactory Information and Classification of Videos for Reality Improvement (영상실감을 위한 후각정보에 대한 사용자 지각과 영상분류)

  • Lee, Guk-Hee;Li, Hyung-Chul O.;Ahn, Chung Hyun;Choi, Ji Hoon;Kim, ShinWoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.229-232
    • /
    • 2013
  • 영상실감증대를 위한 시각, 청각정보의 제시방식에 대해서는 많은 진보가 이루어 졌다. 반면 후각은 정의하기 어렵고 다루기 까다롭기 때문에 관련연구를 찾아보기 어렵다. 본 연구에서는 후각정보를 통한 영상실감증대 연구의 첫걸음으로 후각정보에 대한 사용자 수용도를 조사한 후 이에 근거하여 다양한 영상을 분류하였다. 이를 위해 먼저 영상에 냄새가 존재하는지 (냄새존재여부), 영상과 함께 해당 냄새를 경험하고 싶은지 (냄새제시선호), 영상에 어울리는 냄새가 내가 좋아하는 냄새인지 (냄새자체선호), 그리고 영상에 어울리는 냄새가 얼마나 구체적인지 (냄새의 구체성)라는 네 가지 질문을 선정하였다. 각 질문들에 높은 혹은 낮은 점수를 받을 만한 다양한 장르의 영상 (51)개를 수집한 후, 참가자들에게 하나씩 영상을 시청하게 한 후 위의 네 가지 질문에 대해 7점 척도로 평정하게 하였다. 영상분류를 위해 두 질문씩 쌍으로 묶어 각 질문의 척도를 2차원 평면의 X, Y축으로 설정한 후 평정값을 이용하여 영상분류를 위한 산포도를 구성하였다. 2차원 평면의 서로 다른 사분면에 위치한 영상군집들은 영상실감증대를 위한 후각정보 제시에 중요한 시사점을 줄 것으로 기대한다.

  • PDF

The effects of asking unexpected questions on general details and verifiable details (예상치 못한 질문이 진술의 세부정보와 확인 가능한 사실의 양에 미치는 영향)

  • Moon, Hyemin;Jo, Eunkyung
    • Korean Journal of Forensic Psychology
    • /
    • v.11 no.3
    • /
    • pp.349-370
    • /
    • 2020
  • This study was to test the effects of unanticipated questions on the number of general and verifiable details. In addition, the number of verifiable details would discriminate truth-tellers and liars more accurately than the number of general details. In a 2(Veracity: truth vs. lie) X 2(Question type: Expected questions vs. Unexpected questions) mixed-design study, truth tellers(N=40) were asked to visit a cafe on campus and liars(N=40) were told to fabricated a story as if they visited the cafe. Then, participants were interviewed about their trip to the cafe and asked four questions(two anticipated questions: 'report the trip in detail', 'describe the place'; two unanticipated questions: 'recall in reverse order', 'report verifiable details'). Each participant's statements were transcribed and coded by trained graduate students for the number of general details and verifiable details. The results showed that truth-tellers mentioned significantly more general details than liars regardless of the question type. On the contrary, there was no significant difference between liars and truth-tellers in the number of verifiable details. High percentages of truth-tellers(62.5%) and liars(80.0%) were classified correctly based on the number of general details whereas only 45.0% of truth tellers and 62.5% of liars were accurately classified by the number of verifiable details. Liars were found to speak more words when asked to provide verifiable details compared to a general open question, but the number of general details did not seem to increase accordingly. The limitations of this study and future research directions were discussed.

  • PDF

An Experiment on Automatic Query Modification In Information Retrieval Using the Relevance Feedback (이용자 피이드백에 의한 검색질문의 자동 수정에 관한 연구)

  • Shin, Young-Shil
    • Journal of the Korean Society for information Management
    • /
    • v.2 no.1
    • /
    • pp.108-135
    • /
    • 1985
  • When an information retrieval system is implemented on-line, users can interact with the system to improve the searches. There are studies which achieved dramatic improvements in system effectiveness by using automatic relevance feedback, a technique for reformulating a patron query based on initial retrieval result. In this thesis, an automatic query modification model was applied to a controlled keyword system.

  • PDF

Analysis of Students' and Teachers' Questions Posted on Chemistry Q&A Board in a Chemistry Education Homepage (화학교육 홈페이지의 화학 Q&A 게시판에 등록된 학생과 교사 질문 분석)

  • Han, Jae-Young;Ji, Youn-Jung;Lee, Jae-Youn
    • Journal of the Korean Chemical Society
    • /
    • v.56 no.1
    • /
    • pp.137-143
    • /
    • 2012
  • This study analyzed the questions posted on the chemistry Q&A board by students and teachers in a chemistry education homepage, in order to understand the difficulties in learning and teaching chemistry. The different tendencies were found in the contents and the motivations of questions by students and teachers. In Chemistry I, students raised many questions in the 'Water' unit, while teachers raised many ones in the 'Chemical compound in our life' unit. In Chemistry II, students asked many questions in the 'Gas, liquid, solid' unit, while teachers did in 'Chemical reaction and energy' unit. Students' motivations of questioning were 'Explanation of unclear concept', and 'Problem solving', while teachers' motivations were 'Searching information', and 'Question in experiment'. The Q&A board provided a field in exchanging informations needed in learning and teaching chemistry. Educational implications were discussed on the use of Q&A board in chemistry education.

Question Analysis for Knowledge based Question/Answering (지식기반 질의응답을 위한 질문분석 방법)

  • Heo, Jeong;Hwang, Yi-Gyu;Choi, Mi-Ran;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.308-314
    • /
    • 2004
  • AnyQuestion 1.0은 (주)두산의 '두산세계대백과 엔싸이버'의 인물분야만을 대상으로 한 질의응답형 정보검색 시스템이다. 본 시스템에서는 지식기반 질의응답, Logical Form 기반 질의응답, 단락 기반 질의응답을 통합한 3단계 정답 추출 방법을 제안하고 있다. 지식기반 질의응답은 본문의 구조화된 정보와 비구조화 된 정보로부터 정보추출 기술을 이용하여 구축한 지식베이스에 대한 질의응답을 목적으로 한다. "사용자의 질문에 대한 정답을 지식베이스에서 제시할 수 있는가?"와 "지식베이스에서 어떤 정보를 정답으로 제시해야 하는가?"는 3단계 정답 추출 방법에서는 상당히 중요하다 이를 위해서 질문 분석에서는 수동으로 구축한 지식베이스 속성 자질 정보와 다양한 규칙을 기반으로 질문 분석을 수행하였고, 이를 이용하여 지식기반 질의응답을 하였다. 실험결과, 지식기반 질의응답 할당 재현율은 65.4%, 지식기반 질의응답의 정확률은 81.25%였다. 백과사전 인물분야에 대한 지식기반 질의응답은 기존의 데이터베이스 분야에서 연구되어온 자연어 DB인터페이스를 활용한 질의응답으로 속도가 빠르며, 상대적으로 높은 정확률을 보였다.

  • PDF

A Study on the Stratified Cluster Replicated Systematic Unrelated Question Model (층화 집락 반복계통 무관질문모형에 관한 연구)

  • Lee, Gi-Sung
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.2
    • /
    • pp.209-222
    • /
    • 2013
  • We apply stratified cluster sampling to a replicated systematic unrelated question model for a large scale survey in which the population is comprised of several strata developed by several clusters and with sensitive parameters. We first present a replicated systematic unrelated question model using an unrelated question model to procure sensitive information from the population of clusters and then develop a suggested model to an unrelated question by a stratified cluster replicated systematic sampling that can be used in large population of strata. We cover the proportional and optimum allocation for the suggested model. Finally, we compare and analyze the efficiency of the suggested model with the replicated systematic unrelated question model.

Design of a Korean Question-Answering System for News Item Retrieval (우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구)

  • Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.4 no.1
    • /
    • pp.3-23
    • /
    • 1987
  • This paper describes a question-answering system that can automatically analyze input texts and questions in Korean natural language. The particular texts used for the research were newspaper articles in the specific domain of sports news. The system consists of a set of Cobol programs and an associated set of data files containing lexicon, case grammar, linguistic rules. and data base. This system employs two retrieval functions of fact retrieval and passage retrieval. Therefore input questions can be answered in forms of either sentence or factual data.

  • PDF