• 제목/요약/키워드: 정보 질문

검색결과 874건 처리시간 0.022초

질문구조의 전형을 이용한 정보요구의 모형화에 관한 연구 (A Study on Modeling of Information Need Using Stereotype of Question Structures)

  • 김기영;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1995년도 제2회 학술대회 논문집
    • /
    • pp.17-20
    • /
    • 1995
  • 본 연구는 질의어 확장 및 단기 이용자 모형 구축에 응용할 수 있는 하나의 기법으로서 이용자 질문구조의 전형을 통한 정보요구의 모형화를 실험을 통해 제시한다. 실험방법은 이용자의 질문을 시소러스를 통해 분석, 구조화 하고 그 질문구조에서 전형을 추출한 후 전형에 따라 요구하는 정보가 질문구조내에 일정하게 위치하는지를 알아보았다. 이러한 실험을 통해 6가지 질문구조 전형을 추출할 수 있었으며 질문구조의 전형을 이용한 정보요구 모형의 구축이 타당성이 있음을 입증하였고 지능형 정보검색 시스템에의 적용가능성을 논의하였다.

  • PDF

정답과 구절의 공동 주의 집중 계층을 이용한 한국어 질문 생성 (Korean Question Generation Using Co-Attention Layer of Answer and Passage)

  • 김진태;노형종;이연수;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.315-320
    • /
    • 2019
  • 질문 생성이란 구절이 입력되면 구절에서 답을 찾을 수 있는 질문을 자동으로 생성하는 작업으로 교육용 시스템, 대화 시스템, QA 시스템 등 다양한 분야에서 중요한 역할을 한다. 질문 생성에서 정답의 단어가 질문에 포함되는 문제점을 해결하기 위해 구절과 정답을 분리한다. 하지만 구절과 정답을 분리하게 되면 구절에서 정답의 정보가 손실되고, 정답에서는 구절의 문맥 정보가 손실되어 정답 유형에 맞는 질문을 생성할 수 없는 문제가 발생된다. 본 논문은 이러한 문제를 해결하기 위해 분리된 정답과 구절의 정보를 연결시켜주는 정답과 구절의 공동 주의 집중 계층을 제안한다. 23,658개의 질문-응답 쌍의 말뭉치를 이용한 실험에서 정답과 구절의 공동 주의 집중 계층이 성능 향상에 기여해 우수한 성능(BLEU-26.7, ROUGE-57.5)을 보였다.

  • PDF

대학도서관 이용자의 정보요구에 관한 연구: 참고질문을 중심으로 (A Study of Information Needs of Academic Library Users: With Special Emphasis on Reference Questions)

  • 유재옥
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.125-142
    • /
    • 2001
  • 본 연구는 덕성여자대학교 도서관을 중심으로 도서관내에서 제기되는 이용자의 참고질문을 분석함으로써 대학도서관 이용자들의 잠재적 정보요구를 파악하고자 하였다. 2000년 10월 10일부터 12월 13일 까지 64일 동안 대학도서관내에서 제기되는 참고질문 총 474건을 수집 분석하였다. 사서의 전문적 지식이 요구되는 순수한 참고질문은 총 474건의 질문의 10.1%인 48건에 불과하여 대학도서관의 양질의 참고정보서비스 제공은 매우 소극적 수준인 것으로 나타났다. 특정 도서나 장소의 위치를 묻는 방향적 질문이 139건(29.3%), 기기관련 질문이 113건(23.8%), 도서관 정책관련 질문이 85건(17.9%)등, 세 종류의 질문이 총 질문의 71.0%안 337건을 차지하여 이용자는 도서관 사용에 필수적인 기초적인 안내정보를 필요로하는 것으로 나타났다. 도서관은 적어도 사인(sign)시스템과 안내정보시스템을 개선함으로써 방향적 질문(29.3%)과 도서관정책관련 질문(17.9%)을 포함한 이용자의 정보요구의 47.2%룰 만족시킬 수 있을 것으로 예측된다.

  • PDF

질문 유형에 따른 인터넷 검색엔진의 성능 비교 (Comparing the Performance of Internet Search Engines according to the Query Types)

  • 이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.185-192
    • /
    • 2003
  • 국내 인터넷 검색엔진의 성능을 질문의 유형별로 비교해보았다. 실험에는 30명의 대학생이 참여하여 탐색질문을 작성하고 직접 탐색하여 검색결과의 적합성을 판정하였다. 실험참가자마다 탐색어 1개, 2개, 3개짜리 질문을 하나씩 작성하도록 한 결과 총 90개의 질문이 실험에 사용되었다. 질문의 유형은 질문의 길이 이외에 주제의 최신성 여부와 고유명사의 포함 여부를 기준으로 나누었다. 실험 결과 전체적인 성능은 구글이 가장 뛰어났으나, 고유명사를 포함한 최신주제 질문에 대해서는 네이트와 엠파스가 구글보다 좋은 성능을 보였다.

  • PDF

사이버 공간에서의 문헌.정보학 질문지 회수 (Collection of the Questionnaire Response in the Library & Information Science Research in Cyberspace)

  • 전명숙
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.219-222
    • /
    • 2000
  • 본 연구에서는 인터넷을 통하여 질문지를 배포하고 회수하는 실험을 한 결과 현시점에서는 사이버 공간에서 게시판에 질문지를 올리는 것은 거의 불가능하고, 질문지를 배포하는데는 사서나 아르바이트 학생 등 다른 사람들의 적극적인 도움이 필요할 뿐만 아니라 질문지 회수율이 매우 낮았다. 전자우편으로 질문지를 회수하더라도 일단 프린트하여 종이자료로 처리하게 되므로 자료처지과정은 기존의 종이질문지와 차이가 없었다.

  • PDF

확장된 나이브 베이즈 분류기를 활용한 질문-답변 커뮤니티의 질문 분류 (Modified Na$\ddot{i}$ve Bayes Classifier for Categorizing Questions in Question-Answering Community)

  • 연종흠;심준호;이상구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.95-99
    • /
    • 2010
  • 소셜 미디어(social media)는 블로그, 소셜 네트워크, 위키 등과 같이 사용자의 참여로 만들어지는 정보 컨텐츠이다. 사용자가 작성한 질문에 다른 사용자들이 답변을하는 질문-답변 커뮤니티 서비스도 이러한 소셜 미디어의 한 가지로서 지난 몇 년간 많은 양의 정보를 축적해왔다. 하지만 축적된 질문-답변의 양이 많아질수록 이전의 질문을 정확히 검색하는 것은 점점 어려운 작업이 되고 있다. 본 논문에서는 질문-답변 커뮤니티의 효율적인 정보 검색을 위해 확장된 나이브 베이즈 분류기(Na$\ddot{i}$ve Bayes classifier)를 이용하여 질문을 그 목적에 따라 정보형, 제안형, 의견형으로 자동 분류하는 기법을 제안한다. 정확한 분류를 위해 분류기는 질문-답변 문서의 구조적인 특징을 활용한다. 실제 질문-답변 커뮤니티의 질문들에 대해 실험을 수행한 결과 71.2%의 분류 정확도를 보였다.

협력형 디지털 참고서비스(CDRS) 지식정보DB 내용분석 연구 (Content Analysis of Collaborative Digital Reference Service Knowledge Information Database)

  • 장수현;남영준
    • 한국비블리아학회지
    • /
    • 제32권2호
    • /
    • pp.101-123
    • /
    • 2021
  • 본 연구는 협력형 디지털 참고서비스인 '사서에게 물어보세요'의 지식정보DB에 수록된 질문과 답변을 분석하여 이용자 요구현황을 파악해 이를 바탕으로 서비스 초창기의 정보 이용행태를 도출하였다. 지식정보DB 3,506건 중 1,124건의 DB 항목 데이터를 ① 질문의 개수와 참고 질문 여부, ② 질문의 주제와 키워드, ③ 질문의 목적, ④ 질문의 유형, ⑤ 이용자의 정보 요구, ⑥ 사서가 제공한 정보원과 참고 서비스, ⑦ 답변의 소요 일수와 상관관계, ⑧ 참여 도서관 수준, ⑨ 주제별 질문 유형, 총 9가지 기준으로 분석하였다. 그 결과, 첫째, 이용자는 유사한 주제의 질문을 한 번에 하나씩 요청하는 것이 아닌, 필요에 따라 다양한 주제의 참고 질문을 요청하였지만, 절반 이상의 전체 순수 참고질문은 문헌정보학 분야의 질문이었다. 둘째, 약 71.35%의 이용자는 '사서에게 물어보세요' 서비스를 특정 주제나 연구 문제와 관련된 정보 자원의 목록을 추천받기 위해 이용하고 있었으며 독서상황에 대한 참고 상담을 요구하는 질문도 존재하였다. 셋째, 이용자가 가장 선호하는 정보원은 서지 및 서지사항으로 나타났으며, 온라인 정보원의 경우 이용자는 상대적으로 선호하지 않았다. 넷째, 답변의 소요 일수는 질문의 유형과 참여 도서관의 수준에 따라 유의미한 차이가 남을 확인할 수 있었다. 다섯째, 총류 분야 질문의 목적을 분석한 결과 약 31.33%이 이용자 스스로가 해결 당위성을 가진 자발적 질문으로 나타났다.

제약기반 KBQA를 위한 질문분석 (Question Analysis for Constraint-based KBQA)

  • 허정;이형직;배경만;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.665-668
    • /
    • 2018
  • 본 논문에서는 제약기반 KBQA를 위한 질문분석 기술에 대해서 소개한다. 핵심개체와 속성에 대한 연결 모호성을 해소하기 위해서 세 종류의 제약정보 활용을 제안한다. 세 종류의 제약은 핵심개체에 기반한 제약, 의미정답유형에 기반한 제약, 속성단서에 기반한 제약이다. 제약을 위해서는 질문 내에서 핵심개체와 속성단서를 인식하여야 한다. 본 논문에서는 규칙과 휴리스틱에 기반한 핵심개체와 속성단서 인식 방법에 대해서 소개한다. 핵심개체와 속성단서 인식 실험은 구축된 229개의 질문을 대상으로 수행하였으며, 핵심개체와 속성단서가 모두 정확히 인식된 정확도(accuracy)가 57.21%이고, KBQA 대상질문에서는 71.08%를 보였다.

  • PDF

심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 (Question Retrieval using Deep Semantic Matching for Community Question Answering)

  • 김선훈;장헌석;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

주제 분류를 활용한 국립국어원 질의응답 게시판 유사 질문 검색 시스템 (Similar Question Search System for Q&A board of The National Institute of the Korean Language using Topic Classification)

  • 문정민;송영호;진지환;이현섭;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-205
    • /
    • 2014
  • 국립국어원의 온라인 가나다 서비스는 한국어에 대한 다양한 질문과 정확한 답변을 제공한다. 만일 새롭게 등록되는 질문에 대해 유사한 질문을 자동으로 찾을 수 있다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 국립국어원 질의응답게시판의 특성을 분석하여 질문의 주제를 6가지로 분류하고, 주제 분류 정보와 벡터 유사도, 수열 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용한 결과 1위 정답 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 MRR이 0.62, 정답이 1위, 5위내에 검색될 확률은 각각 54.2%, 78.2%를 보였다.

  • PDF