• 제목/요약/키워드: 정답 문장 선택 문제

검색결과 2건 처리시간 0.016초

질의응답 시스템에서 처음 보는 단어의 역문헌빈도 기반 단어 임베딩 기법 (Inverse Document Frequency-Based Word Embedding of Unseen Words for Question Answering Systems)

  • 이우인;송광호;심규석
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.902-909
    • /
    • 2016
  • 질의응답 시스템은 사용자의 질문에 대한 답을 찾아주는 시스템으로, 기존의 검색엔진이 사용자의 질의에 대해 관련된 문서의 링크만을 찾아주는 반면 질문에 대한 최종적인 답을 찾아준다는 차이점이 있다. 특정 분야에 국한되지 않고 다양한 질문을 처리해주는 오픈 도메인 질의응답 시스템에 필요한 연구들이 최근 자연어 처리, 인공지능, 데이터 마이닝 등 학계의 다양한 분야들에서 뜨거운 관심을 받고 있다. 하지만 관련 연구에서는 학습 데이터에는 없었던 단어들이 질문에 대한 정확한 답과 유사한 오답을 구별해내는데 결정적인 역할을 할 수 있음에도, 이러한 처음 보는 단어들을 모두 단일 토큰으로 치환해버리는 문제가 있다. 본 논문에서는 문맥 정보를 통해 이러한 모르는 단어에 대한 벡터를 계산하는 방법을 제안한다. 그리고 역문헌빈도 가중치를 활용하여 문맥정보를 더 효율적으로 처리하는 모델을 제안한다. 또한 풍부한 실험을 통해 질의응답 시스템의 모델 학습 속도 및 정확성이 기존 연구에 비해 향상됨을 확인하였다.

일본 대학입시센터시험 이과 문항 분석 (Analysis of Science Items of the Japanese National Center Test for University Admissions)

  • 김현경;김동영;최혁준;구자옥;동효관;신일용;이양락
    • 한국과학교육학회지
    • /
    • 제30권4호
    • /
    • pp.452-471
    • /
    • 2010
  • 수능이 1994학년도에 처음 시행된 이후 17년 동안 시행되어 오면서 기출을 피하면서 사고력을 측정하는 참신한 문항을 출제하는 것이 점점 어려워지고 있다. 그러므로 수학능력 측정을 위한 양호한 문항의 개발을 위한 지속적인 연구가 필요하다. 이러한 맥락에서 수능 문항 개발에 필요한 시사점을 도출하기 위해 수능과 같은 국가 수준의 선다형 대입 관련 시험 분석의 일환으로 일본 센터시험을 분석하였다. 이 연구에서는 센터시험의 체제와 이과 출제 과목 및 응시과목의 수나 응시자 현황을 파악하고, 2009년 1월에 시행한 '이과' 시험의 검사지 구성, 문항 유형, 특이 사항 등을 분석하였다. 또한 센터시험 문항을 수능과 관련하여 내용 요소 및 행동영역에 따라 분석하였고, 아울러 우리나라 수험생의 관점에서 예상 정답률을 추정하였다. 분석 결과, 센터시험 문항은 고급 사고력보다는 지식 측정 또는 낮은 사고력을 주로 측정하고 있다. 또한 문항 당 배당되는 시간이 수능보다 길며 문항 수가 고정되지 않았고, 배점과 답지 수도 다양하다. 그리고 실생활 소재를 많이 사용하면서 문장 표현을 엄격하게 하지 않는 경향이 있다. 센터시험에서 원점수를 사용하는 것으로 보아 선택 과목 간 유 불리 문제가 크지 않은 것으로 보인다. 또한 문과나 이과의 계열 구분 없이 대부분의 학과에서 선택 과목으로 과학과목 성적을 요구하고 있다.