• 제목/요약/키워드: 정답제약

검색결과 21건 처리시간 0.027초

번역 품질 예측을 위한 HTER 분포 평준화 기반 인조 번역 품질 말뭉치 구축 방법 (Construction of an Artificial Training Corpus for The Quality Estimation Task based on HTER Distribution Equalization)

  • 박준수;이원기;신재훈;한효정;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.460-464
    • /
    • 2019
  • 번역 품질 예측은 기계번역 시스템이 생성한 번역문의 품질을 정답 번역문을 참고하지 않고 예측하는 과정으로, 번역문의 사후 교정을 위한 번역 오류 검출의 역할을 담당하는 중요한 연구이다. 본 논문은 문장 수준의 번역 품질 예측 문제를 HTER 구간의 분류 문제로 간주하여, 번역 품질 말뭉치의 HTER 분포 불균형으로 인한 성능 제약을 완화하기 위해 인조 사후 교정 말뭉치를 이용하는 방법을 제안하였다. 결과적으로 HTER 분포를 균등하게 조정한 학습 말뭉치가 그렇지 않은 쪽에 비해 번역 품질 예측에 더 효과적인 것을 보였다.

  • PDF

애너그램 문제 인지적 해결과정의 분자컴퓨팅 시뮬레이션 (Molecular Computing Simulation of Cognitive Anagram Solving)

  • 천효선;이지훈;류제환;백다솜;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권12호
    • /
    • pp.700-705
    • /
    • 2014
  • 애너그램은 주어진 문자들을 재배열하여 숨겨진 단어를 찾아내는 철자바꾸기 놀이로, 문제를 빨리 풀어내는 사람들은 제약 만족 네트워크의 병렬적 탐색에 의해 문제를 해결한다. 본 연구에서는 이러한 인지적 현상을 모델링한 분자 애너그램 풀이 알고리즘을 제시하였다. 문자를 DNA 서열로 인코딩하고, 문자 DNA 가닥을 연결하여 바이그램과 단어 서열을 만들었다. DNA 혼성화, 연결, 젤 전기영동, 추출 연산을 수행해 문자와 바이그램 집합으로부터 답을 찾는 데 필요한 바이그램을 추출한 후, 추출한 바이그램과 단어 집합으로부터 다시 네 가지 DNA 연산을 반복하여 답을 찾는다. 분자 실험 결과 분자 컴퓨터는 정답인 단어와 오답인 단어를 구분해낼 수 있었다. 이를 통해 인간의 병렬적 사고과정을 분자 컴퓨터로 모델링할 수 있는 가능성을 보였다.

서울말의 wh-섬 제약 지각 연구 (A perceptual study of the wh-island constraint in Seoul Korean)

  • 윤원희
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.27-35
    • /
    • 2021
  • wh-섬 구조는 내포문에 있는 의문사 구가 모문의 작용역을 갖을 수 없도록 하는 제약이다. 서울말에서 내포문 의문사 구가 모문의 작용역으로 해석할 수 없다고 알려져 있으나 의문사 억양으로 발화될 경우 모문 작용역 해석도 가능하다고 보고되었다. 청취 실험을 통하여 서울말에서 의문사 구의 모문 작용역 해석이 가능한지 알아보았다. 내포문에 '누구를'을 넣어 만든 세 종류의 의문문, 즉 부정 대명사와 내포문 작용역을 갖는 판정 의문문과 의문사 억양으로 발화된 모문 작용역 해석이 가능한 설명 의문문을 자극으로 준비하고 비교를 위해 일반 명사를 사용한 판정 의문문 문장도 함께 실험하였다. 피험자는 자극 문장을 듣고 '네/아니오'를 선택하거나 아니면 설명 의문문을 선택하도록 지시하였다. 피험자의 대답과 함께 선택에 소요된 반응 시간을 함께 기록하여 함께 분석하였다. 분석 결과 83.7%의 피험자가 모문 작용역 해석을 받아들이는 결과를 보여주었고 반응 시간에서 모문 작용역 문장에 대한 선택이 정답과 오답을 포함하여 가장 긴 소요 시간을 보여주었다. 이를 통해 서울말은 약한 wh-섬 제약이라고 할 수 있다.

퍼즐 기반 학습에서 초등정보영재의 컴퓨팅적 문제 해결 접근법 분석 (The Analysis of Informatics Gifted Elementary Students' Computational Problem Solving Approaches in Puzzle-Based Learning)

  • 이은경;최정원;이영준
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.191-201
    • /
    • 2014
  • 본 연구에서는 퍼즐 기반 학습에서 이루어지는 초등정보영재의 컴퓨팅적 문제 해결 접근법을 분석함으로써 퍼즐 기반 학습의 체계적 개선을 위한 시사점을 도출하고자 하였다. 이를 위해, 제약조건, 최적화, 확률, 통계, 패턴인식, 전략의 6가지 유형별 교육용 퍼즐을 구성하고 초등정보영재를 대상으로 퍼즐 기반 학습을 수행하였다. 또한 각 퍼즐 유형에 따른 학습자의 문제 해결 접근법을 확인하기 위해 사전 사후검사 결과의 정답률 및 정답자와 오답자의 문제 해결 접근법을 비교 분석하였다. 연구 결과, 각 퍼즐 유형별 빈번한 오류 발생의 원인인 몇 가지 양식 오류와 다양한 직관들을 확인하였으며, 오답자들은 '백트래킹', '동적 프로그래밍', '추상화', '모델링', '문제 축소'와 같은 컴퓨팅적 전략을 적용하지 못함으로 인해 완전한 해법에 도달하지 못한다는 것을 확인하였다. 이러한 분석 결과를 토대로 퍼즐 문제 표현 방식의 개선, 인지적 피드백의 적시 제공, 퍼즐 기반 학습 지원을 위한 웹 기반 시스템 개발 등 퍼즐 기반 학습 개선 방안을 제안하였다.

수준별 학습과 학습 관심도를 고려한 학습평가시스템 (An online learning system for evaluating learner's activities and study level)

  • 김혜은;유석종
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.69-76
    • /
    • 2008
  • 인터넷은 시간과 공간에 제약받지 않으면서 인간이 원하는 일을 처리할 수 있게 해주는 필수적인 매체로 자리잡고 있다. 교육 분야 역시 정보통신 기술 발달의 영향을 많이 받고 있으며 CAI, 원격강의, e-러닝 등 새로운 분야들이 끊임없이 출현하고 있다. 교육 분야의 발전과는 달리, 학습 평가방법에 있어서는 다양한 시도가 이루어지지 못하고 지필시험에 대한 정답률에 전적으로 의존하고 있으며 학습활동과정 및 학습자 수준 등에 대한 부분은 반영되지 못하였다. 학습 평가는 학생의 학습능력 수준을 파악할 수 있고 그에 맞는 교수법을 사용하거나 새로운 학습 프로그램을 개발하는데 중요한 정보를 제공한다. 본 논문에서는 행동주의 학습이론의 평가방식에 의존하고 있는 기존 학습평가 시스템의 한계점을 개선하기 위하여 구성주의를 도입하여 학습활동을 평가점수에 반영할 수 있는 웹기반 학습평가시스템을 구축한다. 이를 통하여 학습자의 학습 이해도 뿐만 아니라 학습 관심도에 대한 분석 평가를 할 수 있다. 본 연구에서는 전통적인 행동주의 학습이론 평가방식과 함께 구성주의 학습이론 평가를 도입하기 위하여 교사에 의해 학습평가요소 및 반영비율을 설정하는 기능을 구현하고 이를 최종 평가점수에 반영되도록 하였다.

  • PDF

불균형 데이터 집합에 대한 스마트 분류방법과 특허 평가에의 응용 (Smarter Classification for Imbalanced Data Set and Its Application to Patent Evaluation)

  • 권오병;이상연
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.15-34
    • /
    • 2014
  • 성과 지표로서의 전방적 정확도는 정답인 경우 1, 오답인 경우 0으로 계사하는 이른바 모듈화된 정확도를 충분히 고려하지 못한다. 이에 문제의 특징에 따라 모듈화 정확도에 맞는 판별 규칙을 최적화 하는 보다 스마트한 판별 알고리즘이 필요하다고 볼 수 있다. 이에 따라, 스마트한 알고리즘은 문제 유형에 따라 보다 일반화되고 실제 성능의 왜곡을 야기할 수 있는 이산화에 제약되지 않아야 한다. 따라서 본 논문의 목적인 모듈화 정확도를 개선하는 새로운 부스팅 알고리즘을 제안하는 것이다. 이에 일반화를 도모하고 문제 영역의 특성에 맞게 판별화 모형을 선정하기 위해 스마트함을 고려한 모형 선정 알고리즘을 개발하였다. 제안된 방법의 성능을 검증하기 위해 실제로 47,000여건의 특허건을 가지고 실제 실용화 가능성을 판별하는 실험을 수행하였다.

BM25 기반 고난도 부정 지식 검색을 통한 오픈 도메인 지식 기반 한국어 대화의 지식 검색 모듈 성능 향상 (Improvement of Knowledge Retriever Performance of Open-domain Knowledge-Grounded Korean Dialogue through BM25-based Hard Negative Knowledge Retrieval)

  • 문선아;김산;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.125-130
    • /
    • 2022
  • 최근 자연어처리 연구로 지식 기반 대화에서 대화 내용에 자유로운 주제와 다양한 지식을 포함하는 연구가 활발히 이루어지고 있다. 지식 기반 대화는 대화 내용이 주어질 때 특정 지식 정보를 포함하여 이어질 응답을 생성한다. 이때 대화에 필요한 지식이 검색 가능하여 선택에 제약이 없는 오픈 도메인(Open-domain) 지식 기반 대화가 가능하도록 한다. 오픈 도메인 지식 기반 대화의 성능 향상을 위해서는 대화에 이어지는 자연스러운 답변을 연속적으로 생성하는 응답 생성 모델의 성능 뿐만 아니라, 내용에 어울리는 응답이 생성될 수 있도록 적합한 지식을 선택하는 지식 검색 모델의 성능 향상도 매우 중요하다. 본 논문에서는 오픈 도메인 지식 기반 한국어 대화에서 지식 검색 성능을 높이기 위해 밀집 벡터 기반 검색 방식과 주제어(Keyword) 기반의 검색 방식을 함께 사용하는 것을 제안하였다. 먼저 밀집 벡터 기반의 검색 모델을 학습하고 학습된 모델로부터 고난도 부정(Hard negative) 지식 후보를 생성하고 주제어 기반 검색 방식으로 고난도 부정 지식 후보를 생성하여 각각 밀집 벡터 기반의 검색 모델을 학습하였다. 성능을 측정하기 위해 전체 지식 중에서 하나의 지식을 검색했을 때 정답 지식인 경우를 계산하였고 고난도 부정 지식 후보로 학습한 주제어 기반 검색 모델의 성능이 6.175%로 가장 높은 것을 확인하였다.

  • PDF

상호정보량과 복합명사 의미사전에 기반한 동음이의어 중의성 해소 (Homonym Disambiguation based on Mutual Information and Sense-Tagged Compound Noun Dictionary)

  • 허정;서희철;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1073-1089
    • /
    • 2006
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구는 상호정보량과 기 분석된 복합명사 의미사전에 기반한 동음이의어 의미 중의성 해소를 위한 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 기술들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료 부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 언어적인 특징을 반영하기 위해서 상호정보량을 가지는 어휘 쌍의 비율 가중치, 의미 별 비율 가중치와 뜻풀이의 길이 가중치를 사용하였다. 그리고, 복합명사를 구성하는 단일명사들은 서로의 의미를 제약한다는 것에 기반하여 고빈도 복합명사에 대해서 의미를 부착한 의미사전을 구축하였고, 이를 동음이의어 중의성 해소에 활용하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 200 여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 네 유형의 실험을 수행하였다. 실험 결과는 상호 정보량만을 이용하였을 때 65.06%의 정확률을 보였고, 가중치를 활용하였을 때 85.35%의 정확률을 보였다. 또한, 복합명사 의미분석 사전을 활용하였을 때는 88.82%의 정확률을 보였다.

침해사고 예방을 위한 정보보안 교육훈련 문제은행 시스템 (A Design of Information Security Education training Databank System for Preventing Computer Security incident)

  • 모은수;이재필;이재광;이준현;이재광
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.277-280
    • /
    • 2015
  • 스미싱, 피싱 등의 개인정보 침해사고로 인한 개인정보보안이 화두가 되고 있다. 이와 같은 개인정보 침해 사건사고는 개인정보관리에 있어 사용자의 의식이 부족하기 때문에 발생한다. 본 논문에서는 기존의 XML Tag 구조 기반 문제은행 시스템과 달리 텍스트 기반 교환 형식 기술로 언어에 의존하지 않는 장점을 가진 Key-Value 방식의 JSON을 사용하였다. 제안하는 시스템은 정보보호 분야별 상, 중, 하의 난이도로 구분하며, 공간 및 시간 제약 없는 자유로운 스마트기기 및 PC를 통해 사용자에게 서비스를 제공한다. 교육훈련 서버(훈련서버)의 안정적인 서비스를 위하여 오픈소스 기반의 Nodejs와 Apache의 Load Balancing 기술을 사용한다. 또한 교육훈련의 정답, 오답 판정 시 훈련서버에게 요청하지 않고 웹페이지에서 처리하며, 그 결과는 jQuery Ajax를 이용하여 훈련서버에게 전송된다. 사용자 ID를 기준으로 데이터베이스에 저장되고, 교육훈련통계 지표로 사용하도록 하였다. 본 논문에서는 사용자의 정보보안 의식 강화를 위해 수준별 교육훈련 시스템을 설계하였다.

  • PDF

자유탐구 활동에서 나타난 과학고등학교 학생들의 인식적 목표, 인식적 이해와 추론의 복잡성 탐색 (Exploring Science High School Students' Epistemic Goals, Epistemic Considerations and Complexity of Reasoning in Open Inquiry)

  • 윤현정;김희백
    • 한국과학교육학회지
    • /
    • 제38권4호
    • /
    • pp.541-553
    • /
    • 2018
  • 본 연구는 자유탐구 활동에서 나타난 과학고등학교 학생들의 인식적 목표와 인식적 이해가 추론 복잡성과 어떠한 관련이 있는지 알아보고, 자유탐구가 참과학 탐구의 성격을 띠게 하는 맥락을 탐색하였다. 1명의 교사와 12명의 2학년 학생이 연구에 참여하였으며, 연구에 참여한 6팀 중 인식적 측면과 추론의 복잡성이 뚜렷하게 구분되는 2팀을 초점 집단으로 선정하여 사례연구를 실시하였다. 학생의 활동과 면담을 녹화, 녹음한 후 전사한 자료, 참여관찰 자료, 학생이 작성한 인공물 등을 분석하여 다음과 같은 연구 결과를 얻었다. 첫째, 학생들의 인식적 목표와 이해는 인식 대상의 특성과 맥락에 따라 차이가 있었다. '현상 이해에 대한 가치 공유, 연구 가치에 대한 성찰 기회, 협업과 합의를 요구한 과제 특성, 팀원 간의 충분한 소통 기회'와 같은 맥락은 학생들의 인식적 목표와 이해의 향상을 촉진했다. 반면, '연구 관련 문헌에 대한 비판적 검토 기회의 부재, 환경적 제약'과 같은 맥락은 학생들의 인식적 목표와 이해의 하락을 촉진했다. 둘째, 학생들의 인식적 목표와 이해는 추론의 복잡성에 영향을 미쳤다. '과학적 의미 형성'의 목표는 학생이 생성한 의문을 바탕으로 검증 가능한 가설을 설정하는 높은 수준의 추론에 영향을 미쳤다. 정당화에 대한 높은 이해는 대조군 설정에 의도적으로 주목하고 독창적인 실험 노하우를 개발하는 높은 수준의 추론으로 이어졌다. 청중에 대한 높은 이해는 논변을 들어 자신들의 연구를 방어하고, 후속 연구를 제안하는 높은 수준의 추론으로 이어졌다. 반면, '정답 찾기'의 목표와 정당화에 대한 낮은 이해는 자료의 의미를 해석하지 않고, 실험의 한계점을 조절하지 않는 낮은 수준의 추론으로 이어졌다. 청중에 대한 낮은 이해는 연구를 적극적으로 방어하지 않고, 후속 연구를 고려하지 않는 낮은 수준의 추론으로 이어졌다. 본 연구는 자유탐구 지도와 관련하여 활동의 가치를 공유하고, 학생의 인식적 권위를 확인할 수 있는 소통 기회와 비판적 검토 기회를 제공할 것을 시사한다.