• 제목/요약/키워드: 정답 특징

검색결과 57건 처리시간 0.02초

균일한 부류 확률값 학습을 통한 도메인 일반화 (Domain Generalization via Class Balanced Probability Learning)

  • 윤성준;심규진;김창익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.103-105
    • /
    • 2020
  • 본 논문에서는, 영상 분류 문제에서 손실 값 계산 시 정답 부류를 제외한 나머지 부류에서 우세한 결괏값이 나오지 않도록 평활화하는 보조적인 손실함수를 고안한다. 합성곱 신경망 구조를 이용해 학습이 진행되면 손실함수가 작아지는 방향으로 가중치가 갱신되기 때문에, 정답을 제외한 나머지 부류들의 결괏값은 줄어든다. 하지만, 정답을 제외한 나머지 부류들 사이의 상대적인 값이 고려되지 않고 손실함수가 줄어들기 때문에 값들은 균일하지 않게 되고, 정답 부류와 유사한 특징을 가진 부류들의 값이 상대적으로 커지게 된다. 이는 정답 부류와 나머지 부류 중 가장 값이 큰 부류 사이에 공통의 특징을 공유한다고 생각할 수 있다. 정답 부류만이 가지고 있는 고유의 특징을 추출하지 못하고, 다른 부류도 가지고 있는 특징의 흔적이 남아있게 됨으로써 테스트 시 소스 도메인과 전혀 다른 도메인의 영상이 보일 때 그러한 특징이 부각 되어 부정확한 결과를 초래하게 된다. 본 논문에서는 단순한 손실함수의 추가로 도메인이 다른 환경에서 기존의 연구보다 좋은 분류 결과를 보여주는 것을 실험을 통해 확인하였다.

  • PDF

질의응답시스템에서 정답 특징에 관한 실험적 분석 (Experimental Analysis of Correct Answer Characteristics in Question Answering Systems)

  • 한경수
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.927-933
    • /
    • 2018
  • 자연어 질문에 대해 답변을 찾아 제공하는 질의응답시스템의 오류에 가장 큰 영향을 미치는 요소 중 하나가 질문으로 정답을 포함하고 있을 만한 문서나 단락을 검색하는 단계이다. 검색의 성능 향상을 위해서는 정답 포함 문서 및 단락의 특징을 잘 이해해야 한다. 본 논문은 질문, 정답 포함 문서, 정답 미포함 문서로 구성된 말뭉치를 사용하여 정답 문서에는 질문 단어가 얼마나 많이 출현하는지, 출현 위치는 어떻게 분포하는지, 질문과 정답 문서의 주제는 얼마나 유사한지 등을 실험적으로 분석한다. 이를 통해 질의응답시스템을 위한 기존의 검색 연구 결과들에 대한 원인을 설명하고 효과적인 검색 단계의 필요 요소에 관해 논의한다.

한국어 개체명 인식 과제에서의 의미 모호성 연구 (A study on semantic ambiguity in the Korean Named Entity Recognition)

  • 김성현;송영숙;송치성;한지윤
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 2021
  • 본 논문에서는 맥락에 따라 개체명의 범주가 달라지는 어휘를 중심으로 교차 태깅된 개체명의 성능을 레이블과 스팬 정답률, 문장 성분과 문장 위치에 따른 정답률로 나누어 살펴 보았다. 레이블의 정확도는 KoGPT2, mBERT, KLUE-RoBERTa 순으로 정답률이 높아지는 양상을 보였다. 스팬 정답률에서는 mBERT가 KLUE-RoBERTa보다 근소하게 성능이 높았고 KoGPT2는 매우 낮은 정확도를 보였다. 다만, KoGPT2는 개체명이 문장의 끝에 위치할 때는 다른 모델과 비슷한 정도로 성능이 개선되는 결과를 보였다. 문장 종결 위치에서 인식기의 성능이 좋은 것은 실험에 사용된 말뭉치의 문장 성분이 서술어일 때 명사의 중첩이 적고 구문이 패턴화되어 있다는 특징과 KoGPT2가 decoder기반의 모델이기 때문으로 여겨지나 이에 대해서는 후속 연구가 필요하다.

  • PDF

정답문서집합 자동 구축을 위한 속성 기반 분류 방법 (Attribute-Based Classification Method for Automatic Construction of Answer Set)

  • 오효정;장문수;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.764-772
    • /
    • 2003
  • 본 논문에서는 사용자에게 보다 유용한 정보를 제공하기 위하여 개념의 활용분야에 따른 속성 분류 기법이라는 새로운 분류 기법을 제안하고, 이를 활용해 정답문서집합 지식베이스를 자동으로 구축하는 방안을 제시한다. 제안된 방법은 범주간의 구분이 유동적인 속성의 특성을 반영하기 위하여 속성 특징(clue)을 활용함으로써 분류 정확도를 높이고, 개념망에 정의된 개념들 사이의 관계를 참조함으로써 지식베이스를 구축하기 위한 노력과 비용을 최소화하여 점진적인 분류기 생성을 가능하게 한다. 실험을 통해 제안된 방법의 정확도와 효율성을 입증하였으며, 정답문서기반 정보검색 시스템을 위한 정답문서집합 구축과정에 적용시킨 결과를 제시함으로써 방법의 실제 효용성을 보였다.

집단지성 기반 오답노트 시스템 (Collective Intelligence based Wrong Answer Note System)

  • 하진석;김창석
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.457-463
    • /
    • 2015
  • 본 논문은 적시학습을 위한 집단지성 기반 오답노트 시스템의 필요성과 개념을 제시하고 활용도 및 만족도를 보인다. 기존 오답노트 시스템은 평가문항에 대한 정답 여부를 체크하여 응답 결과가 오답인 문항에 대하여 일괄적인 정답 해설을 제공하는 특징을 갖고 있다. 이러한 특징은 학습자가 평가문항을 잘 이해하지 못하고 운 좋게 맞은 문항과 개별 학습자들의 오답 선택 과정에 대한 오류를 적절하게 피드백 받지 못하기 때문에 오답분석과 피드백 측면에서 많은 개선을 필요로 하고 있다. 본 논문에서는 이러한 '점수의 오류'를 개선하여 학습자의 취약점을 보완하는 새로운 방법인 SERO(Stability Emergency Risk Opportunity) 오답노트를 제안한다. SERO 오답노트는 자신이 풀어낸 평가문항들을 4가지 유형(S유형, E유형, R유형, O유형)으로 분류하고, 정답 해설 뿐만 아니라 집단지성을 이용한 다양한 오답노트 해설들을 제시하여 학습의 만족도를 높인다.

블로그 포스트 자동 품질 평가를 위한 기계학습 기법 비교 연구 (A Comparison of Machine Learning Techniques for Evaluating the Quality of Blog Posts)

  • 한범준;김민정;이형규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.385-388
    • /
    • 2010
  • 블로그는 다양한 주제 분야에 대한 내용을 자유롭게 표현할 수 있는 일종의 개인 웹사이트로, 많은 양과 다양성으로 매우 중요한 정보원이 될 수 있다. 블로그는 생산속도가 매우 빠르므로 보다 고품질의 블로그를 선별하는 것이 중요하다. 본 논문에서는 블로그의 본문을 담고 있는 포스트를 대상으로 기계학습 기법을 이용하여 문서의 품질을 자동으로 평가하고자 하였다. 학습을 위한 자질로는 모든 블로그에 공통적으로 적용할 수 있도록 형태소 분석에서 추출한 동사, 부사, 형용사의 내용어만을 선택하였다. 성능 비교를 위해 수작업으로 약 4,600개의 정답 집합을 구축하고, 적합한 기계학습 기법을 찾기 위해 다양한 학습 기법을 사용하여 비교 실험하였다. 실험 결과 Bagging 기법의 성능이 79% F-measure로 가장 좋음을 보여주었다. 한정된 자질을 사용했을 때와 정답 집합의 문서 수 비율이 불균등할 경우 단순함, 유연성, 효율성의 특징을 지닌 Bagging 기법이 적합할 것으로 보인다.

Synthetic fisheye 이미지를 이용한 360° 파노라마 이미지 스티칭 (Panorama Image Stitching Using Sythetic Fisheye Image)

  • 권혁준;조동현
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.20-30
    • /
    • 2022
  • 최근 VR (Virtual Reality) 기술이 주목받기 시작하면서 생동감 넘치는 VR 컨텐츠를 볼 수 있는 360° 파노라마 영상이 많은 관심을 받고 있다. 이미지 스티칭 기술은 360° 파노라마 영상을 제작하는데 주요한 기술로서 많은 연구가 활발하게 이루어지고 있다. 일반적인 스티칭 알고리즘은 특징점 기반 이미지 스티칭을 기반으로 한다. 하지만 기존의 특징점 기반 이미지 스티칭 방법들은 특징점에 크게 영향을 받는다는 문제가 존재한다. 이러한 문제를 해결하기 위해서 최근에는 딥러닝 기반의 이미지 스티칭 기술들이 연구되고 있지만 이미지 간의 겹치는 영역이 거의 없거나 큰 시차가 존재할 때 여전히 많은 문제점이 존재한다. 또한 실제 환경에서는 라벨링 된 정답 파노라마 영상을 얻을 수 없으므로 완전한 지도학습에 한계가 존재한다. 따라서 자율주행분야에 많이 이용되는 칼라(Carla) 시뮬레이터를 통해 카메라 센터가 다른 3개의 fisheye 이미지와 그에 대응되는 정답 영상을 제작하였다. 우리는 제작한 fisheye 영상으로360° 파노라마 영상을 만드는 이미지 스티칭 모델을 제안한다. 최종 실험 결과로는 실제 환경과 비슷하게 구성한 가상의 데이터 세트로 다양한 환경과 큰 시차에도 강인한 스티칭 결과를 검증한다.

TIMSS 2015 중학교 2학년 지구과학 영역에 대한 우리나라 학생들의 성취 특성 및 교육과정 연계성 탐색 (Exploration of Features of Korean Eighth Grade Students' Achievement and Curriculum Matching in TIMSS 2015 Earth Science)

  • 곽영순
    • 한국과학교육학회지
    • /
    • 제37권1호
    • /
    • pp.9-16
    • /
    • 2017
  • 4년 주기로 반복되는 TIMSS 연구는 2016년 말에 TIMSS 2015 결과를 발표하였다. TIMSS 2015에서 우리나라 중학교 2학년의 과학 성취도는 이전 주기인 TIMSS 2011의 평균점수와 유사하며, 참여국 중 4위로 TIMSS 2011에 비해 1단계가 낮아졌다. 본 연구에서는 우리나라 중학교 2학년 지구과학 영역을 중심으로 TIMSS 2015 문항과 우리나라 교육과정의 일치도를 분석하고, TIMSS 2015 지구과학 평가틀의 평가주제별로 우리나라 학생들의 정답률과 응답경향을 분석하였다. 교육과정 일치도를 분석함에 있어서 제7차 교육과정부터 2015 개정 교육과정까지를 분석대상으로 삼았다. 연구결과에 따르면, 교육과정에서 다룬 문항일수록 우리나라 학생들의 정답률이 높게 나타나며, 우리나라 학생들의 경우 선택형 문항에 비해 자유롭게 답을 적도록 한 구성형 문항의 정답률이 절반가량으로 떨어지는 것으로 나타났다. 지구과학 평가주제별로는, 지구의 구조와 물리적 특징, 지구의 변화와 역사 등을 포괄하는 '고체 지구' 영역의 경우 교육과정에서 다루어진 선택형 문항의 정답률은 높은 반면에, 실생활과 연계된 문항이나 생물 등 다른 과학영역과 연계된 문항의 경우 정답률이 낮게 나타났다. 지구의 순환을 포괄하는 '대기와 해양' 영역의 경우, 지역별 기후 비교나 지구온난화의 특징 등에 대한 우리나라 학생들의 정답률이 낮게 나타났는데 일부 내용은 중학교 사회과 지리 영역에서 다루는 것으로 나타났다. 태양계와 우주에서의 지구를 포괄하는 '우주' 영역의 경우, 지구의 자전과 공전, 달의 중력 등은 초등학교에서부터 학습한 내용이어서 높은 정답률을 나타내었다. 연구결과를 토대로 우리나라 중학교 지구과학 교육과정 개선 및 교수학습 개선 방안을 초등학교와 중학교교육과정에서 지구과학 내용의 연계성 확보, 학교 평가에서 서술형 문항의 출제 경향 변화의 필요성, 과학탐구 관련 역량 신장의 필요성 등의 측면에서 제안하였다.

우리나라 초등학교 6학년 학생들의 수학 성취수준별 특징 탐색 - 2003년 국가수준 학업성취도 평가 결과 분석 - (Investigations into the Characteristics of Students in Grade 6 According to Achievement Levels - The Result Analysis of National Assessment of Educational Achievement in 2003 -)

  • 조영미
    • 대한수학교육학회지:학교수학
    • /
    • 제7권1호
    • /
    • pp.33-54
    • /
    • 2005
  • 2003년 국가수준 학업성취도 평가에서는 결과 분석의 하나로, 각 문항별로 우수학력, 보통학력, 기초학력 수준 각각에 속한 학생들의 정답률을 산출하였다. 이 논문에서는 특별히 초등학교 6학년을 대상으로 한 결과 분석 내용을 활용하여, 먼저 문항별 성취수준의 특징을 분석하고, 다음으로 성취수준별 학생들의 특징을 추출하였다. 이 결과는 최근 활발히 논의되고 있는 수준별 교육과정이나 수준별 수업의 운영에 필요한 기본적인 정보로 활용될 수 있을 것으로 생각된다.

  • PDF

특징창과 특징링크를 이용한 스테레오 특징점의 정합 성능 향상 (Enhancement of Stereo Feature Matching using Feature Windows and Feature Links)

  • 김창일;박순용
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.113-122
    • /
    • 2012
  • 스테레오 정합(stereo matching) 기술은 주어진 두 영상에서 동일한 물체의 영상점이 어떤 위치 관계를 가지고 있는지를 결정하는 기술이다. 본 논문에서는 영상 특징점에 대해 스테레오 위치관계를 결정하는 새로운 스테레오 특징점 정합(stereo feature matching) 방법을 제시한다. 제안하는 방법은 주어진 스테레오 영상에서 FAST 추출기를 이용하여 특징점을 추출하고, 특징점 벡터들의 정보들을 내부에 포함하는 특징창(feature window)이라는 공간을 정의하여 스테레오 정합의 성능을 향상한다. 제안하는 방법은 표준 영상에 추출된 특징점들에 대해 특징창을 생성하고, 참조 영상에서 표준 영상의 특징창과 가장 유사한 특징창을 탐색 및 결정한 다음, 결정된 두 개의 특징창 내부의 특징점들의 시차관계는 특징링크(feature link)를 생성하여 시차를 결정한다. 만약, 이 과정에서 시차가 결정되지 않은 특징점들이 있다면, 특징창 내의 결정된 시차 정보를 이용하여 시차 값을 보간한다. 마지막으로, 제안하는 방법의 성능을 검증하기 위해 결과 영상과 정답 영상의 시차를 비교하여 정합 정확성과 수행시간을 비교하였다. 또한, 기존의 특징점 기반 스테레오 정합 방법들과 제안하는 방법의 성능을 비교 및 분석하였다.