• 제목/요약/키워드: 표상 방법

검색결과 200건 처리시간 0.021초

Bidirectional LSTM CRF 기반의 개체명 인식을 위한 단어 표상의 확장 (Expansion of Word Representation for Named Entity Recognition Based on Bidirectional LSTM CRFs)

  • 유홍연;고영중
    • 정보과학회 논문지
    • /
    • 제44권3호
    • /
    • pp.306-313
    • /
    • 2017
  • 개체명 인식이란 문서 내에서 인명, 기관명, 지명, 시간, 날짜 등 고유한 의미를 가지는 개체명을 추출하여 그 종류를 결정하는 것을 말한다. 최근 개체명 인식 연구에서 가장 우수한 성능을 보여주고 있는 모델은 Bidirectional LSTM CRFs 모델이다. 이러한 LSTM 기반의 딥 러닝 모델은 입력이 되는 단어 표상에 의존적이다. 따라서 입력이 되는 단어를 잘 표현하기 위하여 단어 표상을 확장하는 방법에 대한 연구가 많이 진행되어지고 있다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs모델을 사용하고, 그 입력으로 사용되는 단어 표상을 확장하기 위해 사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반에서 확장된 단어 임베딩 벡터, 그리고 개체명 사전 자질 벡터를 사용한다. 최종 단어 표상 확장 결과 사전 학습된 단어 임베딩 벡터만 사용한 것 보다 8.05%p의 성능 향상을 보였다.

잠재의미분석을 활용한 성격검사문항의 의미표상과 요인구조의 비교 (A Comparison between Factor Structure and Semantic Representation of Personality Test Items Using Latent Semantic Analysis)

  • 박성준;박희영;김청택
    • 인지과학
    • /
    • 제30권3호
    • /
    • pp.133-156
    • /
    • 2019
  • 본 연구는 수검자가 검사 문항을 어떻게 이해했는지를 조사하기 위해 검사문항의 의미표상을 탐구하였다. 잠재의미분석을 활용하여 성격검사문항과 성격요인의 의미표상 간 유사도를 나타내는 의미유사도 행렬을 제안하였고, 이를 기존의 탐색적 요인분석 결과와 비교하였다. 이를 위해 예비 연구에서 대학생 154명을 대상으로 제한된 맥락에서 성격의 5요인을 각각 묘사하는 지문을 수집하였고, 이를 바탕으로 5차원의 축소하여 의미공간을 구성하였다. 연구 1에서는 간편형 한국어 BFI의 요인부하량 행렬과, 예비 연구에서 구성한 의미공간에서 생성한 의미유사도 행렬을 비교하여, 두 행렬이 높은 정적 상관이 있음을 보여주었다. 연구 2에서는 의미유사도를 기반으로 성격검사문항을 생성하고, 수검자의 반응을 수집하여 탐색적 요인분석을 통해 요인구조를 도출하여 두 행렬이 유사함을 보였다. 결론적으로 본 연구는 성격검사에 대한 수검자의 반응 없이 검사문항의 의미표상을 분석하여 구성타당도를 추론할 수 있는 방법을 제안하였고, 성격검사의 요인구조를 검사문항과 성격요인의 의미표상 간 유사도로 해석할 수 있음을 보여주었다. 이러한 결과는 성격검사 개발에 실용적인 도움을 줄 수 있을 것이다.

초등학교 6학년의 분수와 소수의 크기에 대한 수직선 표상의 정확성 및 사용 전략 분석 (Analyses of the precision and strategies for representing the magnitude of fractions and decimals on the number line among 6th graders)

  • 허진영;임수현
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권3호
    • /
    • pp.393-409
    • /
    • 2024
  • 분수와 소수가 나타내는 크기에 대한 이해를 돕기 위해, 수의 크기를 공간상에 직관적으로 표시하는 수직선 모델이 널리 활용된다. 본 연구에서는 수직선 추정 과제를 활용하여 초등학교 6학년 학생들의 분수와 소수에 대한 이해도 및 문제 해결 전략을 살펴보고, 다양한 전략 사용의 유연성이 분수와 소수의 표상의 정확성, 연산 능력, 수학 학업성취도의 개인차와 연관성이 있는지를 분석하였다. 분석 결과, 학생들은 자연수에 비해 분수와 소수의 수직선 표상 정확성이 상대적으로 낮았으며, 특별히 분수의 경우 분모가 짝수인 분수보다 홀수인 분수에서, 소수의 경우 소수 세 자리 수 보다 소수 두 자리 수에서 수직선 표상의 정확성이 더 낮게 나타났다. 전략 사용의 측면에서 학생들은 분수를 수직선에 표상할 때 기준점 참고 전략, 분할 전략, 어림 전략 순으로 많이 사용하였으며, 소수를 표상할 때에는 기준점 참고 전략, 반올림 전략, 자연수 변환 전략 순으로 많이 사용하였다. 마지막으로 분수를 표상할 때 사용하는 전략이 다양할수록 분수의 표상 정확성과 수학 학업성취 점수가 높게 나타났다. 이러한 결과를 토대로 분수의 다양한 개념과 자연수 대비 소수의 자릿값 및 0의 개념에 대한 세심한 지도의 필요성을 제언하였다. 또한 분수와 소수에 대한 이해를 돕기 위한 방안으로, 수직선 모델 활용과 함께 표상 전략을 병행해서 지도하는 방법에 대해 논의하였다.

국가 간 감성이미지의 비교 연구 : 색채와 언어 이미지 척도를 이용한 제품 이미지의 평가 (A comparison of sensibility image across nations : The evaluation of product image based on the color and concept image scale)

  • 신수길;한광희;황상민
    • 감성과학
    • /
    • 제1권1호
    • /
    • pp.161-169
    • /
    • 1998
  • 제품의 “감성이미지”란 제품의 기능과 함께 제품의 전달하는 감각적 요소 그리고 사용자가 제품을 통해 표현하고자 하는 개념적 표상을 통합하는 이미지이다. 감성이미지의 국제 비교 연구는 사용자가 특정 제품에 대해 가지고 있는 이미지를 구가나 문화의 맥락 속에서 해석하고, 이들 이미지를 상호 비교 평가하고자 한다. 생활문하 속에서 사용자들이 제품에 대해 가지는 감성이미지를 계량적으로 규명하고 비교 평가하며, 이 정보를 기초로 각국의 문화와 정서에 적합한 제품 디자인의 모형을 제시하는데 본 연구의 목적이 있다. 구체적인 연구활동으로 다음과 같은 방법이 제시되었다. 먼저, 각 문화 집단을 특징 지울 수 있는 표상개념으로 “언어 이미지” 스케일을 구성하였다. 이 언어 이미지에 대응하는 디자인 요소로 색채를 활용하여, 언어 개념과 색채 요소에 상응하는 자동차 제품의 감성 이미지가 각 문화 집단에 따라 상이하게 나타날 수 있는지를 비교하고자 하였다. 본 연구에서 나타난 각 문화 집단들이 특정 제품에 대해 적용하는 감성 이미지는 언어와 색체 요소로 구체화 될 뿐 아니라, 이들 집단이 형성한 사회적 표상(social representation)의 개념으로 비교될 수 있는 것을 보이고자 하였다.

  • PDF

언어 모델 다중 학습을 이용한 한국어 개체명 인식 (Korean Named Entity Recognition using Joint Learning with Language Model)

  • 김병재;박찬민;최윤영;권명준;서정연
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.333-337
    • /
    • 2017
  • 본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.

  • PDF

단서자극과 표적자극의 표상된 위치의 일치성이 주의기제의 작용에 미치는 영향 (The Effect of Consistency between Represented Location of the Cue and the Target on Attention Mechanism)

  • 서준호;이형철
    • 인지과학
    • /
    • 제20권4호
    • /
    • pp.481-506
    • /
    • 2009
  • 본 연구의 목적은 단서와 표적의 표상된 위치의 일치성이 주의기제의 작용에 중요한 역할을 하는지 회귀억제 연구방법을 이용하여 규명하는 것이었다. 실험 1에서는 청각단서와 시각표적을, 실험 2에서는 시각단서와 청각표적을 사용하였고, 단서와 표적이 제시되는 표상된 위치와 물리적 위치의 일치성에 따라 일치조건과 불일치조건으로 구분하였다. 실험결과, 실험 1에서 표상된 위치의 일치성에 따라 일치조건과 불일치조건을 구분하였을 경우 일치조건에서 반응촉진이 관찰되었다. 하지만 물리적 위치의 일치성에 따른 일치/불일치조건에서는 반응시간 차이가 관찰되지 않았다. 실험 2에서도 표상된 위치의 일치성에 따라 일치조건과 불일치조건을 구분하였을 경우 일치조건에서 반응촉진이 관찰되었으나 매우 제한적이었다. 이러한 실험결과는 단서와 표적의 표상된 위치의 일치성이 주의기제의 역할 중 반응촉진에 중요한 역할을 하며, 주의 연구에서 물리적 위치와 표상된 위치를 구분해야할 필요성을 시사한다.

  • PDF

ELMo와 멀티헤드 어텐션을 이용한 한국어 의존 구문 분석 (Korean Dependency Parsing Using ELMo and Multi-head Attention)

  • 박성식;오신혁;김홍진;김시형;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.8-12
    • /
    • 2018
  • 구문 분석이란 문장을 단어, 어절, 구 등의 구성 성분으로 분해하고 각각의 구조적 정보를 분석하여 문장의 구조를 알아내는 작업을 말한다. 최근 의존 구문 분석은 심층 신경망을 이용하는 방법이 활발히 연구되고 있다. 특히 포인터 네트워크를 사용하는 방법은 다른 심층 신경망보다 높은 성능을 보이고 있다. 그러나 포인터 네트워크의 사용만으로 의존 관계와 의존 관계명을 예측하는 것은 한계가 존재한다. 본 논문에서는 최근 사용하는 단어 표상 방법 별로 비교 실험을 진행하고 의존 구문 분석에서 GloVe의 성능이 가장 좋음을 보인다. 또한 언어 모델을 통한 단어 표상 방법인 ELMo와 멀티헤드 어텐션을 사용하여 포인터 네트워크만을 사용 했을 때보다 높은 성능(UAS 92.85%, LAS 90.65%)을 보였다.

  • PDF

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

시각작업기억 표상에 대한 고정해상도 슬롯 모형과 탄력적 자원 모형 사이의 쟁점에 대한 개관 (A Review of the Debates between Fixed-Resolution Slot and Flexible-Resource Models)

  • 현주석
    • 인지과학
    • /
    • 제26권4호
    • /
    • pp.453-481
    • /
    • 2015
  • 본 연구는 시각작업기억의 표상 특성에 대해 상반되는 주장을 펼치고 있는 고정해상도 슬롯 모형과 탄력적 자원 모형을 개관하고, 두 모형 간 상충을 해소하기 위한 노력이 필요함을 강조하였다. 이를 위해 고정해상도 슬롯과 탄력적 자원 모형을 태동시킨 객체 및 병렬 저장 가설을 살펴보고 두 모형의 상반되는 주장에 대한 이론적 근거를 소개하였다. 다음으로 두 모형을 지지한 구체적인 연구 사례를 통해 경험적 지지 증거의 객관성을 평가하고 관련 신경생리학적 모형에 대한 이해를 시도하였다. 마지막으로 두 모형 간의 상충을 해소하기 위한 이론적 그리고 방법론적 재고와 이를 달성하기 위한 수렴적 증거 확보의 필요성을 강조하였다.

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF