• 제목/요약/키워드: 표현 방법

검색결과 8,711건 처리시간 0.037초

오픈 도메인 질의응답을 위한 질문-구절의 밀집 벡터 표현 연구 (A Study on the Dense Vector Representation of Query-Passage for Open Domain Question Answering)

  • 정민지;이새벽;김영준;허철훈;이충희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.115-121
    • /
    • 2022
  • 질문에 답하기 위해 관련 구절을 검색하는 기술은 오픈 도메인 질의응답의 검색 단계를 위해 필요하다. 전통적인 방법은 정보 검색 기법인 빈도-역문서 빈도(TF-IDF) 기반으로 희소한 벡터 표현을 활용하여 구절을 검색한다. 하지만 희소 벡터 표현은 벡터 길이가 길 뿐만 아니라, 질문에 나오지 않는 단어나 토큰을 검색하지 못한다는 취약점을 가진다. 밀집 벡터 표현 연구는 이러한 취약점을 개선하고 있으며 대부분의 연구가 영어 데이터셋을 학습한 것이다. 따라서, 본 연구는 한국어 데이터셋을 학습한 밀집 벡터 표현을 연구하고 여러 가지 부정 샘플(negative sample) 추출 방법을 도입하여 전이 학습한 모델 성능을 비교 분석한다. 또한, 대화 응답 선택 태스크에서 밀집 검색에 활용한 순위 재지정 상호작용 레이어를 추가한 실험을 진행하고 비교 분석한다. 밀집 벡터 표현 모델을 학습하는 것이 도전적인 과제인만큼 향후에도 다양한 시도가 필요할 것으로 보인다.

  • PDF

개념적 모델링을 위한 관계 표현의 확장

  • 강병영
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 1997년도 추계학술대회논문집 기업경쟁력 향상을 위한 정보통신 기술의 활용
    • /
    • pp.427-436
    • /
    • 1997
  • 데이터베이스 설계에서 개념적 모델링 단계에서는 논리적 설계가 효율적으로 수행 되도록 하기 위하여 현실 세계를 보다 정확하게 표현할 수 있도록 다양한 의미 표현 도구를 제공해야 한다. 본 연구에서는 데이터베이스 개념 설계에 가장 널리 사용되는 실체 관계 모 델(ERD)을 기반으로 데이터의 표현 능력을 향상시키고자 한다. 특히 데이터의 표현을 확장 하려는 연구들을 정리하고 통합적인 데이터 모델링 방법의 개발 필요성을 제시한다.

  • PDF

민화의 재해석을 통한 현대한국화의 표현에 대한 연구 (A Study of Contemporary Korean Painting's Expressions through the Reinterpretation of Folk Painting)

  • 오세권
    • 조형예술학연구
    • /
    • 제10권
    • /
    • pp.51-72
    • /
    • 2006
  • 민화가 갖는 조형적 특성이 현대 한국화 작품에서 재해석되고 있는데 이는 민화가 지니고 있는 조형적 특성에서 오늘날 현대 한국화가 나아가야 할 방법론을 찾아보는 것이다. 그 표현들을 보면 민화에서 나타나는 도상의 재현, 평면화와 다시점적 표현 방법의 재해석, 민화 도상들을 오브제화 하고 혼성모방을 하는 등 실험성을 나타내기도 한다. 이 모든 표현들이 '민화'를 통한 현대 한국화의 방법들을 제시하는 것들이다. 현대 한국화 표현에서 민화는 오래전부터 응용되었지만 관심이 더욱 높아진 것은 1980년대 들어서이다. 당시 리얼리즘 미술의 민족적 표현 방식과 채색화의 등장으로 인하여 민화에서 나타나는 전통적 오방색과 서민적 내용 그리고 도상들을 차용하면서 점차 작가들이 민화를 재해석하여 자신의 작품 속에 등장시키기 시작하였던 것이다. 특히 '한국의 미'에 대한 관심이 민화에 대한 관심으로 나타났고, 민화는 전통적 조형 표현 방법에 있어 중요한 '한국의 미'를 제공하였다. 본 연구에서는 조선조 민화에서 나타나는 도상을 재현하거나 재해석하여 오늘날 한국화의 새로운 표현으로 등장시킨 작가들의 작품들을 살펴보고 그 작품들에서 어떠한 특성들이 있는가 하는 것을 알아보는 것을 목적으로 한다. 이와 같은 목적을 해결하기 위하여 민화에서 나타나는 조형적인 특성을 변용하거나 재해석하여 현대적인 작품세계로 나아가는 작가들을 '민화 이미지의 재수용' '민화 특성의 재해석' '실험적 표현' 등으로 나누어 살펴보았다. 그 결과 민화가 고전적인 표현이며 조선시대에서만 사용된 조형적 방법이 아니라 오늘날 조형 방법론으로 재해석할 수 있는 민족적 표현임을 알 수 있다.

  • PDF

크로마 레벨 표현, 동적 시간 왜곡, 꺾인 거리함수에 기반한 멜로디 사이의 유사도 개발 (Development of melody similarity based on chroma representation, dynamic time warping, and hinge distance)

  • 장달원;박성주;장세진;이석필
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.258-260
    • /
    • 2011
  • 이 논문에서는 쿼리-바이-싱잉/허밍 (Query-by-singing/humming, QbSH) 시스템 또는 커버 노래 인식 (cover song identification) 시스템에서 사용 가능한 멜로디 유사도를 제안한다. QbSH 또는 커버 노래 인식은 디지털 음악의 사용이 보편화되면서 음악 검색의 방법으로 많은 연구가 진행되어 오고 있다. 멜로디 유사도는 이런 시스템을 구현하는데 필수적인 요소이며, 두 개의 음악에서 멜로디가 추출되었다고 가정하고, 추출된 멜로디 사이의 유사한 정도를 수치로 표현한다. QbSh 시스템이나 커버 노래 인식 시스템은 멜로디 유사도에 기반하여 입력 노래와 유사한 노래를 데이터베이스에서 검색하는 작업을 수행한다. 이 논문에서 제안하는 멜로디 유사도 방식은 기존의 많이 연구되던 동적 시간 왜곡 (dynamic time warping, DTW) 방법과 크로마 표현 방법 (chroma representation)을 사용하였다. DTW방법은 비대칭적으로 사용하고 미디 노트 영역에서 표현된 멜로디 특징은 0이상 12 미만의 크로마 레벨로 표현하였다. 기존의 방법에서는 정수값을 많이 사용하였으나 이 논문에서는 실수값을 사용한다. DTW 에 사용하는 거리 함수를 기존에 사용하던 차이의 절대값 대신 꺾인 함수 형태를 사용함으로써 성능을 높였다. QbSH 시스템에서의 실험을 통해서 성능을 검증하였다. 본 논문에서는 10-12초 길이의 1000번의 쿼리(Query)에 대해서 28시간 정도의 데이터베이스에서 실험한 결과, 순위 역의 평균 (Mean reciprocal rank, MRR) 값이 0.713을 보였다.

  • PDF

고기능성 정보의 속성에 관한 연구 -Airline Safety information을 중심으로 (The Attributes of high-functional Information - Based on the Safety Information of Airlines)

  • 한지애;류시천
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.135-137
    • /
    • 2010
  • 본 연구는 여러 정보환경 또는 정보 디자인 유형 중에서 짧은 정보 노출 시간에 비해 정보 전달력이 강해야 하는 정보유형의 인지력을 높이는 방법을 모색하기 위해 진행되었다. 이와 같은 정보를 본 연구에서는 '고기능성 정보(High-Functional Information)'라고 정의하고, 연구를 위해 7개 항공기에서 사용되고 있는 Safety Information을 중심으로, 고기능성 정보의 주요 속성과 그에 따른 거시적 정보 표현 방법에 대해서 연구하였다. 본 연구는 상황, 순서, 흐름, 구조 표현으로서의 정보디자인인 Safety Information을 기능변수에 대한 활용이 중요한 '고기능성 정보'라고 정의하고, 이에 대한 주요 정보 속성을 Accessibility, Errorless, Understandable, Timeliness로 제시하였다. 고기능성 정보는 맥락에 따라, 시각적 재현 측면에서 Understandable, Accessibility 속성이 충족되어야 하며, 사용자 조작 측면에서는 Errorless, Timeliness 속성이 충족되어야 한다. 각 측면에서의 거시적 표현 방법으로써, 시각적 재현 측면에서 독특 속성을 기반으로 한 속성이론, 도상화를 통한 "현실감지" 최대화, 정보 주도성(Proactivity), 잉여정보와 노이즈 정보의 최소화를 제시하였으며, 사용자 조작측면에서 맥락효과, 일차적 독특성을 중심으로 한 기억부호화, 이중부호화 및 표현 방법 등을 제시하였다. 본 연구에서의 개괄적인 연구 내용을 토대로 앞으로 정보환경 또는 디자인 유형과 속성에 따른 정보 표현방법에 관한 연구가 추진될 예정이다.

  • PDF

KAISER: 워드 임베딩 기반 개체명 어휘 자가 학습 방법을 적용한 개체명 인식기 (KAISER: Named Entity Recognizer using Word Embedding-based Self-learning of Gazettes)

  • 함영균;최동호;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.337-339
    • /
    • 2016
  • 본 논문에서는 한국어 개체명 인식의 성능 향상을 위하여 워드 임베딩을 활용할 수 있는 방법에 대하여 기술한다. 워드 임베딩이란 문장의 단어의 공기정보를 바탕으로 그 단어의 의미를 벡터로 표현하는 분산표현이다. 이러한 분산 표현은 단어 간의 유의미한 정도를 계산하는데 유용하다. 본 논문에서는 이러한 워드 임베딩을 통하여 단어 벡터들의 코사인 유사도를 통한 개체명 사전 자가 학습 및 매칭 방법을 적용하고, 그 실험 결과를 보고한다.

  • PDF

색상과 모양 특징을 이용한 효율적인 이미지 검색기법 (Efficient Image Search Technique Using Color and Shape Feature)

  • 조범석;박영배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2000
  • 내용기반 이미지 검색을 위한 기존의 대부분의 기법들은 이미지 데이터에 효과적으로 적용할 수 있는 고차원의 색인구조를 고려하지 않았다. 이 연구에서는 이미지 데이터베이스에서 보다 효율적이며 정확도가 높은 검색결과를 기대할 수 있는 색상 특징 데이터 표현방법인 ECCV기법, 모양 특징 데이터 표현방법인 EPA기법을 소개한다. 또한 고차원 데이터에 대해서도 검색속도를 향상시킬 수 있는 새로운 다차원 공간 인덱스 구조인 XS-트리를 제안한다. 이 방법을 이용하면 특징표현단계에서는 차원의 수가 증가되어 저장에 필요한 공간을 많이 요구하지만 인덱싱 단계를 거치면 이미지 검색 속도가 향상되며 정확한 이미지를 검색 할 수 있는 장점이 있다.

  • PDF

STM(Short-term Memorable) Information의 속성 및 정보표현 (Attributes and Expression of STM(Short-term Memorable) Information)

  • 한지애;류시천
    • 한국콘텐츠학회논문지
    • /
    • 제10권9호
    • /
    • pp.201-211
    • /
    • 2010
  • 본 연구의 목적은 정보 디자인 유형 중에서 상대적으로 "노출 시간이 짧지만 정보 전달력이 강한 정보" 즉, STM 정보(Short-term Memorable Information)” 에 대한 사용자의 인지력을 높이기 위한 방법을 모색하는 것이다. 연구를 통해 STM 정보의 디자인 속성을 고찰하고 거시적 관점에서 디자인적 표현 방법을 다음과 같이 제안하였다. STM 정보는 기능변수의 조작, 방법, 사건, 사용 예라는 네 가지 시각화 속성을 기준으로 시각적 재현 측면에서 '이해도(Understandable)', '접근성(Accessibility)' 속성이 충족되어야 한다. 또한 사용자 조작 측면에서는 '무오류(Errorless)', '적정성(Timeliness)' 속성이 충족되어야 한다. 각 측면에서의 거시적 표현 방법으로써, 시각적 재현 측면에서 "속성이론", "인식모형", "정보 주도성(Proactivity)의 최대화", "잉여 정보의 최소화", "이중부호의 사용"을 제안했으며, 사용자 조작측면에서 "맥락효과", 일차적 독특성을 중심으로 한 "기억부호화", "정보 주사(Scanning)"의 두 가지 방법을 제안했다. 사용자 설문 인터뷰를 통해서 앞서 제안한 8가지 표현 방법의 효율성에 관한 확증 및 STM 정보에 대한 사용자 인지패턴을 발견하였다. 본 연구에서의 주요 발견점을 토대로 향후에는 노출시간별 효과적인 정보 표현 및 그에 따른 응용 방법에 관한 연구가 진행될 필요가 있다.

화법에 의한 성격표현에 활용할 소리대본 작성법 (Use of Voice Script For Speech Characterization)

  • 이기호
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.976-985
    • /
    • 2011
  • 본 연구는 배우가 극중 인물의 성격을 창조하는 한 과정으로서, 언어적 성격창조를 위해 화법에 의한 성격표현에 활용할 소리대본의 작성 및 그 활용에 관한 연구이다. 배우의 연기에 있어서 궁극적인 목표는 극중 인물의 성격을 창조하여 완벽하게 구현해내는 것이라고 할 수 있으며, 그 목표를 달성하기 위하여 배우는 성격분석 방법을 터득하는 한편, 다양한 연기훈련으로 연기술을 연마하여 자신의 연기역량을 향상 시키는데 주력한다. 배우의 연기역량은 신체적 표현능력과 언어적 표현능력 개발로 향상된다. 따라서 배우들은 극중 인물의 성격을 창조하여 표현해내기 위하여 신체적, 언어적 표현능력을 향상시키는데 많은 노력을 기울인다. 그 중에서도 언어적 성격창조는 호흡과 발성, 그리고 화법에 의한 대사의 구사로 창조된다. 본고에서는 자유로운 호흡과 발성의 토대위에서 배우의 발성역량을 향상시키고, 향상된 발성역량으로 다양한 화법을 구사할 수 있는 방법을 연구, 제시함으로써 배우들이 언어적 성격창조를 효과적으로 할 수 있는 방법을 도출하고자 하였다. 극중 인물의 언어적 성격창조를 위해 다양한 화법, 즉 말하는 방법과 양식을 터득하게 함으로써 배우는 극중 인물의 성격을 효과적으로 창조할 수가 있게 된다. 따라서 효과적인 언어적 성격창조의 한 방법으로 화법에 의한 성격표현술을 습득하는 데 효과적인 방법론으로서의 소리대본을 작성하는 방법을 제시하고 활용토록 하고자 한다.

질의-응답 시스템을 위한 한국어 시간 표현의 인식 및 정규화 (The Recognition and Normalization of Korean Temporal Expression for Question-Answering System)

  • 윤도상;이도길;정후중;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.46-52
    • /
    • 2004
  • 본 논문에서는 질의-응답 시스템의 질의에서 많이 나타나는 시간 표현을 인식하고, 인식한 시간 표현에 대해서 정규화 하는 방법을 제안한다. 본 논문에서 사용하는 질의-응답 시스템의 도메인은 TV방송 스케줄, 날씨 정보이며, 이러한 도메인에서는 시간 표현이 매우 빈번하게 사용되기 때문에 질의에 나타나는 시간 표현을 정확하게 인식해서 정규화 하는 것이 중요하다. 제안하는 방법은 시간 표현을 의미와 기능에 따라 분류하고 각 유형마다 적절한 인식 및 정규화 기법을 사용한다. 질의에서 시간 표현은 시간 개체명 태거. 품사 태거, 시간 파서를 사용하여 인식하고, 시간 추론기와 시간 표현 사전을 이용하여 정규화 한다. TV방송 스케줄과 날씨 정보 도메인의 280개 질의에서 184개의 시간표현을 이용하여 평가한 결과, 시간 표현의 인식과 정규화는 각각 93%와 96%의 정확률, 97%와 93%의 재현율을 보였다.

  • PDF