• 제목/요약/키워드: 문맥 표현

검색결과 177건 처리시간 0.023초

채널에 강인한 화자 인식을 위한 채널 정규화 피치 동기 켑스트럼에 관한 연구 (A Study on the Channel Normalized Pitch Synchronous Cepstrum for Speaker Recognition)

  • 김유진;정재호
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.61-74
    • /
    • 2004
  • 본 논문에서는 채널 환경에 강인한 화자 인식 시스템을 위하여 문맥과 화자에 종속적인 켑스트럼 추출 방법과 추출된 켑스트럼에서 화자 정보의 손실을 최소화하는 채널 정규화 방법을 제안하였다. 제안된 추출 방법은 화자의 고유한 피치를 이용한 피치 동기 분석 방법에 기반을 두어 켑스트럼을 추출한다. 따라서 일명 피치 동기 켑스트럼 (PSC)은 유성음 구간에서 성도의 임펄스 응답을 보다 정확하게 표현할 수 있다. 또한 피치는 채널 환경에서 스펙트럼에 비해 강인하므로 피치 동기 켑스트럼은 채널에 의한 스펙트럼의 왜곡을 보상할 수 있다. 제안된 채널 정규화방법인 포먼트 평활화 피치 동기 켑스트랄 평균 차감법 (FBPSCMS)은 포먼트 평활화 켑스트랄 평균 차감법을 PSC에 적용하여 프레임 내 처리의 정확도를 개선시킨다. 제안된 방법들의 화자 인식 성능을 비교하기 위해 남자 112명과 여자 56명에 대해 WMIT과 전화선 환경의 NTIMIT을 이용한 화자 식별을 수행하였다. 실험 결과 피치 동기 LPCC는 기존 단구간 켑스트럼과 비교하여 에러 감소율을 최대 7.7%까지 향상시켰고, FBPSCMS는 극점 필터링 CMS에 비해 보다 안정되고 낮은 에러율을 나타내었다.

암묵 데이터를 활용한 인문학 인풋값과 다중 모달리티의 가중치 할당 방법에 관한 연구 (A Study on the Weight Allocation Method of Humanist Input Value and Multiplex Modality using Tacit Data)

  • 이원태;강장묵
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.157-163
    • /
    • 2014
  • 이용자의 감성은 그 어느 때보다 기업, 정부 그리고 개인 간의 소통에서 중요한 변수로 인식된다. 특히 수많은 연구에서 이용자의 감성을 파악하는 방법으로 음성 톤, 속도, 얼굴 표정, 몸의 이동 방향과 속도, 제스쳐 등이 사용된다. 다중 모달리티는 단일의 모달리티보다 정확도가 높은 반면 멀티 센싱에 따른 인식률 한계와 데이터 처리 부하 그리고 센싱된 값을 추론하는 우수한 알고리즘이 요구된다. 즉 다중 모달리티는 각 모달리티의 개념, 속성이 상이하여 인간의 감성값이라는 표준화된 값으로 전환하는데 오류가 발생할 수 있다. 이 문제를 해결하기 위해 다중 모발리티 중관계망 분석, 문맥 파악, 디지털 필터 등의 기술을 이용하여 이용자에게 우선 순위를 갖는 감성 표현 모달리티를 추출할 필요가 있다. 특정 상황에 우선 순위를 갖는 모달리티와 그 주변을 에워싼 다른 모발리티를 암묵 값으로 처리하면 감성 인식에 있어 컴퓨터 자원의 소비 대비 견고한 시스템을 구성할 수 있다. 본 연구 결과, 암묵 데이터를 활용하여 다중 모발리티 중 가중치를 어떻게 부여할지에 대하여 제안하였다.

XML 문서의 변환을 위한 온톨로지 갱신 기반 XML 스키마 매칭 (XML Schema Matching based on Ontology Update for the Transformation of XML Documents)

  • 이경호;이준승
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.727-740
    • /
    • 2006
  • 서로 다른 XML 스키마로 작성된 XML 문서간의 변환을 위해서는 두 스키마 사이의 의미적 연관관계를 계산하는 스키마 매칭 과정이 필수적이다. 본 논문에서는 XML 문서의 변환을 위한 효율적인 스키마 매칭 알고리즘을 제안한다. 제안된 알고리즘은 두 단계로 구성된다. 먼저 제안된 온톨로지와 어휘 유사도에 기반하여 단말노드 사이의 후보매칭을 계산한다. 또한 문맥 정보를 반영하는 제안된 경로 유사도 비교를 통해 후보매칭간계 중에서 최종 매칭 결과를 선택한다. 특히 제안된 방법은 기존 연구와 달리 사용자 피드백에 의해 점증적으로 갱신되는 온톨로지에 기반한다. 제안된 온톨로지는 IsA나 PartOf와 같은 다양한 관계를 표현할 수 있기 때문에 일대일 매칭은 물론이고 다대일 및 일대다 관계의 복합매칭을 계산할 수 있다. 제안된 알고리즘의 성능 평가를 위해 다양한 도메인의 XML 스키마를 대상으로 실험한 결과, 평균 97%의 정확률과 83%의 재현율을 나타내어 기존 연구보다 우수하였다. 특히 제안된 온톨로지의 갱신을 통하여 약 9%의 성능 향상을 확인할 수 있었다.

XBRL을 사용한 표준 전자세금계산서의 재구성 (Reconstruction of Standard Electronic Tax Invoices in XBRL)

  • 김형도
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.27-36
    • /
    • 2009
  • 표준 전자세금계산서는 사업자간에 비즈니스 거래 증빙자료로 활용되던 종이 세금계산서를 전자문서로 교환하고자 할 때 이용되는 전자문서 표준이다. 이러한 표준 전자세금계산서는 기업과 기업 그리고 기업과 국세청간의 전자문서 교환에 중점을 둔 것으로, 교환 이후에 표준 전자세금계산서를 유용하게 활용할 수 있도록 재무 정보 등의 의미와 문맥을 명확하고 경제적으로 표현하는데 있어서 한계가 있다. 무엇보다도 전자세금계산서가 세금에 관한 기본적인 재무정보를 포함하고 있어서 발급받은 기업의 재무제표작성이나 감사 등 기업 내부에서 광범위하게 활용될 수 있을 뿐만 아니라, 국세청에 제출되는 보고서 성격을 감안하는 것이 필요하다. 이런 관점에서 이 논문은 표준 전자세금계산서를 사실상의 국제 표준 비즈니스 보고 언어인 XBRL로 구성하는 방법을 표현력과 활용 능력 중심으로 구체적인 사례와 함께 비교 분석해보고, XBRL 기반 표준 전자세금계산서의 가능성을 논한다.

기계학습 기반 경쟁자 자동추출 방법 (Competitor Extraction based on Machine Learning Methods)

  • 이충희;김현진;류법모;김현기;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.107-112
    • /
    • 2012
  • 본 논문은 일반 텍스트에 나타나는 경쟁 관계에 있는 고유명사들을 경쟁자로 자동 추출하는 방법에 대한 것으로, 규칙 기반 방법과 기계 학습 기반 방법을 모두 제안하고 비교하였다. 제안한 시스템은 뉴스 기사를 대상으로 하였고, 문장에 경쟁관계를 나타내는 명확한 정보가 있는 경우에만 추출하는 것을 목표로 하였다. 규칙기반 경쟁어 추출 시스템은 2개의 고유명사가 경쟁관계임을 나타내는 단서단어에 기반해서 경쟁어를 추출하는 시스템이며, 경쟁표현 단서단어는 620개가 수집되어 사용됐다. 기계학습 기반 경쟁어 추출시스템은 경쟁어 추출을 경쟁어 후보에 대한 경쟁여부의 바이너리 분류 문제로 접근하였다. 분류 알고리즘은 Support Vector Machines을 사용하였고, 경쟁어 주변 문맥 정보를 대표할 수 있는 언어 독립적 5개 자질에 기반해서 모델을 학습하였다. 성능평가를 위해서 이슈화되고 있는 핫키워드 54개에 대해서 623개의 경쟁어를 뉴스 기사로부터 수집해서 평가셋을 구축하였다. 비교 평가를 위해서 기준시스템으로 연관어에 기반해서 경쟁어를 추출하는 시스템을 구현하였고, Recall/Precision/F1 성능으로 0.119/0.214/0.153을 얻었다. 제안 시스템의 실험 결과로 규칙기반 시스템은 0.793/0.207/0.328 성능을 보였고, 기계 학습기반 시스템은 0.578/0.730/0.645 성능을 보였다. Recall 성능은 규칙기반 시스템이 0.793으로 가장 좋았고, 기준시스템에 비해서 67.4%의 성능 향상이 있었다. Precision과 F1 성능은 기계학습기반 시스템이 0.730과 0.645로 가장 좋았고, 기준시스템에 비해서 각각 61.6%, 49.2%의 성능향상이 있었다. 기준시스템에 비해서 제안한 시스템이 Recall, Precision, F1 성능이 모두 대폭적으로 향상되었으므로 제안한 방법이 효과적임을 알 수 있다.

  • PDF

H.264/AVC를 위한 효율적인 이진 산술 부호화기 설계 (Design of an Efficient Binary Arithmetic Encoder for H.264/AVC)

  • 문전학;김윤섭;이성수
    • 대한전자공학회논문지SD
    • /
    • 제46권12호
    • /
    • pp.66-72
    • /
    • 2009
  • 본 논문에서는 H.264/AVC에서 사용되는 엔트로피 부호화 방법 중 하나인 CABAC를 위한 효율적인 이진 산술 부호화기를 제안한다. 기존의 이진 산술 부호화 알고리즘은 연산의 복잡도와 각 단계간의 데이터 의존도가 매우 높기 때문에 빠른 연산이 어렵다. 따라서 연산 과정의 복잡도와 데이터 의존도를 줄이기 위하여 재정규화 과정을 효율적으로 처리할 수 있는 2단 파이프라인 구조를 사용한다. 하드웨어 면적을 줄이기 위해서 문맥 모델 갱신기는 transIdxMPS 표를 간단한 식으로 표현하고, transIdxLPS 표와 rangeTabLPS 표를 함께 구현한다. 산술 연산기는 입력 값의 발생 확률에 따라 일반 모드, 우회 모드, 종결 모드로 나누어 설계하여 각 모드마다 최대 속도로 동작할 수 있게 한다. 제안하는 이진 산술 부호화기는 0.18um 표준 셀 라이브러리에서 7282 게이트의 면적을 사용하며 입력 심벌 당 소요되는 사이클 수는 약 1을 갖는다.

유비쿼터스 가정환경을 위한 상호주도형 대화 에이전트 (A mixed-initiative conversational agent for ubiquitous home environments)

  • 송인지;홍진혁;조성배
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.834-839
    • /
    • 2005
  • 유비쿼터스 가정환경의 다양한 서비스들을 사용자에게 제공하기 위해서는, 사용자의 의도를 정확히 파악하여 적절한 서비스를 수행하는 지능형 에이전트가 필요하다. 기존에 서비스 선택을 위해 사용되던 명령어 기반 사용자 인터페이스와는 달리, 대화 시스템은 인간과 시스템 사이의 유연하고 풍부한 의사소통에 유용하지만 기존의 사용자나 시스템 주도 대화 시스템은 사용자의 배경지식이나 대화의 문맥에 기인한 다양한 표현을 다루기 어렵다. 본 논문에서는 '상호주도형' 의사소통을 위한 계층적 베이지안 네트워크를 이용하여 사용자와 에이전트 사이에 발생하는 대화의 모호성을 해결한다. 서비스 추론 시 정보가 부족할 경우에는 계층적 베이지안 네트워크를 이용하여 추가로 필요한 정보를 분석하고 사용자로부터 수집한다. 제안하는 방법을 유비쿼터스 가정환경에 적용하고 시뮬레이션 환경을 구축하여 그 유용성을 확인하였다.

Self-Supervised Document Representation Method

  • Yun, Yeoil;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.187-197
    • /
    • 2020
  • 최근 신경망 기반의 학습 알고리즘인 딥 러닝 기술의 발전으로 인해 텍스트의 문맥을 고려한 문서 임베딩 모델이 다양하게 고안되었으며, 특히 대량의 텍스트 데이터를 사용하여 학습을 수행한 사전 학습 언어 모델을 사용하여 분석 문서의 벡터를 추론하는 방식의 임베딩이 활발하게 연구되고 있다. 하지만 기존의 사전 학습 언어 모델을 사용하여 새로운 텍스트에 대한 임베딩을 수행할 경우 해당 텍스트가 가진 고유한 정보를 충분히 활용하지 못한다는 한계를 가지며, 이는 특히 텍스트가 가진 토큰의 수에 큰 영향을 받는 것으로 알려져 있다. 이에 본 연구에서는 다수의 토큰을 포함한 장문 텍스트의 정보를 최대한 활용하여 해당 텍스트의 벡터를 도출할 수 있는 자기 지도 학습 기반의 사전 학습 언어 모델 미세 조정 방법을 제안한다. 또한, 제안 방법론을 실제 뉴스 기사에 적용하여 문서 벡터를 도출하고 이를 활용하여 뉴스의 카테고리 분류 실험을 수행하는 외부적인 임베딩 평가를 수행함으로써, 제안 방법론과 기존 문서 임베딩 모델과의 성능을 평가하였다. 그 결과 제안 방법론을 통해 도출된 벡터가 텍스트의 고유 정보를 충분히 활용함으로써, 문서의 특성을 더욱 정확하게 표현할 수 있음을 확인하였다.

XML 문서 처리에 관한 연구 (A Study on Processing XML Documents)

  • 김태권
    • 정보과학회 논문지
    • /
    • 제43권4호
    • /
    • pp.489-496
    • /
    • 2016
  • XML은 관계형 데이터는 물론 구조화 또는 반구조화된 데이터를 효과적으로 조직화하여 표현할 수가 있다. XQuery는 이러한 XML 데이터를 대상으로 필요한 정보를 편리하게 검색하는 질의어이다. 이 논문은 XQuery 작성기를 설계 및 구현하고, XQuery 처리기에 대한 인터페이스를 제공하여 적합한 프로세서를 등록할 수 있다. XQuery 작성기는 등록된 질의 처리기로 처리된 질의의 결과를 보여준다. 작성기는 파서를 내장하고 있기 때문에 파싱 트리의 영역 정보에 따라 영역 연산자를 사용함으로써 문맥에 따라 대응되는 다양한 대화상자에 의하여 대응하는 구문을 효과적으로 작성할 수 있다. 특히 작성기는 XML 문서의 DTD에 대응하는 엘리먼트의 트리를 그래픽으로 보여주기 때문에 경로식을 쉽게 작성할 수 있다. 엘리먼트의 계층구조에서 경로에 따라 노드를 체크함으로써 엘리먼트의 서술식을 포함하는 경로식을 자동적으로 작성한다.

표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서 (Generalized LR Parser with Conditional Action Model(CAM) using Surface Phrasal Types)

  • 곽용재;박소영;황영숙;정후중;이상주;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.81-92
    • /
    • 2003
  • 일반화 LR(Generalized LR, 이하 GLR) 파싱은 선형 스택을 사용하는 전통적인 LR 파싱 방식의 한계를 극복하도록 만들어진 LR 파싱 기법의 하나로서, LR 기법에 여러 가지 매커니즘을 통합하여 자연어 파싱에 응용하는 작업의 토대가 되어 왔다. 본 논문에서는 기존의 확률적 LR 파싱 기법이 가지고 있는 문제를 개선한 조건부 연산 모델(Conditional Action Model)을 제안한다. 기존의 확률적 LR 파싱 기법은 그래프 구조 스택의 복잡성으로 인해 상대적으로 제한된 문맥 정보만을 사용하여 왔다. 제안된 모델은 부분 생성 파스의 표현을 위하여 표층 구문 타입(Surface Phrasal Type)을 사용하여 그래프 구조 스택에 들어 있는 구문 구조를 기술함으로써 좀 더 세분된 구조적 선호도를 파서에 반영시킬 수 있다. 실험 결과, 어휘를 고려하지 않고 학습한 조건부 연산 모델로 구현된 본 GLR 파서는 기존의 방식보다 약 6-7%의 정확도 향상을 보였으며, 본 모델을 통해 풍부한 스택 정보를 확률적 LR 파서의 구조적 중의성 해결에 효과적으로 사용할 수 있음을 보였다.