• 제목/요약/키워드: 가변길이 윈도우

검색결과 5건 처리시간 0.023초

가변길이 윈도우를 이용한 통계 기반 동형이의어의 중의성 해소 (Statistical Word Sense Disambiguation based on using Variant Window Size)

  • 박기태;이태훈;황소현;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-44
    • /
    • 2012
  • 어휘가 갖는 의미적 중의성은 자연어의 특성 중 하나로 자연어 처리의 정확도를 떨어트리는 요인으로, 이러한 중의성을 해소하기 위해 언어적 규칙과 다양한 기계 학습 모델을 이용한 연구가 지속되고 있다. 의미적 중의성을 가지고 있는 동형이의어의 의미분별을 위해서는 주변 문맥이 가장 중요한 자질이 되며, 자질 정보를 추출하기 위해 사용하는 문맥 창의 크기는 중의성 해소의 성능과 밀접한 연관이 있어 신중히 결정되어야 한다. 본 논문에서는 의미분별과정에 필요한 문맥을 가변적인 크기로 사용하는 가변길이 윈도우 방식을 제안한다. 세종코퍼스의 형태의미분석 말뭉치로 학습하여 12단어 32,735문장에 대해 실험한 결과 용언의 경우 평균 정확도 92.2%로 윈도우를 고정적으로 사용한 경우에 비해 향상된 결과를 보였다.

  • PDF

OFDMA 하향링크 시스템에서의 PAPR 저감을 위한 다단계 및 가변길이 첨두 윈도윙 기법들 (Multi-stage and Variable-length Peak Windowing Techniques for PAPR Reduction of OFDMA Downlink Systems)

  • 이성은;민현기;방극준;홍대식
    • 대한전자공학회논문지TC
    • /
    • 제45권2호
    • /
    • pp.67-74
    • /
    • 2008
  • 본 논문에서는 OFDMA 하향링크 시스템에서 PAPR를 저감할 수 있는 두 가지 새로운 첨두 윈도윙(peak windowing) 기법을 제안한다. 제안한 첨두 윈도윙 기법들은 기존의 첨두 윈도윙 기법에서 매우 인접한 여러 개의 첨두들 또는 주변 신호에 비해 상대적으로 큰 첨두에 의해 발생하는 과도한 신호 왜곡 효과를 완화시킨다. 여러 단계의 임계치를 이용한 다단계 첨두 윈도윙(multi-stage peak windowing) 기법은 인접 신호에 비해 상대적으로 매우 큰 첨두들을 우선적으로 제거함으로써, 윈도우가 과도하게 인접 신호를 억제할 수 있는 경우를 방지한다. 다음으로 가변적인 윈도우 길이를 이용하는 가변길이 첨두치 윈도윙(variable-length peak windowing) 기법은 연속적인 첨두가 매우 인접하여 발생하였을 경우 여러 첨두에 적용되는 윈도우들이 중첩되지 않도록 윈도우 길이를 줄여서 과도하게 인접 신호가 억제되는 경우를 줄이게 된다. 제안한 첨두 윈도윙 기법들은 인접하여 발생하는 연속적인 첨두치나 상대적으로 큰 첨두에 의한 과도한 신호 억제를 미연에 방지함으로써 기존의 첨두 윈도윙 기법에 비해서 우수한 성능을 나타낸다. 기존의 첨두 윈도윙 기법 및 제안한 첨두 윈도윙 기법의 수신비트 오율(BER), 스펙트럼 특성은 OFDMA를 적용한 WiBro 하향링크 모의 실험 환경을 통해서 평가되며, 이를 통해 제안한 첨두 윈도윙 기법이 월등한 성능을 나타냄을 검증한다.

가변 크기 문맥과 거리가중치를 이용한 동형이의어 중의성 해소 (Word sense disambiguation using dynamic sized context and distance weighting)

  • 이현아
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제38권4호
    • /
    • pp.444-450
    • /
    • 2014
  • 의미 중의성 해소를 위한 대부분의 기존 연구에서는 문장의 특성에 상관없이 고정적인 크기의 문맥을 사용해 왔다. 본 논문에서는 중의성 해소에서 문장에 따라 가변적인 크기의 문맥을 사용하는 가변길이 윈도우와 단어간 거리를 사용한 의미분석 방법을 제안한다. 세종코퍼스의 형태의미분석 말뭉치로 학습하여 12단어 32,735문장에 대해 실험한 결과에서 제안된 방법이 용언에 대하여 92.2%의 평균 정확도를 보여 고정 크기의 문맥을 사용한 경우에 비해 향상된 결과를 보였다.

가변 적응형 사전을 이용한 텍스트 압축방식의 병렬 처리를 위한 VLSI 구조 (A Novel VLSI Architecture for Parallel Adaptive Dictionary-Base Text Compression)

  • 이용두;김희철;김중규
    • 한국정보처리학회논문지
    • /
    • 제4권6호
    • /
    • pp.1495-1507
    • /
    • 1997
  • 컴퓨터 통신망의 발달로 다량의 텍스트(Text) 또는 영상(Image) 정보의 전달이 이루어 지고 있다. 텍스트 압축과정에서 주어진 어휘를 이전에 나타난 같은 어휘를 가리키는 포인터로 대치시키는 원리에 준하여 설계된 LZ77 알고리즘은 가변적응형(adaptive) 사전을 이용한 텍스트 압축 방식으로 실제적으로 가장 많이 사용되는 알고리즘이다. 본 논문은 LZ77의 병렬 처리를 위해 LZ77의 Parallelism에 대한 분석 결과를 보여주며, 그 분석 결과를 적용한 병렬 LZ77 알고리즘의 설계, 그리고 그러한 병렬 LZ77 알고리즘을 처리하도록 고안된 VLSI 시스템 구조에 관한 연구 내용을 기술한다. 이전의 유사한 연구 내용과 비교하여, 본 논문에서 제안된 VLSI 시스템은 사전 윈도우(dictionary window)의 크기에 제한이 없으므로 확장성이 뛰어난 장점을 갖으며, 입력 텍스트의 길이가 (N)일때, 사전 윈도우의 크기에 관계없이 그 처리속도가 O(N)이며 VLSI 구현시 다른 유사한 시스템보다 향상된 집적도를 갖는다.

  • PDF

문서의 감정 분류를 위한 주목 방법 기반의 딥러닝 인코더 (An Attention Method-based Deep Learning Encoder for the Sentiment Classification of Documents)

  • 권순재;김주애;강상우;서정연
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권4호
    • /
    • pp.268-273
    • /
    • 2017
  • 최근 감정 분류 분야에서 딥러닝 인코더 기반의 접근 방법이 활발히 적용되고 있다. 딥러닝 인코더 기반의 접근 방법은 가변 길이 문장을 고정 길이 문서 벡터로 압축하여 표현한다. 하지만 딥러닝 인코더에 흔히 사용되는 구조인 장 단기 기억망(Long Short-Term Memory network) 딥러닝 인코더는 문서가 길어지는 경우, 문서 벡터 표현의 품질이 저하된다고 알려져 있다. 본 논문에서는 효과적인 감정 문서의 분류를 위해, 장 단기 기억망의 출력을 중요도에 따라 가중합하여 문서 벡터 표현을 생성하는 주목방법 기반의 딥러닝 인코더를 사용하는 것을 제안한다. 또한, 주목 방법 기반의 딥러닝 인코더를 문서의 감정 분류 영역에 맞게 수정하는 방법을 제안한다. 제안하는 방법은 윈도우 주목 방법(Window Attention Method)을 적용한 단계와 주목 가중치 재조정(Weight Adjustment) 단계로 구성된다. 윈도우 주목 방법은 한 단어 이상으로 구성된 감정 자질을 효과적으로 인식하기 위해, 윈도우 단위로 가중치를 학습한다. 주목 가중치 재조정에서는 학습된 가중치를 평활화(Smoothing) 한다, 실험 결과, 본 논문에서 제안하는 방법은 정확도 기준으로 89.67%의 성능을 나타내어 장 단기 기억망 인코더보다 높은 성능을 보였다.