• 제목/요약/키워드: 음절수

검색결과 314건 처리시간 0.036초

딥러닝을 이용한 전이 기반 한국어 형태소 분석 및 품사 태깅 (A Transition based Joint Model for Korean Morpheme Segmentation and POS Tagging Using Deep Learning)

  • 민진우;나승훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.305-308
    • /
    • 2017
  • 한국어 형태소 분석은 많은 자연어 처리 분야에서 핵심적인 역할을 수행하고 있기 때문에 형태소를 분류하고 형태소에 맞는 알맞은 품사를 결정하는 것은 매우 중요하다. 형태소의 품사를 태깅하는 대표적인 방법은 크게 음절 단위 형태소 분석과 단어 단위 형태소 분석의 두 가지로 나눌 수 있다. 본 논문에서는 의존 파싱 분야에서 널리 활용되고 있는 전이 기반 방식을 적용하여 전이 기반 단어 단위 한국어 형태소 분석 모델을 제안하고 해당 모델을 한국어 형태소 분석 데이터인 세종 품사 부착 말뭉치 셋에 적용하여 F1 97.77 %로 기존의 성능을 더욱 향상시켰다.

  • PDF

음절 정보만 이용한 한국어 복합 명사 분해 (Korean Compound Noun Decomposition Only Using Syllabic Information)

  • 박성배;장병탁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-39
    • /
    • 2003
  • 한국어에서는 복합 명사 생성이 매우 자유스럽다. 즉, 독립된 명사를 연속으로 붙여 쓰는 것이 가능하다. 하지만, 기계번역이나 정보 검색과 같이 복합 명사를 처리하는 시스템에서 정확한 분석을 위해서는 복합 명사를 다시 단일 명사들로 분해하는 과정이 필요하다. 본 논문에서는 한국어 복합 명사 분해를 위해 GECORAM(GEneralized Combination of Rule-based learning And Memory-based learning) 알고리듬을 제시한다. 규칙 학습 알고리듬의 장점은 생성된 학습 결과를 사람이 쉽게 이해할 수 있다는 점이지만, 다른 지도학습 알고리듬에 비해 성능이 떨어진다는 단점이 있다. 본 논문에서는 이를 위해 규칙 학습 알고리듬과 기억기반 학습을 결합하는 방법을 제시한다. 실험 결과, GECORAM 알고리듬은 규칙 기반 학습이나 기억 기반 학습을 단독으로 쓰는 경우보다 높은 정확도를 보였다.

  • PDF

DSP를 이용한 연속숫자 음성 인식기 구현 (The Implementation of Continuous Digit Recognition Using DSP)

  • 이성권;임영춘;서준배;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.93-96
    • /
    • 2004
  • 본 논문은 TMS320C5501 16bit DSP를 적용한 실시간 화자독립 연속 숫자인식기의 구현에 관해 서술한다. 하드웨어 모듈의 구성은 TMS320C5501 300MHz DSP, 코덱으로는 TLV320AIC1103, SDRAM, 외부장치와의 인터페이스를 위한 HPI, Uart, MIC, SPK Out 단자로 구성되었다. 음성인식 알고리즘은 HM-Net 방식을 사용하였고 고정소수점 연산처리 방식으로 C를 이용한 최적화 작업을 수행하였으며 스트리밍 방식의 인식 방법으로 실시간 처리가 가능하도록 구현하였다. 숫자 인식에 사용한 모델은 41음소에 기반한 트라이폰을 학습하였으며, 특징 파라미터로는 LPCMEL 20차를 사용하였다. 임베디드 시스템의 실시간 음성인식 시스템 구성에 중점을 두었으며 PC상에서의 성능과 비교해 볼때 본 DSP 상에서 500단어, 50문장의 인식을 평균 1.5초 전후로 인식하도록 하였으며 간단한 연결 단어 인식을 수행하는데 무리 없음을 보여준다. 특별히 한국어 연속숫자 부분에 중점을 두었고, 본 연구에서 구현된 연속 음성인식 시스템에 사용된 숫자 인식에서 음절 바이폰 모델에 대하여 $92.92\%$의 인식율을 얻을 수 있었다.

  • PDF

딥러닝을 이용한 전이 기반 한국어 형태소 분석 및 품사 태깅 (A Transition based Joint Model for Korean Morpheme Segmentation and POS Tagging Using Deep Learning)

  • 민진우;나승훈;김영길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.305-308
    • /
    • 2017
  • 한국어 형태소 분석은 많은 자연어 처리 분야에서 핵심적인 역할을 수행하고 있기 때문에 형태소를 분류하고 형태소에 맞는 알맞은 품사를 결정하는 것은 매우 중요하다. 형태소의 품사를 태깅하는 대표적인 방법은 크게 음절 단위 형태소 분석과 단어 단위 형태소 분석의 두 가지로 나눌 수 있다. 본 논문에서는 의존 파싱 분야에서 널리 활용되고 있는 전이 기반 방식을 적용하여 전이 기반 단어 단위 한국어 형태소 분석 모델을 제안하고 해당 모델을 한국어 형태소 분석 데이터인 세종 품사 부착 말뭉치 셋에 적용하여 F1 97.77 %로 기존의 성능을 더욱 향상시켰다.

  • PDF

수화 인식에 대한 센서 시스템 (Development of Sensor System for Finger Gesture)

  • 이재홍;정은석;김대은
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.4-5
    • /
    • 2011
  • 수화는 몸 동작 또는 손가락의 움직임을 통하여 상호 커뮤니케이션을 하는 하나의 언어이며, 이 언어의 디지탈 미디어로의 소통을 위해서는 동작을 하나의 의미 있는 단어, 음절로의 표현이 가능해야 한다. 여기서는 몸 동작, 팔 다리의 움직임 보다는 손가락의 움직임에 초점을 맞추어 지문자 인식에 필요한 센서 시스템에 대하여 고찰한다. 우선 연속적인 지문자, 지숫자의 입력을 인식하기 위해서는 각 문자 절음 인식이 가장 중요한 문제가 된다. 절음 위치를 인식하는 것은 현재 입력된 패턴과 다음 패턴을 구분지어 각각 다른 지문자 혹은 지숫자로 인식할 수 있게 하는 기반이 된다. 손가락 구부러짐의 구분 및 인식을 위한 방법의 개발을 위해, 언어별 수화의 특징 분석을 토대로 다양한 적용 가능한 센서를 탐색하고 수화 장갑을 위한 원천기술을 개발, 수화 장갑 프로토타입을 제작하였다.

  • PDF

한국어 음절의 Entropy에 관한 연구 (Statistical Measurement of Monsyllable Entropy for Korean Language)

  • 이주근;최흥문
    • 대한전자공학회논문지
    • /
    • 제11권3호
    • /
    • pp.15-21
    • /
    • 1974
  • 이 논문은 한국어의 3성음의 조직을 방정식화하고 그로부터 조직약적 상태 graph를 유도하여 정보원의 성질을 구명하고 나아가서 기본 요소의 통계량에 대한 Entropy와 Redundancy를 측정하여 서구어와 비교검토 하였다. 특히 한국어에서 정보원의 성질을 구명하기 위한 syllable의 상태 graph는 단일화된다는 것을 명시함으로서 타언어에서 볼 수 없는 특이한 현상이 나타난다는 것을 지적하였다.

  • PDF

음운환경을 고려한 피치 기반 세기 제어 모델 (Pitch-based Intensity Control Models Considering Phonetic Environments)

  • 김기중;김진영;진달복
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.80-85
    • /
    • 1998
  • 본 논문에서는 음성합성기에서 합성음의 자연성을 향상시키기 위한 한 방법으로 운 율 제어요소중 세기 제어 모델을 통계적인 방법을 이용하여 제안하였다. 세기 제어 모델을 구성하기 위하여, 음성의 세기는 피치에 비례한다는 사실에 기반하여, 녹음된 음성 데이터에 서 음절의 각 모음에 대한 평균파워와 평균피치를 구하고, 피치를 종속변수로 하는 모음의 세기 예측식을 만들었다. 예측식에 의하여 얻어진 세기값과 실제 측정된 세기값과의 상관도 는 전체모음에 대하여 약 0.63으로 나타났다. 본 논문에서는 예측 세기와 실제 세기와의 상 관도를 향상시키기 위하여 피치만을 고려하여 예측된 세기값을 음운환경을 고려하여 선형 오차를 보정하는 방법을 제안하였고, 이 방법을 이용하여 얻어진 세기값은 전체모음에 대하 여 실제 세기값과 0.71의 상관도로 향상시킬 수 있었다.

  • PDF

한국어 음절 인식을 위한 MLP 신경망 구조 및 특징 추출에 관한 연구 (A Study on MLP Neural Network Architecture and Feature Extraction for Korean Syllable Recognition)

  • 금지수;이현수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.672-675
    • /
    • 1999
  • In this paper, we propose a MLP neural network architecture and feature extraction for Korean syllable recognition. In the proposed syllable recognition system, firstly onset is classified by onset classification neural network. And the results information of onset classification neural network are used for feature selection of imput patterns vector. The feature extraction of Korean syllables is based on sonority. Using the threshold rate separate the syllable. The results of separation are used for feature of onset. nucleus and coda. ETRI's SAMDORI has been used by speech DB. The recognition rate is 96% in the speaker dependent and 93.3% in the speaker independent.

  • PDF

정보교환용 조선글 부호 KPS 9566-97의 분석 (An Analysis of KPS 9566-97 Korean Character Code for Information Interchange)

  • 변정용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.199-204
    • /
    • 2001
  • 분단으로 빚어진 남북한 사회의 이질화는 한글과 조선글이라는 쌍둥이의 탄생으로 연결되고, 이들 둘은 자모순이 다르고 음절 부호화 방식을 채택하였기 때문에 정보교환을 함에 있어서 돌아오지 못할 다리를 건너고 말았다. 이제 남북경협의 본격화가 예상되고 그에 따른 정보교환의 급증이 예상되는 시점에서 최근 개정된 조선글 두바이트 부호 국규 9566-97의 분석을 통하여 양 문자를 통합할 수 있는 기틀을 마련하고자 한다 여기서 문제 해결의 핵심은 자모순이 서로 다름으로 인하여 빚어지는 것으로 이들 남북의 자모순 및 정보교환용 문자부호 표준화를 위하여 몇 가지 모색을 하고 방법을 논한다. 또한 남한안 일변도인 국제 문자부호 표준에 대하여 북한의 수정요구가 진행되고 있고 그 내용과 조선글 두바이트 부호안을 종합하여 표준을 마련하기 위한 기본 방향을 설정하고 허배선생의 연구를 통하여 새로운 자모순 모색의 가능성을 논한다.

  • PDF

서브밴드 선형근사에 의한 피치변경법에 관한 연구 (A Study on the Pitch Alteration Technique by Sub-band Linear Approximation in Spectrum)

  • 김영규;김봉영;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2423-2426
    • /
    • 2003
  • 음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다 하지만 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 서브 선형근사에 의하여 스펙트럼 평탄화 시킨 후 스펙트럼 스케일링을 이용하여 피치를 변경하는 방법에 대하여 제안하였다. 기존 방법인 LPC법, Cepstrum법과 비교하여 어느 정도의 우수성을 보이는지 평가하였고 평가방법은 각각의 평탄화 된 신호의 분산을 구하여 평탄화의 정도를 측정하였다. 이때 평탄화 된 신호는 최고점이 영이 되도록 정규화 시키고 평균이 영인 분산을 계산하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.12% 이하로 유지되었으며 실험결과 제안한 방법이 기존의 방법보다 우수함을 보여주었다.

  • PDF