통합 검색 | Korea Science

세그멘트 통계량을 이용한 HMM 의 한국어 음절 인식 (Syllable Reconition by HMM Using Segmental Statistics)

박창호
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
- /
- pp.175-178
- /
- 1995
기존이 연속 출력 분포형 HMM은 시계열의 과도적 변화에 대하여 표현 능력이 부족하다는 단점이 있다. 이것을 보완하기 위해 본 논문에서는 음성의 동적 변화를 반영하기 위한 특징 파라메타로서 여러 개의 프레임을 결합하여 세그멘트를 구성하여 각각에 대해 한 개의 벡터를 만들었다. 이것을 그대로 이용하면 세그멘트의 프레임수에 대응하는 파라메타의 차원수가 증가하기 때문에 학습 데이터가 불충분한 경우 모델의 파라메타를 잘 추정할 수 없으므로 K-L 전개로서 파라메타의 차원을 압축하여 파라메타수를 감소시켰다. 인식실험은 한국어 단음절에 대하여 멜켑스트럼ㅇ르 K-L 전개로 압축한 벡터를 이용한 결과와 멜켑스트럼, 멜켑스트럼 선형회귀계수를 파라메타로 이용한 경우를 비교하였다. 실험결과 K-L 전개로 압축한 벡터만을 이용한 경우는 멜켑스트럼 + 선형회귀계수를 파라메타로 이용한 경우보다 인식율이 낮앗으나 멜켑스트럼 + K-L 전개로 압축한 경우와 거의 동등한 결과를 얻을 수 있었다.
PDF

한글 Common Lisp에서 한글 함수 기능

이창열;오승준;임영환
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
- /
- pp.172-179
- /
- 1990
본 논문에서는 한글(한국어) ascii 코드와 4가지 한글 표현 원리에 만들어지는 한글음절을 정의한다. Common Lisp(CL)의 확장된 버전으로 한글이 사용 가능한 한글 CL(HCL)의 소개하고 CL에 추가되는 새로운 한글 함수에 대하여 설명한다. HCL의 모든 함수는 한글을 다루는 방법에 따라 4가지 타입으로 나뉘어진다. 1) 타입 0 - 한글을 입출력 값으로 취하지 않는 전형적인 CL 함수, 2) 타입 1 - 원래 CL 함수정의의 변경없이 입력으로 한글을 받아들이는 함수, 3) 타입 2 - 한글을 사용하기 위하여 함수의 정의를 확장해야하는 CL 함수, 4) 타입 3 - 한글 처리를 하기 위하여 새로 설계한 새로운 함수. 위의 타입에 의해 분류되는 각 함수에 대한 정의를 제안하고 한글 편집기에 대하여 소개한다.
PDF

LDA를 이용한 트윗 유저의 연령대, 성별, 지역 분석 (Analyzing ages, gender, location on Twitter using LDA)

이호경;천주룡;송남훈;고영중
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
- /
- pp.116-119
- /
- 2013
요즘 많은 사람들은 트위터를 통해 짧은 문장의 트윗을 작성하여 자신의 의견이나 생각을 표현한다. 사람들이 작성한 트윗은 사용자의 연령, 성별, 지역에 따라 다른 특성이 담겨있다. 이러한 정보를 이용하여, 기업에서는 연령대, 성별, 지역에 따라 각기 다른 마케팅 전략을 세울 수 있을 것이다. 본 논문에서는 트위터 사용자들의 트윗을 분석하여 연령대, 성별, 지역을 예측하려 한다. 네이버 오픈사전의 자질, 한국전자통신연구원(ETRI)의 개체명 사전을 이용한 자질 및 한국어 형태소 분석, 음절 단위의 bigram을 클래스별 의미 있는 자질로 선택하고 LDA를 이용하여 예측된 확률분포를 활용하여 분류한 결과, 연령 72%, 성별 75%, 지역 43%의 납득할만한 예측 정확도 결과를 얻게 되었다.
PDF

비형식적인 문서에 강건한 문장 경계 인식 (Robust Method for Sentence Boundary Identification in informal documents)

김주희;서정연
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
- /
- pp.266-270
- /
- 2010
본 논문에서는 구두점이나 띄어쓰기가 없는 비형식적인 문서에서도 문장의 경계를 잘 인식할 수 있는 문장 경계 인식기를 제안한다. 기존의 문장인식기는 문장경계의 후보를 구두점 출현 위치만으로 하였는데 이는 잡음이 많은 웹문서를 처리하는데 한계가 있다. 반면에 제안한 방법은 문장 경계의 후보를 구두점의 출연 위치로 제한하지 않고 문장 경계 인식을 위한 자질로 구두점에 비 의존적인 음절 n-gram을 사용함으로써, 구두점이 잘 표현된 문서뿐만 아니라 구두점의 생략이 빈번한 웹문서의 문장 경계 인식까지 효과적으로 수행할 수 있다. 통계기반의 기계학습 기법으로 CRFs를 이용하여 하였고, 학습과 실험에 세종계획 말뭉치를 사용하였다. 제안한 문장 경계 인식기는 세종계획 말뭉치에서 99.99%의 정확률과 100.00%의 재현율을 보였고, 세종계획 말뭉치에서 문장 경계의 구두점을 제거한 경우에도 96.20%의 정확률과 87.51%의 재현율을 보여 구두점이 없는 경우에도 문장 경계 인식이 잘이루어짐을 확인할 수 있었다.
PDF

강건한 음향모델을 위한 모델의 상태와 문맥환경에 관한 연구 (A Study on Context Environment and Model State for Robustness Acoustic Models)

최재영;오세진;황도삼
- 한국멀티미디어학회:학술대회논문집
- /
- 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
- /
- pp.366-369
- /
- 2003
본 연구에서는 강건한 문맥의존 음향모델을 작성하기 위한 기초적인 연구로서 문맥환경과 상태수의 변화에 따른 음향모델의 성능을 고찰하고자 한다. 음성은 시간함수로 표현되며 음절, 단어, 연속음성을 발성할때 자음과 모음에 따라 발성시간에 차이가 있으며 음성인식의 최소 인식단위로 널리 사용되는 음소의 앞과 뒤에 오는 문맥환경에 따라 인식성능에 많은 차이를 보이고 있다. 따라서 본 연구에서는 시간의 변화(상태수의 변화)와 상태분할 과정에서 문맥환경의 변화를 고려하여 다양한 형태의 문맥의존 음향모델을 작성하였다. 모델학습은 음소결정트리 기반 SSS 알고리즘(Phonetic Decision Tree-based Successive State Splitting： PDT-555)을 이용하였다 PDT-SSS 알고리즘은 미지의 문맥정보를 해결하기 위해 문맥방향과 시간방향으로 목표 상태수에 도달할 때까지 상태분할을 수행하여 모델을 작성하는 방법이다. 본 연구에서 강건한 문맥의존 음향모델을 학습하기 위한 방법의 유효성을 확인하기 위해 국어공학센터의 452 단어를 대상으로 음소와 단어인식 실험을 수행하였다. 실험결과, 음성의 시간변이에 따른 모델의 상태수와 각 음소의 문맥환경에 따라 인식성능의 변화를 고찰할 수 있었다. 따라서 본 연구는 향후 음성인식 시스템의 강건한 문맥의존 음향모델을 작성하는데 유효할 것으로 기대된다.
PDF

딥러닝 기법을 이용한 가짜뉴스 탐지 (Fake news detection using deep learning)

이동호;이정훈;김유리;김형준;박승면;양유준;신웅비
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2018년도 춘계학술발표대회
- /
- pp.384-387
- /
- 2018
SNS가 급속도로 확산되며 거짓 정보를 언론으로 위장한 형태인 가짜뉴스는 큰 사회적 문제가 되었다. 본 논문에서는 이를 해결하기 위해 한글 가짜뉴스 탐지를 위한 딥러닝 모델을 제시한다. 기존 연구들은 영어에 적합한 모델들을 제시하고 있으나, 한글은 같은 의미라도 더 짧은 문장으로 표현 가능해 딥러닝을 하기 위한 특징수가 부족하여 깊은 신경망을 운용하기 어렵다는 점과, 형태소 중의성으로 인한 의미 분석의 어려움으로 인해 기존 오델들을 적용하기에는 한계가 있다. 이를 해결하기 위해 얕은 CNN 모델과 음절 단위로 학습된 단어 임베딩 모델인 'Fasttext'를 활용하여 시스템을 구현하고, 이를 학습시켜 검증하였다.
https://doi.org/10.3745/PKIPS.y2018m05a.384 인용 PDF

K-Pop 노랫말의 운율구조 변화 현상 : 댄스음악을 중심으로 (Metrical Structure Change Phenomenon of K-Pop Songs : Focusing on Dance Music)

서근영
- 한국엔터테인먼트산업학회논문지
- /
- 제14권7호
- /
- pp.343-362
- /
- 2020
영어는 강세 박자 언어로서 강세 변화에 의한 발화의 재구조가 이루어지는 음운체계를 갖는다. 반면 한국어는 각각의 음절을 거의 똑같은 길이와 강도로 발음하는 음절 박자 언어로 일반적 발화 속에서 한국어와 영어는 분명하게 다른 운율체계를 갖는다. 그러나 K-Pop 음악 속에서 노랫말의 언어가 한국어와 영어, 두 가지 언어로 혼용되면서 K-Pop 음악 속에서의 한국어 노랫말은 영어처럼 강세변화에 의한 운율체계를 갖게 되었다. 이러한 한국어 노랫말의 운율구조 변화 현상을 신한류 지속화를 위해 앞으로도 지속될 수밖에 없는 필연적 현상으로 보는 것이 논자의 입장이다. 따라서 본 연구에서는 K-Pop 음악의 주요 장르이자 리듬표현에 중점을 두는 댄스음악을 한류 변화 양상에 따라 1998년, 2003년, 2009년으로 구분하고, 각 시기의 노랫말 운율구조를 비교·분석하였다. 또한 이를 바탕으로 현재의 K-Pop 운율구조 특징을 도출하여 한 음표당 하나의 음절씩 배당하여 작사하던 기존의 제한적 작사법에서 벗어난 K-Pop 한국어 작사법을 제안하였다. 이 연구가 K-Pop에서 한국어 노랫말로 작사할 때의 하나의 방법론으로 활용되기를 바라며, 더불어 한국어 노랫말 사용의 장려 방안이 되기를 기대해 본다.
https://doi.org/10.21184/jkeia.2017.10.11.7.343 인용

감정단어 발화 시 억양 패턴을 반영한 멜로디 특성 (Tonal Characteristics Based on Intonation Pattern of the Korean Emotion Words)

이수연;오재혁;정현주
- 인간행동과 음악연구
- /
- 제13권2호
- /
- pp.67-83
- /
- 2016
본 연구는 감정단어의 억양 패턴을 음향학적으로 분석하여 멜로디의 음높이 패턴으로 전환한 뒤 그 특성을 알아보았다. 이를 위해 만 19-23세 여성 30명을 대상으로 기쁨, 화남, 슬픔을 표현하는 4음절 감정단어의 음성자료를 수집하였다. 총 180개의 어휘를 수집하고 Praat 프로그램을 이용하여 음절 당 평균 주파수(f0)를 측정한 후 평균 음정과 음높이 패턴의 멜로디 요소로 전환하였다. 연구 결과, 첫째, 감정단어의 음높이 패턴은 '즐거워서' A3-A3-G3-G3, '즐거워요' G4-G4-F4-F4, '행복해서' C4-D4-B3-A3, '행복해요' D4-D4-A3-G3, '억울해서' G3-A3-G3-G3, '억울해요' G3-G3-G3-A3, F3-G3-E3-D3, '불안해서' A3-A3-G3-A3, '불안해요' A3-G3-F3-F3, '침울해서' C4-C4-A3-G3, '침울해요' A3-A3-F3-F3으로 나타났다. 둘째, 음 진행에서는 기쁨이 넓은 간격의 도약 진행, 화남이 좁은 간격의 도약 진행, 슬픔이 넓은 간격의 순차 진행 특성을 보였다. 본 연구에서는 감정의 속성과 본질, 한국어의 음성 특성을 고려하여 감정단어의 억양 패턴을 분석하고, 이를 멜로디 요소에 반영한 특성을 제시하였다. 또한, 체계적이고 객관화된 방법으로 말과 멜로디의 전환 가능성 및 적합성을 확인한 것에 의의가 있다. 본 연구의 결과는 감정을 효과적으로 표현할 수 있는 멜로디 창작 방안을 마련하기 위한 근거 자료로 활용될 수 있다.
https://doi.org/10.21187/jmhb.2016.13.2.67 인용 PDF

말소리가 제한된 아동을 위한 말리듬을 이용한 난타 프로그램의 개발과 효과 (Development and effects of Nanta program using speech rhythm for children with limited speech sound production)

박영혜;최성희
- 말소리와 음성과학
- /
- 제13권2호
- /
- pp.67-76
- /
- 2021
난타는 북과 같은 타악기를 이용한 "두드리기"라는 뜻으로 한국 전통 음악인 사물놀이의 리듬이다. 말소리 산출이 제한된 아이들을 위해 난타 프로그램이 개발되어 적용되었다. 또한, 이 연구는 언어 리듬을 이용한 난타 프로그램의 효과에 대한 증거를 제공한다. 난타 음성 리듬 중재 프로그램은 말리듬을 이용하여 개발되었다. 난타 프로그램은 청각 자극, 다양한 소리와 박자, 리듬을 제공했으며, 리듬과 함께 호흡, 발성, 조음의 세 단계로 구성되어 있다. 말소리 목록이 제한된 6명의 아이들이 이 연구에 참여했다. 아동들에게 소리와 박자를 탐색하고 소리와 박자를 자유롭게 표현하도록 하였다. 또한, 리듬과 함께 단어를 모방하고 모방하는 단어에서 음절의 길이를 늘림으로써 다양한 말소리를 산출하도록 격려하였다. 매 회당 40분 동안 주 2회씩 총 15회의 세션이 실시되었다. 중재 효과를 조사하기 위해 치료 전후 취학전 아동의 수용언어 및 표현언어 발달척도(PRES)와 수용-표현 어휘력 검사(REVT) 점수를 비교하였다. Wilcoxon rank test 결과, 중재 후 PRES에서 수용언어 점수(p=.027)와 표현언어 점수(p=.024) 및 수용어휘력(p=.028)과 표현어휘력 (p=.028) 점수가 유의하게 향상되었음을 보여주었다. 난타 리듬 컨트롤 프로그램은 수용적이고 표현적인 어휘와 언어 발달에 상당한 긍정적인 영향을 미쳤다. 이러한 발견들은 리듬 컨트롤 프로그램이 제한된 음성 소리 생성을 가진 어린이들의 언어 발달과 어휘 향상에 유용할 수 있다는 것을 암시한다.
https://doi.org/10.13064/KSSS.2021.13.2.067 인용 PDF KSCI

SMS 메시지에 따른 모바일 3D 아바타의 입술 모양과 음성 동기화 (Lip and Voice Synchronization with SMS Messages for Mobile 3D Avatar)

윤재홍;송용규;김은석;허기택
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
- /
- pp.682-686
- /
- 2006
모바일 3D 엔진을 탑재한 단말기의 등장과 모바일 콘텐츠 시장의 성장에 따라 3D 모바일 콘텐츠 서비스에 대한 관심이 고조되고 있다. 모바일 3D 아바타는 개인화된 모바일 기기 사용자의 개성을 표출할 수 있는 가장 효과적인 상품이다. 그러나 3D 아바타 표현 방법은 PC기반의 가상환경에서 캐릭터의 얼굴 표정 및 입술 모양 변화에 따른 자연스럽고 사실적인 표현에 대한 연구들이 주로 이루어 졌다. 본 논문에서는 모바일 환경에서 수신된 SMS 메시지를 3D 모바일 아바타에 적용하여 입술 모양 및 음성과 동기화 시키는 방법을 제안한다. 제안된 방법은 수신된 메시지 문장을 음절단위로 분해하여 모바일 3D 아바타의 입술 모양과 해당 음성을 동기화 시킴으로써, 모바일 아바타의 자연스럽고 효과적인 SMS 메시지 읽기 서비스를 구현할 수 있도록 해준다.
PDF

검색결과 69건 처리시간 0.028초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)