• 제목/요약/키워드: 초성

검색결과 153건 처리시간 0.03초

한국어 자모단위 음성인식 결과 후보정을 위한 신경망 기반 자모 병합 방법론 (Enhancing Korean Alphabet Unit Speech Recognition with Neural Network-Based Alphabet Merging Methodology)

  • 임솔이;이원준;이근배;김윤수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.659-663
    • /
    • 2023
  • 이 논문은 한국어 음성인식 성능을 개선하고자 기존 음성인식 과정을 자모단위 음성인식 모델과 신경망 기반 자모 병합 모델 총 두 단계로 구성하였다. 한국어는 조합어 특성상 음성 인식에 필요한 음절 단위가 약 2900자에 이른다. 이는 학습 데이터셋에 자주 등장하지 않는 음절에 대해서 음성인식 성능을 저하시키고, 학습 비용을 높이는 단점이 있다. 이를 개선하고자 음절 단위의 인식이 아닌 51가지 자모 단위(ㄱ-ㅎ, ㅏ-ㅞ)의 음성인식을 수행한 후 자모 단위 인식 결과를 음절단위의 한글로 병합하는 과정을 수행할 수 있다[1]. 자모단위 인식결과는 초성, 중성, 종성을 고려하면 규칙 기반의 병합이 가능하다. 하지만 음성인식 결과에 잘못인식된 자모가 포함되어 있다면 최종 병합 결과에 오류를 생성하고 만다. 이를 해결하고자 신경망 기반의 자모 병합 모델을 제시한다. 자모 병합 모델은 분리되어 있는 자모단위의 입력을 완성된 한글 문장으로 변환하는 작업을 수행하고, 이 과정에서 음성인식 결과로 잘못인식된 자모에 대해서도 올바른 한글 문장으로 변환하는 오류 수정이 가능하다. 본 연구는 한국어 음성인식 말뭉치 KsponSpeech를 활용하여 실험을 진행하였고, 음성인식 모델로 Wav2Vec2.0 모델을 활용하였다. 기존 규칙 기반의 자모 병합 방법에 비해 제시하는 자모 병합 모델이 상대적 음절단위오류율(Character Error Rate, CER) 17.2% 와 단어단위오류율(Word Error Rate, WER) 13.1% 향상을 확인할 수 있었다.

  • PDF

한국어 초, 중, 종성 혼돈 단음절 최소대립쌍 (CVC)에 대한 정상 성인의 지각경계 연구 (Speech Perception Boundaries of Korean Confusing Monosyllabic Minimal Pairs (CVC) in Normal Adults)

  • 이성민;임덕환
    • 한국음향학회지
    • /
    • 제29권5호
    • /
    • pp.325-331
    • /
    • 2010
  • 청각 범주지각 (categorical perception)은 언어적 자극과 관련되어 나타나는 특징적 현상이다. 본 연구에서는 임상적으로 혼돈되기 쉬운 한국어 초성, 중성, 종성 최소대랍쌍의 지각경계에 관한 분석을 하였다. 이를 위해서 단음절어 최소대립쌍(consonant-vowel-consonant, CVC)인 /곰-공/, /논-눈/, /돈-논/을 물리적 에너지 관점에서 11가지 단계 (index)로 구분하여 변환하였다. 그리고, 정상 성인 (40명)을 대상으로 하여 지각경계 패턴, 지각경계 기울기, 지각경계 폭, 비우위 지수(non-dominant factor) 분포를 분석하였다. 이 결과에서 대립쌍들은 범주지각 과정에서 대립쌍 상호간에서 상대적인 차이가 있음을 보여 주었다. 본 자료에서는 중성 최소대립쌍의 경우가 범주지각이 가장 낮게 나타났으며, 이러한 분석 과정이 청각기능 평가 등에 응용 가능성이 있음을 확인할 수 있었다.

한국어 성조 이벤트와 음향적 길이 (Correlation between tonal events and their acoustic duration)

  • 이숙향
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.383-386
    • /
    • 1998
  • 한국어의 운율구조는 발화문장(utterance), 억양구(intonational phrase), 악센트구(accentual phrase), 음운적 어절(phonological word), 음절(syllable) 순의 계층적 구조를 가지고 있다. 본 연구에서는 운율구조의 각 층에서 성조 이벤트가 얹혀지는 음절이나 또는 각 층의 운율단위말의 음절의 음향적 길이를 측정함으로써 첫째, 운율단위말의 음절의 음향적 길이 또한 계층적 순위를 보이는지 둘째, 성조 이벤트(tonal event)와 음향적 길이 사이에 높은 상관관계를 보이는지 보고자 한다. 즉, 두 가지 측면에서 길이비교가 수행되었는데 하나는 언어 보편적 현상으로 알려진 구말 장음화 현상으로써 각 층 운율적 단위의 마지막 음절의 모음 길이 비교이며 다른 하나는 억양구초 고성조가 실현되는 음절의 모음과 어절 내 모음, 그리고 고성조가 실현되는 억양구말 음절의 모음간의 길이 비교이다. 남녀 각각 200문장의 각 분절음과 운율분석을 한 후 길이에 대한 일원분산분석 실시 결과 억양구말은 악센트구말 보다 길었으나 악센트구말은 어절말과 차이를 보이지 않거나 남자 화자의 경우 오히려 짧게 나타났다. 그리고 남자화자의 경우 악센트구초 고성자가 얹혀지는 음절의 길이는 어절 내 어절말 음절을 제외한 그 외 음절과 화자에 따라 큰 차이를 보이지 않거나 그보다 조금 짧게 실현되는 것으로 나타났다. 위의 결과는 첫째, 단위말 음절 모음의 장음화는 운율적 구조의 층위에 일대일 대응을 보이지 않는 것으로 해석되며 둘째, 성조 이벤트와 그것이 실현되는 분절음의 음향적 길이와는 큰 상관관계를 보이지 않는 것으로 해석될 수 있겠다. 그러나 이러한 일반화에 대한 충분한 근거 제공을 위해서는 해당음절의 모음 길이 뿐만 아니라 초성자음의 길이간의 비교와 음절자체의 길이 비교 또한 필요한 것이며 모음길이에 대한 선행자음의 분절음적 영향 고려가 수반되어야 할 것으로 보인다. 다음 내용을 정리해 보고자 한다.리해 보고자 한다.rc$ 구입할 때 중점적으로 살펴보는 사항은 신선도와 순수재래종 여부, 위생상태였다. 한편 소비자가 언제나 구입할 수 없다는 의견이 85.2%나 되어 원활한 공급과 시장조성이 아직 정착되지 않고 있었다. $\bigcirc$ 현재 유통되고 있는 재래종닭은 소비자 대부분이 잡종으로 인식하고 있었으며, 재래종과 일반육계와의 구별은 깃털색, 피부색, 정강이색등 외관상으로 구별하고 있었다. 체중에 대한 반응은 너무 작다는 의견이었고, 식품으로의 인식도는 비교적 고급식품으로 인식하고 있다. $\bigcirc$ 재래종닭고기의 브랜드화에 대한 견해는 젊고 소득이 높은 계층에서 브랜드화의 필요성을 강조하고 있다. $\bigcirc$ 재래종달걀의 소비형태는 대부분의 소비자가 좋아하였으나 아직 먹어보지 못한 응답자가 많았다. 재래종달걀의 맛에 대해서는 고소하고 독특하여 차별성을 느끼고 있었다. $\bigcirc$ 재래종달걀의 구입장소는 계란판매점(축협.농협), 슈퍼, 백화점, 재래닭 사육 농장등 다양하였으며 포장단위는 10개를 가장 선호하였고, 포장재료는 종이, 플라스틱, 짚의 순으로 좋아하였다. $\bigcirc$ 달걀의 가격은 200원정도를 적정하다고 하였으며, 크기는 (평균 52g)는 가장 적당하다고 인식하고 있으며, 난각색은 대부분의 응답자가 갈색을 선호하였다. $\bigcirc$ 재래종달걀의 구입시 애로사항은 믿을수 없고, 구입장소를 몰라서, 값이 싸다 등이었고, 앞으로 신뢰할 수 있고 위생적인 생산 및 유통체계가 확립될 경우 더 많이 소비하겠다는 의견이었다. $\bigcirc$ 재래닭 판매업소(식당)의 판매형태는 66.7%인 대부분의 업소가 잡종과 개량종 유색닭을 판매하고 있었으며, 1개 업소에서 1일 판

  • PDF

회선 신경망을 활용한 자모 단위 한국형 감성 분석 모델 개발 및 검증 (Development and Validation of the Letter-unit based Korean Sentimental Analysis Model Using Convolution Neural Network)

  • 성원경;안재영;이중정
    • 한국전자거래학회지
    • /
    • 제25권1호
    • /
    • pp.13-33
    • /
    • 2020
  • 본 연구는 자모 단위의 임베딩과 회선 신경망을 활용한 한국어 감성 분석 알고리즘을 제안한다. 감성 분석은 텍스트에서 나타난 사람의 태도, 의견, 성향과 같은 주관적인 데이터 분석을 위한 자연어 처리 기술이다. 최근 한국어 감성 분석을 위한 연구는 꾸준히 증가하고 있지만, 범용 감성 사전을 사용하지 못하고 각 분야에서 자체적인 감성 사전을 구축하여 사용하고 있다. 이와 같은 현상의 문제는 한국어 특성에 맞지 않게 형태소 분석을 수행한다는 것이다. 따라서 본 연구에서는 감성 분석 절차 중 형태소 분석을 배제하고 초성, 중성, 종성을 기반으로 음절 벡터를 생성하여 감성 분석을 하는 모델을 개발하였다. 그 결과 단어 학습 문제와 미등록 단어의 문제점을 최소화할 수 있었고 모델의 정확도는 88% 나타내었다. 해당 모델은 입력 데이터의 비 정형성에 대한 영향을 적게 받으며, 텍스트의 맥락에 따른 극성 분류가 가능하게 되었다. 한국어 특성을 고려하여 개발된 본 모델이 한국어 감성 분석을 수행하고자 하는 비전문가에게 보다 쉽게 이용될 수 있기를 기대한다.

오프라인 필기체 한글 자소 인식에 있어서 특징성능의 비교 (Comparison of Feature Performance in Off-line Hanwritten Korean Alphabet Recognition)

  • 고태석;김종렬;정규식
    • 인지과학
    • /
    • 제7권1호
    • /
    • pp.57-74
    • /
    • 1996
  • 본 논문에서는 근래의 필기체 한글인식에서 상요되고 있는 특징들의 인식 성능을 비교한다.본 연구는 인식률 뿐만 아니라 인식시스템의 효율성을 향상시키기 위한 특징 선택의 기반을 마련함에 그 목적이 있다.특징성능 비교를 위해 그 특징들의 특성들을 분석하였고,그 특성에 따라 특징들을 전역적 특징(영상변환,통계적 특징,지역/위상적 특징의 3가지 종류로 분류하였다.각 종류별로 한글 자소 특징을 나타내는데 적합한 특징들을 4-5가지씩 선정하였고,인식실험을 한글의 초성자음,횡모음,종모음별로 수행하였다. 실험에 사용된 인식기로는 오류역전파 알고리즘으로 학습된 은닉층이 하나인 다층 퍼셉트론이 사용되었다.실험에 사용된 학습 및 시험용 데이타는 PE92중 30벌이다.실험결과를 보면,1)지역/위상적 특징들이 다른 종류의 특징들보다 인식 성능이 우수하였으며,2) 통계적 특징 중에서는 망 특징과 투영특징이,전역적인 특징들 중에서는 왈쉬특징과 DCT특징이,지역/위상적 특징에서는 윤곽선 위상변화 특징과 오목성 특징이 각각 성능이 우수하였다.

  • PDF

일본인이 지각하는 한국어 자음의 구조 (The Structure of Korean Consonants as Perceived by the Japanese)

  • 배문정;김정오
    • 인지과학
    • /
    • 제19권2호
    • /
    • pp.163-175
    • /
    • 2008
  • 한국에 거주하는 일본인 12명을 대상으로 한국어 초성 자음에 대한 지각적 혼동을 조사하여 그들이 한국어 자음을 지각할 때 사용하는 심리적 차원과 특질들을 추출하였다. 개음절들은 비소음(no noise) 조건과 소음 조건에서 제시되고 참여자들은 그 정체를 파악하였다. 실험 결과로 자음들 간의 혼동 행렬(confusion matrix)을 구성하였고 이 행렬 자료로 가산 군집 분석, 개별차이 척도법 및 정보 전달율을 계산했다. 가산 군집 분석 결과, 비소음 조건에서 일본인들은 '다 타'를 가장 유사한 소리로 지각했으며, '가 카', '자 차 짜', '타 따', '파 빠', '사 싸' 순으로 지각적 군집을 형성하였다. 소음 조건에서는 '가 다 바', '마 바', '차 카 타 파' 등 10개의 군집이 추출되었는데, 이 군집들은 같은 청취 조건에서 '싸 짜', '다 자', '파 하' 등 발성 유형(공명, 이완, 기식, 긴장)이 같고 조음 방법이 다른 음소들을 유사한 소리로 지각한 한국인의 군집들과 큰 차이를 보였다. 개별차이 척도법을 적용한 결과, 소음 조건에서 공명음을 포함한 이완음과 나머지 음소를 구분하는 차원(이완성 차원), 기식성의 정도와 관련된 차원(기식성 차원) 및 조음 위치(설정음과 주변음)와 관련된 차원(설정성 차원)을 찾았다. 한국인이 보인 기식성과 긴장성 차원은 이원적인 값을 갖고 있었으나 일본인이 보인 차원은 연속적인 값을 가지는 것으로 드러났다. 정보 전달율을 분석한 결과, 일본인은 한국인에 비해 기식성과 긴장성의 후두 자질은 잘 지각하지 못하지만 순음성과 설정성의 조음 위치 자질은 더 잘 지각하였다. 본 연구의 결과들은 각 언어의 음소 범주를 구성하는 기저 표상의 구조적 차이로 다루는 접근의 중요성을 시사한다.

  • PDF

벼 최소경운 건답직파재배를 이용한 잡초성벼 방제 (Control of Weedy Rice Using Minimum Tillage Direct Seeding of Rice on Dry Paddy)

  • 성기영;이정태;박태선;조현숙;서명철;김미향;강항원
    • Weed & Turfgrass Science
    • /
    • 제2권3호
    • /
    • pp.322-326
    • /
    • 2013
  • 본 연구는 벼 최소경운 건답직파재배기술을 이용하여 논잡초성벼 방제를 시도하기 위하여 2011년에 수행되었다. 벼 최소경운 건답직파재배는 1자형 로타리날을 이용하여 무경운 상태의 논에서 조파 27 cm간격으로 폭 4 cm의 파종골을 내어 파종하는 벼 건답직파재배 기술이다. 이 재배기술은 파종 작업시 경운을 최소화하기 때문에 잡초성벼 방제가 가능하다. 2012년의 경우 4월 28일 잡초성벼가 발생을 시작하였고 5월 9일경 잡초성벼 발생 비율이 61.9% 이었다. 이때 파종을 하고 파종후 10일 제초제를 처리하면 89~96%, 파종후 15일에 처리하면 97~99%의 잡초성벼를 방제할 수 있었다. 하지만 해에 따라 잡초성벼 발생은 4월중 기온과 강수량에 영향을 받아 달라질 수 있다. 따라서 잡초성벼를 효과적으로 방제하면서 안정적인 쌀 수량을 확보하기 위해서는 4월 15~20일경 관개하여 잡초성벼 발생을 유도하여 적정파종시기가 당겨지는 방법이 좋을 것으로 판단되었다.

돼지 7번 염색체에서 육색 연관 QTL 확인 (Identification of Quantitative Trait Loci(QTL) for Meat Color Trait on Chromosome 7 in Pig)

  • 최봉환;이혜영;김태헌;홍기창;정일정
    • Journal of Animal Science and Technology
    • /
    • 제46권4호
    • /
    • pp.525-536
    • /
    • 2004
  • 본 연구는 돼지의 염색체 7번에 존재하는 주요 경제형질에 관여하는 양적형질 유전자좌위(Quantitative trait loci; QTL)를 밝히기 위해 초성위체 표지인자를 이용하여 유전자지도(연관지도) 작성을 수행하였다. 기준집단의 조성은 이형접합성이 높은 기준집단을 조성하기 위하여 유전적 특성이 현격히 다른 우리나라의 재래돼지와 Landrace를 전형매 교배하여 생산된 $F_2$ 183두를 사용하였으며 기준집단에 대해 도축 24시간 후의 pH, 육색, 육즙손실량, 전단력, 가열감량, 조지방, 조회분, 수분, 조단백질 등 육질형질을 조사 및 분석하였다. 염색체 7번의 연관지도는 총 23개의 표지인자로 작성되었으며 암수평균 연관지도 길이는 154.6 cM 이었으며 수컷과 암컷의 연관지도 길이는 각각 169.2 cM과 141.4 cM로 수컷의 연관지도 길이가 암컷의 것보다 27.8 cM 더 길었다. 표지인자간의 최소간격은 SW175와 S0066 표지인자사이로 1.6 cM이었고, 최대간격은 SW2002와 SWR773표지인자사이로서 15.9 cM이었으며 평균간격은 7.02 cM이었다. 본 연구에서는 9개의 육질관련 형질 중 육색과 연관된 2개의 QTL이 확인되었는데 적색도(CIE-a)와 연관된 QTL은 45 cM 영역에서 1% 수준의 통계적 유의성을 나타내었고(Fig. 2), 이 영역에서 불과 3${\sim}$4 cM 떨어진 위치에서 황색도(CIE-b)와 연관된 QTL이 확인되었다. 향후에 본 연구에서 탐색된 QTL 영역에 대하여 고밀도의 유전자 지도 작성을 통하여 특정 형질과 연관된 부분을 계속해서 추적해 나간다면 육색형질을 조절하는 주유전자의 클로닝 및 특성 구명이 가능할 것으로 사료되며 궁극적으로는 돼지의 개량에 효율적으로 활용할 수 있는 표지인자(MAS)의 개발 등도 가능 할 것으로 사료된다.

안동심성암체의 역누대 초성변화와 그 성인 (Reversely Zoned Compositional Variations and their Origins of the Andong Pluton, Andong Batholith, Korea)

  • 황상구;이보현
    • 자원환경지질
    • /
    • 제35권1호
    • /
    • pp.75-95
    • /
    • 2002
  • 안동심성암체는 3개 암상으로 구분되는 동원성 마그마로부터 유래되었다. 이 암체는 전체적으로 중앙부에 각섬석 흑운모 토날라이트가 노출되고 이의 연변부에 흑운모 화강섬록암이 놓이며, 상단부(복동부)에 반상 흑운모 화강암이 놓인다. 결과적으로 이들은 토날라이트를 중심으로 하는 동심원상 분포를 하며, 중앙부에 고온 광물군의 고철질 암석이 우세하고 연변부와 상단부로 갓수록 보다 저온 광물군의 규장질 암석이 우세한 역누대를 나타낸다. 이 암체의 모드 및 화학 자료는 중앙부에서 연변부, 상단부 순으로 역누대 조성변화를 보여준다. 이 조성변화는 인접하는 암상간에서 매우 점이적으로 변화한다. 각섬석과 흑운모 등의 고철질 광물은 중앙부의 토날라이트에서 가장 풍부하고 연변부로 갈면서 감소하고 상단부로 갈수록 더욱 감소한다. 석영과 K-장석 등의 규장질 광물은 이와 반대로 변화한다. 화학적으로도 고철질 광물을 지배하는 원소들은 중앙부에서 최고치이고 이로부터 연변부와 상단부로 갈수록 점차 감소되는 양상을 보이며, 반면에 규장질 광물을 주로 지배하는 원소들은 이와 반대 양상을 나타낸다. 이 역누대 심성암체는 열중력확산작용과 분별결정작용에 의해 수정된 마그마챔버의 상부 규장질 부분 속으로 하부의 더 고철질 부분이 재이동(소생)된 결과이다. 진화의 초기 단계에 , 이 마그마챔비는 하부에 토날라이트질, 중부에 화강섬록암질, 상부에 화강암질 마그마를 갖는 화학적 조성누대를 이룬 암석화학계이었다. 후기 단계에 챔버 기저에서 더 고철질 마그마의 유입에 의해 하부의 토날라이트질 조성대가 상부의 규장질 조성대 속으로 재이동을 야기시켰다.

해부학적 위치에 따른 혀의 촉각식별능의 차이와 심상유두 개수의 관계 (The Relationship of Two-Point Discrimination Threshold and the Number of Fungiform Papilla According to Anatomical Location of Tongue)

  • 김균요;허윤경;최재갑
    • Journal of Oral Medicine and Pain
    • /
    • 제33권4호
    • /
    • pp.295-303
    • /
    • 2008
  • 목적: 혀의 해부학적 위치에 따른 촉각식별능의 차이를 조사하고 이것과 심상유두의 개수 사이에 관련성이 있는지의 여부를 확인하기 위해서 본 연구를 시행하였다. 방법: 현재 복용 중인 약물이 없고, 과거 장기간 약물을 복용한 경험이 없었으며, 전신질환이 없는 건강한 남녀 13명(평균 연령 $30{\pm}3$세)을 대상으로 혀의 수초성 $A{\delta}$ 섬유와 무수초성 C 섬유와 관련한 촉각식별능을 알아보기 위해서 Castroviezo $caliper^{(R)}$를 이용한 두점식별검사를 실시하였다. 심상유두의 개수는 methylene blue로 혀를 염색해서 심상유두를 확인하여 개수를 세었다. 결과: 1. 혀의 전방부와 후측방부위의 심상유두개수를 세어 본 결과, 남자는 전방과 후측방이 각각$51.69{\pm}14.15$개, $12.92{\pm}6.13$개였으며, 여자는 $58.85{\pm}13.56$개, $16.23{\pm}6.38$개였다. 남녀 모두 후측방에 비해 전방부에서 유두의 개수가 3배 이상 많은 것을 관찰할 수가 있다. 2. 두 점으로 식별해내는 최소한의 거리는 전방에서 평균 $1.91{\pm}0.74mm$였으며, 성별에 따라 나눠 다시 분류했을 때, 남자의 인식 역치가 높은 것으로 관찰되었으나, 성별에 따른 통계적 유의성은 나타나지 않았다. 3. 두점식별거리를 기준으로 네 개의 그룹으로 나누었을 때, 거리가 증가할수록 심상유두의 개수가 감소하는 경향을 보였다. 그러나, 두점인지역치와 심상유두의 개수 간에 통계적 유의성은 없었다.