• 제목/요약/키워드: 방언 분류

검색결과 5건 처리시간 0.018초

Performance Comparison of Korean Dialect Classification Models Based on Acoustic Features

  • Kim, Young Kook;Kim, Myung Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.37-43
    • /
    • 2021
  • 말소리의 음향 특징을 이용하여 화자에 대한 중요한 사회, 언어학적 정보를 얻을 수 있는데 그 중 한 가지 핵심 특징은 방언이다. 화자의 방언 사용은 컴퓨터와의 상호작용을 방해하는 주요 요소이다. 방언은 발화의 음소, 음절, 단어, 문장 및 구와 같이 다양한 수준에서 구분할 수 있지만 이를 하나하나 식별하여 방언을 구분하기는 어렵다. 이에 본 논문에서는 음성 데이터의 특성 중 MFCC만 사용하는 경량화된 한국어 방언 분류 모델을 제안한다. 한국인 대화 음성 데이터를 통해 MFCC 특징을 활용하는 최적의 방법을 연구하고, 8가지 머신 러닝 및 딥러닝 분류 모델에서 경기/서울, 강원, 충청, 전라, 경상 5개의 한국어 방언 분류 성능을 비교한다. MFCC를 정규화하는 방법으로 대부분의 분류 모델에서 성능을 향상시켰으며, MFCC를 정규화하기 전 분류 모델의 최고 성능과 비교하여 정확도는 1.07%, F1-score는 2.04% 향상된 성능을 기록하였다.

발화 속도와 휴지 구간 길이를 사용한 방언 분류 (Dialect classification based on the speed and the pause of speech utterances)

  • 나종환;이보원
    • 말소리와 음성과학
    • /
    • 제15권2호
    • /
    • pp.43-51
    • /
    • 2023
  • 본 논문에서는 음성의 발화 속도와 휴지 구간의 길이 그리고 화자의 연령과 성별에 기반한 방언 분류 접근 방법을 제안한다. 방언 분류는 음성 분석을 위한 중요한 기술 중 하나이다. 예를 들어 정확한 방언 분류 모델은 화자 인식 또는 음성 인식의 성능을 향상시킬 수 있는 잠재력을 가질 수 있다. 선행 연구에 따르면, Mel-Frequency Cepstral Coefficients(MFCC) 특징을 사용한 딥러닝 기반의 연구가 주류를 이루었다. 우리는 지역 간의 음향적 차이에 주목하여 그 차이를 바탕으로 추출한 특징을 사용하여 방언 분류를 진행하였다. 본 논문에서는 음성의 발화 속도, 휴지 구간의 길이 특성을 추출하여 사용하며 이와 함께 화자의 연령과 성별과 같은 메타데이터를 추가로 사용하는 새로운 접근 방법을 제안한다. 실험 결과 제안된 접근 방법이 더 높은 정확도를 보이는 것을 확인하였으며 특히 음성의 발화 속도 특성을 사용하는 것이 기존 MFCC만을 사용하는 방법보다 향상된 성능을 보여준다는 것을 확인할 수 있었다. MFCC 특성만을 사용한 방법과 비교했을 때 본 논문에서 제안한 특성들을 모두 사용하였을 때의 정확도는 91.02%에서 97.02%로 향상되었다.

독어방언분류와 <고지독어 음운추이>의 발생시기 (Dialektengrenzen in Deutschland und das Alter der hochdeutschen Lautverschiebung)

  • 송완용
    • 한국독어학회지:독어학
    • /
    • 제7집
    • /
    • pp.61-83
    • /
    • 2003
  • Die wichtigsten Theorien tiber das Alter der hochdeutschen Lautverschiebung (LV) sind die beiden folgenden: 1. ein sehr hohes Alter(wohl noch var Chr. abgeschlossen), 2. ein relativ junges Alter(im Allgemeinen das 6.-10. Jh. n. Chr.). Die beiden Datierungen weichen um uber ein halbes Jahrtausend voneinander ab. Diese Abweichungen gehen auf unterschiedliche Methoden der Altersbestimmung zuruck: entweder datiert man nur anhand schriftlichen Zeugnisse oder aufgrund von etwas spekulativ ethnologischen Erwagungen. Die letztere lasst zwar ein hohes Alter der LV zu, gibt aber es keine sicheren Belege dafur. Deshalb kann nur sprachliches Material eine sichere Basis fur die Datierung der LV sein. Das gilt immer noch, wenn auch die Schreibung i. d. R. Veranderungen in der gesprochenen Sprache nicht rechtzeitig widerspiegelt. Die altesten Belege fur die wichtigsten Dialekte sind die folgenden: Die alemannische Runeninschrift von Stetten (ca. 680, wahl der fruheste Beleg uberhaupt fur die hd. LV), Handschrift des langobardischen Edictus Rathari $({\cal}um 700)$, das bairische Salzburger Verbrtiderungsbuch(784), die mittelfrankischen Glossen des Echtemacher Evangeliars $({\cal}um 700)$.

  • PDF

1930년대 교토대학의 한반도 채집과 지명 정리: G. Koidzumi, J. Ohwi, S. Kitamura (A gazetteer of three Japanese plant taxonomists (G. Koidzumi, J. Ohwi, and S. Kitamura) of Kyoto University in Korea during 1930s)

  • 장계선;박수경;김휘;장진성
    • 식물분류학회지
    • /
    • 제43권4호
    • /
    • pp.319-331
    • /
    • 2013
  • Koidzumi Gen'ichi(1883-1953), Ohwi Jisaburo(1905-1977), Kitamura Siro(1906-2002) 등이 1930년에서 1935년에 걸쳐 약 5년간 실시한 한반도 식물 채집에서 얻어진 식물표본레이블에 기록된 내용을 바탕으로 당시의 채집행적을 정리하였다. 일본 교토대학(京都大學, Kyoto University; KYO)에 소장된 표본은 전체 2,000 점으로 다양하지만, 대부분은 채집자와 간략한 채집지명이 한자, 일본어 혹은 지역 방언으로 기록되어 있다. 교토대학였던 Koidzumi(小泉)는 주로 1932년, 1933년, 1935년의 방학동안인 7-8월에 한반도 남부의 제주도와 경상북도, 전라북도 지역과 북부의 금강산, 함경북도, 평안북도, 황해도 등에서 식물 채집을 하였다. Ohwi(大井)는 1930년과 1932년 3달 동안 주로 기존 채집자들이 시도하지 않은 지역인 함경북도의 경성군, 부령군, 회령군, 무산군과 함경남도 장진군, 신흥군과 함께 금강산에서 채집하고, 1935년에는 지리산, 제주도 등 한반도 남부지역에서 주로 채집하였다. Kitamura(北村)는 1930년과 1932년, 1935년에 한반도 채집을 실시하였으며 제주도와 금강산, 함경남도의 원산 및 개마고원 일대의 채집 기록이 남아 있다.

국내 온라인 유통 복어 제품의 종판별 및 표시사항 모니터링 연구 (Species Identification and Monitoring of Labeling Compliance for Commercial Pufferfish Products Sold in Korean On-line Markets)

  • 이지영;김건희;강태선
    • 한국식품위생안전성학회지
    • /
    • 제38권6호
    • /
    • pp.464-475
    • /
    • 2023
  • 본 연구에서는 온라인 마켓에서 판매되는 50개 복어제품의 종판별 및 표시사항 일치여부 모니터링을 수행했다. 복어의 종판별을 위해 cytochrome c oxidase subunit I 및 cytochrome b 유전자의 염기서열을 분석하여 NCBI GenBank 데이터베이스에 등록되어있는 생물종의 염기서열과 비교 후 계통 분석을 수행했다. 참복, 흰점참복, 까치복, 복섬, 검복, 국매리복, 흑밀복 총 7종이 동정되었으며, 35개 제품(70%)에서 표시사항과의 불일치를 나타냈다. 12개의 제품(24%)에서는 식품공전에서 제시한 식용 가능한 복어 21종의 국명 대신 일반명(복어)을 사용하였다. 가공 정도별 불일치율은 다중가공 제품(n=9, 81.8%)이 단순가공 제품(n=26, 66.7%)보다 높은 비율을 보였으며, 원산지별 불일치율의 경우 중국산 제품(n=8, 80%)이 국산 제품(n=26, 66.7%)보다 높은 비율을 보였다. 시장명, 방언 등의 이름이 혼용되어 다수의 복어종을 밀복, 졸복으로 표시하였다. 이러한 분류체계의 어려움으로 인해 흰점참복, 국매리복과 같은 식용불가 복어가 식용 가능한 복어인 졸복으로 혼용되어 판매되는 것이 확인되었다. 따라서 식용 가능한 복어를 정확히 분류할 수 있는 방법의 개발이 필요하며, 수입 및 국내 유통 복어 제품의 주기적인 모니터링이 필요하다.