• 제목/요약/키워드: Dialect Classification

검색결과 9건 처리시간 0.017초

발화 속도와 휴지 구간 길이를 사용한 방언 분류 (Dialect classification based on the speed and the pause of speech utterances)

  • 나종환;이보원
    • 말소리와 음성과학
    • /
    • 제15권2호
    • /
    • pp.43-51
    • /
    • 2023
  • 본 논문에서는 음성의 발화 속도와 휴지 구간의 길이 그리고 화자의 연령과 성별에 기반한 방언 분류 접근 방법을 제안한다. 방언 분류는 음성 분석을 위한 중요한 기술 중 하나이다. 예를 들어 정확한 방언 분류 모델은 화자 인식 또는 음성 인식의 성능을 향상시킬 수 있는 잠재력을 가질 수 있다. 선행 연구에 따르면, Mel-Frequency Cepstral Coefficients(MFCC) 특징을 사용한 딥러닝 기반의 연구가 주류를 이루었다. 우리는 지역 간의 음향적 차이에 주목하여 그 차이를 바탕으로 추출한 특징을 사용하여 방언 분류를 진행하였다. 본 논문에서는 음성의 발화 속도, 휴지 구간의 길이 특성을 추출하여 사용하며 이와 함께 화자의 연령과 성별과 같은 메타데이터를 추가로 사용하는 새로운 접근 방법을 제안한다. 실험 결과 제안된 접근 방법이 더 높은 정확도를 보이는 것을 확인하였으며 특히 음성의 발화 속도 특성을 사용하는 것이 기존 MFCC만을 사용하는 방법보다 향상된 성능을 보여준다는 것을 확인할 수 있었다. MFCC 특성만을 사용한 방법과 비교했을 때 본 논문에서 제안한 특성들을 모두 사용하였을 때의 정확도는 91.02%에서 97.02%로 향상되었다.

Performance Comparison of Korean Dialect Classification Models Based on Acoustic Features

  • Kim, Young Kook;Kim, Myung Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.37-43
    • /
    • 2021
  • 말소리의 음향 특징을 이용하여 화자에 대한 중요한 사회, 언어학적 정보를 얻을 수 있는데 그 중 한 가지 핵심 특징은 방언이다. 화자의 방언 사용은 컴퓨터와의 상호작용을 방해하는 주요 요소이다. 방언은 발화의 음소, 음절, 단어, 문장 및 구와 같이 다양한 수준에서 구분할 수 있지만 이를 하나하나 식별하여 방언을 구분하기는 어렵다. 이에 본 논문에서는 음성 데이터의 특성 중 MFCC만 사용하는 경량화된 한국어 방언 분류 모델을 제안한다. 한국인 대화 음성 데이터를 통해 MFCC 특징을 활용하는 최적의 방법을 연구하고, 8가지 머신 러닝 및 딥러닝 분류 모델에서 경기/서울, 강원, 충청, 전라, 경상 5개의 한국어 방언 분류 성능을 비교한다. MFCC를 정규화하는 방법으로 대부분의 분류 모델에서 성능을 향상시켰으며, MFCC를 정규화하기 전 분류 모델의 최고 성능과 비교하여 정확도는 1.07%, F1-score는 2.04% 향상된 성능을 기록하였다.

Emotion Recognition in Arabic Speech from Saudi Dialect Corpus Using Machine Learning and Deep Learning Algorithms

  • Hanaa Alamri;Hanan S. Alshanbari
    • International Journal of Computer Science & Network Security
    • /
    • 제23권8호
    • /
    • pp.9-16
    • /
    • 2023
  • Speech can actively elicit feelings and attitudes by using words. It is important for researchers to identify the emotional content contained in speech signals as well as the sort of emotion that resulted from the speech that was made. In this study, we studied the emotion recognition system using a database in Arabic, especially in the Saudi dialect, the database is from a YouTube channel called Telfaz11, The four emotions that were examined were anger, happiness, sadness, and neutral. In our experiments, we extracted features from audio signals, such as Mel Frequency Cepstral Coefficient (MFCC) and Zero-Crossing Rate (ZCR), then we classified emotions using many classification algorithms such as machine learning algorithms (Support Vector Machine (SVM) and K-Nearest Neighbor (KNN)) and deep learning algorithms such as (Convolution Neural Network (CNN) and Long Short-Term Memory (LSTM)). Our Experiments showed that the MFCC feature extraction method and CNN model obtained the best accuracy result with 95%, proving the effectiveness of this classification system in recognizing Arabic spoken emotions.

Identifying Mobile Owner based on Authorship Attribution using WhatsApp Conversation

  • Almezaini, Badr Mohammd;Khan, Muhammad Asif
    • International Journal of Computer Science & Network Security
    • /
    • 제21권7호
    • /
    • pp.317-323
    • /
    • 2021
  • Social media is increasingly becoming a part of our daily life for communicating each other. There are various tools and applications for communication and therefore, identity theft is a common issue among users of such application. A new style of identity theft occurs when cybercriminals break into WhatsApp account, pretend as real friends and demand money or blackmail emotionally. In order to prevent from such issues, data mining can be used for text classification (TC) in analysis authorship attribution (AA) to recognize original sender of the message. Arabic is one of the most spoken languages around the world with different variants. In this research, we built a machine learning model for mining and analyzing the Arabic messages to identify the author of the messages in Saudi dialect. Many points would be addressed regarding authorship attribution mining and analysis: collect Arabic messages in the Saudi dialect, filtration of the messages' tokens. The classification would use a cross-validation technique and different machine-learning algorithms (Naïve Baye, Support Vector Machine). Results of average accuracy for Naïve Baye and Support Vector Machine have been presented and suggestions for future work have been presented.

성조 분석과 음조 기술에서 청각음성학의 일차성;반자동 음조 청취 등급 분석기 개발과 관련하여 (On the primacy of auditory phonetics In tonological analysis and pitch description;In connection with the development of a new pitch scale)

  • 김차균
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.3-23
    • /
    • 2007
  • King Sejong the Great, his students in Jip-hyeun-jeon school and Choe Sejin, their successor of the sixteenth century, indicated Middle Korean had three distinctive pitches, low, high, and rising (phyeong-, geo-, sang-sheong). Thanks to $Hun-min-jeng-{\emptyset}eum$ as well as its Annotation and side-dots literatures in fifteenth and sixteenth centuries, we can compare Middle Korean with Hamgyeong dialect, Gyeongsang dialect, and extant tone dialects with joint preservers of what was probably the tonal system of unitary mother Korean language. What is most remarkable about middle Korean phonetic work is its manifest superiority in conception and execution as anything produced in the present day linguistic scholarship. But at this stage in linguistics, prior to the technology and equipment needed for the scientific analysis of sound waves, auditory description was the only possible frame for an accurate and systematic classification. And auditory phonetics still remains fundamental in pitch description, even though modern acoustic categories may supplement and supersede auditory ones in tonological analysis. Auditory phonetics, however, has serious shortcoming that its theory and practice are too subject to be developed into the present century science. With joint researchers, I am developping a new pitch scale. It is a semiautomatic auditory grade pitch analysis program. The result of our labor will give a significant breakthrough to upgrade our component in linguistics.

  • PDF

F0 Perturbation as a Perceptual Cue to Stop Distinction in Busan and Seoul Dialects of Korean

  • Kang, Kyoung-Ho
    • 말소리와 음성과학
    • /
    • 제5권4호
    • /
    • pp.137-143
    • /
    • 2013
  • Recent investigation of acoustic correlates of Korean stop manner contrasts has reported a diachronic transition in Korean stops: young Seoul speakers are relatively more dependent on the F0 characteristics of the stops than on the VOT characteristics in aspirated and lenis stop distinction. This finding has been examined against tonal dialects of Korean and the results suggested that the speakers of tonal dialects are not sharing the transition. These results also suggested that F0 function for segmental stop classification interferes with the function for lexical tone classification in their tonal speech. The current study investigated these findings in terms of perception. Perceptual behavior of Seoul and Busan speakers of Korean was examined in a comparative manner through the measurement of perceptual cue weight of F0 and VOT in particular. The results from regression and correlation analyses revealed that Busan speakers are closer to older Seoul speakers than to younger Seoul speakers in that the cue weight for VOT and F0 were comparable in the aspirated-lenis stop distinction. This result was in contrast to the perceptual behavior of younger Seoul speakers who showed clear dominance of F0 over VOT for the same distinction. These findings provided perceptual evidence of the dual function of F0 for segmental and lexical distinctions in tonal dialects of Korean.

영남지역 내 하위지역 구분 (Classification of Subregions in Yeongnam Region)

  • 손명원
    • 한국지역지리학회지
    • /
    • 제22권1호
    • /
    • pp.25-35
    • /
    • 2016
  • 본 연구는 영남지역 내 하위지역들을 구분하고 그 핵심부를 파악함으로써, 영남지역에 내재된 문화적 특성을 밝히는 기반을 제공하고자 하였다. 지역의 인문환경 요소인 행정구역과 방언, 그리고 자연환경 요소인 하천유역과 기후 분포를 중첩하고, 계수관과 유사한 환경요소를 갖는 범위를 하위지역으로 설정하였다. 요소들의 조합이 동일하게 나타나는 구획은 1개의 시 군으로 이루어진 것에서부터 6개의 시 군으로 이루어진 것에 이르기까지 모두 27개의 구획으로 구분되었다. 이들은 안동, 상주, 경주, 대구, 김해, 진주 증 6개의 하위지역으로 구분되었다. 각 하위지역은 유통에 장애가 되는 산줄기나 하천을 경계로 하며, 장애가 뚜렷하지 않은 경우에는 점이지대가 나타났다. 안동하위지역은 봉화와 예천, 영주, 의성, 군위, 영양, 청송, 영덕, 울진 등으로 이루어져 있으며, 상주하위지역은 상주와 구미, 김천, 문경을 포함한다. 경주하위지역은 경주와 영천, 포항 등을 포함하고, 대구하위지역은 대구와 칠곡, 고령, 성주, 경산, 청도 등으로 이루어져 있다. 김해하위지역은 김해와 양산, 부산, 울산, 창녕, 밀양 등을 포함하며, 진주하위지역은 진주와 합천, 의령, 사천, 고성, 통영, 남해, 함안, 거창, 함양, 산청, 하동, 창원, 거제 등으로 이루어져 있다.

  • PDF

제주도산 송이의 공학적 특성에 관한 연구 (A Study on the Engineering Characteristic of scoria in Jeju-Do)

  • 천병식;김동훈;김영훈;이동엽
    • 한국지반공학회:학술대회논문집
    • /
    • 한국지반공학회 2008년도 추계 학술발표회
    • /
    • pp.1630-1637
    • /
    • 2008
  • Jeju-do is a island formed by the volcanic activity and has more than 360 volcanic cones distributed widely along the long axis of the elliptically shaped island. The volcanic cones consist mainly of scoria, so called "Song-I" in the local dialect. In this study the chemical and soil mechanical properties of scoria being very different from those of the inland were investigated with the various tests. In the sieve-passing test the particle size of scoria had more than 10 of uniformity coefficient and gradation coefficient of 1 ~ 3, showing relatively homogenous distribution. Based on the uniformity classification, scoria was assorted into GW. In the large scale direct shear tested for measuring the mechanical strength of scoria the internal friction angle of red scoria was $37^{\circ}$ and that of black scoria was $36^{\circ}$. This indicated that there was no difference in the mechanical strength between two types of scoria. On the other hand, red and black scoria had $1.24{\times}10^{-3}$ to $3.55{\times}10^{-2}$ cm/sec of k values for the static water level permeability, thus being classified into a coarse or fine sand as compared with that representing the saturated soil. They also had 1.411 to $1.477\;g/cm^3$ of notably low $r_{dmax}$ values for the compaction test as compared with common soil, which was considered to be due to their low specific gravity and high porosity. In conclusion, the soil mechanic properties of scoria obtained from this study are thought to be very helpful for reducing lots of trial and error happening in the civil engineering construction.

  • PDF

국내 온라인 유통 복어 제품의 종판별 및 표시사항 모니터링 연구 (Species Identification and Monitoring of Labeling Compliance for Commercial Pufferfish Products Sold in Korean On-line Markets)

  • 이지영;김건희;강태선
    • 한국식품위생안전성학회지
    • /
    • 제38권6호
    • /
    • pp.464-475
    • /
    • 2023
  • 본 연구에서는 온라인 마켓에서 판매되는 50개 복어제품의 종판별 및 표시사항 일치여부 모니터링을 수행했다. 복어의 종판별을 위해 cytochrome c oxidase subunit I 및 cytochrome b 유전자의 염기서열을 분석하여 NCBI GenBank 데이터베이스에 등록되어있는 생물종의 염기서열과 비교 후 계통 분석을 수행했다. 참복, 흰점참복, 까치복, 복섬, 검복, 국매리복, 흑밀복 총 7종이 동정되었으며, 35개 제품(70%)에서 표시사항과의 불일치를 나타냈다. 12개의 제품(24%)에서는 식품공전에서 제시한 식용 가능한 복어 21종의 국명 대신 일반명(복어)을 사용하였다. 가공 정도별 불일치율은 다중가공 제품(n=9, 81.8%)이 단순가공 제품(n=26, 66.7%)보다 높은 비율을 보였으며, 원산지별 불일치율의 경우 중국산 제품(n=8, 80%)이 국산 제품(n=26, 66.7%)보다 높은 비율을 보였다. 시장명, 방언 등의 이름이 혼용되어 다수의 복어종을 밀복, 졸복으로 표시하였다. 이러한 분류체계의 어려움으로 인해 흰점참복, 국매리복과 같은 식용불가 복어가 식용 가능한 복어인 졸복으로 혼용되어 판매되는 것이 확인되었다. 따라서 식용 가능한 복어를 정확히 분류할 수 있는 방법의 개발이 필요하며, 수입 및 국내 유통 복어 제품의 주기적인 모니터링이 필요하다.