• 제목/요약/키워드: consonants

검색결과 455건 처리시간 0.021초

한국어 음소 최소대립쌍의 계량언어학적 연구: 초성 자음을 중심으로 (A quantitative study on the minimal pair of Korean phonemes: Focused on syllable-initial consonants)

  • 정지은
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.29-40
    • /
    • 2019
  • 이 연구의 목적은 한국어 음소의 최소대립쌍 출현 양상에 대해 계량언어학적으로 알아보는 것이다. 최소대립쌍은 한 언어에서 음소의 체계를 세우는 데 중요한 역할을 하고, 기능부담량의 측정에도 중요한 척도가 됨에도 불구하고 아직까지 한국어 음소의 최소대립쌍에 대한 전면적인 연구가 이루어지지 않았다. 이를 위해 "우리말샘"의 표제어 325,715개의 발음을 대상으로 초성 위치에서의 자음 최소대립쌍의 개수를 절대수치와 상대수치로 산출하고, 최소대립쌍을 이루는 두 단어의 품사 관계에 대해서 분석했다. "우리말샘"을 연구의 대상으로 삼은 이유는 최소대립쌍 분석은 기본적으로 사전을 통해서 이루어져야 한다고 판단했고, 한국어 사전 중 규모가 가장 크기 때문이다. 연구 결과는 다음과 같다. 첫째, 최소대립쌍은 총 153가지, 337,135개였다. 개수가 많은 음소 쌍(/ㅅ-ㅈ/, /ㄱ-ㅅ/, /ㄱ-ㅈ/, /ㄱ-ㅂ/, /ㄱ-ㅎ/)은 평음의 비중이 높고, 개수가 적은 음소 쌍(/ㅃ-ㅋ/, /ㄹ-ㅃ/, /ㅉ-ㅋ/, /ㄸ-ㅋ/, /ㅆ-ㅋ/)은 경음의 비중이 높았다. 최소대립쌍 형성에 많은 역할을 담당하는 음소를 개별 음소 단위에서 살펴보면 /ㄱ, ㅅ, ㅈ, ㅂ, ㅊ/ 순으로 높게 나타났는데, 경구개음의 비율이 높게 나타난 것이 특징적이었다. 삼지적 상관속을 이루는 장애음의 최소 대립쌍 관계에도 조음 위치와 조음 방법에 따라 차이가 나타났다. 최소대립쌍의 절대수치와 상대수치의 상관계수는 0.937로 높은 상관관계를 보였다. 둘째, 최소대립쌍을 이루는 두 단어의 품사는 '명사-명사'의 최소대립쌍이 70.25%로 가장 많았고, 그다음으로 '동사-동사' 쌍이 14.77%로 나타나 이 두 유형이 전체 85% 이상을 차지했다. 초성 최소대립쌍의 품사 일치율은 87.91%로 나타나 최소대립쌍은 의미 형태적으로도 비슷한 범주로 묶일 수 있음을 확인할 수 있었다. 이 연구의 결과는 한국어 음소와 관련된 기초 자료로서 국어학, 언어 병리학, 언어 교육, 언어 습득, 음성 공학 등의 다양한 응용 분야에서 유용하게 활용될 수 있을 것이다.

아랍식-말레이문자(Jawi Script) 키보드(Keyboard)에 관한 연구 (A Study on the Keyboard of Jawi Script (Arabic-Malay Script))

  • 강경석
    • 수완나부미
    • /
    • 제3권1호
    • /
    • pp.47-66
    • /
    • 2011
  • Malay society is rooted on the Islamic concept. That Islam influenced every corner of that Malay society which had ever been an edge of the civilizations of the Indus and Ganges. Once the letters of that Hindu religion namely Sanscrit was adopted to this Malay society for the purpose of getting the Malay language, that is, Bahasa Melayu down to the practical literation but in vain. The Sanscrit was too complicated for Malay society to imitate and put it into practice in everyday life because it was totally different type of letters which has many of the similar allographs for a sound. In the end Malay society gave it up and just used the Malay language without using any letters for herself. After a few centuries Islam entered this Malay society with taking Arabic letters. It was not merely influencing Malay cultures, but to the religious life according to wide spread of that Islam. Finally Arabic letters was to the very means that Malay language was written by. It means that Arabic letters had been used for Arabic language in former times, but it became a similar form of letters for a new language which was named as Malay language. This Arabic letters for Arabic language has no problems whereas Arabic letters for Malay language has some of it. Naturally speaking, arabic letters was not designed for any other language but just for Arabic language itself. On account of this, there occurred a few problems in writing Malay consonants, just like p, ng, g, c, ny and v. These 6 letters could never be written down in Arabic letters. Those 6 ones were never known before in trying to pronounce by Arab people. Therefore, Malay society had only to modify a few new forms of letters for these 6 letters which had frequently been found in their own Malay sounds. As a result, pa was derived from fa, nga was derived from ain, ga was derived from kaf, ca was derived from jim, nya was derived from tha or ba, and va was derived from wau itself. Where must these 6 newly modified letters be put on this Arabic keyboard? This is the very core of this working paper. As a matter of course, these 6 letters were put on the place where 6 Arabic signs which were scarecely written in Malay language. Those 6 are found when they are used only in the 'shift-key-using-letters.' These newly designed 6 letters were put instead of the original places of fatha, kasra, damma, sukun, tanween and so on. The main differences between the 2 set of 6 letters are this: 6 in Arabic orginal keyboard are only signs for Arabic letters, on the other hand 6 Malay's are real letters. In others words, 6 newly modified Malay letters were substituted for unused 6 Arabic signs in Malay keyboard. This type of newly designed Malay Jawi Script keyboard is still used in Malaysia, Brunei and some other Malay countries. But this sort of keyboard also needs to go forward to find out another way of keyboard system which is in accordance with the alphabetically ordered keyboard system. It means that alif is going to be typed for A key, and zai shall be typed when Z key is pressed. This keyboard system is called 'Malay Jawi-English Rumi matching keyboard system', even though this system should probably be inconvenient for Malay Jawi experts who are good at Arabic 'alif-ba-ta'order.

  • PDF

모음 유형과 표준문단의 문장 위치가 음성장애 환자의 청지각적 및 켑스트럼 및 스펙트럼 분석에 미치는 효과 (Effects of vowel types and sentence positions in standard passage on auditory and cepstral and spectral measures in patients with voice disorders)

  • 최미현;최성희
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.81-90
    • /
    • 2023
  • 청지각적 평가 및 음향학적 분석은 음성평가를 위해 임상 현장에서 일반적으로 사용해오고 있다. 본 연구는 음성장애 환자의 청지각적 및 음향학적 측정 시 말 과제 효과를 조사하고자 한다. 음성장애로 진단받은 총 22명의 환자로부터 모음연장발성(/a/, /e/, /i/, /o/, /u/, /ɯ/, /ʌ/)과 연속구어('가을'표준문단의 9개 하위문장)를 녹음하였다. 음성장애 평가 및 치료 경험이 있는 2명의 음성언어치료사가 맹검 및 무작위 음성 샘플을 사용하여 GRBAS('G', 'R', 'B', 'A', 'S')척도 및 CAPE-V('OS', 'R', 'B', 'S', 'P', 'L')를 사용하여 청지각적 평가를 실시하였다. 또한, ADSV(analysis of dysphonia in speech and voice model)를 이용하여 켑스트럼 및 스펙트럼 측정치를 구하였다. 모음 유형에 따라 GRBAS 척도에서 'B'를 제외하고 청지각적 평가에 영향을 미치지 않았으나, CAPE-V에서는 'OS', 'R', 'B'에 영향을 미쳤다(p<.05). CPP 및 L/H ratio 는 모음 유형과 문장 위치의 영향을 받았다. 표준문단의 CPP값은 모든 모음에서 'G', 하위 9문장과 유의미한 부적 상관 관계가 나타났고, 특히, /e/모음(r=-.739)에서 가장 높은 상관관계를 보였다. 두 번째 문장의 CPP는 모든 모음과 높은 상관관계를 보였다. CAPE-V는 말 자극에 따라 GRBAS보다 청지각적 평가에 더 많은 영향을 받을 수 있으며, 'B' 척도, CPP, L/H ratio는 모음 유형과 자음을 포함한 문장 위치에 따라 영향을 받았다. 따라서, 음성 장애 환자의 음성 평가에서 모음을 사용할 때는 /a/뿐만 아니라 ' 기식성'음질과 음향적으로 상관성이 높은 /i/모음을 함께 사용하는 것이 유용할 수 있다. 또한 /e/모음은 한국 표준문단 '가을' 및 하위 문장들과 음향적으로 상관성이 높았으므로 문단 대신 사용할 수 있을 것이다. 또한, 음성장애 신호들이 대부분 비주기적이라는 점을 감안할 때, CPP와 함께 표준문단 중 가장 음향적으로 상관성이 높은 두 번째 문장을 사용할 수 있을 것이다. 이러한 결과는 말과제가 청지각적 평가 및 음향학적 측정에 미치는 영향에 대한 임상적 증거를 제공하며, 이는 음성장애 환자의 음성 평가에 대한 가이드라인을 제공하는 데 도움을 줄 수 있을 것이다.

홍천강에 서식하는 멸종위기종 새미 Ladislavia taczanowskii의 난발생 및 자치어 형태발달 (Development of Eggs, Larvae and Juveniles of the Ladislavia taczanowskii from Hongcheongang-River)

  • 박재민;조성장;한경호
    • 한국어류학회지
    • /
    • 제36권2호
    • /
    • pp.109-119
    • /
    • 2024
  • 이 연구는 멸종위기어류 새미의 난발생 및 자치어 형태발달을 관찰하여 초기생활사를 규명하고 종보존 연구의 기초자료로 활용하고자 실시하였다. 연구에 사용된 어미는 강원특별자치도 홍천군 홍천강 일원에서 확보하였다. 연구실에서 사육 중이던 어미는 2021년 5월 성숙한 개체를 선별하여 호르몬 주사로 산란유도를 하였다. 성숙란은 원형의 침성점착란으로 난 크기는 1.50~1.79 (평균 1.59±0.08, n=30) mm였다. 부화 시간은 수온 16.5℃ 168시간, 25.5℃에서 109시간 30분이 소요되었다. 부화 직후 자어는 전장 5.55~6.31 (6.30±6.93, n=30) mm로 입과 항문이 열리지 않았고 난황을 가지고 있었다. 부화 후 5일째 전기자어는 전장 9.91~10.8 (10.1±0.27, n=30) mm로 입과 항문이 열렸고, 먹이 섭취 활동이 시작되었다. 부화 후 8일째 중기자어는 전장 10.3~11.4 (10.8±0.38) mm로 꼬리지느러미 끝의 척추말단 부분이 위쪽으로 휘어지기 시작하였다. 부화 후 10일째 후 기자어는 전장 11.8~13.1 (12.3±0.43) mm로 꼬리 끝의 척추말단 부분이 45°로 완전히 휘어졌다. 부화 후 18일째 치어는 전장 18.9~23.4 (20.4±1.69) mm로 각 부위별 지느러미 기조 수는 등지느러미 10개, 뒷지느러미 9개, 꼬리지느러미 22개, 배지느러미 7개로 정수에 달하였다. 연구 결과 후기자어는 꼬리 끝 하미축골 위쪽과 등지느러미의 반점 모양, 머리에 발달한 세로 줄무늬, 몸 전체 불규칙적으로 침착된 흑색소포가 다른 모래무지아과 어류들과 형태적 차이를 보였다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.