• 제목/요약/키워드: 모음구간

검색결과 50건 처리시간 0.036초

소구치 발거를 통한 교정치료가 한국어 자음의 발음에 미치는 영향 (THE EFFECT OF ORTHODONTIC TREATMENT BY PREMOLAR EXTRACTION ON THE PRONUNCIATION OF THE KOREAN CONSONATS)

  • 이정희;윤영주;김광연
    • 대한치과교정학회지
    • /
    • 제27권1호
    • /
    • pp.91-103
    • /
    • 1997
  • 교정치료가 발음에 어떠한 영향을 미치는가에 대해 연구하기 위해 구강용적의 감소를 초래하는 4개의 소구치를 발거하고 교정치료를 끝낸 환자와 대조군을 대상으로 한국어 자음에 대하여 자음의 지속시간과 파형의 형태를 비교 분석한 결과 다음과 같은 결론을 얻었다. 1. 자음의 지속시간에 있어서 CV형의 "ㅅ"과 "ㅌ"을 제외한 모든 어음에서 치료군의 자음 지속시간이 길었고, 특히 CV형에서의 "ㅈ"과"ㅆ"르리고 VCV형에서 "ㄷ"에서는 현저한 자음지속시간의 차이를 보였다. 2. VCV형에 있어서 두드러진 차이를 보이는 것은 "ㅉ"과 "ㅆ", "ㅊ"이였는데 "ㅉ"에 있어서는 파형의 형태가 치료군에서 더 강하고 특히 후속모음으로 이행구간에는 더 두드러졌으며, "ㅆ"에서는 선행모음에서 자음으로 이행시 치료군에서는 자음의 성분이 뚜렷하게 연속해서 나타나나, 대조군에서는 자음의 시작점이 불분명하고, 자음의 지속시간 또한 치료군에서 더 길었으며, 파형 자체의 영교차점도 치료군에서 더 빈번하였다. "ㅊ"에 있어서는 파형의 형태에 있어 유기음의 성분은 치료군에서 더 두드러졌으며, 파형의 형태 또한 강하게 나타났다. 3. 파형의 형태 비교에서는 CV형에서 "ㄷ", "ㅈ"의 발음시 치료군에서는 "ㅌ", "ㅈ" 같은 유기음에서 볼수 있는 기류의 흐름이 나타났다. 4. 유기음의 "ㅌ"와 "ㅊ"에서는 대조군보다 치료군에서 기류의 흐름이 많았으며 파형의 형태 또한 강하게 나타났다.

  • PDF

神經網을 利用한 韓國語 數字音 認識에 관한 硏究 (A Study on the Spoken KOrean-Digit Recognition Using the Neural Netwok)

  • 박현화;강해동;배건ㅅ성
    • 한국음향학회지
    • /
    • 제11권3호
    • /
    • pp.5-13
    • /
    • 1992
  • 한국어 숫자음이 단음절인 특성을 이용하여 각 숫자음에 대해 시간정합을 필요로 하지 않으면서 일정한 수를 갖는 특징벡터를 추출하여 다층구조 신경망으로 인식실험을 하였다. 음성신호의 시작점/끝점과 더불어 모음의 최대 피크점을 기준으로 해석구간을 초성, 중성, 종성의 세 부분으로 나누었으며, 음성신호의 특징벡터로는 반사계수, 켑스트럼, ${\Delta}$켑스트럼, ${\Delta}$에너지 등을 이용하여, 각 특징벡터 및 입력층과 은닉층의 노드 수에 따른 인식율 및 학습속도 등을 비교하였다. 신경망의 입력층의 특징벡터로서 반사계수를 사용한 경우보다 켑스트럼을 사용했을 때가 더 좋은 인식율을 보였다. ${\Delta}$켑스트럼의 특성이 전체 인식율에 미치는 영향이 그다지 크지 않았는데, 이는 한국어 숫자음이 단음절로 구성되어 있는 특징을 이용해 분석 구간을 stationary한 특성을 갖는 세 부분으로 구분하였기 때문이라 생각된다. 각 숫자음에 대해 150개의 켑스트럼을 사용한 경우에 97.8%의 인식율을 얻었다.

  • PDF

비폐색 부위에 따른 비강자음의 음향학적 특성과 비음비율의 변화

  • 손영익;정유석;윤영선;이은경
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1997년도 제8회 학술대회 심포지움
    • /
    • pp.253-253
    • /
    • 1997
  • 비폐색이 있는 경우 음성이 변하는 것을 쉽게 느낄 수 있지만, 비폐색 때의 음향학적인 특성에 대하여 알려진 바를 찾기는 쉽지 않다. 저자들은 인위적으로 비폐색을 유발하여 비폐색 부위에 따른 비강자음의 음향학적 변화특성을 파악하고 비음도의 변화 정도를 비교하고자 하였다. 정상비음도를 보이는 성인남녀 각 10명을 대상으로, 2ml의 부피를 갖도록 수술용장갑에 Merocel$^{\circledR}$을 넣은 뒤, 이를 이용하여 ostiomeatal unit(OMU)을 중심으로 전후상하 4부위의 인위적인 비폐색을 유발하여, 비폐색 전과 후의 부위에 빠른 차이틀 비교하였다. /나나/의 발성을 각 조건에서 3회 실시하여, 모음중간의 /ㄴ/중 (CVCV) 안정된 spectorgram소견을 보이는 부위를 선택하여, 해당구간의 제1, 제2, 제3 음형대와 각각의 bandwidth 평균값을 남녀별로 비교하였고, 표준비음비율이 알려진 rabbit, baby, mama 문장을 이용하여 비음비율을 비교하였다. 남녀모두 비폐색전에 비하여 OMU의 앞쪽부위를 막은 경우에 제1음형대가 가장 뚜렷하게 감소되었으며, 비음비율의 유의한 감소를 보였다. 비폐색이 있는 경우, 비강자음 /ㄴ/은 제1음형대를 중심으로 주요변화가 일어남을 알 수 있었으며, 비폐색 부위에 따라 비음비율이나 제1음형대 감소의 정도가 다름을 알 수 있었다.

  • PDF

주파수 분할 및 최소 자승법을 이용한 TSIUVC 근사합성법에 관한 연구 (A Study on TSIUVC Approximate-Synthesis Method using Least Mean Square and Frequency Division)

  • 이시우
    • 한국멀티미디어학회논문지
    • /
    • 제6권3호
    • /
    • pp.462-468
    • /
    • 2003
  • 유성음원과 무성음원을 사용하는 음성부호화 방식에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 음질저하 현상이 나타난다. 본 연구에서는 같은 프레임안에 유성음과 무성자음이 존재하지 않도록 FIR-STREAK 필터 와 zerocrossing rate을 이용한 개별피치 펄스를 사용하여 연속음성에서 무성자음을 포함한 천이구간(TSIUVC)을 탐색, 추출하는 방법을 제안한다. 또한 본 논문에서는 최송 자승법과 주파수 대역 분할을 이용한 TSIUVC 근사합성법을 제안하였다. 실험 결과, 0.547KHz 이하 2.813KHz 이상의 주파수 정보를 사용하여 TSIUVC 음성파형을 양호하게 근사합성할 수 있었으며, 최대 오차신호가 일그러짐이 적은 TSIUVC 근사합성 파형에 중요한 역할을 한다는 것을 알 수 있었다. 이 방법은 음성합성, 음성분석, 새로운 Voiced/Silence/TSIUVC의 음성부호화 방식에 활용할 수 있을 것으로 기대된다.

  • PDF

화자 정규화를 위한 비정형 워핑함수 도출에 관한 실험 (Experiments on Extraction of Non-Parametric Warping Functions for Speaker Normalization)

  • 신옥근
    • 한국음향학회지
    • /
    • 제24권5호
    • /
    • pp.255-261
    • /
    • 2005
  • 화자들 사이의 워핑특성을 알아보기 위해 비정형 워핑함수를 도출하는 실험을 수행하였다. 이를 위해 모음의 MFCC와 LP 스펙트럼을 이용하여 화자별, 음소별 대표 스펙트럼을 선정한 다음 음소별 기준 스펙트럼을 선택하였다. 기준 스펙트럼과 대표 스펙트럼을 스펙트럼의 전체대역에서 DTW로 비교하여 화자별 워핑함수를 구한 다음, 이들을 clustering함으로써 비정형 워핑함수의 집합을 도출하였다. 이 함수집합에서 남성화자와 여성화자의 함수들이 각각 구간선형함수와 파워함수와 유사함을 관찰할 수 있었으며, 이를 근거로 이 함수들을 조합한 하이브리드 워핑함수집합을 정의하였다. 음소단위의 인식 실험을 통하여 새로 정의된 함수들의 인식률을 시험하였으며 두 함수집합 모두에서 개선된 인식률을 얻을 수 있었다.

8kbps에 있어서 ACFBD-MPC에 관한 연구 (A Study on ACFBD-MPC in 8kbps)

  • 이시우
    • 한국산학기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.49-53
    • /
    • 2016
  • 최근 무선네트워크의 효율을 높이기 위하여 신호압축 방식의 사용이 증가되고 있다. 특히, MPC 시스템은 비트율을 줄이기 위하여 피치추출 방법과 유성음과 무성음의 음원을 사용하였다. 일반적으로, 유성음원과 무성음원을 사용하는 MPC 시스템에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 재생 음성파형에 일그러짐이 나타난다. 이것은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성파형이 정규화 되는 것이 원인으로 작용한다. 본 논문에서는 재생 음성파형의 일그러짐을 제어하기 위하여 피치구간 마다 멀티펄스의 진폭을 보정하고, 특정 주파수를 이용하는 ACFBD-MPC(Amplitude Compensation Frequency Band Division-Multi Pulse Coding)를 제안하였다. 실험은 남자와 여자음성에서 각각 16개의 문장을 사용하였으며, 음성신호는 10kHz 12bit로 A/D 변환하였다. 또한 8kbps의 부호화 조건에서 ACFBD-MPC 시스템을 구현하고, ACFBD-MPC의 SNR를 평가하였다. 그 결과 ACFBD-MPC의 남자 음성에서 14.2dB, 여자 음성에서 13.6dB 임을 확인할 수 있었으며, ACFBD-MPC가 기존의 MPC에 비하여 남자음성에서 1dB, 여자음성에서 0.9dB 개선되는 것을 알 수 있었다. 이 방법은 셀룰러폰이나 스마트폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

Low Bit Rate을 고려한 8kbps FBD-MPC 방식에 관한 연구 (A Study on 8kbps FBD-MPC Method Considering Low Bit Rate)

  • 이시우
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.271-276
    • /
    • 2014
  • 유성음원과 무성음원을 사용하는 음성부호화 방식에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 음질저하현상이 나타난다. 본 연구에서는 연속음성에서 무성자음을 포함한 천이구간을 탐색, 추출하고 주파수대역에서 근사합성하는 8kbps의 멀티펄스 음성부호화 방식(FBD-MPC)를 제안하였다. 기존의 8kbps MPC와 FBD-MPC의 SNRseg를 평가한 결과, FBD-MPC의 남자음성에서 0.5dB, 여자음성에서 0.2dB 개선된 것을 확인할 수 있었다. 결국, MPC에 비해 FBD-MPC의 SNRseg가 개선되어 음성파형의 일그러짐을 제어할 수 있었으며, 본 방법은 셀룰러폰이나 스마트폰과 같이 Low Bit Rate의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

클라우드 기반 HyGIS (HyGIS based on cloud computing)

  • 원영진;최윤석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.316-316
    • /
    • 2016
  • HyGIS는 DEM 기반의 수문지형처리를 중심으로 다양한 모형을 연계할 수 있도록 구성된 S/W 모음이다. 이는 한국건설기술연구원을 비롯한 다수의 기관 및 연구원들이 노력한 성과물이다. 본 연구는 기존 HyGIS 연구과정에서 도출된 성과물의 실용화 사업화를 위한 방안을 연구하였다. 이를 위하여 S/W 테스팅, 오픈소스 도입, 클라우드 컴퓨팅으로 나누어 접근하였다. 먼저 S/W의 테스팅에 있어서 기존 개발 소스코드는 블랙박스 테스트 방식의 동등 클래스 분할, 경계 값 분석 등 일부 모듈에 대한 단위 테스트와 제한적인 통합테스트가 수행된 바 있다. 보다 체계적인 테스트 단계로서 화이트박스 테스트 개념 중 문장/분기/조건 커버리지에 대하여 검토하였으며, 실제 소스코드 중 핵심 구간에 대한 적용 및 정량화를 통하여 현 수준을 객관적으로 진단하였고 보완 방안을 도출하였다. 오픈소스 적용을 위하여 QGIS, MapWindow 등 공간정보 분야의 최신 오픈소스 모듈을 비교 검토하였다. 적용 단계는 이를 기존 HyGIS S/W에 반영시키는 과정이며, S/W 관점에서는 컴포넌트 모듈의 대체라고 표현될 수 있다. 대규모의 전환 비용이 발생되므로 적용 후보에 대하여는 기능적 측면 뿐만 아니라 마이그레이션 비용과 중장기적인 유지보수 비용을 고려한 검토가 이루어 졌다. 한편 오픈소스 기술의 적용은 단순히 구성 요소 원가절감 측면만이 아닌, 중장기적 유지보수 체계 도모 및 지속가능한 생태계로의 전환에 더 큰 의의가 있다. 마지막으로 클라우드 컴퓨팅 기술의 적용 분야이다. HyGIS 입력 Data의 공급을 위한 인프라로서 자체 구축 인프라가 아닌 IaaS 클라우드인 Blob Storage 및 CDN을 시험 적용하였다. 클라우드를 활용함으로써 초기 비용을 최소화하고 합리적 비용으로 유연한 확장이 가능한(Scale Out, Scale Up) 구조를 취하게 되었다. 또한 입력 Data 공급 서버를 위한 Storage 측면만이 아니라 S/W의 배포에 있어서도 클라우드 컴퓨팅 기술을 활용하고자 시도하였다. 클라우드 기술을 활용하여 HyGIS S/W가 설치된 VM(Virtual Machine)자체를 임대하는 방식으로 시험 구성 되었다. VM에 대한 RDP 프로토콜 Access에 있어서 IP기반 접근 제어를 통하여 보안을 강화하는 방안을 실험하였으며, ISO 27001, ISO 27018 등 관련 보안 규정에 부합하는 서비스 제공이 가능하도록 검토하였다. 이러한 클라우드 VM방식 서비스를 통하여 Package형 S/W 뿐만 아니라 Subscription 방식의 서비스 제공 방식을 병행할 수 있다. 사용자에게는 S/W 설치 및 H/W Lock 구비 과정이 생략되는 이점이 있다.

  • PDF

동해 가스 하이드레이트 탄성파자료의 중합전 심도 구조보정 (Prestack Depth Migration for Gas Hydrate Seismic Data of the East Sea)

  • 장성형;서상용;고진석
    • 자원환경지질
    • /
    • 제39권6호
    • /
    • pp.711-717
    • /
    • 2006
  • 한국지질자원연구원은 1997년부터 새로운 에너지 자원으로 활용 가능성을 포함하고 있는 가스 하이드레이트를 조사하기 위해 동해 일원에서 탄성파탐사를 실시하고 있다. 탄성파 반사자료로부터 가스 하이드레이트 부존여부를 확인하는 방법은 해저면과 평행하면서 위상이 반대로 나타나는 고진폭 반사파 Bottom Simulating Reflector (BSR)과 BSR상부에서의 진폭감소, 하부에서 진폭증가와 구간속도 감소 둥을 들 수 있다. 대용량 탐사자료로 구성된 탄성파 반사자료에 깊이영역 구조보정을 적용하기 위해서는 고성능 컴퓨터와 병렬처리 기술이 필요하다. PSPI법은 적은 컴퓨터 계산량과 효율성 그리고 주파수 영역에서 구조적으로 병렬화가 용이한 특성을 지니고 있어 구조보정에 많이 이용되고 있다. 여기에서는 동해 가스 하이드레이트 탄성파 반사자료에 대한 일반자료처리와 함께 BSR로 여길 수 있는 구간에 대해 message passing interface_local area multicomputers(MPI_LAM)으로 병렬 코드화된 MPI PSPI를 이용하여 깊이영역 중합 전 구조보정에 적용하였다. 중합 전 깊이영역 구조보정 입력자료를 위한 속도모델은 자체 개발된 지오빗을 이용하여 중합 단면도로부터 지층경계면을 구하고 중합속도를 이용하여 제작하였다. BSR은 시간영역구조보정 된 중합 단면도상에서 음원모음도 3555-4162 사이와 왕복주시 2950 ms 부근에서 확인되지만 깊이영역 단면도에서는 해수면 6 km에서 17 km사이, 해저면에서 약 2.1km 깊이영역에서 나타남을 알 수 있다. 또한 구조보정 결과 반사파 에너지가 집중되는 지점에서 영상화가 잘 이루어지므로 관심대상 지역에 에너지를 많이 보낼 수 있는 자료취득변수를 결정해야 함을 알 수 있다.

음성특징의 거리에 기반한 한국어 발음의 시각화 (Visualization of Korean Speech Based on the Distance of Acoustic Features)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.197-205
    • /
    • 2020
  • 한국어는 자음과 모음과 같은 음소 단위의 발음은 고정되어 있고 표기에 대응하는 발음은 변하지 않기 때문에 외국인 학습자가 쉽게 접근할 수 있다. 그러나 단어와 어구, 문장을 말할 때는 음절과 음절의 경계에서 소리의 변동이 다양하고 복잡하며 표기와 발음이 일치하지 않기 때문에 외국어로서의 한국어 표준 발음 학습은 어려운 면이 있다. 그러나 영어 같은 다른 언어와 달리 한국어의 표기와 발음의 관계는 논리적인 원리에 따라 예외 없이 규칙화 할 수 있는 장점이 있으므로 발음오류에 대해 체계적인 분석이 가능한 것으로 여겨진다. 본 연구에서는 오류 발음과 표준 발음의 차이를 컴퓨터 화면상의 상대적 거리로 표현하여 시각화하는 모델을 제시한다. 기존 연구에서는 발음의 특징을 단지 컬러 또는 3차원 그래픽으로 표현하거나 입과 구강의 변화하는 형태를 애니메이션으로 보여 주는 방식에 머물러 있으며 추출하는 음성의 특징도 구간의 평균과 같은 점 데이터를 이용하는데 그치고 있다. 본 연구에서는 시계열로 표현되는 음성데이터의 특성 및 구조를 요약하거나 변형하지 않고 직접 이용하는 방법을 제시한다. 이를 위해서 딥러닝 기법을 토대로 자기조직화 알고리즘과 variational autoencoder(VAE) 모델 및 마코브 확률모델을 결합한 확률적 SOM-VAE 기법을 사용하여 클러스터링 성능을 향상시켰다.