• 제목/요약/키워드: 음성자료분석

검색결과 263건 처리시간 0.027초

음성언어 번역 시스템을 위한 새로운 형태소 분석 (A New Morphological Analysis for the Spoken Language Translation System)

  • 양승원;김재훈
    • 한국음향학회지
    • /
    • 제18권4호
    • /
    • pp.17-22
    • /
    • 1999
  • 음성 처리부와 기계번역부를 통합하는 음성언어 번역 시스템에서는 각 모듈들이 다루는 자료나 처리단위 등이 서로 달라 통합이 어렵다. 따라서, 전체 시스템의 효율을 제고하면서 각 모듈에서 공통으로 사용할 수 있는 새로운 입출력 단위가 필요하다. 본 논문에서는 음성언어 번역 시스템에서 음성 처리 모듈들과 언어번역 모듈과의 인터페이스 단위로서 의사 형태소를 제안하고, 입력되는 문장을 의사 형태소 단위로 분석하는 형태소 분석기를 구현하였다. 의사형태소를 이용한 음성인식/합성은 어절이나 형태소단위의 음성인식/합성에서 보다 개선된 결과를 얻을 수 있게 해주며, 전체적인 음성언어 번역시스템의 성능도 높일 수 있다. 본 논문에서 구현한 의사 형태소 분석기의 분석율은 약98.9%로 일반 형태소 분석기와 동일한 수준의 성능을 보였다.

  • PDF

한국어 파찰음의 조음에 대한 시간적.공간적 연구 (An spatio-temporal study on Kroean affricates)

  • 신지영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.375-378
    • /
    • 1998
  • 본 연구의 목적은 한국에 존재하는 세 종류 파찰음/ㅈ,ㅊ, ㅉ/의 시간적.공간적 조음 특성을 전자구개도와 스펙트로그램 분석을 통하여 면밀히 검토해 보려는 것이다. 이를 위하여 두 실험이 행해 졌는데, 조음 음성학적인 실험(전자구개도를 이용한 실험)에는 한 명의 피험자가, 그리고 음향 음성학적인 실험(음향 자료의 스펙트로그램 분석)에는 세 명의 피험자가 발화한 자료가 이용되었다. 대상이 되는 세 자음들은 /ㅏ_ㅏ/, /ㅡ_ㅡ/, /ㅣ_ㅣ/ 등 세 모음 사이에서 발화되었으나, 모음이 자음의 조음에 미치는 영향, 즉 모음_자음 동시조음은 본 연구의 범위에서 제외되었다.

  • PDF

청각장애 아동과 건청아동의 이중모음 산출에 대한 음향음성학적 특징 비교

  • 배남주;고도흥
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.244-244
    • /
    • 2003
  • 말소리의 생성 및 전달에서 화자의 청각적 피드백은 말소리 발달에 중요한 부분을 차지한다(고도흥 외, 2000). 그러나 청각장애 아동의 경우, 청각적인 피드백이 부족하여 말소리 발달과 언어발달에서 지체를 보이게 된다. 특히 이러한 말소리 발달은 아동의 말명료도에 큰 영향을 미치게 되고, 국내외 여러 학자들은 청각장애 아동의 말 산출에 대한 연구를 활발하게 하고 있다. 그러나 현재 국내의 연구 중 이중모음에 대한 연구는 거의 없는 실정이다. 국내의 청각장애 성인이나 아동을 대상으로 한 연구들은 대부분 연구자의 지각적이고 주관적인 입장에서 이루어지고 있다. 좀더 객관적인 연구 자료는 임상적인 목적뿐만 아니라 말소리 발달의 연구에서 필요하다. 따라서 이 연구는 청각장애 아동의 이중모음의 특징을 음향음성학적인 방법으로 객관적으로 분석하여 그 자료를 제시하고, 건청 아동과의 비교를 통해 임상적인 자료를 제시하고자 한다. (중략)

  • PDF

독립성분분석을 이용한 강인한 화자인식 (Robust Speaker Recognition using Independent Component Analysis)

  • 장길진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.327-330
    • /
    • 1998
  • 독립성분분석(ICA: Independent Component Analysis)이란 특징이 상이한 둘 이상의 신호들이 선형적으로 결합되어 있을 때 이를 효과적으로 분리하는 방법들을 통칭하며 잡음제거, 음질개선 및 신호처리 분야에서 많이 활용되고 있다. 본 논문에서는 전화음성 화자인식 시스템의 성능향상을 위해 독립성분분석을 이용하는 방법을 제안한다. 먼저 화자가 발성한 음성신호의 켑스트럼 계수를 여러 채널 함수들의 선형적인 합으로 가정하고, 독립성분분석을 이용하여 얻은 새로운 켑스트럼 벡터를 학습과 인식에 사용하였다. 실험자료는 잔화음성 화자식별기의 성능평가에 널리 쓰이고 있는 SPIDRE를 사용하였고 regodic 은닉 마코프 모델을 이용하여 문장 독립 화자식별 시스템을 구성하였다. 학습음성의 특징과 실험음성의 특징이 다른 조건에서 기존의 채널 정규화 방법들에 비해 10~15%이상 인식률이 향상되었다.

  • PDF

말기 신부전 환자에서 혈액투석 치료가 성대 및 강도의 변화에 미치는 영향 (The Influence of Vocal Cords and Intensity by Hemodialysis in End Stage Renal Disease)

  • 김봉현;조동욱;강응택
    • 한국통신학회논문지
    • /
    • 제35권7B호
    • /
    • pp.1066-1072
    • /
    • 2010
  • 신장 질환은 초고령화 사회로 접어들고 있는 현대 사회에서 발병율이 매우 높은 질환이다. 이러한 신장 질환을 초기에 발견하면 약물이나 식이요법으로 막을 수 있지만 악화될 경우 인공투석이나 신장이식을 받아야 한다. 따라서 본 논문에서는 혈액투석에 따른 성대 및 강도의 변화율을 측정, 분석하여 신장과 음성과의 상관성을 분석하였다. 이를 위해 혈액투석 치료를 받는 피실험자를 대상으로 혈액투석 전과 후의 음성을 수집하고 음성 분석학적 요소의 적용을 통해 비교, 분석하였다. 즉, 신장에 이상이 있을 때 목소리가 가라앉는다는 동양의학적 진단 이론에 기반하여 혈액투석 치료 전의 음성과 치료 후의 음성을 각각 수집하고 수집된 음성 자료에 성대의 떨림과 강도 분석을 적용하여 혈액투석 치료 전과 후의 음성 변화를 측정, 분석하였다.

음성인식기술 기반 영어학습 체제 설계와 적용에 관한 연구 (A Study on Design & Application of VR Technology Based English Learning System)

  • 서영곤;김창주
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2004년도 동계학술대회
    • /
    • pp.195-206
    • /
    • 2004
  • 본 연구는 음성 인식 기술을 적용해서 시범적으로 영어 학습 제품을 제작하고 이것을 현장에 적용한 후 설문과 관찰을 통해 결과를 해석하는 Pilot Test로 계획되었다. 본 연구의 목적은 음성 인식 영어 학습 제품 사용 후, 학생들의 학습태도 변화를 확인하고, 실험에 참가한 회원, 학부모, 교사의 만족도를 조사하고, 영어 교육학 전공자를 통해서 음성인식 영어 학습 제품의 완성도를 조사 분석하는 것을 목적으로 한다. 본 연구를 통해 도출된 data 들은 음성 인식 기술의 제품 적용 가능성을 검증해 주고, 향후 사업화 추진을 위한 근거 자료나 기초 자료로서의 역할을 할 것으로 기대한다.

  • PDF

이러닝 콘텐츠에서 비음성 사운드에 대한 학습자 인식 분석 (Learners' Perceptions toward Non-speech Sounds Designed in e-Learning Contents)

  • 김태현;나일주
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.470-480
    • /
    • 2010
  • 이러닝 콘텐츠에는 시각자료와 함께 다양한 청각자료를 포함하고 있음에도 불구하고 그동안 학습자료에서 청각정보 설계에 대한 연구는 극히 제한적으로 이루어져 왔다. 청각정보의 한 유형인 비음성 사운드가 학습자들에게 피드백 제공 및 행위유도를 즉시적으로 할 수 있다는 장점을 감안한다면 비음성 사운드의 체계적 설계가 요구된다. 이에 본 논문은 다차원척도법을 활용하여 학습자들이 이러닝 콘텐츠에 설계된 비음성 사운드를 어떠한 방식으로 인식하고 있는지를 경험적으로 탐색하는 것을 목적으로 수행되었다. 한국교육학술정보원에서 제공하는 이러닝 콘텐츠에 설계된 비음성 사운드 중 대표성이 있는 11개의 비음성 사운드가 선정되었다. A 대학교 3학년 학생 66명을 대상으로 11개의 비음성 사운드들 간의 유사 정도에 대해 응답하도록 하였고 그 결과가 다차원 공간에 표현되었다. 연구결과, 학습자들은 비음성 사운드의 길이와 비음성 사운드가 전달하는 긍정적 혹은 부정적 분위기에 따라 비음성 사운드를 구분하여 인식하고 있는 것으로 나타났다.

한국어의 LSP 분석에 관한 연구 (A study on the analysis of Korean vowels by the Line Spectrum Pair method)

  • 이응정;김희래
    • 한국음향학회지
    • /
    • 제5권3호
    • /
    • pp.21-27
    • /
    • 1986
  • LSP 방식은 음성의 주파수 특성을 포함하는 공진 주파수를 낮은 부분과 SHB은 부분의 주파수 로 표시되는 선스펙트럼쌍 계수를 구하는 방법이다. 본 논문은 LSP 방식을 사용하여 한국어의 기본 모 음 7개를 대상으로 하여 분석하고 LSP 계수를 구하는 Algorithm을 개발하였으며 PARCOR 방식과 비 교하였다. 실험 결과 LSP 방식의 연산량이 PARCO 방식의 연산량보다 약 1/2정도로 적음을 알 수 있었 고 Hardware 구성 시에 있어서도 경제적임을 알 수 있었다. 그리고 LSP는 계수 모음의 종류에 따라 각 기 다른 공진 주파수, 대역폭을 나타내기 때문에 음성 합성이나 음성 인식 분야에 있어 기초 자료로 이 용할 수 있을 것으로 사료된다.

  • PDF

비대면 음성 쇼핑의 인지된 가치, 지속이용의도에 미치는 영향 관계에 관한 연구 (The Influence of Perceived Value on Continuance Use Intention in Voice Commerce Context)

  • 김효정
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.225-234
    • /
    • 2022
  • 음성 쇼핑이 새로운 정보 탐색 및 구매 채널로 주목을 받고 있다. 본 논문은 비대면 음성 쇼핑의 지속이용의도에 영향을 미치는 요인들을 가치기반수용모델을 이용하여 살펴보았다. 음성 쇼핑 이용 경험이 있는 소비자들을 대상으로 온라인 조사를 실시하였으며, 총 470명의 응답자료가 최종 분석에 활용되었다. 음성 쇼핑 경험자는 음성 쇼핑으로 물품을 구매하였거나 음식 배달 서비스를 이용한 개인들로 한정하였다. SPSS 23.0과 Amos 23.0 프로그램을 이용하여 기술통계 분석, 상관관계 분석, 확인적 요인분석, 그리고 구조모형 분석을 실시하였다. 본 연구의 결과를 요약하면 다음과 같다. 첫째, 유용성과 응대 정확성이 음성 쇼핑의 인지된 가치를 증가시키는 것으로 확인되었다. 둘째, 기능적 위험이 음성 쇼핑의 인지된 가치를 감소시키는 것으로 확인되었다. 셋째, 인지된 가치가 음성 쇼핑의 지속이용의도를 향상시키는 것으로 나타났다. 본 연구 결과는 음성 쇼핑을 이용하는 소비자들의 특성을 이해하고, 음성 쇼핑이 이용자들에게 혜택을 제공하는 유용한 서비스로 자리매김하는데 기여할 수 있을 것이다.

한국 남성의 단모음 [아, 에, 이, 오, 우]에 대한 음향음성학적 기반연구 (Fundamental Acoustic Investigation of Korean Male 5 Monophthongs)

  • 최예린
    • 한국콘텐츠학회논문지
    • /
    • 제10권6호
    • /
    • pp.373-377
    • /
    • 2010
  • 영어의 경우는 모음포만트 분석이 질적이나 양적으로 이미 오래전부터 많이 이루어져 왔다. 그러나 한국어 모음이 음향음성학적으로는 제대로 분석되지 않고 있는 실정이다. 본 연구의 목적은 한국어 모음에 대한 음향음성학적 측면에서 정량적으로 충분한 자료 확보를 위한 과정의 일환으로 정상 남자 20대와 30대를 대상으로 한국어 모음의 음향학적 측면에서 정량적 자료를 얻고자 하였다. 한국어 표준어를 산출하는 20~30대의 남자 총 31명을 대상으로 기본 5 모음 인 /아, 에(애), 이, 오, 우/를 3회 반복산출한 것을 Cool edit에 녹음하여 MATLAB음향분석 프로그램을 이용하여 모음의 F1, F2, F3, F4를 구하였다. F1과 F2 모두에서 본 연구의 모음 포만트가 선행연구보다 전반적으로 낮은 경향을 보였으나 전체적인 패턴은 매우 유사하였다. 연령별, 어음재료에 따른 한국어 모음 자료들에 대한 연구가 더 요구될 것으로 사료된다.