• 제목/요약/키워드: 음향적 특징

검색결과 437건 처리시간 0.022초

전화망 환경에서의 연속숫자음 인식 성능평가 (Performance Evaluation of Telephone Continuous Digit Recognition)

  • 김성탁;김상진;정호영;김회린;한민수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.253-256
    • /
    • 2002
  • 한국어 숫자는 단음절로 이루어져 있고, 연속적으로 발음할 때 조음현상에 의해 발음이 심하게 변하고, 숫자간의 경계를 규정하기가 어려워진다. 특히 잡음환경에서는 한국어의 무성음인 자음구간의 주파수 특징이 많이 왜곡되어 성능이 저하된다. 본 논문에서는 전화망에서의 고성능 연속숫자음 인식기 개발을 위하여 그 첫 단계로서 다양한 조건에서 MFCC 특징계수를 구하는 방법들과 문맥독립 및 문맥종속 HMM의 상태수 및 각 상태에서의 mixture 수 변화에 대한 성능을 분석해본다. 음향모델로는 문맥독립 모델인 음소와 문맥종속 모델인 triphone 모델을 모두 평가하였다.

  • PDF

KT 증권정보 서비스 시스템의 구현과 시스템 자원의 효율적 활용을 위한 방법 고찰 (Implementation of Stock Information System and Methods for Efficient Use of System Resources)

  • 박성준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.323-326
    • /
    • 1998
  • 본 논문에서는 한국통신에서 음성인식을 이용한 전화정보 서비스의 일환으로 개발해 온 증권정보 시스템의 구조와 기능을 설명하고, 시스템을 다채널로 확장함에 있어서 시스템의 자원을 효율적으로 활용하기 위하여 적용한 방법에 대하여 기술하였다. 이 시스템에서는 음성특징을 추출하는 프로세서(DSP0)들과 단억검색을 하는 프로세서(DSP1)들이 분리되어 있으며, 이 둘 간의 개수 비율을 조절함으로써 실시간적 처리 효과를 유지하면서도 시스템의 전체 프로세서의 개수를 줄였다. DSP0와 DSP1 간의 음성 특징 데이터 전송에 있어서는 DSP0에서 발생하는 데이터를 음성이 입력되는 중에 전송할 수 있게 함으로써, DSP1에서는 DSP0과 병렬적으로 작업을 수행시킬 수 있으며, 결과적으로 시스템의 속도를 빠르게 하였다.

  • PDF

합성용 운율 DB 구축에서의 MLP 기반 후처리가 포함된 음소분할 (The phoneme segmentatioi with MLP-based postprocessor on speech synthesis corpora)

  • 박은영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.344-349
    • /
    • 1998
  • 음성/언어학적 및 음성의 과학적 연구를 위해서는 대량의 음소 단위 분절 레이블링된 데이터베이스 구축이 필수적이다. 따라서, 본 논문은 음성 합성용 DB 의 구축 및 합성 단위 자동 생성 연구의 일환으로 자동 음소 분할기의 경계오류를 보상할 목적으로 MLP 기반 호처리기가 포함된 음소 분할 방식을 제안한다. 최근 자동 음소 분할기의 성능 향상으로 자동 분절 결과를 이용하여 음성 합성용 운율 DB를 작성하고 있으나, 여전히 경계오류를 수정하지 않고서는 합성 단위로 직접 사용하기 어렵다. 이로 인해 보다 개선된 자동 분절 기술이 요구된다. 따라서, 본 논문에서는 음성에 내제된 음향적 특징을 다층 신경회로망으로 학습하고, 자동 분절기 오류의 통계 특성을 이용하여 자동 분절 경계 수정에 용이한 방식을 제안한다. 고립단어로 발성된 합성 데이터베이스에서, 제안된 후처리기를 도입 후, 기존 자동 분절 시스템이 분할율에 비해 약 25% 의 향상된 성능을 보였으며, 절대 오류는 약 39%가 향상되었다.

  • PDF

연주자의 의도와 청자 간의 음악 연주를 통한 정서 전달 (Emotional Expression in Musical Performance)

  • 김종완;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.439-444
    • /
    • 2007
  • 정서 전달에는 언어적 의사소통뿐만 아니라 비언어적 의사소통이 거론되곤 한다. 하지만 지금까지의 비언어적 의사소통 연구는 대부분 언어의 음향학적 연구나 얼굴표정 연구에 국한되었다. 또한 음악의 정서에 대한 연구는 음악적 구조 혹은 스타일과 여러 성격적 특질 및 행동 간의 관계, 혹은 생리적 효과 등 어떤 음악(what music)이 특정한 효과를 일으키느냐에 중점을 두고 있었다. 따라서 본 연구에서는 Gabrielsson & Juslin(1996)의 연구에 의거, 음악을 통하여 작곡가가 아닌 연주자의 의도된 정서가 청자에게 얼마나 잘 지각될 수 있는지 알아보고자 하였다. 봉 녕구의 가설은 다음과 같다; 첫째, 연주자의 정서적 의도는 음악의 모든 물리적 변인에 영향을 준다; 둘째, 청자는 의도된 정서를 지각하는 데 일반적으로 성공적이다; 셋째, 특정 정서는 다른 정서보다 더 잘 구분된다. 본 연구에 사용된 곡은 학습 효과를 배제하기 위하여 새롭게 전문 작곡가에 의해 작곡되었으며, 전문 연주자는 동일한 곡을 7종류의 정서(행복한, 슬픈, 화난, 두려운, 다정한, 엄숙한, 정서 표현 없음)를 표현하도록 연주하였다. 하나의 완전한 음악을 표현하기 위하여 각 곡은 멜로디(악기구성: 일렉트릭 기타, 베이스, 그랜드 피아노)와 리듬(드럼)을 포함하였다. 실험참가자는 각 곡을 듣고 7개의 정서 종류 각각에 점수를 평정하였다. 그 결과 이전 연구와 마찬가지로 청자는 연주자의 의도된 정서를 일반적으로 지각하는 데 성공하였으며 7개의 정서 중 특징적인 정서("행복한", "슬픈", "화난", "다정한") 는 다른 정서 보다 더 잘 구별되었다. 본 연구에 사용된 "두려운" 정서 곡의 음향분석 결과 소리 강도의 큰 변산이 특징이었다. 이는 이전 연구에서 "두려운" 정서의 특징인 타이밍의 큰 변산과 함께, "두려운" 정서가 '불규칙적이거나 변화가 커서 예측하기 어려운' 속성을 지니고 있음을 시사한다. 또한 "다정한" 정서에 대해서 본 연구에서는 다른 모든 정서와 유의미한 차이를 보인 반면, 이전 연구에서는 "슬픈"과 유의미한 차이가 없었다. 이는 본 연구에 쓰인 "다정한" 정서의 곡은 리듬 패턴을 다른 정서 버전과는 다르게 보사노바 리듬을 사용하였다. 이전 연구와는 다르게 빠른 템포였음에도 불구하고 구별이 잘 된 이유는 이와 같이 장르 특징적인 영향이 컸기 때문이라고 할 수 있다. 이는 연주자나 음악 스타일 자체의 성격이 정서 판단에 있어 큰 영향을 준다는 사실을 시사한다. 종합적으로 음악을 통한 정서 전달에 있어 연주자, 청자, 악기, 음악 스타일의 차이가 영향을 줄 수 있다는 사실을 확인하였으며 이러한 결과는 Scherer & Oshinsky(1977)가 언급하였듯 음악 연주가 다른 비언어적 의사소통 방법과 공유하는 특징이 있음을 시사한다.

  • PDF

영어 어말 폐쇄음의 유.무성 인지 실마리에 관한 연구 -폐쇄음의 자음적 특징을 중심으로 - (On the Perceptual Cues to Voicing of English Word-Final Stops -Focusing on the consonantal features-)

  • 고현주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.89-92
    • /
    • 1998
  • 영어의 선행모음의 길이 특성이 어말 자음의 유.무성 인지에 어떤 영향을 미치는지에 관한 선행 연구의 후행연구로서 후행하는 폐쇄음의 자음적 특성은 어떠한 실마리로 적용하는지 한국어 화자들을 대상으로 한 인지실험을 통해 알아보았다. 실험결과, 한국어 모국어 화자들에게 어말 폐쇄음의 자음적 특성은 자음의 유.무성 인지에 중요한 실마리로 작용하지 못하고 있다는 사실을 알 수 있었다.

  • PDF

한국인과 일본인의 호주 영어 모음 연쇄 /w+V/ 조음 비교 (Australian English sequences of semivowel /w/ + Back Vowel /3:/, / :/ or / / production by Korean and Japanese learners of English)

  • 박시균
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.188-191
    • /
    • 1998
  • 호주 영어의 단어 중 한국인과 일본인이 구별하기 어려운 'work', 'walk', 'wok' 세 단어에 대해 다룬다. 우선 한국인과 일본인이 이들 세 단어를 어떻게 조음할 것인가를 예측하고, 실제로 한국인과 일본인 화자들이 조음한 자료를 가지고 모듬의 음질과 길이 두가지 측면으로 나누어 예측한 사항과 비교하고 또 이들 단어를 조음할 때 한국인과 일본인 사이에 어떤 음성 음운적 특징이 나타나는지도 비교 분석한다. 결과는 모국어의 음성, 음운적 영향이 목표어의 음소를 습득하고 발음하는데에 영향을 미친다는 사실을 보여주고 있다. 하지만 wok/wo k/의 예는 언어 보편적인 요소가 L2의 음소를 습득하는데 있어 또 하나의 요소로 작용하고 있음도 알려주고 있다.

  • PDF

디지털 융복합 환경을 고려한 음향 및 오디오 기술 교육과정 개발 (Curriculum Development of Acoustics and Audio Engineering on Digital Convergence Environment)

  • 오원근;이에스더
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.191-197
    • /
    • 2013
  • 본 논문에서는 디지털 융복합 환경하에서 효과적인 음향 기술 교육을 위한 대학 학부 교육과정을 개발하였다. 이를 위해 먼저 미국음향학회(ASA)와 오디오 엔지니어협회(AES)에 링크된 미국과 유럽 대학의 음향 기술 교육과정을 그 특징에 따라 순수 음향학 지향, 음향 응용 지향, 그리고 학제간 융합 지향과 같이 3가지 유형으로 분류하였다. 또한 각 유형별로 외국 사례를 고찰한 다음, 이를 기반으로 음향 기술 교과과정에 대한 단계별 기초 모형과 세부적인 교과목(안)을 제안하였다. 제안된 내용은 향후 본격적인 국내 음향교육 교과과정 구축에서 효과적인 방법론으로 제시될 수 있을 것이다.

어텐션 기반 게이트 순환 유닛을 이용한 수동소나 신호분류 (Passive sonar signal classification using attention based gated recurrent unit)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.345-356
    • /
    • 2023
  • 수동소나의 표적신호는 수초 내 세기의 변화를 갖는 협대역 고조파 특성과 로이드 거울 효과에 의한 장시간 주파수 변이 특성을 나타낸다. 본 논문에서는 지역 및 전역적 시계열 특징을 학습하는 게이트 순환 유닛 기반의 신호분류 알고리즘을 제안한다. 제안하는 알고리즘은 게이트 순환 유닛을 이용한 다층 네트워크를 구성하고 확장된 연결을 통해 지역 및 전역적 시계열 특징들을 추출한다. 이후 어텐션 메커니즘을 학습하여 시계열 특징들을 가중하고 수동소나 신호를 분류한다. 공개된 수중 음향 데이터를 이용한 실험에서 제안된 네트워크는 96.50 %의 우수한 분류 정확도를 보였다. 이러한 결과는 기존의 잔차 연결된 게이트 순환 유닛 네트워크과 비교하여 4.17 % 높은 분류 정확도를 갖는다.

매미의 발음 기제를 모사한 음향 발생 장치의 설계에 관한 연구 (A Study on the Design of an Acoustic Actuator Based on the Singing Mechanism of Cicadas)

  • 조완호;이정권
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.309-312
    • /
    • 2004
  • 본 연구에서는 매미가 소형이면서도 광대역의 소리를 낼 수 있는 원리가 무엇인지를 파악하고 이중 음향 발생 장치 제작에 적용할 수 있는 요소를 도출하였다. 매미의 발음기관에서 가장 중요한 부분은 복부 공명실과 진동판이다. 복부 공명실은 위상 반전형 인클로져 시스템으로 모델링 할 수 있으며, 진동판은 돔 형태의 박판으로 볼 수 있다. 근육에서 발생된 입력 신호는 진동판의 곡면에 의해 판에 좌굴을 일으켜 높은 음압의 소리를 발생시킨다. 발생된 소리는 복부를 통해 위상이 반전되어 특정 대역이 강조된다. 진동판의 가장 큰 특징은 곡면구조에 의한 비선형적인 출력이며 이를 통하여 가진 주파수와 상이한 주파수 성분들을 효과적으로 발생시키게 된다. 이러한 구조를 음향 발생장치로 활용하기 위하여 단순한 곡면판의 기하학적 파라미터 변화에 따른 출력 변화 경향을 관찰 하였으며, 이러한 원리를 활용한 음향 발생장치를 구성하였다.

  • PDF

거리종속 표준해양을 이용한 해양음향 토모그래피 (Ocean Acoustic Tomography using by Range-Dependent Canonical Ocean)

  • 한상규
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1996년도 제11회 수중음향학 학술발표회 논문집 11th Underwater Acoustics Symposium Proceedings
    • /
    • pp.41-43
    • /
    • 1996
  • 동해의 경우 강한 극전선이 존재하여 복부해역과 남부해역의 음속구조는 커다란 차이를 보이고 있다. 이러한 해역에서 평균음속구조를 구하여 표준해양을 설정할 경우 음파 전파경로의 차이가 커지게 된다. 따라서 이러나 해역에서 해양음향 토모그래피를 이용한 해양탐사를 수행하기 위해서는 해역별로 다른 음속구조를 가지는 표준해양의 설정이 필요하며 이를 근거로 음파의 전파경로 및 음속구조를 표준해양으로 설정하여 수온 및 수중음속의 변동량을 역추정하는 방법을 이용하고 있다. 본 연구에서는 인위적인 극전선을 설정하고 해역별 특징을 갖는 표준해양을 설정하여 음파 도달시간의 기준을 설정하고 음속구조의 역추정을 수행하여 기존의 해양음향 토모그래피에 의한 해양탐사 방법과 비교하였다. 그 결과 기존의 해양음향 토모그래피를 이용한 역추정에서는 전선의 형태를 재현하기 위해서 여러 개의 음원과 수신기가 필요하였으나 거리종속 표준해양을 이용할 경우 그 수가 줄어도 가능하고 평균오차고 작아지는 결과를 얻었다.

  • PDF