• 제목/요약/키워드: 음성다중연구

검색결과 148건 처리시간 0.024초

부호분할 다중화 기법을 이용한 음성 회선 확대 방안 연구 (A Study for the Voice channel extension method using Code Division Multiplexing)

  • 권기형;신용조
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권4호
    • /
    • pp.103-109
    • /
    • 1998
  • 국내 전화 전송망은 El을 많이 사용하며, 음성 한 회선에 64Kb㎰를 할당하여 총 30회선 2.048Mb㎰로 구성되어 있다. El 방식에서는 TDM을 이용하므로 고정된 회선만을 이용한다. 본 연구에서는 CDM기법을 이용하면 음성 회선을 증가시키고 가입자수를 늘릴 수있음을 보였다.

  • PDF

이동단말에서 다중발화를 이용한 Home network 환경에서의 QoS 보장 연구 (A study on The Guarantee of QoS in the Home Network using Multiple Speech)

  • 황지수;이창섭;박준석;김유섭;박찬영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.811-813
    • /
    • 2004
  • 휴대전화에서 전달되는 음성데이터들이 전달되는 과정에서 잡음 등의 외부 요인으로 인하여 데이터에 손실이 생기는 문제가 발생한다. 이렇게 전달된 음성데이터가 음성 인식기를 통과하면 바로 음성 인식기를 통과했을 때 보다 인식률이 낮아진다. 본 연구에서는 음성인식 알고리즘을 이용하여 홈 네트워크를 제어하는데 있어서 음성 인식율을 향상시키기 위해서 반복적으로 음성 데이터를 입력받아. 이를 유사율 알고리즘을 적용시켜 추출 된 여러 개의 데이터(text)를 이미 구축된 홈 네트워크 용어 관련 사전에 등록된 단어와의 유사성을 검토하여 추출된 결과로 홈 네트워크를 제어하는 방안을 제안한다. 이 결과, 기존의 방법에 비해서 10% 정도의 인식률의 향상을 확인할 수 있었다.

  • PDF

다중생체인식을 이용한 사용자 인증 (Person Authentication using Multi-Modal Biometrics)

  • 이경희;최우용;지형근;반성범;정용화
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2003년도 하계학술대회논문집
    • /
    • pp.204-207
    • /
    • 2003
  • 생체인식 기술은 전통적인 비밀번호 방식 또는 토큰 방식보다 신뢰성 면에서 더 선호되지만, 환경의 영향에 매우 민감하여 성능의 한계가 있다. 이러한 단일 생체인식 기술의 한계를 극복하기 위하여 여러 종류의 생체 정보를 결합한 다중 생체인식 (multimodal biometrics)에 관한 다양한 연구가 진행되고 있다 본 논문에서는 다중 생체인식 기술을 간략히 소개하고, Support Vector Machines(SVM)을 이용하여 얼굴 및 음성 정보를 함께 이용한 다중 생체인식 실험으로 성능이 개선될 수 있음을 확인하였다.

  • PDF

웨이블렛 변환을 이용한 음성에서의 감정 추출 및 인식 기법 (Emotion Recognition Method from Speech Signal Using the Wavelet Transform)

  • 고현주;이대종;박장환;전명근
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.150-155
    • /
    • 2004
  • 본 논문에서는 사람의 음성속에 내포된 6가지 기본 감정(기쁨, 슬픔, 화남, 놀람, 공포, 혐오)의 특징을 추출하고 인식하고자 한다. 제안한 감정인식 알고리즘은 웨이블렛 필터뱅크를 이용하여 각각의 감정별 코드북을 만들고, 인식단계에서 필터뱅크별 감정을 확인한 후 최종적으로 다중의사결정기법에 의해 감정을 인식하는 구조로 이루어져 있다. 이와 같은 웨이블렛 필터뱅크와 다중의사 결정기법에 기반을 둔 알고리즘의 유용성을 보이기 위해 실험에 사용된 음성은 20명의 화자로부터 6가지의 감정을 대상으로 각각 3번씩 발음한 감정음성을 녹음하여 총 360개의 데이터베이스로 구성하고 실험하였다. 이와 같이 제안한 알고리즘은 기존의 연구에 비해 5% 이상 향상된 인식률을 보였다.

청각보철을 위한 PLP방식의 음성신호처리에 관한 연구 (A Study on the Speech Signal Processing for Cochlear Implant using the PLP Analysis)

  • 김영선;최두일;박상희;백승화
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1992년도 춘계학술대회
    • /
    • pp.167-170
    • /
    • 1992
  • 본 논문에서는 감각성 난청자들이 정상인들과 유사한 음성 인식을 하도록 청각 보철 기기를 구성하였다. 음성의 포먼트를 추출하기 위해서는 PLP(Perceptual Linear Prediction) 방식을 이용하였으며, pitch 추출을 위해서는 3 단계 클리핑 함수를 이용한 자기 상관법을 이용하였다. 또한 다중 채널 - 다중 전극 방식을 이용하여 내이의 헤어셀에 17 개의 전극을 삽입하여 신호를 가하는 시뮬레이션을 하였다. 실험에 사용한 데이타는 모음 /a/, /e/, /i/, /o/, /u/로 전모음과 후모음의 차이를 구별하였으며 두번째 포먼트의 변화와 포먼트 통합 이론에 대한 검증을 하였다.

  • PDF

다중대역 음성인식을 위한 부대역 신뢰도의 추정 및 가중 (Estimation and Weighting of Sub-band Reliability for Multi-band Speech Recognition)

  • 조훈영;지상문;오영환
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.552-558
    • /
    • 2002
  • 최근에 Fletcher의 HSR (human speech recognition) 이론을 기초로 한 다중대역 (multi-band) 음성인식이 활발히 연구되고 있다. 다중대역 음성인식은 주파수 영역을 다수의 부대역으로 나누고 별도로 인식한 뒤 부대역들의 인식결과를 부대역 신뢰도로 가중 및 통합하여 최종 판단을 내리는 새로운 음성인식 방식으로서 잡음환경에 특히 강인하다고 알려졌다. 잡음이 정상적인 경우 무음구간의 잡음정보를 이용하여 부대역 신호대 잡음비(SNR)를 추정하고 이를 가중치로 사용하기도 하였으나, 비정상잡음은 시간에 따라 특성이 변하여 부대역 신호대 잡음비를 추정하기가 쉽지 않다. 본 논문에서는 깨끗한 음성으로 학습한 은닉 마코프 모델과 잡음음성의 통계적 정합에 의해 각 부대역에서 모델과 잡음음성 사이의 거리를 추정하고, 이 거리의 역을 부대역 가중치로 사용하는 ISD (inverse sub-band distance) 가중을 제안한다. 1500∼1800㎐로 대역이 제한된 백색잡음 및 클래식 기타음에 대한 인식 실험 결과, 제안한 방법은 정상 및 비정상대역제한잡음에 대하여 부대역의 신뢰도를 효과적으로 표현하며 인식 성능을 향상시켰다.

KSOM을 이용한 다중생체 인식시스템에 관한 연구 (Implementation of Embedded System for Multi-modal Biometric Recognition using KSOM)

  • 김재완;이상배
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.91-94
    • /
    • 2006
  • 본 논문은 생체인식시스템에서 단일시스템의 각각의 특징을 바탕으로 신뢰성을 증가시키는 것에 있다. 간단하면서 높은 인식률을 가지는 지문과 개개인의 음성을 다중생체인식에 활용하여 다중생체인식 시스템을 구현 하였다. 화자인식부에서는 DSP를 이용하여 화자인식을 수행하고, 이후 지문인식부에서 지문 특징점을 추출하여 KSOM신경망 알고리즘을 이용하여 인식을 수행하였다. 그리고 각 인식부의 전체적인 제어는 ATmega16L을 사용하였다. 또한 인증결과를 PC에 MFC로 디스플레이 한다.

  • PDF

미디어 멀티태스킹 환경에서 인터페이스의 감각양식 차이가 인지부하와 과업수행에 미치는 영향에 관한 연구 다중 자원 이론과 스레드 인지 모델을 기반으로 (The Effects of Interface Modality on Cognitive Load and Task Performance in Media Multitasking Environment)

  • 이다나;한광희
    • 한국HCI학회논문지
    • /
    • 제14권2호
    • /
    • pp.31-39
    • /
    • 2019
  • 본 연구는 빠르게 발전하는 음성 기반의 디바이스가 스크린 중심의 미디어 멀티태스킹 환경에 어떤 변화를 가져올 수 있을지 확인하고자 했다. 서로 다른 자원 구조를 가진 과업을 동시에 수행할 때 정보 처리 효율이 높아진다는 이론적 근거를 토대로, 시각 주의가 필요한 과제와 음성 또는 스크린 기반의 디바이스를 활용해 정보를 검색하는 과업을 동시에 수행하는 실험이 진행되었다. 실험 결과, 과업수행 환경과 인터페이스 감각양식은 모두 인지부하에 유의미한 영향을 미쳤다. 음성 인터페이스 그룹에서 전반적으로 인지부하 수준이 높게 나타났는데, 단독으로 사용된 단일 과업 조건보다 시각 과제를 동시에 수행한 다중 과업 조건에서 시각 인터페이스 그룹과의 차이가 줄어들었다. 과업 수행도의 경우 음성 인터페이스 그룹에서 시각 과제에 대한 수행능력이 시각 인터페이스 그룹보다 더 높게 측정되었다. 이러한 결과는 멀티태스킹 환경에서 음성 인터페이스를 사용했을 때 동시적 과업을 청각 경로와 시각 경로로 나누어 처리함으로써 인지부하와 과업수행에 이점이 나타났음을 의미한다. 이는 시각 자원의 충돌이 발생하기 쉬운 스크린 중심의 미디어 멀티태스킹 환경에서 음성 기반의 디바이스가 효율적 정보 처리를 촉진시키는 잠재적 역할을 할 수 있다는 함의점을 제공한다. 본 연구는 다중 자원 이론을 통해 자원의 분산처리에 대한 이론적 증거를 제시하고, 스레드 인지 모델을 기반으로 음성 인터페이스를 활용했을 때의 이점을 더욱 구체적으로 규명하고자 했다.

IEEE 802.15.4에서 GTS의 확장개념에 관한 연구 (A study on the Implementation Extended Concept of GTS in IEEE 802.15.4)

  • 전동근
    • 한국전자통신학회논문지
    • /
    • 제10권3호
    • /
    • pp.319-325
    • /
    • 2015
  • 무선 통신 기술에 있어서 눈부신 발전은 서로 멀리에 있는 사람들 간에 통신을 가능케 했다. 최근에는, 저비용과 단순한 하드웨어를 기반으로 하는 무선 시스템을 이용한 근거리 음성커뮤니케이션의 필요성이 급속히 대두되고 있다. 그러나, 이러한 애플리케이션은 작은 지역에서 같은 무선 채널로 다중 이용자(multi-users)들이 통신하는 것을 요구하기 때문에, 현존하는 음성 기술들은 이러한 애플리케이션들에 직접적으로 적용하는 것은 적절치가 않다. 본 논문에서는 다중 이용자 음성통신을 가능케 하는 참신한 아이디어를 제안하고자 한다 특히, 단거리 무선 해결책으로서, 저전력, 저비용을 바탕으로 한 IEEE 802. 15. 4를 이용한다. 그러나, 원래 그 표준은 음성 통신을 위해 개발된 것은 아니기 때문에, 음성 통신에 적당하도록 GTS의 확장 개념을 이용함으로써 원래의 운용계획을 확장한다. 제안된 운용계획의 용량과 타당성은 다양한 음성 압축비에서 양적 분석을 통해 평가된다.