Search | Korea Science

Normalized Recognition Method using Characteristic Vector of Speech Signal (음성의 특징벡터를 사용한 정규화 인식수법)

Choi, Jae-Seung
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2011.10a
- /
- pp.616-618
- /
- 2011
본 논문에서는 음성의 특징벡터를 추출하여 음성인식을 위한 인식 알고리즘을 제안한다. 본 논문에서 제안하는 방법은 사람의 음성을 정규화하여 시간지연신경회로망을 사용하여 음성인식을 하는 인식 알고리즘이다. 본 논문에서는 시간지연신경회로망을 이용하여 입력되는 음성정보를 일정시간 동안 학습시킨 후에 새로이 입력되는 정보를 인식하는 수법이다. 본 실험에서는 음성인식률에 의하여 본 알고리즘의 유효성을 확인한다.
PDF

Recognition Algorithm using MFCC Feature Parameter (MFCC 특징 파라미터를 이용한 인식 알고리즘)

Choi, Jae-seung
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2016.10a
- /
- pp.773-774
- /
- 2016
배경잡음은 음성신호의 특징을 왜곡하기 때문에 음성인식 시스템의 인식율 향상의 방해요소가 된다. 따라서 본 논문에서는 배경잡음이 존재하는 환경에서의 음성인식을 실시하기 위해서, 신경회로망과 Mel 주파수 켑스트럼 계수를 사용하여 연속음성 식별 알고리즘을 제안한다. 본 논문의 실험에서는 본 알고리즘을 사용하여 배경잡음이 섞인 음성신호에 대하여 음성인식의 식별율 개선을 실현할 수 있도록 연구를 진행하며, 본 알고리즘이 유효하다는 것을 실험을 통하여 명백히 한다.
PDF

Strategy for Implementing A Voice Web Browser Based WIPI (WIPI기반 음성 웹브라우저 구현 방안)

Yu Se-Young;Kim Byung-Ki
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2006.05a
- /
- pp.501-504
- /
- 2006
인터넷 및 휴대폰들이 일반화되고 음성처리 기술이 실용화 단계로 발전함에 따라 음성 응용분야가 새로운 이슈로 떠오르고 있다. 음성처리 기술은 사람의 말을 알아들을 수 있는 귀와 사람에게 말을 할 수 있는 입을 마련해주는 새로운 분야다. 그리고, 음성으로 웹의 컨텐츠를 개발하기 위한 표준 언어인 VoiceXML, SALT가 빠르게 보급되고 있다. 음성인식과 음성합성 기술이 꾸준히 발전하여 음성 포털 서비스나 자동 음성 안내 시스템 등에 음성인식과 음성합성 기술이 채택되는 등 상용화 수준에 이르렀다. 사람에게 가장 편리한 정보 습득 방법은 음성이고 이러한 음성을 적용한 음성 웹 브라우저를 현재 유선 상에서 사용하고 있다. 하지만 아직까지 무선 플랫폼에 적용하여 사용하는 브라우저는 개발되지 않고 있다. 사용자에게 친숙한 무선인터넷 환경을 제공하고자 무선 음성 웹 브라우저를 구현방안을 제시하고자 한다.
PDF

Adaptive echo canceller combined with speech coder for mobile communication systems (이동통신 시스템을 위한 음성 부호화기와 결합된 적응 반향제거기에 관한 연구)

이인성;박영남
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.23 no.7
- /
- pp.1650-1658
- /
- 1998
This paper describes how to remove echoes effectively using speech parameter information provided form speech coder. More specially, the proposed adaptive echo canceller utilizes the excitation signal or linearly predicted error signal instead of output speech signal of vocoder as the input signal for adaptation algorithm. The normalized least mean ssquare(NLMS) algorithm is used for the adaptive echo canceller. The proposed algorithm showed a fast convergece charactersitcis in the sinulatio compared to the conventional method. Specially, the proposed echo canceller utilizing the excitation signal of speech coder showed about four times fast convergence speed over the echo canceller utilizing the output speech signal of the speech coder for the adaptation input.
PDF

Transcoding Algorithm from 8 kbps G.729A to 5.3 kbps G.723.1 (8 kbps G.729A에서 5.3 kbps G.723.1로의 상호부호화 알고리듬)

윤성완;정성교;박영철;윤대희
- Proceedings of the IEEK Conference
- /
- 2000.09a
- /
- pp.823-826
- /
- 2000
유/무선 통신 시스템에서는 통신망마다 각각 다른 음성 부호화기를 사용하므로 음성신호는 두 번의 부/복호화 과정을 거치게 된다. 이로 인해 음질저하, 계산량 증가, 그리고 전달 지연 증가 등의 문제가 발생된다. 본 논문에서는 위의 문제점들을 개선하기 위하여 패킷 음성통신과 무선 이동 통신에 사용되는 음성 부호화기의 상호부호화를 위한 알고리듬을 제안한다 효율적인 음성 패킷 변환 방법을 제안하였으며, 8 kbps G.729A 패킷을 5.3 kbps G.723.1 패킷으로 변환하는 방법을 제안한다. 제안된 음성 패킷 변환 방법은 LSP 변환과정, 적응코드북 변환과정 그리고 고정 코드북 고속 탐색 과정으로 구성된다. 여러 가지 음성 신호로 모의 실험한 결과, 본 논문에서 제안된 상호부호화 알고리듬이 두 번의 부/복호화 과정을 거친 경우보다 짧은 전달 지연 시간과 적은 계산량으로 동등한 음질의 음성신호로 복호화함을 확인하였다.
PDF

A Loglet Analysis of Voice and Data Service Diffusion Pattern (Loglet 분석을 이용한 음성 및 데이터 서비스의 수요 확산 패턴 차이)

김문수
- Proceedings of the Korean Operations and Management Science Society Conference
- /
- 2000.04a
- /
- pp.69-73
- /
- 2000
정보통신기술의 역사는 다른 산업 기술에 비해 매우 일천하다. 그러나 현재 가장 빠르게 진보하고 있는 기술이며, 기업활동과 개인의 일상 생활에 커다란 영향 요소로 대두되고 있다. 특히 인터넷의 영향은 지대하다. 인터넷을 이용하여 기업의 생산성을 증대하거나 전자 상거래와 같은 새로운 형태의 사업 기회 제공의 장이 되고 있다. 또한 개인은 매우 다양하고 방대한 정보를 획득, 이용함으로써 자신의 효용을 극대화할 수 있다. 이는 사회, 경제의 새로운 패러다임의 출현으로까지 표현되고 있다. 따라서 과거의 음성통신 서비스 수요와 현재 및 미래의 데이터 통신 수요의 패턴에는 많은 차이가 존재할 수 있다. 본 논문은 대표적 음성 서비스인 전화 서비스 그리고 데이터 서비스라 할 수 있는 인터넷 서비스를 대상으로 수요 속성별 즉, 업무용과 가정용 수요의 확산 패턴을 Logier 분석을 이용하여 고찰하였다. 분석 결과 전체적으로 음성보다는 데이터 수요 확산 속도가 컸으며, 수요 속성별로는 데이터 서비스에서 업무용보다 가정용확산이 음성의 경우보다 훨씬 빠르게 이루어지고 있었다. 그리고 인터넷 가입에 대한 여러 결과를 얻었으며, 이는 정보통신관련 기업과 정책 당국자에게 매우 중요한 자료로 활용할 수 있을 것으로 기대된다.
PDF

별정통신의 사업성 및 전망

Choe, Hung-Sik
- 정보화사회
- /
- s.120
- /
- pp.30-35
- /
- 1997
별정통신사업이란 기간통신사업자의 전기통신회선설비 도는 기간통신역무를 이용하여 기간통신역무를 하는 사업이며, 구내에 전기통신설비를 설치 또는 이를 이용하여 구내에서 전기통신역무를 제공하는 사업이다. 기간통신사업자, 부가통신사업자와 함께 틈새형 시장을 활성화시킬 수 있다. WTO기본통신협상에 의거 98년 부터 재판매 허용되는데, 음성 공전공의 경우 99년 49%, 2001년 100% 외국인 지분을 허용하며, 음성재판매는 98년부터 허용된다.
PDF

Performance Evaluation of Speech Coder for Digital Mobile Communication System in Radio Channel Environment (무선 채널 환경에서 디지털 이동통신용 음성 부호화기의 성능 평가)

김형중;윤병식;최송인
- Journal of the Korea Institute of Information and Communication Engineering
- /
- v.1 no.1
- /
- pp.77-83
- /
- 1997
In this paper, we present a comparison between QCELP(Qualcomm Code Excited Linear Predictor) speech coder that is operating in digital mobile communication system and CS-ACELP(Conjugate Structure Algebraic Code Excited Linear Prediction) speech coder that is scheduled to use for IMT-2000 (International Mobile Telecommunications 2000) system. The performance comparison might give help to design of the speech coding algorithms so that the robustness of the algorithms to channel errors engaged by mobile communication system be optimized.
PDF

Implementation of a Secure and Flexible Peer-to-Peer VoIP Service (보안성과 유연성을 갖는 피어-투-피어 인터넷 음성 통신 서비스의 구현)

Lee, Ju-Ho;Jeong, Choong-Kyo
- Proceedings of the Korean Information Science Society Conference
- /
- 2006.10d
- /
- pp.466-471
- /
- 2006
중앙 집중형 음성 통신 시스템이 확장성, 신뢰성, 그리고 초기 비용의 문제를 가짐에 따라, 분산 아키텍쳐 기반의 피어 투 피어 음성 통신 서비스를 실현하기 위한 연구가 최근 활발히 이루어지고 있다. 그러나 대부분의 연구들은 완전 분산 시스템을 구현하지 못하고 사용자의 인증 및 보안 기능을 위해 중앙의 서버에 일부 의존하는 형태를 취하고 있다. 이러한 형태로 구현된 서비스는 완화되기는 했지만 확장성, 신뢰성, 초기 비용 등의 문제를 그대로 가지고 있으며 또 다양한 서비스로 유연하게 확장하기가 쉽지 않다. 이 연구에서는 사용자 인증 및 보안 기능까지도 완전한 분산 형태로 구현할 수 있는 피어 투 피어 음성 통신 서비스의 구조를 제안하고 구현 사례를 보였다. 또 제안된 서비스 구조가 유연한 확장성과 발전성을 갖는다는 것을 보이기 위해 웹 서비스와의 연동을 통한 확장된 서비스 사례를 보였다. 추가적으로 우리의 제안 구조가 기존의 중앙 집중형 음성 통신 시스템과 호환성을 갖출 수 있도록 하는 방안도 제시한다.
PDF

The Design and Implementation of Personal Audio Recorder Service (개인 오디오 레코더 서비스 설계 및 구현)

Kim, Do-Hyung;Yun, Min-Hong;Kim, Sun-ja;Lee, Kyung-Hee
- Proceedings of the Korea Information Processing Society Conference
- /
- 2007.11a
- /
- pp.727-728
- /
- 2007
본 논문에서는 음성통화를 위해 CDMA 네트워크와 데이터 통신을 위해 와이브로 네트워크를 동시에 사용하는 임베디드 리눅스 기반 듀얼모드 응용 서비스인 개인 오디오 레코더의 구현에 대해서 기술한다. 개인 오디오 레코더는 듀얼모드 지원 단말에 탑재된 클라이언트에서 음성 녹음을 시작하면, 송신자와 수신자의 CDMA 음성 데이터가 와이브로 네트워크를 통해 인터넷 상의 개인 오디오 레코더 서버로 전달된다. 개인 오디오 레코더 서버는 통화 번호 및 통화 시간에 따라 음성 데이터를 저장하게 된다. 구현된 개인 오디오 레코더는 단말의 저장공간이 부족한 환경에서도 음성통화 내용을 저장할 수 있도록 한다.
https://doi.org/10.3745/PKIPS.y2007m11a.727 인용 PDF

Search Result 2,204, Processing Time 0.033 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)