• 제목/요약/키워드: 음성다중

검색결과 350건 처리시간 0.023초

ATM 통신망에서의 지연 및 손실 우선순위를 갖는 다중화 알고리즘의 성능 평가 (Performance Evaluation of Multiplexing Algorithms with Both Delay and Loss Priorities in ATM Networks)

  • 전용희
    • 한국통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.842-856
    • /
    • 1994
  • 광대역 종합정보 통신망 (B-ISDN)이 수용할 여러 서비스들은 다양한 지연, 지연 변화 및 셀 손실 확률 요구 사항을 가지고 있다. B-ISDN을 위한 적절한 제어 방법의 설계는 매우 중요하고 어려운 문제이다. 본 논문에서는, 그러한 다양한 요구사항을 만족하기 위하여, 지연 및 손실 우선 순위 모두를 가진 다종화 알고리즘을 제안한다. 손실 우선 순위의 구현을 위하여, 음성 셀은 폐기 불가한 셀(즉, 높은 우선 순위의 셀) 및 폐기 가능한 셀(즉, 낮은 우선 순위의 셀)로 생성됨을 가정하였다. 낮은 순위의 음성셀은 통신망내에서 혼잡이 발생하면 폐기될 수 있다. 본 셀 탈락 방법은 음성 및 데이터의 지연뿐만 아니라 셀 손실도 감소 시키는 것을 보여주고 있다. 이러한 부하 감소 방법은 광대역 종합정보 통신망의 이용율을 크게 개선 시킬 수 있을 것으로 기대된다.

  • PDF

IMM 기반 특징 보상 기법과 불확실성 디코딩의 결합 (Incorporation of IMM-based Feature Compensation and Uncertainty Decoding)

  • 강신재;한창우;권기수;김남수
    • 한국통신학회논문지
    • /
    • 제37권6C호
    • /
    • pp.492-496
    • /
    • 2012
  • 본 논문은 잡음이 많이 존재할 경우 특징 보상 기법들의 불완전한 추정 방법으로 인하여 발생할 수 있는 불확실성 정보를 음성 인식의 디코딩에 반영해 줌으로써 좀 더 인식 성능을 향상시킬 수 있는 방법에 대한 연구이다. 기존의 특징 보상 기법들은 현재 시간에서의 깨끗한 특징 파라미터를 추정하는 단일점 추정 기법들이 대부분이다. 하지만 낮은 SNR 환경에서의 잘못된 추정 파라미터들이 음성 인식 엔진의 입력으로 사용될 경우 성능이 저하되기 때문에 추정된 파라미터의 불확실성 정보를 이용하여 디코딩을 해주면 추정 오류를 보완해줄 수 있다. 본 논문에서는 대표적인 Aurora-2 DB를 활용하여 적용된 기법의 성능 향상을 확인한다.

멀티채널 오디오 (MPEG-2) 부호화 기술 (Multi-Channel Audio Coding Technologies)

  • 홍진우
    • 전자통신동향분석
    • /
    • 제10권3호통권37호
    • /
    • pp.15-27
    • /
    • 1995
  • 멀티미디어에서 비디오의 품질이 향상되고, 디지털 텔레비젼 (ADTV)이나 고선명 텔레비젼(HDTV) 등의 개발에 의해 화면 크기가 증가하면서 이에 어울리는 실감있는 오디오의 전송 및 재생이 요구된다. 따라서 멀티채널 오디오의 도입과 더불어 효율적이고, 경제적인 방법으로 낮은 비트율로 고품질의 멀티채널 오디오를 제공하기 위한 부호화 기술이 필요하게 된다. 최근에 인간의 청각 특성을 고려한 심리음향 모델을 이용한 멀티채널 오디오의 압축 부호화 기술이 MPEG-2 오디오의 국제 표준으로 제정되었다. MPEG-2 오디오 표준은 MPEG-1 오디오 표준을 기초로 하여 현장감을 필요로 하는 오디오를 위해 기본 스테레오 채널외에 중앙채널, 서라운드 채널, 그리고 저주파 효과채널을 부가한 방식으로 다채널, 음성다중 등의 부가서비스를 제공하기에 적합하다. 본고에서는 MPEG-2 오디오 표준의 계층 II를 중심으로 한 표준의 특징, 알고리즘, 데이터 구조, 그리고 응용분야 등에 대해 기술한다.

변형된 Wavelet 변환을 이용한 한국어 숫자음 인식에 관한 연구 (Isolated Korean Digits Recognition Using Modified Wavelet Transform)

  • 지상문
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.113-116
    • /
    • 1993
  • 본 논문에서는 변형된 wavelet 변환을 통해 추출한 특징벡터를 이용하여 한국어 숫자음을 대상으로 한 음성인식기를 구현하였다. wavelet 변환은 시간 및 주파수 영역에 대해 다중해상도(multiresolution)를 가지는 신호분석법이다. 본 연구에서는 계산량의 감소와 넓은 주파수 대역을 분석하기 위해, mother wavelet의 형태를 분석 주파수 대역에 따라 변화시키는 방법을 제안하였다. 기존의 wavelet 변환으로 실험한 결과 86.5%의 인식율을 얻었고, 변형된 wavelet 변환의 경우 96%의 인식율을 얻었으며 계산량이 감소하였다. 이와 함께 음성인식에서 널리 사용되는 특징 파라미터인 멜켑스트럼과 FFT 멜스케일 필터 대역(mel scale filter bank)과 비교 실험한 결과 인식율의 향상을 보였다. 이는 제안한 방법이 고주파 대역의 세밀한 시간 해상도와 저주파 대역의 세밀한 주파수 해상도를 지니는데 기인하는 것으로 판단된다.

  • PDF

딥러닝 분산처리 기술동향 (Trends on Distributed Frameworks for Deep Learning)

  • 안신영;박유미;임은지;최완
    • 전자통신동향분석
    • /
    • 제31권3호
    • /
    • pp.131-141
    • /
    • 2016
  • 최근 알파고를 통해 인공지능 기술이 전 세계인의 이목을 집중시켰던 반면, 인공지능 연구자들은 인공지능 부활에 결정적 역할을 한 딥러닝 기술에 주목하고 있다. 딥러닝은 다계층 인공신경망 기반의 기계학습 기술로서 최근 컴퓨터 비전, 음성인식, 자연어 처리 분야에서 인식 성능을 높이는 데 중요한 역할을 하고 있다. 딥러닝 기술을 이용하여 기계가 수천만장의 이미지를 학습하여 객체를 인식하게 하고, 수천 시간의 음성 데이터를 학습하여 사람의 말을 알아듣게 처리하는 데에는 다수의 고성능 컴퓨터가 필요하다. 따라서 딥러닝에는 다수의 컴퓨터를 효율적으로 이용하기 위한 분산처리 기술이 필수적이며 관련 연구들이 활발히 진행되고 있다. 이에 본고는 다중 컴퓨터 노드들에서 딥러닝 모델을 분산처리할 수 있는 기존의 프레임워크들을 비교 분석하고 딥러닝 분산처리 기술에 대한 발전 방향을 전망한다.

  • PDF

셀룰러 시스템에서 이동멀티미디어 서비스지원을 위한 CDMA R-ALOHA의 성능분석 (A CDMA Reservation ALOHA Protocol for Mobile Multimedia Integrated Cellular Systems)

  • 허경;김수원;엄두섭;차균현
    • 한국통신학회논문지
    • /
    • 제25권11A호
    • /
    • pp.1630-1641
    • /
    • 2000
  • 본 논문은 셀룰러 시스템 상향 링크에서 음성데이터 및 실시간 영상데이터로 구성된 화상전화서비스, 고속 및 저속 데이터베이스의 다중 전송률 멀티미디어 서비스를 통합 지원할수 있는 CDMA R-ALOHA 프로토콜을 제안하였다. 제안된 프로토콜은 액세스슬롯과 전송슬롯으로 구분된 프레임의 구조를 이용한 코드할당 방식으로 전송슬롯에서의 간섭을 줄였다. 그리고, 각 서비스의 트래픽 특성에 따른 전송코드 예약과 화상전화서비스 사용자의 핸드오프호를 고려하여 분석된 각 서비스 부시스템의 Markov-chain 모델을 이용한 각 서비스의 채널 경쟁 사용자수 추정을 기반으로 서비스별 액세스 허용확률을 제안하여, 액세스슬롯에서의 패킷 충돌을 감소시키고 핸드오프호의 우선권을 보장할 수있다. 또한 화상전화서비스의 영상데이터 전송정보를 이용한 코드 예약방식을 제안하여, 음성 트래픽을 패킷의 손실이 없이 지원하였고 고속 및 저속 데이터베이스를 통해 채널 이용효율을 극대화하였다.

  • PDF

화자 확인을 위한 다중대역에 기반한 주성분 분석 공분산 모델 (PCA Covariance Model Based on Multiband for Speaker Verification)

  • 최민정;이윤정;서창우
    • 음성과학
    • /
    • 제14권2호
    • /
    • pp.127-135
    • /
    • 2007
  • Feature vectors of speech are generally extracted from whole frequency domain. The inherent character of a speaker is located in the low band or high band frequency. However, if the speech is corrupted by narrowband noise with concentrated energy, speaker verification performance is reduced as the individual characteristic is removed. In this paper, we propose a PCA Covariance Model based on the multiband to extract the robust feature vectors against the narrowband noise. First, we divide the overall frequency band into several subbands. Second, the correlation of feature vectors extracted independently from each subband is removed by PCA. The distance obtained from each subband has different distribution. To normalize against the different distribution, we moved the value into the normalized distribution through the mapping function. Finally, the represented value applying the weighting function is used for speaker verification. In the experiments, the proposed method shows better performance of the speaker verification and reduces the computation.

  • PDF

인터넷전화 도입을 위한 기술 및 시장의 주요 이슈

  • 이인화;박종계
    • 정보와 통신
    • /
    • 제21권4호
    • /
    • pp.29-38
    • /
    • 2004
  • VoIP(Voice Over IP) 기술은 인터넷 망 계층 프로토콜인 IP(Internet Protocol) 상에서 데이터 뿐만 아니라 음성 서비스를 동시에 제공할 수 있도록 지원하는 기능 이외에 멀티미디어와 각종 부가서비스를 제공할 수 있는 기술이다. 음성망과 데이터합이 어떤 형태로든 수렴, 통합하는 방향으로 진화될 것이라는 사실에는 대부분의 사람들이 이견이 없으며, 이러한 통합망에서의 가장 중요한 기술의 하나라고 인식되고 있다. VoIP 관련 표준화는 IETF와 ITU-T에서 진행되고 있으며 ITU-T는 H.323 시스템을 기반으로 하여 각종 표준을 제정하고 있으며 IETF에서는 SIP를 중심으로 표준화를 진행하고 있다. 현재 VoIP 기술에 초점이 되고 있는 주요 이슈는 데이터를 위해 최적인 패킷망을 통해 이용자의 요구를 충분히 만족시킬 수 있는 통화품질 보장 여부이다. 패킷화된 다중서비스망의 성공을 보장하기 위해서는 기존의 PSTN망과 동등한 수준의 품질을 제공하여야 한다. 본 고에서는 이러한 VoIP의 기술 동향, 시장 및 사용자 요구사항 분석, 최근의 VoIP의 이슈에 대해서 살펴보고자 한다.(중략)

USB 다중 신호 전송 시스템 (The USB Multi-signal Transmission System)

  • 채정식;김아용;정회경
    • 한국정보통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1330-1335
    • /
    • 2013
  • 최근 컴퓨터에서 DVI(Digital Visual Interface), 오디오, 비디오, USB(Universal Serial Bus), 랜(LAN) 등의 다양한 신호를 동시에 전송할 필요성이 요구됨에 따라 케이블이 복잡해지고 확장성 등의 문제점이 제기 되고 있다. 이에, 본 논문에서는 하나의 USB 케이블을 이용하여 컴퓨터의 영상, 음성, USB, 랜 등의 신호를 분배 할 수 있는 하나의 USB 다중 신호 전송 시스템을 설계 및 구현하였다. 따라서, USB 다중 신호 전송을 위해 단일 USB 신호를 DVI, 오디오, 다중 USB, 랜으로 변환하는 변환기 모듈들을 구현하였다. 이는 USB 방식으로 DVI 포트를 지원하며, 최대 1920 * 1080 해상도를 지원한다. USB 다중 신호 전송 시스템은 하나의 케이블로 다수의 신호를 전송하여 각종 케이블의 설치 비용이 절감되고, 화면 복제 기능을 이용하여 학교 및 학원 등에서 강의 편의 제공 및 컴퓨터 주변 포트의 확장성을 제공할 것이다.

다중 태그 인식 기반의 신뢰성 있는 데이터 수집 환경 (A Reliable Data Capture in Multi-Reader RFID Environments)

  • 이영란
    • 한국산학기술학회논문지
    • /
    • 제12권9호
    • /
    • pp.4133-4137
    • /
    • 2011
  • 신뢰성 있는 다중태그 인식은 최근 다중태그 애플리케이션 이슈 중의 하나이다. 하지만, 데이터 확보 단계에서 다중태그 리더를 통한 신뢰성 있는 다중태그 인식은 리더간의 충돌, 소음, 태그가 부착된 물건들의 이동 등으로 발생하는 거짓양성인식, 거짓음성인식, 비 인식같은 신뢰성 없는 인식으로 인하여 신뢰서 있는 데이터를 확보하는데 어려움을 겪고 있다. 따라서 본 논문은 다중태그 리더를 통한 인식에서 발생되는 이러한 문제점들을 해결하기 위하여 먼저 성능평가 기준을 소개하고, 1) 수신된 신호 강도 표시기 (RSSI)을 이용한 최소 중첩인식공간 설정방식, 2)시-공간 분할 처리방식, 3) 큰 사이즈의 이중 태그 부착 방식등과 같은 3가지 해결방안을 제시하였다. 그리고 본 논문은 멀티 RFID 리더가 설치된 스마트 사무실에서 태그의 성공 인식률 계산을 통하여 제안된 방법의 성능개선을 보여주었다.