• 제목/요약/키워드: 음성다중

검색결과 350건 처리시간 0.026초

PoC Box 단말의 RTSP 운용을 위한 사용자 요구 중심의 효율적인 다중 수신 버퍼링 기법 및 패킷화 방법에 대한 성능 분석에 관한 연구 (A Study of Performance Analysis on Effective Multiple Buffering and Packetizing Method of Multimedia Data for User-Demand Oriented RTSP Based Transmissions Between the PoC Box and a Terminal)

  • 방지웅;김대원
    • 한국멀티미디어학회논문지
    • /
    • 제14권1호
    • /
    • pp.54-75
    • /
    • 2011
  • PoC(Push-to-talk Over Cellular)는 그룹 음성 및 영상 통화와 인터넷, 멀티미디어 서비스를 통합한 단말 기술이다. PoC는 부재, 긴급 상황, 배터리 방전 등과 같은 다양한 이유로 인해 PoC 세션에 참여하지 못하는 사용자에게 종래 MMS 서비스에서의 MM Box와 비슷한 기능을 가진 PoC Box를 사용하는 기능을 제공하고 있다. PoC 표준안에서는 PoC Box에서 PoC 단말로 미디어 전송 시 RTSP (Real-Time Streaming Protocol)를 사용하도록 권장하고 있다. 기존의 RTSP를 적용한 VOD 서비스의 경우는 빠른 유선 네트워크 망을 고려하여 패킷의 크기를 크게 구현하는 반면 PoC 서비스는 무선 통신 환경이기 때문에 이러한 특성을 고려한 RTSP 전송 방법이 필요하다. 무선 통신 환경에서는 패킷의 손실률이 비교적 유선 통신 환경에서보다 다소 높기 때문에 PoC 단말 측에서 미디어 재생 시 화면 끊김 현상, 영상과 음성의 비동기화 발생, 버퍼링 대기 시간 등이 발생한다. 따라서 PoC 단말 측에서의 이러한 문제점은 사용자가 미디어 콘텐츠를 재생하는데 있어 자신이 원하는 정보를 빠르게 습득하기 어렵게 만든다. 본 논문에서는 RTSP를 이용하여 사용자가 미디어 검색 시 단시간 내에 전송되는 미디어에서 효과적으로 중요한 정보를 습득하고 재생 지연 현상을 줄일 수 있는 "교차 이중 수신 버퍼링 기법", "사전 분할 다중 수신 버퍼링 기법", "On-Demand 다중 수신 버퍼링 기법"과 전송 시 미디어 데이터의 패킷화 방법인 "동일 순위 패킷화 전송 방식", "우선 순위 패킷화 전송 방식"을 제안하였고 실험을 통해 그 성능의 적정성 및 우수성을 검증하였다. 실시된 시뮬레이션 성능 평가에서 사용자의 미디어 검색 성향에 따라 제안된 다중 수신 버퍼링 및 패킷화 방식이 기존 단일 수신 버퍼링 방식과 비교하여 효율성 및 우수성 평가에서 6-9점 이상 우수한 결과를 보였다. 그 중 On-Demand 다중 수신 버퍼링 기법은 동일순위 패킷화 방법과 사용될 때 타 기법과 비교하여 3-24점 사이의 우수성을 보임으로써 사용자의 다양한 미디어 검색 성향에 대해 빠르게 대응할 수 있었다. 또한 단시간 내에 사용자가 집중적으로 미디어 검색이 이루어지는 재생 시간대에 대해 많은 미디어 데이터를 수신 받기 때문에 단말 사용자에게 빠른 정보를 제공할 수 있었다.

단일 레이블 분류를 이용한 종단 간 화자 분할 시스템 성능 향상에 관한 연구 (A study on end-to-end speaker diarization system using single-label classification)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.536-543
    • /
    • 2023
  • 다수의 화자가 존재하는 음성에서 "누가 언제 발화했는가?"에 대해 레이블링하는 화자 분할은 발화 중첩 구간에 대한 레이블링과 화자 분할 모델의 최적화를 위해 심층 신경망 기반의 종단 간 방법에 대해 연구되었다. 대부분 심층 신경망 기반의 종단 간 화자 분할 시스템은 음성의 각 프레임에서 발화한 모든 화자의 레이블들을 추정하는 다중 레이블 분류 문제로 분할을 수행한다. 다중 레이블 기반의 화자 분할 시스템은 임계값을 어떤 값으로 설정하는지에 따라 모델의 성능이 많이 달라진다. 본 논문에서는 임계값 없이 화자 분할을 수행할 수 있도록 단일 레이블 분류를 이용한 화자 분할 시스템에 대해 연구하였다. 제안하는 화자 분할 시스템은 기존의 화자 레이블을 단일 레이블 형태로 변환하여 모델의 출력으로부터 레이블을 바로 추정한다. 훈련에서는 화자 레이블 순열을 고려하기 위해 Permutation Invariant Training(PIT) 손실함수와 교차 엔트로피 손실함수를 조합하여 사용하였다. 또한 심층 구조를 갖는 모델의 효과적인 학습을 위해 화자 분할 모델에 잔차 연결 구조를 추가하였다. 실험은 Librispeech 데이터베이스를 이용해 화자 2명에 대한 시뮬레이션 잡음 데이터를 생성하여 사용하였다. Diarization Error Rate(DER) 성능 평가 지수를 이용해 제안한 방법과 베이스라인 모델을 비교 평가했을 때, 제안한 방법이 임계값 없이 분할이 가능하며, 약 20.7 %만큼 향상된 성능을 보였다.

함정용 멀티미디어 통합통신망을 위한 트래픽 및 링크용량 예측 (Traffic Consideration and Link Capacity Estimation for Integrated Multimedia Network of The Naval Ship)

  • 이채동;신우섭;김석찬
    • 대한전자공학회논문지TC
    • /
    • 제49권5호
    • /
    • pp.99-106
    • /
    • 2012
  • 함정의 운용 효율성을 높이기 위해서 한국 해군은 음성통신위주의 함내외 통합통신체계(ICS:Integrated Communication System)을 운용해 오고 있으며, 최근에는 음성, 영상, 문자 등이 포함된 멀티미디어 통합통신망에 대한 적용을 고려하고 있다. 본 논문은 함정용 멀티미디어 통합통신망을 구축하기 위한 기초연구로써 한국 해군의 함정 내 여러 통신망 중에서 통합통신망에 적용할 통신망을 구분하고, 구분된 통신망에서 운용중인 멀티미디어 트래픽의 종류 및 특성들을 고찰한다. 아울러 ICS 통신교환기에서의 트래픽 입력소스 수에 따른 링크용량을 예측하기 위해서 트래픽 다중화 모델을 제안하고, 한국 해군의 주요 함정 별 트래픽의 링크용량 산출 및 통합 트래픽을 분석한다.

차세대 패킷광 통합망 관리 및 제어기술 연구 (Management and Control Scheme for Next Generation Packet-Optical Transport Network)

  • 강현중;김현철
    • 융합보안논문지
    • /
    • 제12권1호
    • /
    • pp.35-42
    • /
    • 2012
  • 데이터 트래픽의 증가와 대용량 실시간 서비스와 관련된 요구사항들의 증가는 음성이나 전용선 서비스를 주된 목적으로 하는 기존의 시간분할 다중화(TDM: Time Division Multiplexing) 기반 네트워크에서 좀 더 유연하고 동적인 구성이 가능한 광 네트워크로의 전환을 요구하고 있다. 이러한 광 네트워크는 데이터, 비디오, 그리고 음성을 전달할 수 있는 다수의 채널을 제공하는 핵심 인프라가 되었다. 이를 위해 차세대 패킷광 통합망은 네트워크 이상이 발생하여도 용인할 수 있는 수준의 서비스를 지속적으로 제공할 수 있어야 한다. 또한 신속하고 최적화된 복구(restoration) 정책은 GMPLS(Generalized Multi-Protocol Label Switching) 기반 제어평면을 사용으로 하는 차세대 패킷광 통합망의 가장 중요한 요구사항이 되었다. 본 논문은 GMPLS 기반 다계층 패킷광 통합망에서 신속하고 일원화된 복구를 지원하기 위한 계층적인 다계층 복구방식을 살펴보고 이를 지원하기 위한 구현방식을 제안하는 것을 목적으로 하고 있다. 또한 본 논문에서는 기존의 신호 및 라우팅 프로토콜을 수정하지 않고 제안한 방식을 구현할 수 있는 방안의 제안을 목적으로 하고 있다.

CDMA 2000-1X를 기반으로한 차세대 이동망의 진화 (Evolution of Next Generation Mobile Network Based on CDMA2000-1X Network)

  • 손동철;김재원;류충상
    • 한국전자통신학회논문지
    • /
    • 제1권1호
    • /
    • pp.70-80
    • /
    • 2006
  • 통신 서비스 시장의 패러다임이 유선 음성통신에서 무선의 데이터 통신으로 급속히 확산되고 있다. 이러한 통신시장의 변화를 수용하기 위해서는 고속의 전송속도에 근거한 다양한 서비스 제공과 아울러 인터넷 응용에 기반한 다양한 서비스들이 제공되어 기존의 이동통신망의 제한성을 탈피한 고품질의 이동통신망들의 구성이 요구된다. 이러한 고속통신을 수용하기 위해서는 무선 신호처리 기술, 광대역 전송기술, 첨단 이동통신망 구축 기술이 필수적이며, 효율적인 운용 기술에 의한 가입자 서비스의 수용 또한 요구되어 진다. 디지털 이동통신 시스템의 기반 기술로 활용되어 온 CDMA 다중접속 방식은 음성, SMS, 회선 데이터 서비스를 제공하기 위한 IS-95A/B 시스템 과 3세대 이동통신 시스템의 규격으로 평가받고 있는 동기방식 CDMA2000, 비동기방식 WCDMA 기술 등이 개발되고 있다. 본 논문에서는 CDMA2000-1X 이동통신 시스템의 망 구조 및 특징을 분석하고, 각 서비스 제공 방안 분석을 통하여 차세대 이동통신망에서의 효율적인 망 구성방안의 기초자료로 도출하며, 3세대 이동통신망의 차세대 이동통신망으로의 진화 전략과 아울러 망 진화를 위하여 요구되는 핵심기술 등을 분석하였다.

  • PDF

WPAN시스템에 미치는 WLAN 시스템의 간섭신호 경감을 위한 MAC schedule 기법에 관한 연구 (Study On The MAC Schedule Technique for WPAN system to alleviate the impact of interference in the presence of WLAN system)

  • 김성철
    • 한국정보통신학회논문지
    • /
    • 제19권10호
    • /
    • pp.2263-2268
    • /
    • 2015
  • 본 논문은 멀티미디어 환경하에서 WPAN 시스템에 미치는 WLAN 시스템의 간섭신호 경감을 위한 MAC schedule 기법에 대해 연구한다. 본 연구에서 고려하는 파라미터는 간섭신호평가와 주장치 지연정책을 고려한다. 제안된 스케쥴링 기법은 패킷 전송손실과 다중 슬롯 패킷의 경우 전송지연시간을 감소시키는데 효과적임을 알 수 있었다. 또 다른 장점은 채널 상태가 나쁠 경우 패킷의 전송이 이루어지지 않기 때문에 전송 전력의 낭비를 막을 수 있다는 것이다. 더욱이 다른 장치에 의해 차지하고 있는 채널을 피함으로 인해 같은 주파수 대역을 사용하고 있는 다른 시스템으로의 간섭의 영향을 줄일 수 있었다. 음성 패킷은 고정된 기간에 보내지기 때문에 스케쥴링 정책은 데이터 트래픽에 한하여 적용된다. 그러나 지연분산이 일정하고 한 슬롯내로 제한된다면 음성을 위한 DM패킷에도 적용 가능 할 것이다.

다중 트랙픽 지원을 위한 CDMA 예약 ALOHA 방안의 성능 분석 (Performance Analysis of CDMA Reservation ALOHA for Multi-traffic Services)

  • 조춘근;허경무;이연우;차균현
    • 한국통신학회논문지
    • /
    • 제24권12A호
    • /
    • pp.1852-1861
    • /
    • 1999
  • 본 논문은 음성 그리고 우선권이 있는 연속적인 트래픽 및 우선권이 없는 랜덤 트래픽을 완전 패킷 방식으로 제공할 수 있는 CDMA 예약 ALOHA 방식을 제안한 것으로, 성능에 영향을 미치는 패킷의 충돌과 타사용자 간섭을 최소로 하는 구조로 되어 있다. 제안된 구조에서 시간 슬롯과 패킷은 같은 크기를 갖고 각각 액세스/전송 단계와 액세스/전송 필드로 나누어져 있다. 액세스 단계에서 패킷의 충돌을 줄이기 위해 piggyback을 이용한 예약과 시스템 평형 상태에서 추정한 경쟁 사용자 수를 이용한 액세스 허용 확률을 이용하고, 전송 단계에서의 타사용자 간섭을 줄이기 위해서 액세스 단계에서 기지국으로부터 전송코드를 할당받은 패킷만이 전송 단계에서 전송을 할 수 있게 하였다. 즉, 음성과 우선 순위가 있는 연속적인 트래픽에 대해 예약을 허용하여 실시간 전송을 가능하게 하고, 우선권이 없는 랜덤 트래픽에도 액세스 허용 확률을 적용하여 전송 지연을 줄일 수 있었다. 또한, 단일 셀 환경의 평형 상태에서 Markov 모델링 기법을 이용하여 각 트래픽의 요구하는 성능을 수식적으로 유도하고, 모의실험을 통해 성능을 도시하였다.

  • PDF

다중 웨이브렛을 이용한 음성신호 데이터 압축에 관한 연구 (A Study on the Data Compression of the Voice Signal using Multi Wavelet)

  • 김태형;박재우;윤동한;노석호;조익현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.625-629
    • /
    • 2005
  • 급변하는 정보 및 통신기술의 발달에 따라 멀티미디어 데이터의 효율적인 압축 기술에 관한 심층적 연구 필요성이 더욱 커지고 있다. 본 논문에서는 멀티미디어 신호 중 음성 및 음향 신호 데이터 압축과 관련하여 웨이브렛 기반의 압축 알고리즘 구조를 설계하였다. 2-band 구조와 웨이브렛 packet 구조에서의 압축의 효율성에 대하여 조사하고, 각 구조에서 웨이브렛 기저함수로 Daubechies 웨이브렛 계수와 Coiflet 계수를 사용하여 구조에서의 효율성 및 재생오차를 조사하였다. 최종 압축은 Huffman code를 사용하여 압축율(CR) 및 재생오차(PRD)를 기존의 DCT와 비교분석하였다.

  • PDF

한국어 연속음성인식을 위한 발음사전 구축 (Pronunciation Dictionary For Continuous Speech Recognition)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.197-199
    • /
    • 2000
  • 연속음성인식을 수행하기 위해서는 발음사전과 언어모델이 필요하다. 이 둘 사이에는 디코딩 단위가 일치하여야 하므로 발음사전 구축시 디코딩 단위로 표제어 단위를 선정하며 표제어 사이의 음운변화 현상을 반영한 발음사전을 구축하여야 한다. 한국어에 부합하는 음운변화현상을 분석하여 학습용 자동 발음열을 생성하고, 이를 통하여 발음사전을 구축한다. 전처리 단계로 기호, 단위, 숫자 등 전처리 과정 및 형태소 분석 과정을 수행하며, 디코딩 단위인 의사 형태소 단위를 생성하기 위해 규칙을 이용한 태깅 과정을 거친다. 이를 통해 나온 결과를 발음열 생성기 입력으로 하며, 결과는 학습용 발음열 또는 발음사전 구성을 위한 형태로 출력한다. 표제어간 음운변화 현상이 반영된 상태의 표제어 단위이므로 실제 음운변화가 반영되지 않은 상태의 표제어와는 그 형태가 상이하다. 이는 연속 발음시 생기는 현상으로 실제 인식에는 이 음운변화 현상이 반영된 사전이 필요하게 된다. 생성된 발음사전의 효용성을 확인하기 위해 다음과 같은 실험을 통해 성능을 평가하였다. 음향학습을 위하여 PBS(Phonetically Balanced Sentence) 낭독체 17200문장을 녹음하고 그 전사파일을 사용하여 학습을 수행하였고, 발음사전의 평가를 위하여 이 중 각각 3100문장을 사용하여 다음과 같은 실험을 수행하였다. 형태소 태그정보를 이용하여 표제어간 음운변화 현상을 반영한 최적의 발음사전과 다중 발음사전, 언어학적 기준에 의한 수작업으로 생성한 표준 발음사전, 그리고 표제어간의 음운변화 현상을 고려하지 않고 독립된 단어로 생성한 발음사전과의 비교 실험을 수행하였다. 실험결과 표제어간 음운변화 현상을 반영하지 않은 경우 단어 인식률이 43.21%인 반면 표제어간 음운변화 현상을 반영한 1-Best 사전의 경우 48.99%, Multi 사전의 경우 50.19%로 인식률이 5~6%정도 향상되었음을 볼 수 있었고, 수작업에 의한 표준발음사전의 단어 인식률 45.90% 보다도 약 3~4% 좋은 성능을 보였다.

  • PDF

정보통신 단말기를 위한 한글 모음 입력 시스템 (Hangul Vowel Input System for Electronic Networking Devices)

  • 강승식;한광수
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.507-512
    • /
    • 2005
  • 휴대용 정보통신 단말기에서 한글 입력 방식은 단말기에 부착되어 있는 제한된 버튼만을 이용한다는 제약이 있다. 이 제약 조건 하에서 한글 모음을 편리하고 빠르게 입력할 수 있도록 8개의 기본 모음 집합으로부터 이중 모음을 조합하는 방식을 제안한다. 이 방식은 최대 2타로 모든 모음들이 조합될 수 있어서 신속한 입력이 가능하고, 이중 모음에 대해 사용자들이 익숙한 방법으로 조합될 수 있도록 2가지 이상의 조합 방식을 지원하여 사용자 편의성을 높였다 또한, 양성-음성 모음 간에 빈번하게 발생하는 입력 오류를 쉽게 수정할 수 있도록 양성 모음과 음성 모음이 추가 키 입력으로 전환되는 오류 수정 기능을 추가하였다. 기존의 모음 입력 방식들과 비교했을 때 제안한 방식이 입력의 신속성과 오류 수정의 용이성 등의 관점에서 매우 효율적임을 확인하였다.