• 제목/요약/키워드: Push-To-Talk

검색결과 23건 처리시간 0.023초

음성의 유성음 특성을 이용한 음성/비음성 판별 방법 (A Robust Speech/Non-Speech Decision Using Voiced Characteristics of Speech)

  • 이성주;정호영;이윤근;김형순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.411-412
    • /
    • 2007
  • 자동음성인식 시스템을 이용하는 사용자 입장에서 보면 음성인식시스템을 사용하기 위하여 음성을 입력할 때마다 버튼을 눌러야 하는 Push-To-Talk (PTT) 방식은 여간 번거로운 일이 아닐 수 없다. 그리고 사용자가 원거리에서 음성을 입력하는 경우처럼 PTT 방식 자체가 용이하지 못 한 음성인식 응용분야에서는 Non-Push-To-Talk (NON-PTT) 방식의 필요성이 대두되게 된다. NON-PTT 방식의 음성 전처리를 위해서는 입력신호로부터 음성신호만을 구분해내는 음성판별기술이 필수적이다. 하지만 일상적인 잡음환경에서 음성신호만을 구분해내는 일은 매우 어려운 일이 아닐 수 없다. 본 논문에서는 일상적인 가정잡음환경에 강인한 음성판별방식을 제안한다. 여기서는 음성판별을 위해서 음성의 유성음 특성을 이용하였다. 즉, 일정구간 이상의 음성신호에는 일정구간이상의 유성음 구간이 존재하며 만약 잡음환경에서도 유성음 구간을 잘 검출할 수 있다면 이러한 음성의 특성을 이용하여 검출된 신호가 음성인지 아닌지를 판별할 수 있다. 이를 위하여 여기서는 가정잡음환경에서도 유성음을 잘 검출할 수 있도록 11 가지 유성음 특징들과 이를 이용한 음성판별방법을 제안하였다. 제안된 방법의 성능 평가를 위하여 음성의 끝점검출방법과 통합하여 음성/비음성 판별 테스트를 수행하였으며 테스트 수행결과 열악한 잡음환경에서 80%이상의 비음성을 거절하는 성능을 보였다.

IMS 기반의 PoC 서비스 전개 구현 (An Implementation of IMS Based PoC Service Deployment)

  • 이재오;이홍규
    • 한국산학기술학회논문지
    • /
    • 제16권7호
    • /
    • pp.4878-4883
    • /
    • 2015
  • IMS(IP Multimedia Subsystem)는 전송 및 서비스들로부터 제어 기능들을 분리하도록 설계되었으며, 이러한 구조를 바탕으로 보장된 QoS(Quality of Service) 및 관리 기능을 수행하여 언제 어디서나 인터넷의 콘텐츠 및 텔레컴 서비스들을 접근할 수 있도록 제공하는 프레임워크 이다. SDP(Service Delivery Platform)는 기존 및 신규 서비스들을 효율적인 방법으로 전개하기 위하여 공통의 프로토콜 및 인터페이스를 제공한다. 따라서 IMS 상의 SDP는 응용 서비스들 사이의 상호작용을 단순화하여 수행할 수 있으며, 이러한 인터페이스를 통하여 기 구축된 네트워크와 신규 IMS 네트워크 사이에서 교량 역할을 수행한다. 멀티미디어 네트워크 통신을 풍부하도록 구축하기 위하여, 모바일 네트워크상에서 전개될 수 있는 후보 서비스들 가운데 대표적이며 독특한 반 이중 방식의 VoIP(Voice Over IP) 응용 서비스로 고려되는 PoC(Push-to-talk over Cellular) 서비스를 전개하려 한다. 본 논문에서는 PoC 서비스 및 구조의 장점을 조사하고, PoC 서비스 전개를 통한 실행을 통한 가능성 및 실현을 확인하기 위하여 프로토타입(prototype)을 구축하는 실질적 구현에 집중하였다.

이종 기기 간 음성통신을 위한 자동전환장치의 구현 (Implementation of the automatic switching device for the voice communications between heterogeneous devices)

  • 류창국;이배호
    • 한국전자통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.1321-1328
    • /
    • 2015
  • 무전기의 음성통신은 PTT(: Push To Talk)를 이용한 반이중(half-duplex) 방식으로, 송신 시 단일 통화선로를 점유한다. 전화와 무전기간, UHF와 VHF 간의 인터페이스와 같이 서로 다른 이종 장치 간 음성통신을 위해서는 두 장치간의 자동전환장치가 요구되고, 이 장치는 입력 신호로부터 전송해야 할 음성을 검출하는 음성전환장치의 성능에 따라 전송되는 음성신호의 손실여부에 많은 영향을 받는다. 기존방식은 단순 입력신호의 크기 즉, 에너지 레벨을 통해 기준을 정함으로써 잡음에도 반응하는 문제점을 지니고 있다. 본 논문에서는 음성신호처리기법을 이용하여 입력된 신호가 음성임을 판별함으로써, 이종 기기 사이의 음성을 자동으로 전달하는 장치를 구현하였다. 이를 통해 음성 자동전환장치의 성능향상을 확인하였고, 이종 기기 간 음성 손실 없는 전송을 수행할 수 있었다.

Codec 2를 이용한 900MHz ISM대역에서의 음성 통신 성능 검토 (Voice Communication Performance in 900MHz ISM Band Using Codec2)

  • 김경진;김정욱
    • 한국산업정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.59-66
    • /
    • 2018
  • 본 논문에서는 오픈소스 프로젝트를 표방하는 디지털 아마추어 무선용 저속 음성 코덱인 Codec 2와 900MHz FSK 트랜시버를 이용하여 PTT(Push to talk) 양방향 무전기를 구현하고, 장거리 음성통신이 가능한지 여부를 실험했다. 일반 디지털 무전기의 경우, 성능 면에서 업계 표준으로 인정되고 있는 AMBE+2 코덱을 사용하는데, 가격이 고가이며 기술의 독점성을 가지고 있다. 주파수 측면에서 보면 400MHz 대역을 사용하는 경우, DMR 12.5kHz, DPMR 6.25kHz의 협대역을 사용하기 때문에 데이터 전송률이 낮다. 900MHz 대역은 대역폭을 확장할 수 있어서 데이터 전송 측면에서도 장점이 있다. 음질 및 통달 거리에 대한 필드 테스트를 진행한 결과, 약 500m 내에서 통신이 이루어지는 것을 확인할 수 있었다. 본 논문에서는 음성통신에 대한 검토가 이루어졌지만, 간단한 이미지와 같은 데이터 전송에 대한 검토가 추가된다면, 이 솔루션이 저가형 IOT 생활 무전기로서 다양한 분야에 활용할 수 있을 것으로 판단된다.

Application of Virtual Studio Technology and Digital Human Monocular Motion Capture Technology -Based on <Beast Town> as an Example-

  • YuanZi Sang;KiHong Kim;JuneSok Lee;JiChu Tang;GaoHe Zhang;ZhengRan Liu;QianRu Liu;ShiJie Sun;YuTing Wang;KaiXing Wang
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제16권1호
    • /
    • pp.106-123
    • /
    • 2024
  • This article takes the talk show "Beast Town" as an example to introduce the overall technical solution, technical difficulties and countermeasures for the combination of cartoon virtual characters and virtual studio technology, providing reference and experience for the multi-scenario application of digital humans. Compared with the live broadcast that combines reality and reality, we have further upgraded our virtual production technology and digital human-driven technology, adopted industry-leading real-time virtual production technology and monocular camera driving technology, and launched a virtual cartoon character talk show - "Beast Town" to achieve real Perfectly combined with virtuality, it further enhances program immersion and audio-visual experience, and expands infinite boundaries for virtual manufacturing. In the talk show, motion capture shooting technology is used for final picture synthesis. The virtual scene needs to present dynamic effects, and at the same time realize the driving of the digital human and the movement with the push, pull and pan of the overall picture. This puts forward very high requirements for multi-party data synchronization, real-time driving of digital people, and synthetic picture rendering. We focus on issues such as virtual and real data docking and monocular camera motion capture effects. We combine camera outward tracking, multi-scene picture perspective, multi-machine rendering and other solutions to effectively solve picture linkage and rendering quality problems in a deeply immersive space environment. , presenting users with visual effects of linkage between digital people and live guests.

VHF 광대역 수신 증폭기 시스템 설계 (Design of Wide Band Receiving Amplifier System for VHF)

  • 김갑기
    • 한국정보통신학회논문지
    • /
    • 제9권4호
    • /
    • pp.839-843
    • /
    • 2005
  • 본 논문에서는 VHF 송수신기 셋트에 쉽게 장착할 수 있는 해상용 광대역 수신증폭기를 소형 경량, 저비용으로 제작하여 전반적인 수신기의 수신성능을 개선하고자 한다. 제작된 수신 증폭기는 140MHz $\~$ 170MHz 주파수 대역에서 3dBm 정도의 수신감도를 개선하는 특성을 나타내었다. 따라서 VHF대역을 이용하는 통신장비를 더욱 효율적으로 사용가능하며, 양질의 원거리통신이 가능하기 때문에 활용도가 매우 높을 것으로 사료된다.

재난 통신 및 네트워크 기술 및 발전 방향

  • 남상준;한동혁;정종문
    • 정보와 통신
    • /
    • 제29권5호
    • /
    • pp.3-9
    • /
    • 2012
  • 본 논문에서는 재난 통신 및 네트워크 기술 그리고 앞으로의 발전 방향에 대해서 소개 하고자 한다. 제 1장에서는 주요 공공재난안전통신 기술들을 소개한다. 특히 동적 그룹통신기술(Push-To-Talk), 망 복구 및 생존성 향상 기술, 긴급호 구현 기술을 소개하며 또한 재난통신기술 표준화 필요성에 대해서 간단히 설명한다. 제 2장에서는 국내외 재난통신기술 동향을 살펴본다. 특히 미국, 유럽, 아시아에서 사용하는 주파수 대역 및 협대역 및 준광대역 주파수 공용 무선통신 기술인 TETRA(Terrestrial Trunked Radio), iDEN(Integrated Digital Enhanced Network) 및 APCO-P25(Association of Public Safety Communications Officials - Project 25)에 대해서 다룬다. 제 3장에서는 재난대비 미래 광대역 통신체계에 대해서 설명하며 마지막으로 제 4장에서는 본 논문의 결론을 맺는다.

CSCF 노드 관리를 이용한 응용 서비스 구현 (The Implementation of Application Services Using CSCFs of Management)

  • 이재오;조재형
    • 인터넷정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.33-40
    • /
    • 2012
  • 최근 네트워크간의 통합으로 인하여 네트워크 통합 관리 시스템 중 하나인 IMS (IP Multimedia Subsystem)의 사용이 증가하고, 이로 인해 네트워크 트래픽이 증가하고 있다. 따라서 IMS에서의 자원을 효율적으로 관리하기 위하여 네크워크 관리 시스템의 기능이 점차 커지고 있다. 특히 IMS 노드에 트래픽은 유동적이기 때문에 이것을 효과적으로 관리하기 위해서는 적절한 동적 라우팅 구조가 필요하다. 따라서 본 논문에서는 IMS 노드간의 트래픽을 제어하기위한 동적 알고리즘 구조를 제안하고, IMS의 대표적인 응용서비스인 Presence Service와 PoC (Push to talk over Cellular)를 이용하여 본 알고리즘의 성능을 측정한다.

PoC Box 단말의 RTSP 운용을 위한 사용자 요구 중심의 효율적인 다중 수신 버퍼링 기법 및 패킷화 방법에 대한 성능 분석에 관한 연구 (A Study of Performance Analysis on Effective Multiple Buffering and Packetizing Method of Multimedia Data for User-Demand Oriented RTSP Based Transmissions Between the PoC Box and a Terminal)

  • 방지웅;김대원
    • 한국멀티미디어학회논문지
    • /
    • 제14권1호
    • /
    • pp.54-75
    • /
    • 2011
  • PoC(Push-to-talk Over Cellular)는 그룹 음성 및 영상 통화와 인터넷, 멀티미디어 서비스를 통합한 단말 기술이다. PoC는 부재, 긴급 상황, 배터리 방전 등과 같은 다양한 이유로 인해 PoC 세션에 참여하지 못하는 사용자에게 종래 MMS 서비스에서의 MM Box와 비슷한 기능을 가진 PoC Box를 사용하는 기능을 제공하고 있다. PoC 표준안에서는 PoC Box에서 PoC 단말로 미디어 전송 시 RTSP (Real-Time Streaming Protocol)를 사용하도록 권장하고 있다. 기존의 RTSP를 적용한 VOD 서비스의 경우는 빠른 유선 네트워크 망을 고려하여 패킷의 크기를 크게 구현하는 반면 PoC 서비스는 무선 통신 환경이기 때문에 이러한 특성을 고려한 RTSP 전송 방법이 필요하다. 무선 통신 환경에서는 패킷의 손실률이 비교적 유선 통신 환경에서보다 다소 높기 때문에 PoC 단말 측에서 미디어 재생 시 화면 끊김 현상, 영상과 음성의 비동기화 발생, 버퍼링 대기 시간 등이 발생한다. 따라서 PoC 단말 측에서의 이러한 문제점은 사용자가 미디어 콘텐츠를 재생하는데 있어 자신이 원하는 정보를 빠르게 습득하기 어렵게 만든다. 본 논문에서는 RTSP를 이용하여 사용자가 미디어 검색 시 단시간 내에 전송되는 미디어에서 효과적으로 중요한 정보를 습득하고 재생 지연 현상을 줄일 수 있는 "교차 이중 수신 버퍼링 기법", "사전 분할 다중 수신 버퍼링 기법", "On-Demand 다중 수신 버퍼링 기법"과 전송 시 미디어 데이터의 패킷화 방법인 "동일 순위 패킷화 전송 방식", "우선 순위 패킷화 전송 방식"을 제안하였고 실험을 통해 그 성능의 적정성 및 우수성을 검증하였다. 실시된 시뮬레이션 성능 평가에서 사용자의 미디어 검색 성향에 따라 제안된 다중 수신 버퍼링 및 패킷화 방식이 기존 단일 수신 버퍼링 방식과 비교하여 효율성 및 우수성 평가에서 6-9점 이상 우수한 결과를 보였다. 그 중 On-Demand 다중 수신 버퍼링 기법은 동일순위 패킷화 방법과 사용될 때 타 기법과 비교하여 3-24점 사이의 우수성을 보임으로써 사용자의 다양한 미디어 검색 성향에 대해 빠르게 대응할 수 있었다. 또한 단시간 내에 사용자가 집중적으로 미디어 검색이 이루어지는 재생 시간대에 대해 많은 미디어 데이터를 수신 받기 때문에 단말 사용자에게 빠른 정보를 제공할 수 있었다.

UHF 대역용 Cartesian Feedback Loop 선형화 칩 설계 (Design of Cartesian Feedback Loop Linearization Chip for UHF Band)

  • 강민수;정영준;오승엽
    • 한국전자파학회논문지
    • /
    • 제21권5호
    • /
    • pp.510-518
    • /
    • 2010
  • 본 논문에서는 UHF 대역(380~910 MHz)의 간이 무선 및 TRS(Trunked Radio System) 단말기에서 이용 가능한 CFL(Cartesian Feedback Loop) 선형화 칩을 Si 기반의 $0.6\;{\mu}m$ BiCMOS 공정을 이용하여 설계 및 제작한 결과를 보였다. 단말기의 송신 전력을 가변하기 위한 이득 제어 회로를 궤환 경로뿐만 아나라 순방향 경로에도 삽입함으로써 CFL의 안정성을 일정하게 유지하도록 하였으며, 무전기 PTT(Push-To-Talk) 동작에 적합하고 구현이 용이한 S/H(Sample & Hold) 구조를 이용한 DC-offset 제거 기능을 구현하였다. 송신 시험 결과, CQPSK(Compatible QPSK) 신호 인가 시, PEP(Peak Envelope Power) 3 W(34.8 dBm) 출력에서 FCC의 방사 마스크 규격을 만족함을 확인하였으며, Two-tone 인가 시, 30 dB 이상의 3차 IMD 성분 개선을 확인하였다.