• 제목/요약/키워드: Voice-based services

검색결과 307건 처리시간 0.025초

E-모델 기반 통화 품질 분석을 통한 VoIP Planning 및 평가 (VoIP Planning and Evaluation through the Analysis of Speech Transmission Quality Based on the E-Model)

  • 배성용;김광훈
    • 인터넷정보학회논문지
    • /
    • 제5권6호
    • /
    • pp.31-43
    • /
    • 2004
  • 인터넷의 발달은 통신 기술에 커다란 변화를 요구하고 있다. 특히 공중전화망(PSTN: Public Switched Telephone Network)은 장기적으로 인터넷으로 흡수 통합되고, 현재는 이들간의 연동이 요구되고 있는 실정이다. 이처럼 인터넷에서의 전화 서비스는 인터넷 응용 서비스 중 가장 활용 가치가 높고, 기대를 모으고 있는 서비스이다. 그러나 높은 기대와 적은 서비스 이용료에도 불구하고 인터넷 전화 서비스의 보급이 부진한 이유는 낮은 서비스 품질에 있다. 지금까지 VoIP(Voice over IP) 서비스 품질 평가를 위해 송수신되는 음성에 기반 한 다수의 통화 품질 측정 알고리즘들이 사용되어 왔지만, 이러한 알고리즘들은 음성 샘플에 따라 그 결과가 다르고, 일부 알고리즘은 음성 전송 경로의 네트워크 환경 요소를 반영하지 못하는 단점이 있다. E-모델은 이러한 알고리즘들의 문제점을 해결하기 위해 사용될 수 있다. 본 논문에서는 VoIP 단말의 통화 품질은 물론, 음성 전송 경로의 네트워크 품질 손실 요소들을 체계적으로 분석할 수 있는 E-모델의 다양한 분석을 통해 인터넷 전화 사업자나 망 운용자의 VoIP 계획(planing)에 대한 가이드라인과 통화 품질 평가 방법 및 결과를 제시하고자 한다.

  • PDF

VoiceXML기반 EPG 검색 시스템 (A VoiceXML-based EPG Retrieval System)

  • 김한수;황인준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.351-363
    • /
    • 2004
  • 최근 들어 디지털 방송의 본격적인 서비스 개시와 더불어 수많은 채널을 통한 TV 프로그램 방송이 가능하게 되었다. 이로 인해 시청자들은 더 이상 신문이나 TV 가이드와 같은 인쇄매체를 통한 방송 스케줄의 검색이 사실상 어렵게 되었다. 이 같은 문제점을 해결하기 위해 디지털 방송 환경에서는 시청자들에게 전자 프로그램 가이드(EPG: Electronic Program Guide)를 제공한다. 현재 대부분의 EPG 서비스는 디지털 TV 화면이나 각 방송사 웹사이트, 그리고 모바일 단말기에서 EPG 정보를 화면상에서 시각적으로 제공하는 측면에만 초점을 두고 있다. 하지만 이와 같은 EPG 서비스 방식은 검색을 위해 키워드를 직접 입력하기 어려운 운전자나 시각 장애인과 같은 사용자 그룹이 EPG 서비스를 이용할 수 없는 한계점을 지닌다. 따라서 본 논문에서는 모바일 폰을 이용하여 운전자나 시각 장애인과 같은 사용자 그룹도 편리하게 EPG 서비스를 검색할 수 있는 음성 EPG 검색 시스템을 제안하고 프로토타입 시스템의 구현 및 실험을 통해 효율성을 입증하였다.

TTS를 이용한 매장 음악 방송 서비스 시스템 구현 (Implementation of Music Broadcasting Service System in the Shopping Center Using Text-To-Speech Technology)

  • 장문수;강선미
    • 음성과학
    • /
    • 제14권4호
    • /
    • pp.169-178
    • /
    • 2007
  • This thesis describes the development of a service system for small-sized shops which support not only music broadcasting, but editing and generating voice announcement using the TTS(Text-To-Speech) technology. The system has been developed based on web environments with an easy access whenever and wherever it is needed. The system is able to control the sound using silverlight media player based on the ASP .NET 2.0 technology without any additional application software. Use of the Ajax control allows for multiple users to get the maximum load when needed. TTS is built in the server side so that the service can be provided without user's computer. Due to convenience and usefulness of the system, the business sector can provide better service to many shops. Further additional functions such as statistical analysis will undoubtedly help shop management provide desirable services.

  • PDF

국가정보통신서비스의 'C'그룹 인터넷전화 사업현황과 이용 분석 (Use and Business Analysis of the 'C'Group Internet Phone on National Information and Communication Service)

  • 신진;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.249-252
    • /
    • 2011
  • 국가정보통신서비스는 행정안전부 주관으로 'A'그룹(회선서비스망), 'B'그룹(IP서비스망), 'C'그룹 (인터넷전화서비스, IP응용서비스)으로 인프라를 구성하여 제공하고 있다. 국가정보통신서비스 'C'그룹 사업자는 인터넷전화 서비스를 제공하고 있다. 본 논문에서는 국가정보통신서비스 'C'그룹 사업자의 국내통화, 국제통화, 이동통화 등의 기본 통화 서비스와 문자메시지, 영상통화, IP-Centrex 서비스 등 7개의 부가서비스를 연구한다. 또한 국가정보통신서비스 사업자의 사업 현황을 분석을 토대로 국가정보통신 인터넷전화망의 인터넷전화 이용 유형을 분석한다. 본 연구는 국가정보통신서비스 산업발전을 위한 기초 자료로 활용될 것이다.

  • PDF

한국어 핵심어 추출 및 연속 음성 인식을 위한 다목적 전처리 프로세서 설계 (Design of Multi-Purpose Preprocessor for Keyword Spotting and Continuous Language Support in Korean)

  • 김동헌;이상준
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.225-236
    • /
    • 2013
  • 음성인식 기술은 단순한 단어 인식을 넘어 자연스럽게 발성한 연속 음성도 인식할 수 있는 수준으로 발전해 왔다. 아이폰에 탑재된 자연어 음성인식 처리 소프트웨어인 시리(Siri)가 2010년에 발표되면서, 음성인식에 대한 연구가 관심을 받고 있다. 한국어 음성 인식 소프트웨어들은 대부분 단어 위주의 인식 서비스로 구성 되어 있으며, 잡음처리 및 음성 에너지 조절 기능들이 부족해 만족할 만한 인식률을 보이지 못하고 있다. 또한 요구된 발성 규칙을 따르지 못한 음성 질의들은 아예 처리하지 못하고 있는 실정이다. 본 논문에서는 이러한 현실적 어려움을 개선할 수 있도록 다목적 전처리 프로세서를 제안하였다. 이 처리기는 음성인식 엔진에 독립적이며, 잡음 제거 기능, 규칙에 따르지 않은 음성 질의도 처리 할 수 있는 핵심어 추출 기능, 그 핵심어를 수식하는 전술부 및 그 해당 음성 질의로부터 수행하기를 원하는 후술부 까지도 추출할 수 있는 기능을 갖추도록 하였다. 실험을 통해, 잡음 제거 효과 평가, 핵심어 인식 성공률, 연속음 인식 성공률을 측정하여 제안한 방법의 타당성을 확인하였다.

청크 기반 시계열 음성의 감정 인식 연구 (A Study on Emotion Recognition of Chunk-Based Time Series Speech)

  • 신현삼;홍준기;홍성찬
    • 인터넷정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.11-18
    • /
    • 2023
  • 최근 음성 감정 인식(Speech Emotion Recognition, SER)분야는 음성 특징과 모델링을 활용하여 인식률을 개선하기 위한 많은 연구가 진행되고 있다. 기존 음성 감정 인식의 정확도를 높이기 위한 모델링 연구 이외에도 음성 특징을 다양한 방법으로 활용하는 연구들이 진행되고 있다. 본 논문에서는 음성 감정이 시간 흐름과 연관이 있음을 착안하여 시계열 방식으로 음성파일을 시간 구간별로 분리한다. 파일 분리 이후, 음성 특징인 Mel, Chroma, zero-crossing rate (ZCR), root mean square (RMS), mel-frequency cepastral coefficients (MFCC)를 추출하여서 순차적 데이터 처리에 사용하는 순환형 신경망 모델에 적용하여 음성 데이터에서 감정을 분류하는 모델을 제안한다. 제안한 모델은 librosa를 사용하여 음성 특징들을 모든 파일에서 추출하여, 신경망 모델에 적용하였다. 시뮬레이션은 영어 데이터 셋인 Interactive Emotional Dyadic Motion Capture (IEMOCAP)을 이용하여 recurrent neural network (RNN), long short-term memory (LSTM) and gated recurrent unit(GRU)의 모델들의 성능을 비교 및 분석하였다.

VoLTE 활성화에 따른 요금 인하 여력 분석 (Analysis of VoLTE Charge Reduction under VoLTE Growth)

  • 이상우;정선화
    • 한국통신학회논문지
    • /
    • 제41권1호
    • /
    • pp.92-100
    • /
    • 2016
  • VoLTE는 음성과 문자까지 IP 기반으로 서비스가 제공됨에 따라 기존 서킷방식의 2G/3G망 기반 음성서비스에 비해 기술 및 원가효율성이 높아 규모의 경제 효과가 클 뿐만 아니라, 음성과 데이터가 하나의 망으로 제공되기 때문에 범위의 경제 효과 또한 큰 것으로 알려져 있다. 이러한 기술적 효율성을 기초로 VoLTE 서비스가 기존 서킷방식의 음성서비스에 비해 원가적 측면에서 비용효율성이 얼마나 큰지 혹은 상대적으로 높은 원가효율성을 지니고 있는 VoLTE 서비스가 활성화될 경우 이에 따라 사업자들에게는 얼마만큼의 요금인하 여력을 제공할 수 있는지에 대한 연구는 전무한 상황이다. 본 논문에서는 기존 서킷방식의 음성서비스 대비 VoLTE 서비스의 상대적 원가효율성 규모를 분석하고, 이를 기초로 VoLTE 서비스 활성화 정도에 따른 음성서비스 요금 인하 여력이 얼마만큼 될 것인지를 계량적으로 분석하였다. 분석결과 첫째 음성통화량이 고정되어 있다는 가정하에 단기적으로는 VoLTE 서비스 제공을 위해 LTE망 구축 투자비 발생으로 인해 평균비용이 상승하나, VoLTE의 상대적 우수한 원가효율성에 따라 VoLTE 전환율이 높아질수록 음성서비스의 요금인하 여력이 발생되는 것으로 분석되었다. 둘째, 모든 음성통화량이 VoLTE로 전이될 경우 음성서비스 요금은 현재 요금 수준의 약 60%까지 인하될 여력이 존재하며, 이에 따라 데이터서비스 중심으로 과금하는 요금안의 정당성을 일부 확보할 수 있음을 증명하였다. 본 연구 결과를 통해 통신사업자에게는 요금전략 수립시 기초자료로 활용될 수 있으며, 정책적으로는 요금인하를 유도할 수 있는 정책자료로 활용될 수 있을 것으로 기대된다.

VoIP와 음석인식에 기반한 통합솔루션 서비스 동향 (The Trend of Integrated Solution Service Based on VoIP and Voice Recognition)

  • 오재삼;윤용근
    • 한국IT서비스학회지
    • /
    • 제1권1호
    • /
    • pp.57-66
    • /
    • 2002
  • 지금까지 VoIP에 음성인식을 접목했을 때 만들 수 있는 서비스를 동향에 맞춰 살펴보았다. 최근 들어 음성인식 기술을 이용한 서비스나 상품들이 홍수처럼 쏟아져 나오고 있으며, 이제는 음성인식 기술이 GUI나 일반 DTMF를 이용하는 사용자 인터페이스(User Interfaces)를 대신할 수 있을 정도로 발전되었고 또 앞으로도 지속적인 발전이 있을 것이라 예상되므로 이제 시작된 VoIP와 음성인식의 접목은 수많은 다양한 종류의 새로운 서비스를 창출해낼 것으로 예상된다. 본 논문의 그림들에서 유선전화, 무선전화, 무선 인터넷 등 세 종류의 서비스가 계속 등장한다. 이렇게 세 종류의 서비스를 유지하는 이유는 현재 유무선 전화 및 인터넷 서비스 사업자에 관련되어 각각 다른 비즈니스 모델이 다음과 같이 형성될 수 있기 때문이다. 유선 전화망을 통한 인터넷 서비스는 유선망과 인터넷망을 연동시켜 주는 하드웨어를 개발하는 제조업체와 인터넷 정보를 제공해 주는 정보제공 업자 및 서비스를 제공하는 통신사업자가 협력하여 부를 창출하는 비즈니스 형태이다. 무선 전화망을 통한 인터넷 서비스는 무선 전화 사업자들이 이미 무선 인터넷이라는 이름으로 다양한 정보 제공 서비스를 지속해왔다는 점에서 인터넷 정보를 제공해 주는 정보제공업자 및 무선전 화 사업자 그리고 서비스 제공업자가 협력하여 매 출을 올라는 비즈니스 형태이다. 무선 인터넷 서비스는 일반 인터넷 서비스와의 차이는 없으며, 특별히 이동성을 강조한 서비스를 제공한다면 일반적인 인터넷 기반 정보제공자보다 경쟁력을 가질 수 있다. VoIP는 단독으로 쓰이기보다는 다른 다양한 기술과 서비스와 합쳐졌을 때 그 효과가 커진다. 이 제 음성처리기술, 특히 음성인식기술과 함께 사용되는 VoIP 기술의 응용 범위가 어디까지 확대될지 사뭇 기대되는 바이다.

Mobile WiMAX에서 IPTV 및 VoIP 음성서비스 품질을 고려한 수면구간 길이와 지터버퍼 크기의 상관관계 분석 (Analysis of Correlation between Sleep Interval Length and Jitter Buffer Size for QoS of IPTV and VoIP Audio Service over Mobile WiMax)

  • 김형석;김태현;황호영
    • 정보처리학회논문지C
    • /
    • 제17C권3호
    • /
    • pp.299-306
    • /
    • 2010
  • IPTV 및 VoIP 서비스는 높은 이동성과 전송 속도를 보장하는 Mobile WiMAX 네트워크 상에서 제공할 수 있는 유용한 응용 서비스들이다. IPTV의 오디오 전송이나 VoIP의 통화 품질에 영향을 미치는 요소 중 전송 경로의 잦은 변경이나 경로간 전송 시간의 차이에 따라 발생하는 지터에 의한 패킷 손실은 지터 버퍼를 이용하여 완화할 수 있다. 본 논문에서는 Mobile WiMAX 네트워크 상에서 이동 단말의 전력 소모 절감을 위해 사용되는 PSC-II 모드를 사용할 때의 오디오 및 음성 서비스의 품질(Quality of Service)과 지터 버퍼 크기의 상관관계에 대해 연구, 분석한다. 이를 위해 절전 모드 사용으로 인해 추가로 발생하는 지연 시간을 포함한 서비스의 종단간 지연시간 모델과 종단간 지연시간을 기준으로 한 서비스 품질 기준을 제시하였다. 또한, 제시한 모델의 다양한 파라미터에 따른 시뮬레이션 분석 결과를 통해 절전 모드를 사용할 경우에는 지터 버퍼의 크기 증가에 따른 지연으로 인한 패킷 손실이 오히려 오디오 및 VoIP 서비스 품질 측면에서 좋지 않은 영향을 미칠 수 있음을 보였다.

인공지능 검색 서비스 활용에 따른 서비스 사용성 평가: 네이버 앱을 중심으로 (Usability Evaluation of Artificial Intelligence Search Services Using the Naver App)

  • 황신희;주다영
    • 감성과학
    • /
    • 제22권2호
    • /
    • pp.49-58
    • /
    • 2019
  • 4차 산업 혁명 시대에 인공지능은 IT 기업을 중심으로 기업들의 핵심 사업 전략이 되고 있다. 그리고 국내외 주요 포탈 기업들 또한, 인공지능 기반의 검색 서비스를 출시하고 있다. 인공지능 검색 서비스는 이미지 음성과 같은 비정형 데이터를 활용하며 검색 패러다임을 확장시켰다. 하지만 기존의 텍스트 기반의 검색 서비스와 다른 인터페이스를 제공한다. 익숙하지 않은 인터페이스는 서비스의 사용성을 저해할 수 있는 요소로, 인공지능 검색 서비스를 이용에 따른 사용성에 변화를 알아볼 필요가 있다. 본 연구는 네이버앱 8.9.3 베타버전을 사례로 인공지능 검색 서비스를 실험한다. 실험은 네이버앱 사용 경험이 있는 20대와 30대 30명을 대상으로, 네이버앱의 인공지능 검색 서비스인 스마트 렌즈, 스마트 보이스, 스마트 어라운드, AiRS 추천 콘텐츠의 사용성을 기존의 네이버앱 검색과 비교하여 평가한다. 실험분석 결과, 기존의 네이버앱 검색과 비교하여 통계적으로 유의미한 사용성 변화가 있는 것으로 나타났다. 스마트 렌즈, 스마트 보이스, 스마트 어라운드는 양(+)의 상관관계가, AiRS 추천 콘텐츠는 음(-)의 상관관계가 있었다. 본 연구는 인공지능 검색 서비스를 적용에 따른 사용성 변화를 평가하고 분석한 것으로, 추후 인공지능을 활용한 서비스의 사용성 평가 연구에 유용한 자료가 될 것으로 기대한다.