• 제목/요약/키워드: 음성 노력

검색결과 148건 처리시간 0.033초

음성정보 서비스의 검색 알고리즘 개선 연구 (A Study on Improvement of Retrieval Algorithm for Audio Response Service)

  • 정유현;김순협
    • 한국음향학회지
    • /
    • 제16권5호
    • /
    • pp.92-95
    • /
    • 1997
  • 현재의 음성정보 서비스는 번호(0~9)와 특수 기호(${\ast},# $)의 조합에 의한 메뉴 검색 및 검색코드를 입력하는 방식으로서 서비스되고 있다. 검색코드 입력 방식은 관광 및 증권 정보와 같이 많은 내용을 대상으로 하는 분야의 검색 방법으로 사용되고 있으나 검색코드 번호를 모르는 경우에는 원하는 정보를 검색하기 위해서는 많은 시간과 노력이 소요된다. 따라서 본 논문에서는 검색코드 번호를 모르는 사용자들도 쉽게 원하는 정보를 검색할 수 있도록 전화 번호에 한글 자음코드를 부여하고, 원하는 정보의 고유명사에 대응하는 초성 자음 열의 전화번호를 검색코드로 입력하는 방법을 제안하였다.

  • PDF

E-비즈니스를 위한 물품 데이터 카탈로그 구현 및 개발 (Development and Implementation of Commodity Data Catalog for E-Business)

  • 윤호군;김선영;허우나;강성화;장선형;정화영
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.127-130
    • /
    • 2000
  • 웹(Web)의 발달로 구매자들은 물건을 구매하기 위하여 직접 매장을 찾지 않고도 인터넷을 통한 각 쇼핑몰에서 제품이나 구매에 관한 정보 서비스를 바탕으로 원하는 제품의 정보를 얻고 제품을 선택해서 구매할 수 있게 되었다. 따라서, 제품의 구매를 결정함에 있어 가장 중요한 요소는 원하는 제품에 칠한 정보에 보다 빠르게 접근하고 정확한 정보를 입수하는 것이다. 이에 따라, 구매자들에게 보다 확실한 제품 정보를 제공하기 위한 효과적인 카탈로그를 구현 및 개발하려는 노력은 다각도로 진행되고있다. 그러나, 기존의 카탈로그는 단순한 텍스트 형식의 문서이며 제품 정보도 너무 빈약해 사용자가 제품에 대한 확실한 정보를 얻기 힘들다. 따라서, 본 논문에서는 사용자가 보다 많은 정보를 쉽게 접할 수 있도록 시각적인 제품정보와 함께 해당 제품정보에 관한 설명을 음성으로 지원하였다. 즉, 기존의 정적인 제품정보 화면에서 음성만을 지원하는 것이 아닌 제품에 관한 정보를 슬라이드 쇼 형태로 제공함으로써 제품에 관한 흥미유발과 구매욕구를 높일 수 있다.

  • PDF

홈 네트워크 환경에서 음성인식기반 사용자 인터페이스를 통한 가전기기 제어 시스템 구현 (Implementation of Home Appliance Control System with Speech Recognition based User Interfaces in Home Network Environments)

  • 김연우;장현수;김구수;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.735-738
    • /
    • 2007
  • 컴퓨팅 기술의 발전에 따라 유비쿼터스 시대로의 이행이 가속화되고 있다. 이에 따라 홈 네트워크 분야에 대한 연구와 상용화를 위한 노력이 활발해지고 있다. 이와 더불어 가전기기들의 종류는 다양해지고 복잡해지면서 사용자들의 가전기기 이용에 있어 사용법을 익혀야하는 어려움이 있다. 이러한 문제점을 해결하기 위한 일환으로 디지털 장치들을 편하게 사용하기 위한 멀티 모달 사용자 인터페이스가 요구되고 있다. 본 논문에서 네트워크 가전기기 제어가 가능한 홈 네트워크 미들웨어인 UPnP를 사용하여 VoiceXML을 통한 음성인식기반 사용자 인터페이스와 디지털 장치 제어 시스템을 제안하고 구현한 후 실험하였다.

VoIP망에서 IP기반 녹취 시스템 설계 및 구현 (An IP Based Transcript System in VoIP Network)

  • 손민호;김수희;김영웅;정인환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.898-900
    • /
    • 2005
  • 초고속 통신망의 확대 적용으로 인터넷의 빠른 성장과 함께 음성과 비디오 그리고 데이터를 통합하고자 하는 노력이 시도 되고 있다. VoIP(Voice over IP)는 IP를 이용하여 음성과 데이터를 패킷 형태로 통합하여 실시간으로 전송하는 기술이다[1]. 패킷 네트워크에서 VoIP 시그널링 기술을 이용하면 망 자원의 효율적 이용 및 PSTN에 가까운 음질 그리고 인터넷과 연계한 다양한 음성서비스 지원(H.323, SIP, MGCP 등 다양한 신호처리 지원)이 가능하다. 본 논문에서는 VoIP망에서 IP기반 녹취 시스템을 설계 및 구현한다. 녹취 시스템은 고객과 상담원의 통화 내용을 자동으로 녹음하여 보관함으로써 고객의 요구사항을 명확히 파악할 수 있으며 녹취 데이터의 통계 자료 제공으로 효율적인 관리가 지원되고 선택 녹취, 스케줄링 녹취, 상담원의 평가 자료를 제공하여 고객 관리의 질적인 향상을 지원한다. 본 논문의 녹취 시스템은 고객과의 통화 내용을 녹취하여 서버의 녹취 DB에 저장하여 관리하는 녹취 시스템으로 모든 네트워크 환경에서 사용할 수 있으며 CTI와 연동하여 효율적이고 체계적인 녹취 시스템 구국이 가능하다.

  • PDF

연속 은닉 마코프 모델을 이용한 한국어 음성 인식을 위한 효율적 음절 모델링 (Effective Syllable Modeling for Korean Speech Recognition Using Continuous HMM)

  • 김봉완;이용주
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.23-27
    • /
    • 2003
  • 최근 연속 음성 인식에서의 성능 향상을 위해 음절을 인식 단위로 사용하고자 하는 노력들이 보고되고 있다. 그러나 음절의 경우 음소에 비해 학습성이 음소에 비해 좋지 않고, 모델의 수가 음소에 비해 매우 많으므로 음절 경계에서의 문맥 종속 모델링이 어렵다는 단점을 갖고 있다. 본 논문에서는 한국어에서의 음절의 학습성을 향상시키기 위한 방법과 음절경계에서의 음소 문맥 종속 음절 모델링을 제안한다. 제안된 방법을 단어 인식 실험에 적용한 결과, 기존의 음절 모델과 비교하여 평균 46.23%의 에러 감소율을 보였다 우측 음소 종속 음절 모델 (right phone dependent syllable model)의 경우 트라이폰(triphone) 모델에 비해 16.7%의 에러 감소율을 볼 수 있었다.

피치 요소 추출 및 분석을 이용한 20-30대 남성의 사상체질 태음인 분류 기법 (Classfication Method of Sasang Constitution Teeumin 20-30 Years of Man Using Pitch Element Extraction and Analysis)

  • 김봉현;가민경;이세환;곽지현;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.133-136
    • /
    • 2008
  • 초고령화 사회로 진입하면서 건강의 유지 및 관리는 일상생활에서 매우 중요한 관심으로 대두되고 있다. 특히 우리나라 전통의학에 대한 가치성이 향상되면서 이를 실생활에 접목하기 위한 노력이 활발하게 진행되고 있는 실정이다. 이를 위해 본 논문에서는 사상의학에 대한 체질 분류의 객관화를 통해 예방차원의 건강 관리를 지속하기 위한 연구를 진행하고자 한다. 특히 사상의학에서 제안하고 있는 여러 사상체질 분류 방법 중에서 음성을 통한 사상체질 분류 방법을 공학적으로 구현하여 이를 객관적 진단 지표로 설계하고자 한다. 따라서 본 논문에서는 서울지역에 거주하고 있는 20-30대 남성의 음성을 수집하여 음성 분석학적 요소 중 피치 분석 요소들에 대한 추출 및 비교를 통해 사상의학의 사기론에서 제안하는 이론적 근거를 입증하고자 한다. 최종적으로 실험을 통해 추출된 결과를 사상의학 전문의의 진단 결과와 비교, 분석하여 제안하는 기법에 대한 검증을 수행하고자 한다.

반자율주행 맥락에서 AI 에이전트의 멀티모달 인터랙션이 운전자 경험에 미치는 효과 : 시각적 캐릭터 유무를 중심으로 (The Effect of AI Agent's Multi Modal Interaction on the Driver Experience in the Semi-autonomous Driving Context : With a Focus on the Existence of Visual Character)

  • 서민수;홍승혜;이정명
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.92-101
    • /
    • 2018
  • 대화형 AI 스피커가 보편화되면서 음성인식은 자율주행 상황에서의 중요한 차량-운전자 인터랙션 방식으로 인식되고 있다. 이 연구의 목적은 반자율주행 상황에서 음성뿐만 아니라 AI 캐릭터의 시각적 피드백을 함께 전달하는 멀티모달 인터랙션이 음성 단일 모드 인터랙션보다 사용자 경험 최적화에 효과적인지를 확인하는 것이다. 실험 참가자에게 주행 중 AI 스피커와 캐릭터를 통해 음악 선곡과 조정을 위한 인터랙션 태스크를 수행하게 하고, 정보 및 시스템 품질, 실재감, 지각된 유용성과 용이성, 그리고 지속 사용 의도를 측정하였다. 평균차이 분석 결과, 대부분의 사용자 경험 요인에서 시각적 캐릭터의 멀티모달 효과는 나타나지 않았으며, 지속사용 의도에서도 효과는 나타나지 않았다. 오히려, 정보품질 요인에서 음성 단일 모드가 멀티모달보다 효과적인 것으로 나타났다. 운전자의 인지적 노력이 필요한 반자율주행 단계에서는 멀티모달 인터랙션이 단일 모드 인터랙션에 비해 사용자 경험 최적화에 효과적이지 않았다.

NGN 환경에서의 멀티미디어 서비스 표준화 동향 (Standardization Activities of Multimedia Services in Next Generation Network)

  • 이종화;강신각
    • 전자통신동향분석
    • /
    • 제22권6호
    • /
    • pp.1-9
    • /
    • 2007
  • 통신 방송간 융합, 음성 데이터의 통합 그리고 유 무선이 하나로 통합되는 NGN 환경에서 고부가가치 창출이 가능한 다양한 형태의 서비스 개발과 상용화 노력이 증가하고 있는 상황이다. 또한, 통신/서비스 사업자들은 인터넷 전화, 영상 전화, IPTV 등 신규 서비스 시장 개척을 위한 준비에 박차를 가하고 있다. 발전된 서비스 시장을 위한 노력은 국제 표준화 단체들의 기술 표준화 활동을 통해서도 진행되고 있다. NGN 멀티미디어 서비스(MoIP) 표준화는 ITU-T를 비롯한 ETSI TISPAN과 3GPP 중심으로 진행되어, 현재 다양한 서비스 기술 표준이 제정되어 있다. 본 고에서는 이들 국제 표준화 단체에서 진행중인 멀티미디어 서비스 표준화 동향을 살펴보고자 하며, 또한 국내에서 멀티미디어 서비스 활성화를 위해 추진중인 현황을 소개하고자 한다.

졸음방지를 위한 안면검출 해석과 서비스에 관한 연구 (A Study on Analysis and Service of the Face Detection to Prevent Drowsiness)

  • 이대연;이수용;박종원;김정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.508-510
    • /
    • 2020
  • 2015년도부터 2019년도까지 5년간 고속도로에서 1,079명의 사망자가 발생하였으며, 이중 졸음운전 및 주시 태만이 729명(67.6%)로 가장 많았다. 졸음운전 방지를 위해 휴게소, 졸음쉼터 등 노력하고 있으나 이러한 노력에도 졸음운전으로 인한 사고는 지금까지도 계속해서 발생하고 있다. 본 연구는 이러한 사고를 방지하기 위해 적외선 카메라를 이용한 영상 촬영하여 안면검출 해석과 서비스를 구현하였다. 안면검출을 통한 동공 상태의 여부와 적합한 수면 판단 기준으로 PERCLOS(Percentage of Eye Closure)을 적용하였다. 운전자의 동공의 장축과 단축의 비율이 1 : 0.35 미만 일 때, 운전자가 졸음상태라 판단하고 음성 알람을 통해 졸음방지를 개선할 수 있었다.

롬바르드 효과가 아동과 성인의 말소리 산출에 미치는 영향: 음향학적 특성과 모음공간면적을 중심으로 (Comparison of acoustic features due to the Lombard effect in typically developing children and adults)

  • 장예림;황재희;이누리;이나경;음세은;이영미
    • 말소리와 음성과학
    • /
    • 제16권2호
    • /
    • pp.19-27
    • /
    • 2024
  • 본 연구는 소음 조건에 따른 롬바르드 효과가 성인과 아동의 발화에 미치는 영향을 음성음향학적 측면에서 살펴보고자 하였다. 본 연구의 대상자는 5-9세 남자 아동 12명과 24-35세 남자 성인 12명이다. 대상자는 무소음과 55 dB, 70 dB의 다화자잡음을 청취하는 조건에서, 발화 과제를 수행하였다. 이때, 대상자의 음성을 디지털레코더로 녹음하였으며, Praat 프로그램을 사용하여 음성의 기본주파수, 강도, 발화길이, 모음공간면적을 분석하였다. 성인과 아동 간에 음도, 발화길이에서 유의한 차이가 있었으나, 두 집단 간에 강도와 모음공간면적에서는 유의한 차이가 없었다. 듣기 조건에 따라 대상자의 음성 강도, 발화길이에 유의한 차이가 있어서, 무소음 조건에 비해 소음 조건에서 대상자의 음성 강도와 발화길이가 유의하게 증가하였다. 본 연구 결과를 통해, 성인과 아동은 소음이 제시되는 상황에서 본인의 음성 강도와 발화길이를 증가시키는 것을 확인하였다. 본 연구는 어린 아동도 성인과 동일하게 소음으로 인한 말명료도 저하를 개선하기 위한 음성적 노력을 기울이고 있다는 것을 확인하였다는 데 의의가 있다.