• Title/Summary/Keyword: Voice function

Search Result 434, Processing Time 0.029 seconds

사이버공격의 국가 경제적 손실분석 - 보이스 피싱을 중심으로 (Analysis on National Economic Loss of Cyber Attack: Voice Phishing Case)

  • 신진
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2341-2346
    • /
    • 2012
  • 보이스 피싱은 해독능력이 약한 노인과 약자를 대상으로 사회공학적인 방법을 이용하여 경제적 피해를 유발시킨다. 최근 인접국과 연계조직에 의한 보이스 피싱이 많은 국민에게 경제적 손실과 정신적 파탄을 야기하였고 대한민국 전체로 보더라도 보이스 피싱으로 인한 국가경제손실 및 정신적 피해는 매우 크다. 최근 정부와 관련기관들이 보이스 피싱을 막기위한 보안시스템과 금융보안장치를 강화하고 있으나 보안효과가 얼마나 큰가는 검증하기 쉽지 않다. 본 논문에서는 보이스 피싱으로 인한 대한민국의 경제적손실과 보안장치강화에 따른 보안효과의 경제성에 관하여 살펴본다. 우리나라의 보이스 피싱 피해의 직접 피해액은 1,100억 원으로 나타나고 있으며 철저한 보안에 따는 잠재적인 경제적 효과는 연간 3,500억 원 규모에 이른다고 볼 수 있다.

박물관 안내를 위한 시나리오 기반의 AI 음성 챗봇 시스템 구현 (Implementation of Scenario-based AI Voice Chatbot System for Museum Guidance)

  • 정선우;최은성;안선규;강영진;정석찬
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.91-102
    • /
    • 2022
  • 인공지능이 발전하면서 AI 챗봇 시스템의 활용이 활발히 이루어지고 있다. 그 예로 공공기관에서는 민원, 행정 분야에서 업무 보조, 전문지식 서비스 등으로 챗봇 활용 분야가 확대되고 있으며 민간기업은 대화형 고객 응대 서비스 등으로 챗봇을 활용하고 있다. 본 연구에서는 시나리오 기반의 AI 음성 챗봇 시스템을 제안하여 박물관의 운영 비용을 절감하고 관람객에게 양방향성 안내 서비스를 제공하고자 한다. 구현한 음성 챗봇 시스템은 실시간으로 특정 디렉터리를 감시하여 사용자의 음성을 감지하는 감시자 객체와 음성 파일이 생성되면 순차적으로 모델별 추론을 수행하여 AI의 응대 음성을 출력하는 이벤트 핸들러 객체로 구성되며, 스레드와 데크를 활용한 중복 방지 기능을 포함하여 단일 GPU 환경에서 추론 중에 GPU의 연산이 중복되지 않도록 한다.

HVCM(Hybrid Voice Coil Motor) Actuator적용을 통한 AUTO Focusing Camera Module 성능개선 (HVCM (Hybrid Voice Coil Motor) Actuator apply performance improvement through the AUTO Focusing Camera Module)

  • 권태권;김영길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.307-309
    • /
    • 2011
  • 최근 출시되는 고사양의 Hand-phone 적용되어진 Camera Module은 대부분 Auto Focusing기능이 탑재되어 있으며 Camera Module의 화소수가 높아지면서 좀 더 정밀하고 안정적인 AF구동제품이 소비자에 의해 요구되고 있다. 본 논문은 현재 출시되고 있는 Camera Module적용 VCM(Actuator)의 문제점인 Auto Focusing시 Lens 초점위치 및 Module 자세에 따른 해상도편차 발생으로 해상도 보증 및 안정된 Actuator 구동을 위해 개선된 구조의 Hybrid VCM을 제안한다.

  • PDF

라인케부종환자의 음성분석 (Acoustic Analysis of Reinke Edema)

  • 김상균;최홍식;공석철;홍원표
    • 대한후두음성언어의학회지
    • /
    • 제7권1호
    • /
    • pp.11-19
    • /
    • 1996
  • Reinke's edema is used for describing varying degrees of chronic swelling of the vocal folds. The acoustic analysis of Reinke's edema has not been reported so far in this country. The purpose of this study is to clarify acoustic and aerodynamic characteristics of the Reinke's edema. Several acoustic evaluations & aerodynamic studies were done in 20 Reinke's edema patients and the data was compared with those of 20 normal controls. Videolaryngoscopy also was done to classify the severity in grading. We used C-Speech, Doctor speech science, and Phonatory function analyser. In C-Speech, we compared jitter, shimmer, and SNR(signal to noise ratio) of normal and Rrinke's edema patient. In Doctor speech science, we compared NNE(Glottal noise energy), speech fundamental frequency, voice quality between two groups. And in phonatory function analyser for aerodynamic function test, we compared speech intensity, airflow rate, and expiratory pressure between two groups. In conclusion, Reinke's edema patients showed lower voice pitches than normal, additionally jitter, shimmer, SNR(signal to noise ratio), NNE(Glottal noise energy), airflow rate, and expiratory pressure may be meaningful parameters for diagnosis and prognosis for treatment.

  • PDF

Neural Network을 이용한 무선 통신시스템에서의 VAD (VAD By Neural Network Under Wireless Communication Systems)

  • 이호선;김수경;박승권
    • 한국통신학회논문지
    • /
    • 제30권12C호
    • /
    • pp.1262-1267
    • /
    • 2005
  • EBF(Elliptical basis function) 신경망은 비선형 처리를 가능하게 하며, 잡음에 강하고 빠른 수렴을 하는 장점이 있다. 또한 EBF는 설계가 간단하여 실시간 음성 구간 검출기(Voice Activity Detection, VAD)에 적용하기 용이하다. 따라서 전송 효율을 높이기 위해 사용되는 음성구간 검출기를 제안함에 있어 EBF 신경망을 이용하였다. EBF의 학습 알고리즘은 평균 클러스터링(K-means Clustering) 알고리즘과 선형 최소 제곱 방범(Least Mean Square error, LMS)을 사용하였다. G.729 Annex B 와 RBF(Radial Basis Function) 신경망을 이용한 음성구간 검출기와 성능 비교에 있에서, G.729 Annex B 음성 검출기보다 $70\%$ 이상의 높은 성능재선을 나타냈고, RBF 신경망을 이용한 음성구간 검출기 보다 비음성 구간에서 $50\%$정도의 높은 효율을 보였다.

시각 장애인을 위한 사무 자동화 보조 장치 개발 (A Development of the Business processing unit for visually-handicapped persons)

  • 김송민
    • 한국전자통신학회논문지
    • /
    • 제7권1호
    • /
    • pp.141-147
    • /
    • 2012
  • 시각장애인들은 정보통신 기술의 발달에도 불구하고 정보소외 계층이다. 이들을 사무직종에 취업시키기 위해서는 정보통신 기술을 활용한 사무자동화 기술의 개발이 필요 하다. 사무 처리에 필요한 기술을 분석하고 이를 기술적으로 극복할 수 있는 통합솔루션을 개발함으로써 컴퓨터 활용 능력을 향상시킬 수 있는 VI 05를 개발하고자 한다. 개발된 VI 05는 사무 처리에 필요한 통합 솔루션으로 화면확대, 문자를 포함한 화면상의 데이터를 음성으로 변환시켜주는 기능, 정밀을 요구하는 작업을 예약 처리하여 그 처리 과정을 단순화 시켜는 기능 등 사무처리 과정에 필요한 기능을 갖추고 있다.

Relationship between executive function and cue weighting in Korean stop perception across different dialects and ages

  • Kong, Eun Jong;Lee, Hyunjung
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.21-29
    • /
    • 2021
  • The present study investigated how one's cognitive resources are related to speech perception by examining Korean speakers' executive function (EF) capacity and its association with voice onset time (VOT) and f0 sensitivity in identifying Korean stop laryngeal categories (/t'/ vs. /t/ vs. /th/). Previously, Kong et al. (under revision) reported that Korean listeners (N = 154) in Seoul and Changwon (Gyeongsang) showed differential group patterns in dialect-specific cue weightings across educational institutions (college, high school, and elementary school). We follow up this study by further relating their EF control (working memory, mental flexibility, and inhibition) to their speech perception patterns to examine whether better cognitive ability would control attention to multiple acoustic dimensions. Partial correlation analyses revealed that better EFs in Korean listeners were associated with greater sensitivity to available acoustic details and with greater suppression of irrelevant acoustic information across subgroups, although only a small set of EF components turned out to be relevant. Unlike Seoul participants, Gyeongsang listeners' f0 use was not correlated with any EF task scores, reflecting dialect-specific cue primacy using f0 as a secondary cue. The findings confirm the link between speech perception and general cognitive ability, providing experimental evidence from Korean listeners.

Personal Credit Evaluation System through Telephone Voice Analysis: By Support Vector Machine

  • 박형우
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.63-72
    • /
    • 2018
  • 인간의 목소리는 사람간의 정보 전달을 위한 가장 쉬운 방법 중 하나이다. 음성의 특징은 사람마다 다를 수 있으며 발성 속도, 발성기관의 형태와 기능, 피치 톤, 언어 습관 및 성별에 따라 다르게 나타난다. 목소리는 사람의 의사소통 핵심 요소이다. 제 4 차 산업 혁명의 시대에 목소리는 사람과 사람, 사람과 기계, 기계 와 기계 사이의 주요한 의사소통 수단이 된다. 그 이유 때문에 사람들은 자신의 의도를 다른 사람들에게 명확하게 전달하려고 노력한다. 그리고 이 과정에서 목소리는 언어 정보와 함께 다양한 추가 정보가 포함되게 된다. 예를 들어 감정 상태, 건강 상태, 신뢰도와 관련되거나, 거짓말의 여부, 음주로 인한 목소리의 변화 등 다양한 언어 및 비언어 정보를 포함하며, 다양한 분석 파라미터로 나타나게 된다. 이를 활용하면 개인의 신용도를 평가하는 척도로 사용할 수 있다. 특히 성대의 기본 주파수의 특성과 성도의 공진 주파수 특성의 관계를 분석함으로써 얻을 수 있다. 이전의 연구에서 다양한 신용 상태의 변화에 따른 목소리 분석 및 특성 변화를 연구 하였다. 본 연구에서는 음성을 통해 추출 된 매개 변수를 통해 기계 학습을 통한 개인 신용 판별 기를 제안한다.

VoiceXML을 이용한 Web 연동 학습 시스템 설계 및 구현 (Design and Implementation of Web Interworking Learning System Using VoiceXML)

  • 김동현;조창수;신정훈;홍광석
    • 전자공학회논문지CI
    • /
    • 제42권2호
    • /
    • pp.21-30
    • /
    • 2005
  • 멀티미디어 및 통신망 기술의 발전은 학습 시스템 구현 측면에서의 많은 변화를 이룩하였다. 보다 창의적이며, 보다 효율적인 학습 시스템 구축을 위한 연구가 Web 및 전화망을 이용하여 시도되었다. 그러나 현재까지 구현된 학습 시스템의 경우 웹 또는 전화망을 이용한 단독 시스템으로 각각의 장 단점을 가지고 있다. 즉, Web을 이용한 학습 시스템의 활용을 통한 학습시 단점으로는 컴퓨터를 활용한 정적인 상태에서의 학습만 가능하며, 컴퓨터를 사용하지 못하는 사람들에겐 이용하기 위한 새로운 시스템 활용법을 익혀야 하는 문제점이 존재하였다. 또한, 전화망을 이용한 학습 시스템의 경우 언제 어디서나 전화를 활용학습이 가능하다는 장점을 가지고 있으나, 컴퓨터를 활용한 시스템과 같이 심도있게 효율적으로 정보의 전달이 이루어지지 않는다는 단점을 가지고 있다. 이에 본 논문에서는 VoiceXML을 활용하며 전화망을 경유한 학습 시스템과 Web 기반 학습 시스템의 연동을 통한, 효율적이며 편리한, 언제 어디서나 활용 가능한 학습 시스템을 제안 한다. 또한 전화망을 사용한 학습 시스템에서 사용자 ID, password, 이름 등록 기능의 새로운 알고리즘을 제안하고 전화망과 Web을 사용한 학습시스템에서는 개인학습 진도 저장 기능을 제안한다.

웨이블렛 기반 바크 코히어런스 함수를 이용한 VoIP 음질평가 (Speech Quality Measure for VoIP Using Wavelet Based Bark Coherence Function)

  • 박상욱;박영철;윤대희
    • 한국통신학회논문지
    • /
    • 제27권4A호
    • /
    • pp.310-315
    • /
    • 2002
  • 본 논문은 객관적 음질 평가법으로 웨이블렛 변환을 이용한 향상된 바크 코히어런스 함수 (Wavelet based Bark Coherence Function : WBCF)를 제안한다. 바크 코히어런스 함수 (Bark Coherence Function : BCF)는 심리 음향 영역에서 코히어런스 함수를 정의함으로서 음성 통신 시스템의 아날로그 부분에 의하여 발생할 수 있는 선형 왜곡에 강한 객관적 음질 평가법이다. VoIP (Voice over Internet Protocol)와 같은 패킷 기반의 음성 전달 시스템은 가변 지연등이 발생 될 수 있는데, 이것은 원음과 왜곡음의 정확한 시간축 정렬을 불가능하게 하여 기존의 객관적 음질 평가법의 성능을 저하시킨다. 제안된 WBCF는 고주파 영역에서 시간 분해능이 높으며, 저주파 영역에서 주파수 분해능이 높은 웨이블렛 변환을 사용한 후 BCF를 계산하여 VoIP 시스템에서의 객관적 음질을 평가한다. 주/객관적 음질 평가 실험을 통하여 WBCF가 ITU-T 권고안인 Perceptual Speech Quality Measure (PSQM)에 비하여 높은 성능을 가짐을 확인하였다.