• Title/Summary/Keyword: Word Input

Search Result 227, Processing Time 0.034 seconds

강인한 음성 인식 시스템을 사용한 감정 인식 (Emotion Recognition using Robust Speech Recognition System)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제18권5호
    • /
    • pp.586-591
    • /
    • 2008
  • 본 논문은 음성을 사용한 인간의 감정 인식 시스템의 성능을 향상시키기 위하여 감정 변화에 강인한 음성 인식 시스템과 결합된 감정 인식 시스템에 관하여 연구하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화가 음성 인식 시스템의 성능에 미치는 영향에 관한 연구와 감정 변화의 영향을 적게 받는 음성 인식 시스템을 구현하였다. 감정 인식은 음성 인식의 결과에 따라 입력 문장에 대한 각각의 감정 모델을 비교하여 입력 음성에 대한 최종감정 인식을 수행한다. 실험 결과에서 강인한 음성 인식 시스템은 음성 파라메터로 RASTA 멜 켑스트럼과 델타 켑스트럼을 사용하고 신호편의 제거 방법으로 CMS를 사용한 HMM 기반의 화자독립 단어 인식기를 사용하였다. 이러한 음성 인식기와 결합된 감정 인식을 수행한 결과 감정 인식기만을 사용한 경우보다 좋은 성능을 나타내었다.

이중채널 잡음음성인식을 위한 공간정보를 이용한 통계모델 기반 음성구간 검출 (Statistical Model-Based Voice Activity Detection Using Spatial Cues for Dual-Channel Noisy Speech Recognition)

  • 신민화;박지훈;김홍국;이연우;이성로
    • 말소리와 음성과학
    • /
    • 제2권3호
    • /
    • pp.141-148
    • /
    • 2010
  • In this paper, voice activity detection (VAD) for dual-channel noisy speech recognition is proposed in which spatial cues are employed. In the proposed method, a probability model for speech presence/absence is constructed using spatial cues obtained from dual-channel input signal, and a speech activity interval is detected through this probability model. In particular, spatial cues are composed of interaural time differences and interaural level differences of dual-channel speech signals, and the probability model for speech presence/absence is based on a Gaussian kernel density. In order to evaluate the performance of the proposed VAD method, speech recognition is performed for speech segments that only include speech intervals detected by the proposed VAD method. The performance of the proposed method is compared with those of several methods such as an SNR-based method, a direction of arrival (DOA) based method, and a phase vector based method. It is shown from the speech recognition experiments that the proposed method outperforms conventional methods by providing relative word error rates reductions of 11.68%, 41.92%, and 10.15% compared with SNR-based, DOA-based, and phase vector based method, respectively.

  • PDF

Design and Implementation of Open-Loop Clock Recovery Circuit for 39.8 Gb/s and 42.8 Gb/s Dual-Mode Operation

  • Lim, Sang-Kyu;Cho, Hyun-Woo;Shin, Jong-Yoon;Ko, Je-Soo
    • ETRI Journal
    • /
    • 제30권2호
    • /
    • pp.268-274
    • /
    • 2008
  • This paper proposes an open-loop clock recovery circuit (CRC) using two high-Q dielectric resonator (DR) filters for 39.8 Gb/s and 42.8 Gb/s dual-mode operation. The DR filters are fabricated to obtain high Q-values of approximately 950 at the 40 GHz band and to suppress spurious resonant modes up to 45 GHz. The CRC is implemented in a compact module by integrating the DR filters with other circuits in the CRC. The peak-to-peak and RMS jitter values of the clock signals recovered from 39.8 Gb/s and 42.8 Gb/s pseudo-random binary sequence (PRBS) data with a word length of $2^{31}-1$ are less than 2.0 ps and 0.3 ps, respectively. The peak-to-peak amplitudes of the recovered clocks are quite stable and within the range of 2.5 V to 2.7 V, even when the input data signals vary from 150 mV to 500 mV. Error-free operation of the 40 Gb/s-class optical receiver with the dual-mode CRC is confirmed at both 39.8 Gb/s and 42.8 Gb/s data rates.

  • PDF

A Natural Language Question Answering System-an Application for e-learning

  • Gupta, Akash;Rajaraman, Prof. V.
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 The Pacific Aisan Confrence On Intelligent Systems 2001
    • /
    • pp.285-291
    • /
    • 2001
  • This paper describes a natural language question answering system that can be used by students in getting as solution to their queries. Unlike AI question answering system that focus on the generation of new answers, the present system retrieves existing ones from question-answer files. Unlike information retrieval approaches that rely on a purely lexical metric of similarity between query and document, it uses a semantic knowledge base (WordNet) to improve its ability to match question. Paper describes the design and the current implementation of the system as an intelligent tutoring system. Main drawback of the existing tutoring systems is that the computer poses a question to the students and guides them in reaching the solution to the problem. In the present approach, a student asks any question related to the topic and gets a suitable reply. Based on his query, he can either get a direct answer to his question or a set of questions (to a maximum of 3 or 4) which bear the greatest resemblance to the user input. We further analyze-application fields for such kind of a system and discuss the scope for future research in this area.

  • PDF

동영상에서 모양 시퀀스를 이용한 동작 검색 방법 (Movement Search in Video Stream Using Shape Sequence)

  • 최민석
    • 한국멀티미디어학회논문지
    • /
    • 제12권4호
    • /
    • pp.492-501
    • /
    • 2009
  • 동영상에서 객체의 동작 정보는 장면의 내용을 분류하고 구분하는 중요한 정보로 이용될 수 있다. 본 논문에서는 동영상에서 객체의 동작을 효과적으로 찾기 위한 모양기반 동작 검색 방법을 제안한다. 객체의 동작 정보는 동영상 프레임에서 객체 영역을 추출하여 연속된 2차원 모양 정보로 표현되고, 각각의 2차원 모양 정보는 모양 기술자를 이용하여 1차원 모양 특정값으로 변환된다. 순서에 따라 나열된 모양 기술자 시퀀스를 이용하여 개별 동작의 분할 과정 없이 문서에서 단어를 검색하듯이 동영상에서 객체의 동작을 검색할 수 있다. MPEG-7 모양 변화 기술자와의 성능 비교 실험을 통하여 제안된 방법이 객체의 동작 정보를 보다 효과적으로 표현할 수 있으며, 동작 검색 및 분석 응용에 적용할 수 있음을 보였다.

  • PDF

포인터 네트워크를 이용한 한국어 의존 구문 분석 (Korean Dependency Parsing using Pointer Networks)

  • 박천음;이창기
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.822-831
    • /
    • 2017
  • 본 논문에서는 멀티 태스크 학습 기반 포인터 네트워크를 이용한 한국어 의존 구문 분석 모델을 제안한다. 멀티 태스크 학습은 두 개 이상의 문제를 동시에 학습시켜 성능을 향상시키는 방법으로, 본 논문에서는 이 방법에 기반한 포인터 네트워크를 이용하여 어절 간의 의존 관계와 의존 레이블 정보를 동시에 구하여 의존 구문 분석을 수행한다. 어절 기반의 의존 구문 분석에서 형태소 기반의 멀티 태스크 학습 기반 포인터 네트워크를 수행하기 위하여 입력 기준 5가지를 정의하고, 성능 향상을 위하여 fine-tuning 방법을 적용한다. 실험 결과, 본 논문에서 제안한 모델이 기존 한국어 의존 구문 분석 연구들 보다 좋은 UAS 91.79%, LAS 89.48%의 성능을 보였다.

연역적이고 국부적인 영문자의 폰트 분류법 ($\emph{A Priori}$ and the Local Font Classification)

  • 정민철
    • 한국산학기술학회논문지
    • /
    • 제3권4호
    • /
    • pp.245-250
    • /
    • 2002
  • 본 연구에서는 영문 단어로부터 폰트를 분류하기 위해 연역적이고 국부적인 폰트 분류 방법을 제안한다. 이는 문자 인식 전에 한 단어의 폰트를 분류하는 것을 말한다. 폰트 분류를 위해 활자 특성인 Ascender, Descender와 Serif가 사용된다. 입력 단어로부터 Ascender, Descender 와 Serif가 추출되어 경사도 특징 벡터가 추출되고, 그 특징 벡터는 인공 신경망에 의해 입력 단어에 대한 폰트 스타일, 폰트 그룹, 폰트 이름이 분류된다. 제안된 연역적이고 국부적인 폰트 분류 방법은 폰트 정보가 문자 분할기와 문자 인식기에 사용될 수 있게 한다. 나아가, 특정 폰트에 따른 Mono-Font 문자 분할기와 Mono-Font 문자 인식기로 구성되는 OCR 시스템을 구성할 수 있는 것을 가능하게 한다.

  • PDF

모바일 단말기를 위한 추천 소프트 키보드 (Preliminary Study on Soft Keyboard with Recommendation for Mobile Device)

  • 황기태;이재문
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.137-145
    • /
    • 2013
  • 최근 대부분의 모바일 단말기는 LCD 터치 화면에 소프트 키보드를 장착한다. 그러나 소프트 키보드의 터치화면의 크기가 작기 때문에, 인접키가 실수로 눌러지고, 한 키를 여러 키 입력에 중복 사용함에 따라 사용자의 키 입력 오류가 많이 발생한다. 본 논문에서는 사용자가 텍스트를 입력하는 동안 적절한 어휘를 추천하여 키 입력 오류를 쉽게 수정하도록 돕는 알고리즘을 제안하고 MissLess 소프트 키보드를 구현한 내용에 대해 기술한다. 3개의 간단한 테스트 셋을 작성하여 MissLess 키보드의 추천 성능을 평가한 결과 다소 차이가 있지만 90%에 달하는 추천 성능을 얻었다. 그러나 추천 워드가 4개인 것을 고려하면 추천 성능을 해석할 필요가 있다.

Performance Analysis of Space-Time Codes in Realistic Propagation Environments: A Moment Generating Function-Based Approach

  • Lamahewa Tharaka A.;Simon Marvin K.;Kennedy Rodney A.;Abhayapala Thushara D.
    • Journal of Communications and Networks
    • /
    • 제7권4호
    • /
    • pp.450-461
    • /
    • 2005
  • In this paper, we derive analytical expressions for the exact pairwise error probability (PEP) of a space-time coded system operating over spatially correlated fast (constant over the duration of a symbol) and slow (constant over the length of a code word) fad­ing channels using a moment-generating function-based approach. We discuss two analytical techniques that can be used to evaluate the exact-PEPs (and therefore, approximate the average bit error probability (BEP)) in closed form. These analytical expressions are more realistic than previously published PEP expressions as they fully account for antenna spacing, antenna geometries (uniform linear array, uniform grid array, uniform circular array, etc.) and scattering models (uniform, Gaussian, Laplacian, Von-mises, etc.). Inclusion of spatial information in these expressions provides valuable insights into the physical factors determining the performance of a space-time code. Using these new PEP expressions, we investigate the effect of antenna spacing, antenna geometries and azimuth power distribution parameters (angle of arrival/departure and angular spread) on the performance of a four-state QPSK space-time trellis code proposed by Tarokh et al. for two transmit antennas.

DEA를 이용한 서비스효율성 측정에 관한 연구 - 국내 5개 시중은행의 서비스품질지수를 중심으로 - (A Study on the Measurement of Service Efficiency using DEA - Focused on the SQI of Five Domestic Banks in Korea -)

  • 김진왕;유한주;송광석
    • 품질경영학회지
    • /
    • 제37권1호
    • /
    • pp.80-90
    • /
    • 2009
  • Nowadays, there are many companies which employ the SQI measurement to assess service quality. The purpose of this study is to measure the service efficiency for Bank Industry. In this paper, we tried to measure the efficiency of service quality and overall customer satisfaction by using Data Envelopment Analysis(DEA). Rather than using the usual method of converting the Service Quality Index(SQI) into mean value, we applied CCR/BCC models in DEA to service quality efficiency. Also, DEA/PS Model is recommended as appropriate model for evaluating service efficiency by complementing the shortfalls of the weighted value of DEA Model. In this study, six dimensions of service quality were considered as input variables and output variables(overall customer satisfaction, reusing intention, and word of mouth). The result of this study statistically verifies that 5 DMUs are relatively efficient, and intensive activities for service efficiency are needed for 20 sample branches. Managerial implications based on the analysis were suggested.