통합 검색 | Korea Science

음성인식기 성능 향상을 위한 영상기반 음성구간 검출 및 적응적 문턱값 추정 (Visual Voice Activity Detection and Adaptive Threshold Estimation for Speech Recognition)

송태엽;이경선;김성수;이재원;고한석
- 한국음향학회지
- /
- 제34권4호
- /
- pp.321-327
- /
- 2015
본 연구에서는 음성인식기 성능향상을 위한 영상기반 음성구간 검출방법을 제안한다. 기존의 광류기반 방법은 조도변화에 대응하지 못하고 연산량이 많아서 이동형 플렛홈에 적용되는 스마트 기기에 적용하는데 어려움이 있고, 카오스 이론 기반 방법은 조도변화에 강인하지만 차량 움직임 및 입술 검출의 부정확성으로 인해 발생하는 오검출이 발생하는 문제점이 있다. 본 연구에서는 기존 영상기반 음성구간 검출 알고리즘의 문제점을 해결하기 위해 지역 분산 히스토그램(Local Variance Histogram, LVH)과 적응적 문턱값 추정 방법을 이용한 음성구간 검출 알고리즘을 제안한다. 제안된 방법은 조도 변화에 따른 픽셀 변화에 강인하고 연산속도가 빠르며 적응적 문턱값을 사용하여 조도변화 및 움직임이 큰 차량 운전자의 발화를 강인하게 검출할 수 있다. 이동중인 차량에서 촬영한 운전자의 동영상을 이용하여 성능을 측정한 결과 제안한 방법이 기존의 방법에 비하여 성능이 우수함을 확인하였다.
https://doi.org/10.7776/ASK.2015.34.4.321 인용 PDF KSCI

모바일 폰의 모션 인식에 의한 근거리 데이터 교환 (Near-field Data Exchange by Motion Recognition of mobile phone)

황태원;서정희;박흥복
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2017년도 춘계학술대회
- /
- pp.800-801
- /
- 2017
위치 기반 서비스(LBS)는 정보 통신 기술과 모바일 폰의 급속한 성장으로 응급 지원, 네비게이션, 위치, 교통 노선, 정보 수집, 엔터테인먼트 등 다양한 응용에서 활용되고 있다. 일반적으로 위치는 좌표로 표시되고 지형과 관련이 있으며, 모바일 기반의 데이터 전송에 많은 관심을 가지고 있다. 본 논문은 위치기반 서비스를 기반으로 근거리의 개별 사용자의 모바일 폰의 동작을 탐지하여 상대방의 연락처를 교환하는 방법을 제안한다. 제안 방법은 모바일 폰의 가속도 센서를 이용하여 움직임을 추출하고 움직임이 일정 시간 이상 지속되면 위치와 시간 정보를 서버로 전송한다. 서버측에서는 근거리에서 모바일 폰의 움직임이 발생하는 사용자들 사이의 연결을 시도한다. 사용자간에 연결이 성공하면 서버측으로부터 암호화된 연락처를 전송받는다. 실험 결과, 제안된 방법은 기존의 방법과 비교하여 핸드셋(Handset) 내의 처리를 최소화하여 데이터를 교환할 수 있음을 보여준다.
PDF

EF 센서기반 손동작 신호 감지 및 자동 프레임 추출 (EF Sensor-Based Hand Motion Detection and Automatic Frame Extraction)

이훈민;정선일;김영철
- 스마트미디어저널
- /
- 제9권4호
- /
- pp.102-108
- /
- 2020
본 논문에서는 사람의 손동작에 의해 모바일장치상의 전기장센서를 통해 감지되는 동작신호의 실시간 검출 및 프레임 추출 알고리즘을 제안한다. 동작인식에 사용되는 전기장센서는 주변 환경 및 시점에 따라 랜덤잡음 및 센서 표면의 초기 대전상태의 가변적인 특성으로 인해 안정적으로 동작신호를 검출하는데 어려움이 있다. 본 논문에서는 이와 같은 환경에서도 안정적이고 강건하게 동작신호를 감지하여 검출할 수 있는 동적문턱치 방법(dynamic thresholding method)을 제안한다. 동작발생감지여부는 10Hz low-pass 필터와 MA(Motion Average) 필터를 통한 입력신호가 특정 문턱 전압값을 넘을 경우 감지되는데 감지 시점 센서상의 정전하상태가 가변적이므로 주기적으로 offset 값을 계산하여 새로운 문턱치를 동적으로 적용하는 방법이다. 이러한 방법으로 동작신호 감지율을 98% 이상으로 향상 시킬 수 있었다. 또한 일단 동작이 감지되면 정문턱치(positive thresold)와 부문턱치(negative threshold)의 통과시점, 횟수와 평균 동작주기를 고려한 동작신호프레임 알고리즘을 제안하였으며 이의 프레임추출 성공률도 98% 이상의 성능을 보였다. 본 논문에서 제안한 알고리즘으로 추출된 동작신호는 이후 신호정규화를 거쳐 LSTN 심층신경망 인식부를 거쳐 높은 손동작 인식률을 보임으로서 제안된 알고리즘의 우수함을 입증하였다.
https://doi.org/10.30693/SMJ.2020.9.4.102 인용 PDF KSCI

얼굴 특징영역상의 광류를 이용한 표정 인식 (Recognition of Hmm Facial Expressions using Optical Flow of Feature Regions)

이미애;박기수
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제32권6호
- /
- pp.570-579
- /
- 2005
표정인식 연구는 맨$\cdot$머신 인터페이스 개발, 개인 식별, 가상모델에 의한 표정복원 등 응용가치의 무한한 가능성과 함께 다양한 분야에서 연구되고 있다 본 논문에서는 인간의 기본정서 중 행복, 분노, 놀람, 슬픔에 대한 4가지 표정을 얼굴의 강체 움직임이 없는 얼굴동영상으로부터 간단히 표정인식 할 수 있는 방법을 제안한다. 먼저, 얼굴 및 표정을 결정하는 요소들과 각 요소의 특징영역들을 색상, 크기 그리고 위치정보를 이용하여 자동으로 검출한다. 다음으로 Gradient Method를 이용하여 추정한 광류 값으로 특징영역들에 대한 방향패턴을 결정한 후, 본 연구가 제안한 방향모델을 이용하여 방향패턴에 대한 매칭을 행한다. 각 정서를 대표하는 방향모델과의 패턴 매칭에서 그 조합 값이 최소를 나타내는 부분이 가장 유사한 정서임을 판단하고 표정인식을 행한다. 마지막으로 실험을 통하여 본 논문의 유효성을 확인한다.
PDF KSCI

연속된 수화 인식을 위한 자동화된 Coarticulation 검출 (Automatic Coarticulation Detection for Continuous Sign Language Recognition)

양희덕;이성환
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제36권1호
- /
- pp.82-91
- /
- 2009
수화 적출은 연속된 손 동작에서 의미 있는 수화 단어를 검출 및 인식하는 것을 말한다. 수화는 손의 움직임과 모양의 변화가 다양하기 때문에 수화 문장에서 수화를 적출하는 것은 쉬운 문제가 아니다. 특히, 자연스러운 수화 문장에는 의미 있는 수화, 수화가 아닌 손동작이 무작위로 발생한다. 본 논문에서는 CRF(Conditional Random Field)에 기반한 적응적 임계치 모델을 제안한다. 제한된 모델은 수화 어휘집에 정의된 수화 손동작과 수화가 아닌 손동작을 구별하기 위한 적응적 임계치 역할을 수행한다. 또한, 수화 적출 및 인식의 성능 향상을 위해 손 모양 기반 수화 인증기, 짧은 수화 적출기, 부사인(subsign) 추론기를 제안된 시스템에 적용하였다. 실험 결과, 제안된 방법은 연속된 수화 동작 데이타에서 88%의 적출률, 사전에 적출된 수화 동작 데이타에서 94%의 인식률을 보였으며, 적응적 임계치 모델, 짧은 수화 적출기, 손 모양 기반 수화 인증기, 부사인 추론기를 사용하지 않은 CRF 모델은 연속된 수화 동작 데이터에서 74%의 적출률, 사전에 적출된 수화 동작 데이타에서 90%의 인식률을 보였다.
PDF KSCI

밀리미터파의 손동작 인식 알고리즘에 관한 연구 (Study on Hand Gestures Recognition Algorithm of Millimeter Wave)

남명우;홍순관
- 한국산학기술학회논문지
- /
- 제21권7호
- /
- pp.685-691
- /
- 2020
본 논문에서는 77GHz를 사용하는 밀리미터파 레이더 센서의 반향 신호를 이용하여 손동작의 움직임을 추적한 후 얻어진 데이터로 0부터 9까지의 숫자들을 인식하는 알고리즘을 개발하였다. 손동작을 감지하여 레이더 센서로부터 얻어진 반향 신호들은 산란 단면적의 차이 등에 의해 불규칙한 점들의 군집형태를 보인다. 이들로부터 유효한 중심점을 얻기 위해 3차원 좌푯값들을 이용해 K-Means 알고리즘을 적용하였다. 그리고 얻어진 중심점들을 연결하여 숫자 형태의 이미지를 생성하였다. 얻어진 이미지와 스무딩 기법을 적용해 사람의 손글씨 형태와 유사하게 만든 이미지를 MNIST(Modified National Institute of Standards and Technology database)로 훈련된 CNN(Convolutional Neural Network) 모델에 입력하여 인식률을 비교하였다. 실험은 두 가지 방법으로 진행되었다. 먼저 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서는 각각 평균 77.0%와 81.0%의 인식률을 얻었다. 그리고 학습데이터를 확장(augmentation)한 CNN 모델의 실험에서는 스무딩 기법을 적용한 이미지와 적용하지 않은 이미지를 사용한 인식 실험에서 각각 평균 97.5%와 평균 99.0%의 인식률을 얻었다. 본 연구는 레이더 센서를 이용한 다양한 비접촉 인식기술에 응용이 가능할 것으로 판단된다.
https://doi.org/10.5762/KAIS.2020.21.7.685 인용 PDF KSCI

Antiblurry Dejitter Image Stabilization Method of Fuzzy Video for Driving Recorders

Xiong, Jing-Ying;Dai, Ming;Zhao, Chun-Lei;Wang, Ruo-Qiu
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제11권6호
- /
- pp.3086-3103
- /
- 2017
Video images captured by vehicle cameras often contain blurry or dithering frames due to inadvertent motion from bumps in the road or by insufficient illumination during the morning or evening, which greatly reduces the perception of objects expression and recognition from the records. Therefore, a real-time electronic stabilization method to correct fuzzy video from driving recorders has been proposed. In the first stage of feature detection, a coarse-to-fine inspection policy and a scale nonlinear diffusion filter are proposed to provide more accurate keypoints. Second, a new antiblurry binary descriptor and a feature point selection strategy for unintentional estimation are proposed, which brought more discriminative power. In addition, a new evaluation criterion for affine region detectors is presented based on the percentage interval of repeatability. The experiments show that the proposed method exhibits improvement in detecting blurry corner points. Moreover, it improves the performance of the algorithm and guarantees high processing speed at the same time.
https://doi.org/10.3837/tiis.2017.06.016 인용 PDF KSCI

키넥트 스테레오 영상을 이용한 원격 재활 시스템 (A Remote Rehabilitation System using Kinect Stereo Camera)

김경아;정완영;김종진
- 센서학회지
- /
- 제25권3호
- /
- pp.196-201
- /
- 2016
Rehabilitation exercises are the treatments designed to help patients who are in the process of recovery from injury or illness to restore their body functions back to the original status. However, many patients suffering from chronic diseases have found difficulties visiting hospitals for the rehabilitation program due to lack of transportation, cost of the program, their own busy schedules, etc. Also, the program usually contains a few medical check-ups which can cause patients to feel uncomfortable. In this paper, we develop a remote rehabilitation system with bio-signals by a stereo camera. A Kinect stereo camera manufactured by Microsoft corporation was used to recognize the body movement of a patient by using its infrared(IR) camera. Also, we detect the chest area of a user from the skeleton data and process to gain respiratory status. ROI coordinates are created on a user's face to detect photoplethysmography(PPG) signals to calculate heart rate values from its color sensor. Finally, rehabilitation exercises and bio-signal detecting features are combined into a Windows application for the cost effective and high performance remote rehabilitation system.
https://doi.org/10.5369/JSST.2016.25.3.196 인용 PDF KSCI

얼굴 표정 표현을 위한 얼굴 특징점 추출 (Facial Characteristic Point Extraction for Representation of Facial Expression)

오정수;김진태
- 한국정보통신학회논문지
- /
- 제9권1호
- /
- pp.117-122
- /
- 2005
본 논문은 얼굴 특징점 추출을 위한 알고리즘을 제안한다. 얼굴 특징점은 얼굴 애니메이션과 아바타 모방을 위한 표정 표현이나, 얼굴 표정 인식 등에서 중요한 자료이다. 얼굴 특징점 추출을 위한 기존 방법은 고가의 모션 캡쳐 장비나 표식을 사용하는 것으로 대상 인물에게 심리적 부담감이나 부자연스러움을 준다. 이에 반해 제안된 알고리즘은 카메라로 취득된 영상에서 영상 처리만으로 얼굴 특징점을 추출함으로써 기존 방법의 문제점을 해결한다. 또한 효율적인 특징점 추출을 위해 특징점 추출의 근원이 되는 기존 얼굴 구성요소 검출 알고리즘의 문제점을 분석하고 개선한다.
PDF KSCI

접근객체 인식 및 전송을 위한 영상 디지털 도어락 시스템 설계 (Video Digital Doorlock System for Recognition and Transmission of Approaching Objects)

이상락;박진태;우병현;최한고
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제3권6호
- /
- pp.237-242
- /
- 2014
기존 사용되고 있는 디지털 도어락 시스템은 사용자의 편의에 중점을 두어 보안 측면에서는 취약한 단점이 있다. 이에 본 논문은 중계기, 서버, 카메라와 센서, 통신 모듈이 결합된 디지털 도어락 시스템화하여 도어락 설치장소 전방에서 접근하는 객체를 감지 및 인식하고 이미지와 문 열림 정보를 사용자의 스마트 디바이스로 전송해 주는 영상 디지털 도어락 시스템을 제안하고자 한다. 제안한 시스템은 실험결과 대상거리 내에서 96~98%의 접근자 인식률과 사용 통신망에 따라 평균 약 17.1~23.9초의 전송시간이 소요되었다. 따라서 도어락 시스템 전방의 상황을 모니터링하여 실시간 보안 대응이 가능할 것으로 판단된다.
https://doi.org/10.3745/KTSDE.2014.3.6.237 인용 PDF KSCI

검색결과 40건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)