통합 검색 | Korea Science

음절수와 모음 열을 이용한 한국어 연결 숫자 음성인식 (Connected Korean Digit Speech Recognition Using Vowel String and Number of Syllables)

윤재선;홍광석
- 정보처리학회논문지A
- /
- 제10A권1호
- /
- pp.1-6
- /
- 2003
본 논문에서는 음절수와 모음 열 정보를 이용한 한국어 연속 숫자 인식을 제안하였다. 제안한 연속 숫자 인식기는 첫 단계로 발성된 연속 숫자 음성에서 음절수와 구간을 추출하고, 두 번째 단계로 모음 열을 인식한다. 이와 같이 인식된 모음 열 정보를 이용하여 인식 후보를 줄이게 된다. 인식후보 모델은 조음효과에 효과적으로 대처할 수 있는 CV(Consonant Vowel), VCCV, VC단위 HMM(Hidden Markov Model)을 사용하여 연속 숫자 음성인식기를 구성하였다. 실험결과 제안된 방법이 조음효과를 효과적으로 대처하고 연결 숫자 인식에 유효함을 확인하였다.
https://doi.org/10.3745/KIPSTA.2003.10A.1.001 인용 PDF KSCI

인지 가중 필터를 이용한 화자 인식의 성능 향상에 관한 연구 (On a Study of the Improvement of Speaker Recognition with Perceptual Weighting Filter)

배재옥
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
- /
- pp.428-431
- /
- 1998
화자 인식의 방법에서 사용되고 있는 특징 파라미터들은 음성 인식에서 사용되고 있는 특징 파라미터를 그대로 사용하고 있다. 따라서, 이를 화자 인식에 적용할 때 화자의 특성을 효과적으로 반영할 수 있어야 한다. 일반적인 화자의 특징이 고주파수 위주로 분포되어 있기 때문에 전체 스펙트럼의 고주파 영역을 강조시킬 수 있고, 또한 인간의 청각특성이 공진 주파수에 기반하여 이루어진다는 사실에 기반을 두어서 공진 주파수 위주로 강조시키는 인지 가중 필터를 인식단의 전처리로 사용하는 방법에 관한 것이다. 본 논문을 실험한 결과 전체 인식율에서는 기존의 방법보다 3.89%까지 인식율의 향상을 얻을 수 있었다. 또한 사칭자 수리율은 2.5%의 저하를 얻을 수 있었다.
PDF

과학 교사들의 비유 사용 실태 및 인식 조사 (A Study on Science Teachers' Practices and Perceptions of Using Analogies)

권혁순;노태희
- 한국과학교육학회지
- /
- 제19권4호
- /
- pp.665-673
- /
- 1999
서울 시내 22개 중학교에서 131명의 과학 교사를 대상으로 비유 사용 실태와 비유 사용에 대한 인식을 조사하였다. 대부분의 과학 교사들은 과학 수업에서 비유를 자주 사용하였고 비유의 효과에 대해서 매우 긍정적으로 인식하였다. 비유를 사용할 때에는 관련된 그림을 함께 제시하고, 비유 자체에 대하여 설명하고, 잘못 생각하기 쉬운 것도 언급해야 한다는 데 동의하였으며, 실제 수업 시간 중에 그렇게 한다고 응답하였다. 그러나 하나의 개념을 여러 개의 비유로 설명하거나 학생 스스로 비유를 만들도록 하는 것은 잘 이루어지지 않는 것으로 나타났다. 또한, 과학 수업에서 비유가 효과적으로 사용되기 위해서는 적절한 비유 자료와 체계적 비유 사용 수업 모형이 필요하다고 생각하였다. 한편, 석사 이상의 학위를 가진 교사 들이 비유 자체에 대해 더 많이 설명하였고, 비유 사용상 보완점과 비유 사용 전략의 필요성에 대해 더 긍정적으로 인식하였다. 과학 수업 및 학생 활동에 대하여 현대적 인식을 가진 교사들이 고전적 인식을 가진 교사들에 비하여 비유를 많이 효과적인 방식으로 사용하였다.
PDF

머리중심점 움직임 분석을 통한 유치원교육콘텐츠의 감성유발 평가기술 개발 (Development of Emotion Evaluation Techniques on Kindergarten Education Contents Using Head Movement Analysis)

김종화;김송이;차예술;강은혜;김진만;최유정;박병하;김용성;김성동;박영충
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
- /
- pp.317-318
- /
- 2015
다감각 자극을 사용한 유치원 교육콘텐츠 서비스를 제공하기 위해 머리중심적 움직임 분석을 사용한 감성인식 기술을 개발하였다. 유치원 교육콘텐츠는 청각/후각/시각 등의 다감각 자극을 통해 교육서비스의 효과를 극대화하기 위한 목적으로 제작되었다. 본 연구에서는 다감각 자극동안 유치원생들의 감성유발을 측정하여 교육서비스 효과를 검증하는 것을 목적으로 인식기술을 개발하였다. 개발한 인식기술은 카메라를 사용하여 상단영상을 측정하고, 머리중심점 움직임을 지속적으로 측정하여 분석함으로써 유발된 감성을 인식한다. 또한 감성인식 결과는 다감각 자극을 제어하는 시스템에 전달되어 다감각 자극을 제시하기 위한 정보로 활용된다. 본 연구의 결과로 교육콘텐츠의 감성유발 결과를 평가할 수 있으며, 효과를 극대화 하기 위한 도구로써 활용가능하였다. 더욱이, 교육콘텐츠 뿐만 아니라 다양한 콘텐츠 서비스 공간에 적용하여 효과 검증 및 서비스 효과 증가에 활용될 수 있는 기술로써 가치가 있을 것으로 예상된다.
PDF

연속분포 HMM에 의한 실시간 Word Spotting 에 관한 연구 (A Study on the Real-time Word Spotting by Continuous density HMM)

서상원
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
- /
- pp.92-95
- /
- 1995
연속분포 HMM을 사용한 실시간 로봇 암 제어 시스템에 대해 기술하고 있다. 본 시스템은 자연스러운 문장의 로봇 암 제어 명령 발성을 받아 핵심단어 인식의 framework을 통한 명령 인식 및 로봇 제어를 구현하고 있다. 로봇 몸체의 부분, 방향, 각도, 동작명령들에 대해 각기 우향 HMM, 이외의 비 핵심어들에 대해서는 이들을 한데 모아 ergodic형 상태천이를 모델링하는 garbage HMM을 형성했는데, 조사, 감탄사 등을 따로 모은 garbage 모델과, silence 및 배경 잡음에 대한 garbage 모델을 형성, 학습 및 인식에 포함시켜 연결단어 인식을 수행함으로써 핵심단어 인식의 효과를 얻었다. 이때 핵심단어들의 사용에 있어 간단한 문법적 제약을 가정하였다. 남성화자 35명을 대상으로 30개 문형에 대해 데이터 수집용 개념적 문장을 구성하여 음성 데이터를 수집하였다. 학습 화자에 대한 제어 명령 인식률은 95% 이상을 나타내고 있으며, 비 학습화자에 대한 인식율은 90% 이상이다. 또한 학습된 단어외의 비 핵심단어들의 사용에 대해서도 긍정적인 인식 성능을 보였다.
PDF

증강현실 콘텐츠의 이미지 인식 기법 효과성 연구 (A Study on the Effectiveness of the Image Recognition Technique of Augmented Reality Contents)

서동희
- 만화애니메이션 연구
- /
- 통권41호
- /
- pp.337-356
- /
- 2015
최근 증강현실 콘텐츠는 광고나 전시 등에서 많이 사용되고 있으며, 어린이들의 동화책으로도 출판되어 판매될 만큼, 대중화되었다. 증강현실 콘텐츠는 현실과 가상을 혼합하여 새로운 예술 공간을 창조하여, 경험자의 몰입도를 높이기 때문에 전시와 광고용 콘텐츠에서 어린이 체험, 교육용 콘텐츠로 다양하게 제작되고 있다. 제작 방법이 복잡하지 않기 때문에, 대학생 과정에서도 간단한 콘텐츠를 개발할 수 있어, 무한한 개발 가능성을 짐작할 수 있다. 증강현실은 카메라로 등록해 놓은 마커를 인식하게 하여 컴퓨터 그래픽 콘텐츠를 그 카메라에 비췬 현실세계에 불러온다. 이때, 증강현실의 제작과정에서는 이미지 인식 기법을 사용하는데, 이는 매우 일반적이며 쉬운 방법이다. 자신이 만든 이미지를 사용할 수도 있기 때문에, 동화책이나 광고에 전반적으로 사용되고 있다. 제작자들이 가장 많이 사용하는 증강현실 마커등록 플랫폼은 퀄컴에서 제공하는 Vuforia이다. 남서울 대학교 가상증강현실 연계전공 학부생들이 제작하여 세종문화회관에 전시된 세 개의 AR콘텐츠는 이미지 인식기법을 사용하였다. 본 연구는 퀄컴에서 제공하는 마커 등록 방법을 학생들이 증강현실 콘텐츠 제작과정에서 사용하면서 시작되었다. 세 개의 각각 다른 이미지를 제작하면서, 마커로 사용하기 위해 Vuforia에서 제공하는 Image Target Manager에 이미지를 등록시키고, 인식률을 조사하여, 인식률을 조금 더 높이기 위해 다양한 방법으로 이미지 제작법을 변경해보았다. 인식률이 높다는 것은 증강현실 콘텐츠를 안정적으로 사용할 수 있음을 의미하기 때문에, 높은 인식률을 가지기 위해, 다양한 시도들을 적용해보았다. 기획의도에 적합한 이미지를 제작하고, 보다 높은 인식률을 위해 몇 가지 방법을 적용하여, 인식률을 비교하였다. 색의 대비, 패턴 등의 요소를 통해 비교하였으며, 그 결과 효율적인 이미지 제작 방안을 제시하였다. 본 연구는 증강현실 콘텐츠의 안정적인 콘텐츠 제작 사례를 제시하고자 한다. 연구의 목적은 이미지 인식 기법을 기반으로 하는 증강현실 콘텐츠의 활용방안과 인식기법의 효과성을 제시하여 증강현실 콘텐츠 개발자들에게 실질적인 도움을 주는 것에 있다.
https://doi.org/10.7230/KOSCAS.2015.41.337 인용 PDF KSCI

접촉 숫자쌍 인식기를 이용한 필기 숫자열 인식 (Recognition of Handwritten Numeral Strings Using Touching Numeral Pair Recognizer)

최순만;오일석
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
- /
- pp.344-346
- /
- 2000
임의 길이 숫자열을 인식하기 위해서는 우선 숫자열 영상을 인식기가 다룰 수 있는 형태로 변환해야 한다. 만일, 사용하는 인식기가 낱자 단위 인식기라면 낱자 단위로 분할하여야 하는데, 두자 이상의 숫자들이 접촉한 경우 정확한 분할이 어렵다. 이 논문은 이러한 문제를 해결하기 위하여 접촉 숫자쌍을 분할하지 않고 통째로 인식하는 방법을 사용한다. 필기 숫자열을 인식하기 위해 제안한 방법은 두 개의 인식기를 이용한다. 숫자열에서 분할된 패턴이 낱자인 경우 낱자 인시기가, 접촉 숫자쌍일 경우 접촉 숫자쌍 인식기가 인식한다. NIST 데이터베이스에 대한 실험 결과 2~10개의 숫자를 포함한 숫자열에 대하여 83.76%의 숫자열 인식률을 보여 접촉 숫자열 패턴을 낱자 단위로 분할하지 않고도 효과적으로 인식할 수 있음을 확인할 수 있었다.
PDF

복수 등장인물을 대상으로 한 제스처 인식 (Gesture Recognition in Multiple People Environment)

홍석주;;김송국;김장운;이칠우
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2007년도 학술대회 1부
- /
- pp.891-896
- /
- 2007
지금까지 진행된 제스처 인식 연구는 한 사람을 대상으로 정적인 환경을 가정하여 이루어져 왔다. 본 논문에서는 복수의 등장인물이 존재하는 환경에서 대화 상대를 선택하여 제스처를 인식하는 방법에 대해 기술한다. 먼저 복수의 인물이 존재하는 환경에서 배경영역을 제외한 행위자의 영역을 추출한다. 그 후 각각의 행위자를 트래킹하면서 카메라와 가장 가까이 있는 행위자를 대화 상대자로 선택한다. 대화상대자가 선택되면 스테레오 카메라에서 입력된 영상에서 추출된 실루엣 이미지를 이용하여 얼굴과 두 손을 특징 영역으로 하여 매 프레임마다 Kalman filter를 사용하여 각 영역을 트래킹한다. 트래킹되는 특징 영역의 2차원 좌표 값을 모델 제스처의 2차원 좌표 값과 비교하여 가장 높은 유사값을 갖는 모델 제스처를 입력 제스처로 인식하게 된다. 본 논문에서 사용한 방법은 복수의 등장인물이 있는 경우 효과적으로 행위 대상자를 선택하여 제스처를 인식할 수 있다. 또한 제스처 인식에 있어서 단순한 큐 매칭을 사용함으로써 계산이 복잡하지 않은 장점이 있다. 실험을 통해 본 논문에서 제시한 방법을 적용함으로써 복수의 인물이 등장하는 환경에서 제스처 인식이 가능함을 입증한다.
PDF

음성 특징에 대한 시간 지연 효과 분석 (Analysis of the Time Delayed Effect for Speech Feature)

안영목
- 한국음향학회지
- /
- 제16권1호
- /
- pp.100-103
- /
- 1997
본 논문에서는 음성 특징의 시간 지연 효과에 대해서 분석한다. 여기에서 시간 지연 효과란 과거의 음성 특징 벡터가 현재의 음성 특징 벡터에 미치는 영향을 의미한다. 본 논문에서는 선형 예측 계수를 바탕으로 한 켑스트럼을 사용하였으며, 켑스트럼의 시간 지연 효과는 음성 인식 시스템의 성능을 바탕으로 평가하였다. 실험에 사용한 음성 데이터는 남성 화자 50명이 발성한 22단어 이며, 50명의 화자 중에서 25명은 음성 인식기의 훈련용으로 사용하였으며 나머지 25명은 평가용으로 사용하였다. 실험의 결과, 특징 벡터에서 시간 지연 효과는 저차원으로 갈수록 그 영향이 커지고, 고차원에서는 시간 지연 효과가 적었다.
PDF

한글의 구조적 특징을 이용한 인쇄체 한글인식을 위한 신경망 설계 (Neural Network design for Printed Hangul recognition using structural characteristic of Hangul)

서원택;조범준
- 한국멀티미디어학회:학술대회논문집
- /
- 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
- /
- pp.588-591
- /
- 2003
본 논문에서는 한글의 구조적인 특징을 이용하여 이를 효과적으로 인식할 수 있는 신경망을 설계해보았고, 이를 이용하여 주민등록증에 있는 이름을 인식하는 시스템을 구성해 보았다. 본 시스템은 한글의 6형식에 따른 구조적인 특징을 효과적으로 구분하기 위해 형식을 구분하는 신경망을 먼저 구성하여 형식별로 분류한 뒤, 형식에 따라 자모음을 분리하여 각 형식에 따라 구성된 2차 신경망으로 입력을 하여 인식하는 구조로 설계되었다. 훈련용 데이터는 각 형식 별로 자소를 분리해서 얻은 영상들을 자소별 평균이미지로 만들어서 이를 조합하여 만든 글자로 사용하였다. 그래서 같은 형식의 같은 자음이라도 글자의 모양과 위치가 조금 다른 것에 대해서 강인한 훈련을 할 수 있었다. 또한 히스토그램의 국부 평균을 적용함으로써 잡음에 효과적으로 대응하였다. 100명의 주민등록증을 컴퓨터 카메라를 이용하여 입력 받아서 테스트한 결과 98.1％의 높은 인식률을 얻을 수 있었다.
PDF

검색결과 1,688건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)