• 제목/요약/키워드: 인식 모델

검색결과 4,429건 처리시간 0.035초

Bi-LSTM 보조 신경망 모델을 결합한 생성형 한국어 Inverse Text Normalization 모델 (Generative Korean Inverse Text Normalization Model Combining a Bi-LSTM Auxiliary Model)

  • 조정제;신동수;조경빈;한영섭;전병기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.716-721
    • /
    • 2023
  • Inverse Text Normalization(ITN) 모델은 음성 인식(STT) 엔진의 중요한 후처리 영역 중 하나이며, STT 인식 결과의 가독성을 개선한다. 최근 ITN 모델에 심층신경망을 활용한 연구가 진행되고 있다. 심층 신경망을 사용하는 대부분의 선행연구는 문장 내 변환이 필요한 부분에 토큰 태깅을 진행하는 방식이다. 그러나 이는 Out-of-vocabulary(OOV) 이슈가 있으며, 학습 데이터 구축 시 토큰 단위의 섬세한 태깅 작업이 필요하다는 한계점이 존재한다. 더불어 선행 연구에서는 STT 인식 결과를 그대로 사용하는데, 이는 띄어쓰기가 중요한 한국어 ITN 처리에 변환 성능을 보장할 수 없다. 본 연구에서는 BART 기반 생성 모델로 생성형 ITN 모델을 구축하였고, Bi-LSTM 기반 보조 신경망 모델을 결합하여 STT 인식 결과에 대한 고유명사 처리, 띄어쓰기 교정 기능을 보완한 모델을 제안한다. 또한 보조 신경망을 통해 생성 모델 처리 여부를 판단하여 평균 추론 속도를 개선하였다. 실험을 통해 두 모델의 각 정량 성능 지표에서 우수한 성능을 확인하였고 결과적으로 본 연구에서 제안하는 두 모델의 결합된 방법론의 효과성을 제시하였다.

  • PDF

가변 어휘 음성 인식기의 음향모델 개선 및 성능분석 (Acoustic Model Improvement and Performance Evaluation of the Variable Vocabulary Speech Recognition System)

  • 이승훈;김회린
    • 한국음향학회지
    • /
    • 제18권8호
    • /
    • pp.3-8
    • /
    • 1999
  • 문맥독립형 음향모델을 채택하고 있는 기존의 가변어휘 음성인식기는 주변환경에 따른 음소의 변화를 모델링 할 수 없었다. 이러한 문제를 해결하기 위해서는 변이음을 이용한 문맥의존형 음향모델을 사용해야 한다. 본 논문은 가변어휘 음성인식기의 음향모델을 효과적으로 개선하기 위하여 적용한 방법에 대해서 기술하고 있다. 즉, 음향모델의 개선은 엔트로피를 이용한 군집화 기법을 적용하여 변이음의 개수를 변경시키면서 최적의 변이음 모델을 추출하는 방법을 사용하였다. 개선된 모델에 대한 성능은 POW(Phonetically Optimized Words) 3848 DB 및 SNR이 크게 다른 2종류의 PC168 DB를 이용하여 훈련 및 인식 실험을 수행하면서 평가하였다. 결론적으로 변이음의 개수를 낮추면서도 인식 성능의 저하를 가져오지 않는 최적의 변이음 모델을 얻을 수 있었으며 PC168 DB를 이용한 인식실험을 통하여 확인할 수 있었다.

  • PDF

360 도 ERP 영상에서 행동 인식 모델 성능 향상을 위한 전처리 기법 (Preprocessing Methods for Action Recognition Model in 360-degree ERP Video)

  • 박은수;유재성;김승환;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.252-255
    • /
    • 2019
  • 본 논문에서 Equirectangular projection(ERP) 영상을 행동 인식 모델에 입력하기전 제안하는 전처리를 통하여 성능을 향상시키는 것을 보인다. ERP 영상의 특성상 행동 인식을 하는데 불필요한 영역이 일반적인 2D 카메라로 촬영한 영상보다 많다. 또한 행동 인식은 사람이 Object of Interest(OOI)이다. 따라서 객체 인식모델로 인간 객체를 인식한 후 Region of Interest(ROI)를 추출하여 불필요한 영역을 없애고, 왜곡 또한 줄어든다. 본 논문에서 제안하는 기법으로 전처리 후 CNN-LSTM 모델로 성능을 테스트했다. 제안하는 방법으로 전처리를 한 데이터와 하지 않은 데이터로 행동 인식을 한 정확도로 비교하였으며 제안하는 기법으로 전처리 한 데이터로 행동 인식을 한 경우 데이터의 특성에 따라 다르지만, 최대 61%까지 성능향상을 보였다.

  • PDF

망막 세포 특성에 의한 영상인식에 관한 연구 (A study on Image Recognition based on the Characteristics of Retinal Cells)

  • 조재현;김도현;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.393-397
    • /
    • 2007
  • 최근 시각 장애인을 위한 인공망막 모델 구현에 관한 연구 중 시피질 자극기 기술은 시각 자극 전달의 중간 단계를 생략하고 직접 뇌세포를 자극하는 것이다. 본 논문에서는 망막에서 시각 피질로 시각정보를 전달할 때 발생하는 시각 피질의 특성, 즉 방향성에 대한 반응 특성을 특징 데이터로 구성하여 인식함으로써 인간 시각 정보 처리와 유사한 영상 추출 및 인식 모델을 제안한다. 제안된 방법은 영상의 특징을 추출 한 후 Delta-bar-delta 기반 오류 역전파 알고리즘을 적용하여 영상의 특징들을 인식한다. 제시된 방법의 성능을 분석하기 위하여 다양한 숫자 패턴들을 대상으로 실험한 결과, 제안된 망막 세포로부터 전달된 정보를 방향성에 대한 민감성을 고려하여 영상의 특성을 추출하여 인식하는 모델이 기존의 영상 추출 및 인식 모델보다 인식률에 있어서는 별 차이가 없지만 다양한 실험에서 확인할 수 있듯이 인간 시각과 같이 인식 성능이 민감하지 않는 것을 알 수 있었다.

  • PDF

웹페이지에서 레이블이 없는 텍스트 인식을 위한 확률 모델 (A Probabilistic Method for Recognizing Unlabeled Text on Web Pages)

  • 정창후;이민호;주원균;맹성현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.163-165
    • /
    • 2003
  • 도메인 지식은 텍스트의 포맷과 의미 정보를 이용하여 웹에 존재하는 텍스트의 다양한 의미를 이해할 수 있도록 도와준다. 그러나 도메인 지식은 텍스트에 데이터의 의미를 표현하는 레이블이 존재하지 알을 경우에 텍스트 인식을 제대로 수행할 수 없기 때문에 무용지물이 되고 만다. 이러한 문제를 해결하기 위해 본 논문에서는 레이블이 존재하지 않는 텍스트의 의미를 효과적으로 추론할 수 있는 엔티티 인식 모델을 제안한다 엔티티 인식 모델은 베이지언 모델과 컨텍스트 정보를 결합한 방법으로서, 구조 분석을 수행한 HTML 문서의 텍스트 토큰에 대해서 어떤 엔티티에 속할 것인가를 결정하는 기능을 수행한다. 실험 결과 본 모델을 사용할 경우 기존에는 레이블이 없어서 인식되지 않았던 텍스트들을 효과적으로 인식하는 것을 확인할 수 있었다.

  • PDF

딥러닝 모델을 이용한 비전이미지 내의 대상체 분류에 관한 연구 (A Study on The Classification of Target-objects with The Deep-learning Model in The Vision-images)

  • 조영준;김종원
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.20-25
    • /
    • 2021
  • 본 논문은 Deep-learning 기반의 검출모델을 이용하여 연속적으로 입력되는 비디오 이미지 내의 해당 대상체를 의미별로 분류해야하는 문제에 대한 구현방법에 관한 논문이다. 기존의 대상체 검출모델은 Deep-learning 기반의 검출모델로서 유사한 대상체 분류를 위해서는 방대한 DATA의 수집과 기계학습과정을 통해서 가능했다. 대상체 검출모델의 구조개선을 통한 유사물체의 인식 및 분류를 위하여 기존의 검출모델을 이용한 분류 문제를 분석하고 처리구조를 변경하여 개선된 비전처리 모듈개발을 통해 이를 기존 인식모델에 접목함으로써 대상체에 대한 인식모델을 구현하였으며, 대상체의 분류를 위하여 검출모델의 구조변경을 통해 고유성과 유사성을 정의하고 이를 검출모델에 적용하였다. 실제 축구경기 영상을 이용하여 대상체의 특징점을 분류의 기준으로 설정하여 실시간으로 분류문제를 해결하여 인식모델의 활용성 검증을 통해 산업에서의 활용도를 확인하였다. 기존의 검출모델과 새롭게 구성한 인식모델을 활용하여 실시간 이미지를 색상과 강도의 구분이 용이한 HSV의 칼라공간으로 변환하는 비전기술을 이용하여 기존모델과 비교 검증하였고, 조도 및 노이즈 환경에서도 높은 검출률을 확보할 수 있는 실시간 환경의 인식모델 최적화를 위한 선행연구를 수행하였다.

공간객체 기반의 온톨로지와 규칙을 이용한 상황정보 모델 (Context Information Model using Ontologies and Rules Based on Spatial Object)

  • 박미;류근호
    • 정보처리학회논문지D
    • /
    • 제13D권6호
    • /
    • pp.789-796
    • /
    • 2006
  • 센서네트워크의 유비쿼터스 환경에서는 지능적이며 상황적응적인 서비스를 제공하기 위한 상황인식 기술이 핵심이다. 상황인식 응용을 지원하기 위해 특정 응용에 종속되지 않고 같은 환경 안에서 응용들이 공유하여 인식할 수 있는 새로운 상황정보 모델이 요구된다. 또한 상황정보모델은 다양한 상황표현과 복잡한 상황인식을 지원하여야 한다. 따라서 이 연구에서 상황인식 과정에 따라 상황정보를 정의하고 도메인 지식과 응용 지식을 온톨로지와 규칙을 이용하여 설계하였다. 공간객체모델을 이용하여 도메인의 공간 온톨로지를 표현하였으며 온톨로지를 확장한 규칙으로 응용 지식을 표현하였다. 풍부한 공간 온톨로지의 표현은 객체의 위치뿐만 아니라 객체사이의 거리와 인접한 객체에 대한 상황정보도 표현하였다. 제안한 상황정보 모델은 확장성과 유연성 및 상호교환을 가능하게 하며 기존의 GIS와 연동하여 다양한 공간상황을 표현하고 복잡한 공간상황을 인식할 수 있는 모델이다. 이 모델을 기반으로 한 시스템구조는 다양한 상황인식 응용뿐 아니라 대규모 실외 상황인식 응용인 대기오염과 재난재해방재 서비스에 적용 가능함을 제시하였다.

손 표현 인식을 위한 계층적 손 자세 모델 (Hierarchical Hand Pose Model for Hand Expression Recognition)

  • 허경용;송복득;김지홍
    • 한국정보통신학회논문지
    • /
    • 제25권10호
    • /
    • pp.1323-1329
    • /
    • 2021
  • 손 표현 인식을 위해서는 손의 정적인 형태를 기반으로 하는 손 자세 인식과 손의 동적인 움직임을 기반으로 하는 손 동작 인식이 함께 사용된다. 이 논문에서는 손 표현 인식을 위해 손가락의 위치와 형태를 기반으로 하는 계층적 손 자세 모델을 제안한다. 손 자세 인식을 위해서는 오픈소스인 미디어파이프를 기반으로 하고, 손가락 상태를 나타내는 모델과 이를 통해 손 자세를 나타내는 모델을 계층적으로 구성하였다. 손가락 모델 역시 손가락 하나의 굽힘과 손가락 두 개의 닿음을 사용하여 계층적으로 구성하였다. 제안하는 모델은 손을 통해 정보를 전달하는 다양한 응용에 사용할 수 있으며, 수화에서의 숫자 인식에 적용하여 그 유용성을 검증하였다. 제안하는 모델은 수화 인식 이외에 컴퓨터의 사용자 인터페이스에서 다양한 응용이 가능할 것으로 기대한다.

모델링 실천을 통한 과학 영재학생들의 메타모델링 지식 구성요소별 인식수준 분석 (Analysis of the Cognitive Level of Meta-modeling Knowledge Components of Science Gifted Students Through Modeling Practice)

  • 김기향;백성혜
    • 대한화학회지
    • /
    • 제67권1호
    • /
    • pp.42-53
    • /
    • 2023
  • 본 연구는 화학교과 내용 맥락 하에서 모델링 실천을 통해 드러난 메타모델링 지식 구성요소별 인식수준을 진단함으로써 메타모델링 지식과 통합된 모델링 실천 프로그램 구성을 위한 기초자료를 얻고자 하였다. A 과학 영재학교 2학년 재학생 16명을 대상으로 화학 교사가 변칙현상이 포함된 탐구기반 모델링을 진행하였으며, 모델의 가변성, 모델의 다중성, 모델링 과정 등 메타모델링 지식 구성요소별 인식수준을 분석하기 위하여 학생이 기록한 탐구노트와 연구자가 기록한 관찰노트를 분석에 활용하였다. 인식수준은 0단계부터 3단계까지 분류하였다. 분석 결과, 메타모델링 지식의 구성요소 중 모델링 과정에 대한 인식수준이 가장 높았으며 모델의 다중성 다음으로 모델의 가변성에 대한 인식수준이 가장 낮은 것으로 나타났다. 모델 가변성에 대한 낮은 인식수준의 원인은 학생들이 개념모델을 객관적 사실로 인식하는 것과 관련이 깊고, 모델 다중성에 대한 낮은 인식수준의 원인은 주어진 현상에 대해 오직 하나의 올바른 모델이 존재한다는 신념과 관련이 있다. 학생들은 개념모델을 화학기호와 같은 상징적 모델을 이용하여 정교화하였으나 모델링 전 과정에 영향을 주는 자료해석의 중요성에 대한 인식이 부족하였다. 모델의 본성을 명시적으로 안내할 수 있는 사전활동의 도입하고, 자료해석의 중요성을 구체적 예시를 통해 안내할 필요가 있다. 다른 관점에서 제안된 모델의 수용 가능성을 고려하고 검증하는 훈련이 모델링 실천 프로그램을 통해 이루어져야 한다.

연속 어휘 인식 시스템에서 어휘 클러스터링 모델의 성능 지원을 위한 검색 시스템 (Retrieve System for Performance support of Vocabulary Clustering Model In Continuous Vocabulary Recognition System)

  • 오상엽
    • 디지털융복합연구
    • /
    • 제10권9호
    • /
    • pp.339-344
    • /
    • 2012
  • 기존의 연속 어휘 인식 시스템에서는 의사 결정 트리 기반 공유 모델링 방법을 사용하여 인식률 향상 시킬 수 있었으나 이들 음소 데이타에 대한 검색을 지원할 수 없는 문제로 인해 시스템 모델의 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 연속 어휘 클러스터링 모델에서 음소 단위로 확률 모델을 검색할 수 있는 시스템을 모델링하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 95.88%의 인식률을 나타내었다.