• 제목/요약/키워드: 정보 오류

검색결과 3,759건 처리시간 0.034초

한국어 음성 인식 시스템의 오류 유형 분류 및 분석 (Categorization and Analysis of Error Types in the Korean Speech Recognition System)

  • 손준영;박찬준;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.144-151
    • /
    • 2021
  • 딥러닝의 등장으로 자동 음성 인식 (Automatic Speech Recognition) 기술은 인간과 컴퓨터의 상호작용을 위한 가장 중요한 요소로 자리 잡았다. 그러나 아직까지 유사 발음 오류, 띄어쓰기 오류, 기호부착 오류 등과 같이 해결해야할 난제들이 많이 존재하며 오류 유형에 대한 명확한 기준 정립이 되고 있지 않은 실정이다. 이에 본 논문은 음성 인식 시스템의 오류 유형 분류 기준을 한국어에 특화되게 설계하였으며 이를 다양한 상용화 음성 인식 시스템을 바탕으로 질적 분석 및 오류 분류를 진행하였다. 실험의 경우 도메인과 어투에 따른 분석을 각각 진행하였으며 이를 통해 각 상용화 시스템별 강건한 부분과 약점인 부분을 파악할 수 있었다.

  • PDF

PBCA의 상태전이행렬을 이용한 이중 오류정정부호의 설계 (Design of Double-Error Correcting Code using the Transition Matrix of PBCA)

  • 조성진;허성훈;김석태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1561-1564
    • /
    • 2004
  • 초고속 유무선 통신망이 확대됨에 따라 디지털 데이터 통신 및 저장 시스템 설계 시 통신채널에서 발생하는 오류를 효율적으로 제어하기 위한 오류정정부호 장치가 중요한 요소가 되었다. 본 논문에서는 기존의 셀룰라 오타마타 기반의 오류정정부호를 개선시킨 이중 오류정정부부호를 설계하는 방법을 제안한다.

  • PDF

연속 변수를 사용한 양자 오류 정정 부호

  • 손일권;허준
    • 정보와 통신
    • /
    • 제31권9호
    • /
    • pp.65-69
    • /
    • 2014
  • 연속 변수 양자 오류 정정 부호는 전자의 스핀, 광자의 편광 등으로 나타내는 불연속 변수와는 다르게 빛의 진폭 및 위상처럼 연속적인 값을 가지는 양자 정보의 오류를 수정하는 기법이다. 본 논문에서는 안정 부호 형태를 기반으로 한 연속 변수 양자 오류 정정 부호의 구성을 살펴보고, 불연속 양자 오류 정정 부호와의 차이점을 알아본다.

병렬 코퍼스를 이용한 한중 기계번역 오류 탐지 방법 (Method for Detecting Errors of Korean-Chinese MT Using Parallel Corpus)

  • 김운;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.113-117
    • /
    • 2008
  • 본 논문에서는 패턴기반 자동번역시스템의 효율적인 번역 성능 향상을 위해 병렬 코퍼스(parallel corpus)를 이용한 오류 자동 탐지 방법을 제안하고자 한다. 번역시스템에 존재하는 대부분 오류는 크게 지식 오류와 엔진 오류로 나눌 수 있는데 통상 이런 오류는 이중 언어가 가능한 훈련된 언어학자가 대량의 자동번역 된 결과 문장을 읽음으로써 오류를 탐지하고 분석하여 번역 지식을 수정/확장하거나 또는 엔진을 개선하게 된다. 하지만, 이런 작업은 많은 시간과 노력을 필요로 하게 된다. 따라서 본 논문에서는 병렬 코퍼스 중의 목적 언어(Target Language) 문장 즉, 정답 문장과 자동번역 된 결과 문장을 다양한 방법으로 비교하면서 번역시스템에 존재하고 있는 지식 및 엔진 오류를 자동으로 탐지하는 방법을 제안한다. 제안한 방법은 한-중 자동번역시스템에 적용하여 그 정확률과 재현률을 측정하였으며, 자동적으로 오류를 탐지하여 추출 할 수 있음을 증명하였다.

  • PDF

한국어 복합명사 분해 오류 탐지 기법 (Error Detection Method for Korean Compound Noun Decomposition)

  • 강민규;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.181-185
    • /
    • 2009
  • 복합명사를 분해하는데 있어서 발생하는 분해오류들은 대부분 예외상황들로 취급된다. 전체적으로 차지하는 비중은 크지 않은데 오류 처리를 위해 들어가는 비용이 상대적으로 크기 때문이다. 하지만 분해된 데이터를 색인기나 문서분류기, 기계번역기 등에 실제로 적용해야 할 경우, 분해오류들을 수정해주어야 더 나은 성능을 보일 수 있기 때문에 분해오류를 찾아내고 수정하는 방법을 고안해야 한다. 본 논문에서는 복합명사 분해기에서 추출된 결과를 살펴보고, 주요 분해오류들이 가진 공통적인 특징을 파악하여 분해오류를 발견하는 방법을 생각해보고자 한다.

  • PDF

SNS 채팅 데이터에 적응적인 Self-Attention 기반 문맥의존 철자오류 교정 시스템 (Adaptive Context-Sensitive Spelling Error Correction System Based on Self-Attention for Social Network Service Chatting Data)

  • 최혜원;장대식;손동철;이승욱;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.362-367
    • /
    • 2019
  • 본 논문에서는 Self-Attention을 활용한 딥러닝 기반 문맥의존 철자오류 교정 모델을 제안한다. 문맥의존 철자오류 교정은 최근 철자오류 교정 분야에서 활발히 연구되고 있는 문제 중 하나이다. 기존에는 규칙 기반, 확률 기반, 임베딩을 활용한 철자오류 교정이 연구되었으나, 아직 양질의 교정을 수행해내기에는 많은 문제점이 있다. 따라서 본 논문에서는 기존 교정 모델들의 단점을 보완하기 위해 Self-Attention을 활용한 문맥의존 철자오류 교정 모델을 제안한다. 제안 모델은 Self-Attention을 활용하여 기존의 임베딩 정보에 문맥 의존적 정보가 반영된 더 나은 임베딩을 생성하는 역할을 한다. 전체 문장의 정보가 반영된 새로운 임베딩을 활용하여 동적으로 타겟 단어와의 관련 단어들을 찾아 문맥의존 철자 오류교정을 시행한다. 본 논문에서는 성능평가를 위해 세종 말뭉치를 평가 데이터로 이용하여 제안 모델을 실험하였고, 비정형화된 구어체(Kakao Talk) 말뭉치로도 평가 데이터를 구축해 실험한 결과 비교 모델보다 높은 정확율과 재현율의 성능향상을 보였다.

  • PDF

웹 기반 멀티미디어 공동 작업 환경에서의 오류 공유 시스템 (An Error Sharing System on a Web based Multimedia Collaboration Environment)

  • 고응남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.185-188
    • /
    • 2003
  • 본 논문에서는 웹 기반의 멀티미디어 공동 작업 환경에서의 오류 공유 시스템에 대하여 제안한다. 오류 공유 시스템은 윈도우 방식을 사용하고 응용 및 오류 공유 구조로는 분산 복제형 구조(CARV)이다. 분산 복제형 구조는 중앙 집중형 구조와 복제형 구조 두개의 장점을 취합한 형태이지만 복제형 구조처럼 완전한 대칭적인 구조를 가지고 있지는 않다. 감지된 오류는 웹 상의 오류 공유 시스템을 이용하여 신속히 전달하여서 오류를 공동으로 공유할 수 있게 하고 신속히 복구할 수 있도록 한다.

  • PDF

웹 기반 멀티미디어 네스티드 세션 관리에서 실행되는 오류 복구 시스템 (An Error Recovery System running on a Web based Multimedia Nested Session Management)

  • 고응남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.61-64
    • /
    • 2003
  • 본 논문에서는 웹 기반의 멀티미디어 네스티드 세션 관리에서의 오류 복구 방식에 대하여 기술한다. 네스티드 세션이란 하나의 부모 세션 아래에 여러 개의 자식 세션이 존재하는 것을 말한다. 제안하고자 하는 오류 제어는 웹 기반 멀티미디어 응용 개발 프레임워크에서 오류 발생시 오류를 하나의 메시지로 취급한다. 네스티드 세션에서 세션 유지와 복구를 위하여 웹 세션과 직접 연관된 프로세스만을 주기적으로 플링하여 오류를 발견하고 오류 복구는 네스티드 세션 및 검사점을 이용한 단순 재실행 방법을 사용하여 복구하는 알고리즘을 제안한다.

  • PDF

Feed-Forward Neural Network를 이용한 문맥의존 철자오류 교정 (Context-sensitive Spelling Error Correction using Feed-Forward Neural Network)

  • 황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.124-128
    • /
    • 2015
  • 문맥의존 철자오류는 해당 단어만 봤을 때에는 오류가 아니지만 문맥상으로는 오류인 문제를 말한다. 이러한 문제를 해결하기 위해서는 문맥정보를 보아야 하지만, 형태소 분석 단계에서는 자세한 문맥 정보를 보기 어렵다. 본 논문에서는 형태소 분석 정보만을 이용한 철자오류 수정을 위한 문맥으로 사전훈련(pre-training)된 단어 표현(Word Embedding)를 사용하고, 기존의 기계학습 알고리즘보다 좋다고 알려진 딥 러닝(Deep Learning) 기술을 적용한 시스템을 제안한다. 실험결과, 기존의 기계학습 알고리즘인 Structural SVM보다 높은 F1-measure 91.61 ~ 98.05%의 성능을 보였다.

  • PDF

단일 오류정정부호의 설계와 검사어 압축 (Design and Reduction of Check Bits of Single Error Correcting Code)

  • 조성진;황윤희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1209-1212
    • /
    • 2004
  • 현대사회에서 정보 전달의 중요성이 강조되면서 부호이론에 대한 연구가 빠른 속도로 진척되었다. 따라서 잡음이 있는 통신로를 통하여 정보를 전송하고자 할 때 발생하는 오류를 정정하는 오류정정부호 장치가 필요하게 되었다. 본 논문에서는 특별한 행렬을 이용하여 보내고자 하는 정보를 단일 오류정정 부호로 부호화, 복호화하고, 또 부호화과정에서 검사어를 압축하는 방법을 고안한 것이다.

  • PDF