• 제목/요약/키워드: 음성.문자 텍스트

검색결과 38건 처리시간 0.032초

형태소 분석기를 이용한 키워드 검색 기반 한국어 텍스트 명령 시스템 (Keyword Retrieval-Based Korean Text Command System Using Morphological Analyzer)

  • 박대근;이완복
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.159-165
    • /
    • 2019
  • 딥러닝을 기반으로 한 음성 인식 기술이 상용 제품에 적용되기 시작했지만, 음성 인식으로 분석된 텍스트를 효율적으로 처리할 방법이 없기 때문에 VR 컨텐츠에서 그 적용 예를 찾아 보기는 쉽지 않다. 본 논문은 문장의 형태소를 분석하는 형태소 분석기와 챗봇 개발에 주로 이용되는 검색 기반 모델(Retrieval-Based Model)을 활용하여 명령어를 효율적으로 인식하고 대응할 수 있는 한국어 텍스트 명령 시스템을 제안하는 것을 목적으로 한다. 실험 결과 제안한 시스템은 문자열 비교 방식과 같은 동작을 하기 위해 16%의 명령어만 필요했으며, Google Cloud Speech와 연동하였을 때 60.1%의 성공률을 보였다. 실험 결과를 통해 제안한 시스템이 문자열 비교 방식보다 효율적이라는 것을 알 수 있다.

체인 코드를 이용한 문서 영상의 잡음 제거 방법 (A Noise Removal Method Using Chain Code for Document Images)

  • 김세호;서동환;박재화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.439-442
    • /
    • 2005
  • 카메라 모바일 폰이 대중화됨에 따라 이제 더 이상 음성 전달 기기로서가 아닌 정보 조작 및 정보 전달 기기로서의 기능이 더욱 중요해졌다. 때문에 이러한 욕구를 충족 시켜주기 위해서는 적시 적소에 정보를 활용할 수 있는 오프라인 문자 인식 시스템이 필요하게 되었다. 하지만, 오프라인 문자 인식 시스템은 카메라를 통해 입력된 영상 중에는 순수 문자 영상뿐만 아니라 배경 이미지나 잡음을 포함한다. 특히, 그림과 함께 삽입 되어져 있는 명함과 같은 텍스트 문서 같은 경우, 삽입되어져 있는 그림 때문에 오인식의 문제가 발생 할 수 있다. 따라서 본 논문에서는 카메라를 통해 입력되는 문서 영상을 문자와 배경 그림을 분리하여 효과적으로 잡음을 제거하는 방법을 제안하였다.

  • PDF

분산형 시스템을 적용한 음성합성에 관한 연구 (A Study on Speech Synthesizer Using Distributed System)

  • 김진우;민소연;나덕수;배명진
    • 한국음향학회지
    • /
    • 제29권3호
    • /
    • pp.209-215
    • /
    • 2010
  • 최근 광대역 무선 통신망의 보급과 소형 저장매체의 대용량화로 인하여 이동형 단말기가 주목 받고 있다. 이로 인해 이동형 단말기에 문자정보를 청취할 수 있도록 문자를 음성으로 변환해 주는 TTS(Text-to-Speech) 기능이 추가되고 있다. 사용자의 요구사항은 고음질의 음성합성이지만 고음질의 음성합성은 많은 계산량이 필요하기 때문에 낮은 성능의 이동형 단말기에 는 적합하지 않다. 본 논문에서 제안하는 분산형 음성합성기 (DTTS)는 고음질 음성합성이 가능한 코퍼스 기반 음성합성 시스템을 서버와 단말기로 나누어 구성한다. 서버 음성합성 시스템은 단말기에서 전송된 텍스트를 데이터베이스 검색 후 음성파형 연결정보를 생성하여 단말기로 전송하고, 단말기 음성합성 시스템은 서버 음성합성 시스템에서 생성된 음성파형 연결정보와 단말기에 존재하는 데이터베이스를 이용하여 간단한 연산으로 고음질 합성음을 생성할 수 있는 시스템이다. 제안하는 분산형 합성기는 단말기에서의 계산량을 줄여 저가의 CPU 사용, 전력소모의 감소, 효율적인 유지보수를 할 수 있도록 하는 장점이 있다.

모바일 이미지 기반의 문자인식 시스템 (The Character Recognition System of Mobile Camera Based Image)

  • 박영현;이형진;백중환
    • 한국산학기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.1677-1684
    • /
    • 2010
  • 최근 모마일 폰의 발달과 스마트 폰의 보급으로 인해서 많은 콘텐츠들이 개발되어지고 있다. 특히, 모바일 휴대장치에 소형 카메라가 탑재되면서부터 카메라로부터 입력되어지는 영상 기반 콘텐츠 개발은 사람들의 흥미뿐만 아니라 활용 면에서도 중요한 부분을 차지하고 있다. 그중 문자인식 시스템은 시각 장애인 보행 보조 시스템, 로봇 자동 주행 시스템, 비디오 자동 검색 및 색인 시스템, 텍스트 자동 번역 시스템 등과 같은 활용영역에서 매우 광범위하게 쓰일 수 있다. 따라서 본 논문에서는 스마트 폰 카메라로 입력되는 자연 영상에 포함되어 있는 텍스트를 추출 및 인식하고 음성으로 출력해주는 시스템을 제안하였다. 텍스트 영역을 추출하기 위해 Adaboost 알고리즘을 이용하고 추출된 개별 텍스트 후보영역의 문자 인식에는 오류 역전파 신경망을 이용하였다.

사용자 맞춤형 외국어학습 콘텐츠 구성을 위한 연구 (A study on Customized Foreign Language Learning Contents Construction)

  • 김귀정;이재일
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.189-194
    • /
    • 2019
  • 본 논문은 글로벌 시대를 살아가는 외국어 학습자들의 학습환경에서 IT기술과 학습콘텐츠의 개발을 통해 사용자 성향별 맞춤 콘텐츠를 제작하는 방법론에 대한 연구이다. 전 세계의 다양한 외국어 학습자들이 모바일기기와 모바일학습콘텐츠를 활용하여 다양한 분야의 학습활동을 하고 있으며 외국어학습이 대표적인 모바일 학습분야의 하나라고 볼 수 있다. 제시된 외국어학습콘텐츠 구성은 학습자의 모국어 음성 문자 텍스트를 기반으로 정보수집 및 콘텐츠 제작의 과정을 거쳐 사용자의 성향별 학습콘텐츠를 구성하는 방법을 제시하였다. 이는 학습자의 학습활동이 실제사용환경과 최대한 유사하게 만들어서 학습과 실제사용에 차이점이 없도록 콘텐츠를 구성하여 학습 후 시행착오를 거쳐 올바른 사용 순서로 이루어지는 기존의 학습방법과 차이를 보여준다. 또한 학습자 개인의 선호 어휘 문맥을 콘텐츠화하여 학습에 사용하므로 학습콘텐츠와 개인성향의 일치를 이루어 학습의 이질감을 최대한 줄여주는 역할을 할 수 있다. 본 연구 내용을 토대로 학습자의 모국어 어휘 문맥 분석 및 텍스트화 과정에 대한 추후 연구가 필요하다.

음성 인식 기반의 모바일 메신저 설계 및 구현 (The Design and Implementation of the Mobile Messenger based on Voice Recognition)

  • 유상철;유병석;김유미;이유진;고훈;윤성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1694-1697
    • /
    • 2012
  • 음성 인식은 인간이 발성하는 음성을 컴퓨터 프로그램을 이용하여 문자 정보로 변환하는 기술이다. 음성은 사람마다 각기 다르기 때문에 인식률도 각각 차이가 나게 되어 범용 인터페이스로 사용되기에는 적합하지 않다. 하지만 최근 구글, 다음 등 대형 포털을 중심으로 서버 기반의 음성 인식 서비스가 제공되면서 사용자 인터페이스로 음성을 이용하는 것이 주요 이슈로 부각되고 있다. 카카오톡과 같은 메신저 프로그램은 네트워크를 이용하여 그룹 내의 사용자들 간에 메시지를 주고받는다. 여기에 사용되는 터치 자판은 간격이 좁아서 오타가 많이 발생하고, 긴 문장을 입력할 때 시간이 많이 걸리며, 운전 중에 사용할 경우 사고 위험이 높아지는 단점이 있다. 이러한 문제들을 해결하기 위해서는 음성 인식 인터페이스를 접목하는 것이 이상적이다. 본 논문에서는 음성 인식 기반의 스마트폰용 모바일 메신저 프로그램을 설계 및 구현하였다. 외부의 음성 인식 서버를 이용하여 음성을 인식하고, 인식된 음성을 텍스트로 변환하며, 채팅 서버를 통해 메시지를 전달한다.

항해안전을 위한 AIS와 ECDIS 기반의 문자통신시스템 개발에 관한 연구 (A Study on the Development of Text Communication System based on AIS and ECDIS for Safe Navigation)

  • 안영중;강석용;이윤석
    • 해양환경안전학회지
    • /
    • 제21권4호
    • /
    • pp.403-408
    • /
    • 2015
  • 해상에서 발생하는 선박 간 음성통신의 문제점을 보완하기 위한 방법으로, 언어적 오류와 VHF 사용제한 및 잡음 등에 영향을 받지 않는 텍스트 기반의 통신시스템을 AIS의 통신기능과 ECDIS의 화면전시 및 입력기능을 연계하는 방법에 착안하여 설계하였다. 개발된 문자통신시스템은 메시지를 이용해 정확한 의사전달이 가능하며, 사용자 편의성 향상을 위한 다양한 UI들을 소프트웨어를 통해 구현하였다. 하드웨어의 추가적인 설치와 개조 없이 구현되고, Message Banner Interface를 이용해 통신문장을 키보드 입력 없이 선택만으로 송신할 수 있으며, 자체 메시지 코딩과 디코딩을 통해 처리속도를 향상시키는 장점을 가진다. 문자통신시스템의 실선적용은 사용자의 언어적 한계와 인식오류를 감소시킬 수 있고, 다양한 VHF 음성통신의 문제를 해결할 수 있는 가장 실용적인 대안으로 판단된다. 또한 해상교통량이 많은 수역에서의 VHF 통신량 감소와 텍스트 기반의 정확한 의사전달과 협력동작 요청으로 선박 간 충돌사고 예방에 도움이 될 것이다.

현대 한국어에서 아라비안 숫자의 읽기 규칙 연구 (A Study on the Arabic numeral reading rules in Modern Korean)

  • 정영임;김정세;김상훈;이영직;윤애선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.16-23
    • /
    • 2002
  • 본 논문에서는 아라비안 숫자를 포함한 텍스트를 음성으로 합성하기 위하여, 숫자 형태와 분류사 그리고 숫자가 나오는 문맥에 따라 숫자를 자동으로 문자화할 수 있는 전처리 규칙을 설정하는데 목적을 둔다. 먼저 선행연구를 통해 숫자를 포함한 수사 및 수사표현의 읽기 규칙의 적용 범위 및 한계점을 살펴보고, 음성 합성을 위한 아라비안 숫자의 문자화 규칙을 설정하고자 한다. 현대 한국어에서 아라비안 숫자를 읽는 방식은 크게 고유어 방식과 한자어 방식이 있으며 단(單)단위에서는 영어가 사용되기도 한다. 또한 한자어 방식에서도 단위를 붙여 읽는 경우와 모든 수를 단 단위로 읽는 경우가 있으므로, 아라비안 숫자의 문자화를 단순한 규칙을 설정하여 자동화하기에는 중의성이 높다. 본 연구에서는 (1) 숫자 전 전치어(pre-numeral), (2) 기호를 포함한 숫자열의 표현 형식과 크기, (3) 단위 표현, (4) 숫자 후치어(post-numeral), (5) 분류사(classifier) (6) 분류사 후치어(post-classifier), (7) 수사표현 앞뒤 문맥에 따라, 아라비안 숫자표현이 문자화되는 방식을 살펴보았다. 분석 대상 말뭉치는 C 신문의 2000년 1월부터 2000년 4월까지 전체 기사 1,400건에서 숫자가 포함된 숫자표현 약 63,000개론 구성하였다. 패턴화된 구조 및 중의성이 없는 구조를 12가지로 밝히고 중의성이 있는 구조의 유형을 밝혔으며 분류사 후치어와의 결합 관계, 좌우 문맥정보를 통해 중의성 해결의 단서를 제시하고자 하였다.

  • PDF

TTS 시스템을 위한 한국어 발음열 자동 생성 (Automatic Generatio of Korean Pronunciation Variants)

  • 차선화
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.413-418
    • /
    • 1998
  • 음성 합성 시스템의 한 모듈로서 한국어 문자열을 음소열로 자동 변환하는 시스템을 구현하였다. 문자열을 음소열로 변환할 때에는 한국어 음운현상에 대한 체계적인 분석 과정이 필요하다. 한국어의 음운 변화 현상은 단일 형태소 내부와 여러 형태소가 결합하여 한 어절을 이루는 경우 그 형태소 경계, 그리고 어절 경계에서 서로 다른 음운규칙이 적용된다. 따라서 언절이나 문장 등의 입력을 음소열로 변환하기 위해서는 형태소 분석, 태깅작업이 반드시 수행되어야 올바른 발음열을 유도할 수 있다. 본 논문에서 제안한 시스템은 한국어의 형태음운현상을 반영하기 위해 형태소 분석을 선행한 후, 한국어에서 빈번하게 발생하는 음운 변화 현상의 분석을 통해 정의된 음소 변동 규칙과 변이음 규칙을 선택적으로 적용하여 형태소, 어절, 언절 또는 문장 등의 다양한 형태의 입력에 대해 발음열을 생성한다. 기존의 연구에서 분리되어 있던 형태소 태거와 변환시스템을 통합하여 사용자 편의성을 높였으며 텍스트 기반의 형태소 분석기를 사용하기 때문에 원형이 복원되는 형태소들에 대한 처리 루틴을 두어 오류를 감소 시켰다.

  • PDF

전사텍스트를 이용한 반자동 레이블링 구현 (Implement of Semi-automatic Labeling Using Transcripts Text)

  • 원동진;장문수;강선미
    • 한국지능시스템학회논문지
    • /
    • 제25권6호
    • /
    • pp.585-591
    • /
    • 2015
  • 구어 연구를 위한 전사 과정에서 문자로 표현된 발화를 녹음 음성에 연결해주는 작업을 레이블링이라고 한다. 기존 레이블링 도구들은 대부분 수동으로 작업이 이루어진다. 제안하는 반자동 레이블링은 자동화 모듈과 수동 조정 모듈로 구성된다. 자동화 모듈은 G.Saha 알고리즘을 활용하여 음성구간을 추출하고, 기구축된 발화텍스트의 발화 수와 발화의 길이 정보를 이용하여 발화구간을 예측한다. 본 논문에서는 기존 수동 도구의 정확성을 유지하기 위하여 자동 레이블링된 발화구간을 보정하기 위한 수동 조정 사용자 인터페이스를 제공한다. 제안하는 반자동 레이블링 알고리즘으로 구현한 도구는 기존 수동 레이블링 도구와 비교하여 작업 속도가 평균 27% 향상되었다.