• Title/Summary/Keyword: 텍스트 연구

Search Result 3,471, Processing Time 0.034 seconds

Graph-to-Text Generation Using Relation Extraction Datasets (관계 추출 데이터를 이용한 그래프-투-텍스트 생성)

  • Yang, Kisu;Jang, Yoonna;Lee, Chanhee;Seo, Jaehyung;Jang, Hwanseok;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.597-601
    • /
    • 2021
  • 주어진 정보를 자연어로 변환하는 작업은 대화 시스템의 핵심 모듈임에도 불구하고 학습 데이터의 제작 비용이 높아 공개된 데이터가 언어에 따라 부족하거나 없다. 이에 본 연구에서는 텍스트-투-그래프(text-to-graph) 작업인 관계 추출에 쓰이는 데이터의 입출력을 반대로 지정하여 그래프-투-텍스트(graph-to-text) 생성 작업에 이용하는 역 관계 추출(reverse relation extraction, RevRE) 기법을 소개한다. 이 기법은 학습 데이터의 양을 늘려 영어 그래프-투-텍스트 작업의 성능을 높이고 지식 묘사 데이터가 부재한 한국어에선 데이터를 재생성한다.

  • PDF

A Study on the Text-Independent Speaker Recognition Using Frequency Energy (주파수 에너지를 이용한 텍스트 독립 화자인식에 관한 연구)

  • 조연아
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.235-240
    • /
    • 1994
  • 모음 검출을 통하여 미리 등록한 단어가 아닌 경우에도 화자를 인식할 수 있도록 특징 파라메터를 개발하고, 실용화가 가능하도록 처리 방법을 간략화한 텍스트 독립 화자 인식 연구를 진행하였다. 이를 위해서, 화자가 발성한 음성에서 모음을 검출하여 화자인식에 사용하는 방법을 제안하였으며, 인식은 각 화자가 발성한 음성 신호에서 모음을 검출한 다음, 검출된 모음의 29 채널의 주파수 에너지를 퍼지값으로 효현한 후, 퍼지 추론을 적용하여 수행하였다. 실험을 위해 모음 검출 알고리듬을 개발하였으며, 화자인식의 특징 파라메터로 29 채널 주파수 에너지를 제안하였는데, 별도의 코드북 없이 사용이 가능하고, 기존의 파라메터에 비해 인식율이 높으면서도 구성 및 계산이 간단한 특징이 있다. 실험결과, 미리 작성된 표준패턴과 동일한 단어를 사용한 텍스트 의존 화자 인식 실험은 95.5% 인식율을 보였고, 표준 패턴과 다른 종류의 단어를 사용한 텍스트 독립 화자인식 실험은 94.2% 인식율을 보이고 있다.

  • PDF

Transcribing Some Text Symbols for Improving Korean TTS System (한국어 음성 합성을 위한'이음표'의 문자 전사)

  • 정영임;정휘웅;윤애선;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.558-560
    • /
    • 2003
  • 최근 신문기사의 음성 서비스 등 음성합성 연구가 실용단계로 접어들고 있으나, 텍스트의 비-문자 처리에는 오류율이 높다. 본 연구는 신문 텍스트에 나타나는 비-문자 중 중의성이 높은 이음표의 문자화 유형을 6가지로 제시하고, 이음표를 포함한 어절의 패턴화된 구조 및 좌우 문맥 정보를 이용하여 이음표의 문자화 규칙을 알아본다. 제시된 이응표의 문자화 규칙과 이음표가 좌우 문맥 숫자의 문자화에 미치는 영향에 따른 숫자 읽기 방식을 포함하여 이음표 포함된 텍스트의 문자화 전사 시스템을 구현하였고, 2런치 J신문 텍스트를 코퍼스로 하여 이음표 문자화 시스템의 정확도를 측정하였다. 아울러 실험 결과에서 오류로 나타난 유형을 분석하여 정확도를 향상시킬 수 있는 방안을 제시하였다.

  • PDF

Effective text visualization for biomedical information (생물 의료 정보의 효과적인 텍스트 시각화)

  • Kim, Tak-Eun;Park, Jong-C.
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.399-405
    • /
    • 2007
  • 생물 의료 분야에서 정보의 양이 아주 빠르게 증가하고 있다. 이러한 방대한 양의 정보에서 유용한 정보를 추출하기 위해 텍스트 마이닝 기법을 이용한 연구들이 많이 진행되어 왔다. 그렇지만 이렇게 뽑아진 정보조차 그 양이 방대하고, 또한 텍스트로 되어 있기 때문에 직관적으로 이해하기가 어렵다. 따라서 이러한 정보들을 좀 더 직관적으로 이해하기 위해서는 정보 시각화 시스템이 필수적이다. 최근 들어 이러한 정보 시각화에 대한 연구가 많이 진행되었으나 이러한 시각화 정보조차 너무나 방대하기 때문에 사용자가 필요로 하는 정보를 여과해 주는 방법이 필요하다. 그리고 시각화 시스템에서의 지식 발견을 위한 방법을 제공하여야 한다. 본 논문에서는 생물 의료 정보의 텍스트 시각화에 초점을 맞추어 생물 의료 정보의 효과적인 표현 방법과 지식 발견을 위한 직관적인 인터페이스를 제안하고자 한다.

  • PDF

The Effectiveness of Cognitive Load in Multimeida Learning (멀티미디어 학습환경에서 인지부하 효과)

  • 송승진;조경자;한광희
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.93-98
    • /
    • 2000
  • 본 연구에서는 멀티미디어 환경에서 인지부하 정도에 따라 학습 수행에 어떤 차이를 보이는지를 알아보고자 하였다. 본 연구에서는 멀티미디어 환경 학습을 함에 있어서 학습 제시 유형이 학습 수행에 영향을 미칠 것으로 보아, 같은 내용을 텍스트로 제시하는 조건, 텍스트와 나레이션으로 제시하는 조건, 애니메이션과 텍스트로 제시하는 조건에서 학습하도록 한 후 학습 수행 정도를 비교하였다. 학습 수행 정도는 학습이 끝난 후 즉시 시행하는 검사와 일 주일 후에 실시한 지연검사로 평가되었다. 그 결과 텍스트로만 제시한 조건의 학습자들이 다른 조건에 비해 즉시 검사와 지연검사 모두 더 높은 수행을 보인 것으로 나타났다. 이 결과는 멀티미디어 환경에서 인지부하를 주는 자극 제시 유형은 학습에 방해를 준다는 것을 보여주며, 이는 멀티미디어로 학습정보를 제시하는 것이 어떠한 경우에서나 늘 좋은 것이 아니라, 학습자 상황과 학습 내용을 충분히 고려해야 하는 것을 시사한다.

  • PDF

A Study on HTML Text Editor Development for Elementary School Students (초등학생을 위한 HTML 텍스트 에디터 개발 연구)

  • Lee, Eun-Young;Kim, Kap-Su
    • 한국정보교육학회:학술대회논문집
    • /
    • 2006.08a
    • /
    • pp.257-262
    • /
    • 2006
  • PISA의 연구 결과에 따르면 컴퓨터 활용 빈도나 ICT 활용 환경 등의 양적 활용 실태는 세계적인 수준이나 프로그램이나 소프트웨어 활동 등의 컴퓨터 질적 활용 정도는 제고될 필요성이 있는 것으로 나타났다. 이는 초등 컴퓨터 교육에도 시사하는 바가 크다. 하지만 인적 물적 여건 등으로 인해 프로그래밍 교육을 초등학교 현장에 바로 적용하기에는 무리가 있다. 따라서 본 논문에서는 언어의 복잡성이 낮고 프로그래밍 단계와 과정이 간단한 HTML을 현장에 효과적으로 적용하기 위한 텍스트 에디터를 개발하고 개선점을 찾아보았다. 텍스트 에디터는 우선 태그를 직접 칠 필요가 없으며 학생들이 쉽게 학습할 수 있도록 도움말을 제시해 주었고 간단한 이미지 뷰어 기능을 통해 쉽게 이미지를 넣을 수 있도록 하였다. 개발된 텍스트 에디터의 효과를 설문지로 조사한 결과 쉽게 HTML 문서를 작성할 수 있어 학습에 도움이 된다는 점과 도움말을 제시한 부분은 긍정적으로 평가된 반면 보다 UI를 좀더 개선해야 한다는 결과가 나왔다.

  • PDF

Development of an Indexing Model for Korean Textual Databases (국내 문자정보 데이터베이스의 색인에 관한 연구)

  • 정영미
    • Journal of the Korean Society for information Management
    • /
    • v.13 no.1
    • /
    • pp.19-43
    • /
    • 1996
  • The indexing languages and techniques were ~ u ~ e y e d for Korean textual databases, and retrieval effectivenesses of two indexing languages were evaluated in an online searching experiment. It was found that most of the Korean textual databases surveyed employ natural language indexing by either an automatic or a manual method, and that natural language indexing may outperform controlled language indexing if appropriate search strategies are employed.

  • PDF

Reproducing Fairy Tales for Plot Identification (사건의 흐름 분석을 위한 동화의 재구성)

  • An, Seungjoo;Park, Jong C.
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.3-8
    • /
    • 2011
  • 텍스트의 스토리를 자동으로 이해하기 위해 텍스트에서 기술된 사건(event)을 파악하고 이들을 조합하여 스토리가 어떻게 구성되어 있는지를 파악하는 연구들이 진행되어 왔다. 하지만 이는 스토리의 깊은 의미론적 이해를 요구하는 것 이외에도 텍스트마다 상황과 일어나는 사건들이 다양하기 때문에 언어 자원이 부족한 환경에서의 처리에는 한계가 있다. 이러한 문제는 사건들을 추상화 하여 단순하게 표현할 수 있다면 스토리 이해의 자연스러움을 저해하지 않고 해결 할 수 있다. 본 논문에서는 사건들의 추상화 과정을 위한 기초 연구로서 텍스트 속 등장인물이 행하거나 당하는 사건들을 추출하여 PMI기법을 통해 사건의 흐름을 파악하고 언어학적 단서를 참조하여 스토리 이해 과정에 누락될 수 있는 사건들을 추가하여 보완하였다. 이러한 접근을 통해 등장인물이 행할 수 있는 사건들을 재구성하여 단순화하는 방법을 제시한다.

  • PDF

Design of Fairy Tale Illustrations Automatic Generation System (동화 삽화 자동 생성 시스템 설계)

  • Moon, Young-Ju;Hong, SunGi;Lee, HwaMin;Kim, HyunBin
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1121-1124
    • /
    • 2013
  • 프로그램 실행 시 동화(텍스트)를 읽을 수 있게 하는 입력 파일을 받을 수 있게 만든다. 이렇게 받은 텍스트를 프로그램이 읽어 들여 알고리즘으로 대입한다. 알고리즘은 읽은 텍스트 중에 중요 단어를 뽑아내어 DB에 이에 알맞은 삽화를 요청하게 된다. 요청을 받은 데이터베이스는 다시 프로그램에 이미지를 보내주고, 프로그램은 이 삽화를 그 텍스트에 출력시키게 된다. 이 과정이 한 페이지를 만드는 과정이며, 원하지 않는 페이지는 건너 뛸 수 있게 한다. 이러한 작업을 반복하여 새로운 책 한권이 완성이 된다.

Text Style Transfer of Non-parallel Data using Transformer and Discriminator (트랜스포머와 판별기를 이용한 비병렬 데이터의 텍스트 스타일 변환)

  • Park, Da-Sol;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.64-68
    • /
    • 2020
  • 텍스트 스타일 변환은 문장 내 컨텐츠는 유지하면서 문장의 스타일을 변경하는 것이다. 스타일의 정의가 모호하기 때문에 텍스트 스타일 변환에 대한 연구는 대부분 지도 학습으로 진행되어왔다. 본 논문에서는 병렬 데이터 구축이 되지 않은 데이터를 학습하기 위해 비병렬 데이터를 이용하여 스타일 변환을 시도한다. 트랜스포머 기반의 문장 생성기를 이용하여 문장을 생성하고, 해당 스타일을 분류하는 판별기로 이루어진 모델을 제안한다. 제안 모델을 통해, 감정 변환의 성능은 정확도(Accuracy) 56.9%, self-BLEU 0.393(긍정→부정), 0.366(부정→긍정), 유창성(fluency) 798.23(긍정→부정), 1381.05(부정→긍정)을 보였다. 본 연구는 비병렬 데이터에 대해 스타일 변환을 적용함으로써, 병렬 데이터가 없는 다양한 도메인에도 적용가능 할 것이다.

  • PDF