• Title/Summary/Keyword: 언어TEXT

Search Result 754, Processing Time 0.023 seconds

Locative Inversion and EPP

  • Kim, Yong-Ha
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2002.06a
    • /
    • pp.181-183
    • /
    • 2002
  • No Abstract(See Full Text)

  • PDF

On The Full-Text Database Retrieval and Indexing Language

  • Chang, Hye-Rhan
    • Journal of the Korean Society for information Management
    • /
    • v.4 no.1
    • /
    • pp.24-46
    • /
    • 1987
  • The recent growth of full-text database operations has brought new opportunities for subject access. The fundamental problem of subject access in the online environment is the indexing language and technology. The purpose of this paper is to identify the characteristics and capabilities of full-text retrieval as compared to traditional bibliographic retrieval. Retrieval performance of indexing languages, full-text systems features achieved so far, and the new role of a controlled vocabulary, are examined. This paper also includes a review of the research on full-text retrieval performance.

  • PDF

The Design of Text and Dictionary Management System (텍스트 및 전자사전 관리시스템의 설계)

  • Lee, Jae-Sung;Choi, Byung-Jin;Lee, Woon-Jae;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.408-414
    • /
    • 1996
  • 자연언어처리 프로그램에서 어휘지식을 제공하는 전자사전은 그 중요성에 비해 작성 및 관리에 불편함이 많다. 본 논문에서는 전자사전의 작성 및 관리를 편리하게 할 수 있도록, 다양한 형태의 어휘 자료로부터 필요한 정보를 추출, 변형하고, 편집할 수 있는 텍스트 및 사전 관리시스템(TDMS: Text and Dictionary Management System)의 설계에 관하여 소개한다. TDMS에서는 SGML(Standard General Markup Language)의 일부를 사용하여, 표준사전 표기언어(SDML: Standard Dictionary Markup Language)를 정의하고, 이를 이용하여 다양한 형태의 사전 형식을 기술하고 있다. 또, 표준사전 표기언어로 표현된 사전이나 텍스트는 각종 응용프로그램에 독립적인 형태로 존재하여, 정보의 표준화와 교환을 용이하게 한다.

  • PDF

A Quantitative Approach to a Similarity Analysis on the Culinary Manuscripts in the Chosun Periods (계량적 접근에 의한 조선시대 필사본 조리서의 유사성 분석)

  • Lee, Ki-Hwang;Lee, Jae-Yun;Paek, Doo-Hyun
    • Language and Information
    • /
    • v.14 no.2
    • /
    • pp.131-157
    • /
    • 2010
  • This article reports an attempt to perform a similarity analysis on a collection of 25 culinary manuscripts in Chosun periods using a set of quantitative text analysis methods. Historical culinary texts are valuable resources for linguistic, historic, and cultural studies. We consider the similarity of two texts as the distributional similarities of the functional components of the texts. In the case of culinary texts, text elements such as food names, cooking methods, and ingredients are regarded as functional components. We derive the similarity information from the distributional characteristics of the two key functional components, cooking methods and ingredients. The results are also quantified and visualized to achieve a better understanding of the properties of the individual texts and the collection of the texts as a whole.

  • PDF

Development of Device Prototypes for Toddler Language Learning using Sensors and TTS API (센서와 tts api를 이용한 유아용 언어 학습용 디바이스 프로토타입 개발)

  • Choi, Hyo Hyun;Yu, Kwang Sik
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.509-510
    • /
    • 2021
  • 본 논문에서는 라즈베리파이, 마이크, 스피커, 버튼센서, 진동센서, TTS(Text-To-Speech) api를 활용하여 유아용 언어 학습용 디바이스를 개발한다. 학습시키고 싶은 단어가 쓰여져 있는 상자를 유아가 건드리면 그 단어의 소리가 나는 것을 가정하였다. 사용자가 버튼을 통해 직접 단어를 녹음을 할 수 있으며 웹페이지를 통해 텍스트(영어)를 입력하면 text-to-speech api를 통해 텍스트(영어)에 맞는 음성파일을 제공받을 수 있다. 저장된 음성파일은 진동센서를 통해 진동이 감지되면 스피커를 통해서 출력이 되는 시스템으로 구성하였다.

  • PDF

Graph-to-Text Generation Using Relation Extraction Datasets (관계 추출 데이터를 이용한 그래프-투-텍스트 생성)

  • Yang, Kisu;Jang, Yoonna;Lee, Chanhee;Seo, Jaehyung;Jang, Hwanseok;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.597-601
    • /
    • 2021
  • 주어진 정보를 자연어로 변환하는 작업은 대화 시스템의 핵심 모듈임에도 불구하고 학습 데이터의 제작 비용이 높아 공개된 데이터가 언어에 따라 부족하거나 없다. 이에 본 연구에서는 텍스트-투-그래프(text-to-graph) 작업인 관계 추출에 쓰이는 데이터의 입출력을 반대로 지정하여 그래프-투-텍스트(graph-to-text) 생성 작업에 이용하는 역 관계 추출(reverse relation extraction, RevRE) 기법을 소개한다. 이 기법은 학습 데이터의 양을 늘려 영어 그래프-투-텍스트 작업의 성능을 높이고 지식 묘사 데이터가 부재한 한국어에선 데이터를 재생성한다.

  • PDF

An Exploratory Study on Advertising Effectiveness Using Linguistic Analysis: Focused on KLIWC (언어분석을 이용한 광고효과 탐색연구 : KLIWC를 중심으로)

  • Ryu, Yeon-Jae
    • Journal of Digital Convergence
    • /
    • v.17 no.9
    • /
    • pp.407-420
    • /
    • 2019
  • The purpose of this study is to explore the possibility of measuring advertising effectiveness through the ad evaluation text. The 384 university students were asked to evaluate the positive and negative evaluation ads of high and low involvement products by self-report method and to write ad evaluation text online. The written ad evaluation text were analyzed by KLIWC and to examine the difference between the comment of positive and negative advertising. The results of the analysis are as follows. First, there were differences between positive and negative ads in 17 psychosocial variables. Second, there were differences between positive and negative ads in 9 linguistic variables. Third, there was a significant correlation between KLIWC variables(Positive & negative emotions, inhibition, conviction, physical condition & function and sleep/dreams) and advertising effect variables. This study suggests that the advertising evaluation comment reflects the consumer's psychological reaction to advertising and the possibility of measuring the advertising effectiveness using advertising evaluation text.

100 K-Poison: Poisonous Texts Resistance Test Dataset For Korean Generative Models (100 K-Poison: 한국어 생성 모델을 위한 독성 텍스트 저항력 검증 데이터셋 )

  • Li Fei;Yejee Kang;Seoyoon Park;Yeonji Jang;Hansaem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.149-154
    • /
    • 2023
  • 본고는 한국어 생성 모델의 독성 텍스트 저항 능력을 검증하기 위해 'CVALUE' 데이터셋에서 추출한 고난도 독성 질문-대답 100쌍을 바탕으로 한국어 생성 모델을 위한 '100 K-Poison' 데이터셋을 시범적으로 구축했다. 이 데이터셋을 토대로 4가지 대표적인 한국어 생성 모델 'ZeroShot TextClassifcation'과 'Text Generation7 실험을 진행함으로써 현재 한국어 생성 모델의 독성 텍스트 식별 및 응답 능력을 종합적으로 고찰했고, 모델 간의 독성 텍스트 저항력 격차 현상을 분석했으며, 앞으로 한국어 생성 모델의 독성 텍스트 식별 및 웅대 성능을 한층 더 강화하기 위한 '이독공독(以毒攻毒)' 학습 전략을 새로 제안하였다.

  • PDF

Web Search Engine based on Database Management System (데이터베이스 관리 시스템에 기반한 웹검색엔진의 구현)

  • Kang, Byung-Ju;Lee, Ji-Dong;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.211-218
    • /
    • 1997
  • 웹검색엔진은 색인되는 웹문서가 많아질수록 시스템 확장성(scalability)이라든지, 데이터베이스 유지 관리의 용이성, 데이터의 안전성 문제, 등의 많은 문제가 웹검색엔진에 부담으로 주어지게 된다. 반면에 인트라넷(intranet)용 검색엔진의 경우는 확장성보다는 검색엔진 자체의 개발의 용이성이 더욱 중요하다. Oracle $ConText^{TM}$는 오라클 사(社의) RDBMS인 $Oracle7^{TM}$의 정보검색 확장 옵션으로 텍스트를 Oracle7의 기본 데이터 타입으로 사용될 수 있게 한다. Oracle7+ConText는 대용량의 문서 베이스와 개발의 용이성을 동시에 보장할 수 있는 매우 훌륭한 웹검색엔진 개발 도구이다. 우리는 이를 검증하기 위하여 Oracle7+ConText에 기반한 WEBSECT(Web Search Engine With ConText)라는 웹검색엔진을 개발하였다. 본 논문은 WEBSECT의 개발과 시험 운영을 통해 데이터베이스에 기반한 웹검색엔진의 우수한 확장성과 텍스트 애플리케이션 개발의 용이성 등을 소개한다.

  • PDF

Preview Sentences and Paragraphing in Expository Text: Effects on Recall (사전문장과 문단나누기가 설명글의 기억에 미치는 효과)

  • Kim, Jung-Ho;Kim, Sun-Joo
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.405-412
    • /
    • 1992
  • The present study examined the effects of preview sentences and paragraphing in expository text on subjects' recall of the text. College students who participated in this study were randomly assigned to one of four text version groups: the no preview sentences and no paragraphing group, the no preview sentences and paragraphing group, the preview sentences and no paragraphing group, and the preview sentences and no paragraphing group. The result showed no significant effects of preview sentences and paragraphing. However, students' learning ability being considered, significant interaction effects were found. Although subjects with high learning ability recalled well regardless of whether or not passage was paragraphed, subjects with low learning ability recalled more in paragraphing condition than no paragraphing condition. The implication of these results is discussed.

  • PDF