• Title/Summary/Keyword: 용어추출

Search Result 365, Processing Time 0.026 seconds

Voice Recognition using a Phoneme based Similarity Algorithm in Home Networks (음소 기반의 유사율 알고리즘을 이용한 Home Network 환경에서의 음성 인식)

  • Lee, Chang-Sub;Yu, Jae-Bong;Park, Joon-Seok;Yang, Soo-Ho;Kim, Yu-Seop;Park, Chan-Young
    • Annual Conference of KIPS
    • /
    • 2005.05a
    • /
    • pp.767-770
    • /
    • 2005
  • 네트워크상에서 전달되는 음성데이터는 전달되는 과정에서 잡음 등의 외부 요인으로 인하여 데이터에 손실이 생기는 문제가 발생한다. 이렇게 전달된 음성데이터가 음성 인식기를 통과하면 바로 음성 인식기를 통과했을 때 보다 인식률이 낮아진다. 본 연구에서는 홈 네트워크를 제어하는데 있어서 음성 인식률을 향상시키기 위해서 음성 데이터를 입력받아, 이를 음소단위 기반의 유사율 알고리즘을 적용시켜 이미 구축된 홈 네트워크 용어 관련 사전에 등록된 단어와의 유사성을 검토하여 추출된 결과로 홈 네트워크를 제어하는 방안을 제안한다. 음소단위 기반의 유사율 알고리즘과 다중발화를 이용했을 때 Threshold 값이 85% 일 경우 사전에 구축된 단어와 매칭된 인식률은 100%였으며, 사전에 없는 단어의 오인식률은 2%로 감소되었다.

  • PDF

Design and implementation of a XQuery Expansion System using Bio-Ontology (생물학 온톨로지를 이용한 XQuery 확장 시스템 설계 및 구현)

  • Kim Jeongjin;Yang Kyungah;Yang Jaedong;Bae Myungnam;Chung Myunggeun;Lim Myungeun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.268-270
    • /
    • 2005
  • 본 논문에서는 온톨로지를 활용하여 생물학 데이터를 효율적으로 통합 검색하기 위한 XQuery일 확장 시스템을 설계하고 구현하였다. 이를 위해 본 논문에서는 먼저 공개 생물학 온톨로지 등인 GO, UMLS들로부터 의미 있는 정보를 추출하기 위한 생물학 온톨로지 API를 온톨로지별로 정의하였다. 정의된 온톨로지 API는 본 시스템에서 사용하는 XQuery의 사용자 정의 함수로써 포함되며 이 XQuery는 본 시스템에 내장된 XQuery Expander에 의해 확장되어 처리된다. 확장된 XQuery는 온톨로지를 이용함으로써 이질적인 구조와 용어로 이루어진 생물학 데이터들을 통합 검색 할 수 있으며, 온톨로지에 정의되어 있는 지식과 관계들을 확장검색에 활용함으로써 재현율을 획기적으로 높일 수 있다. 본 논문에서는 또한 XQuery의 작성을 용이하게 할 수 있도록 지원하는 GUI 환경도 구현하였다.

  • PDF

A Study on the Development of a Metadata Schema for Sports Moving Records (스포츠경기 영상기록물을 위한 메타데이터 요소 개발에 관한 연구)

  • Jang, Ji Won;Kim, Soojung
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.25 no.4
    • /
    • pp.29-57
    • /
    • 2014
  • This study aims to develop a metadata schema for sports moving records based on a multiple entity model as an attempt to suggest an effective way to manage, retrieve, and utilize sports moving records. The multiple entity model consists of four entities - sports match, match contributors, moving records, and record management business - and metadata elements were developed for each entity. In addition, authority records for sports team and persons were created to ensure the consistency of terminology and provide rich contextual information. The suggested multiple entity model, metadata elements, and authority records for sports teams and persons were verified, modified, and expanded by a group of experts including a sports marketing expert and professors in the sports department.

A Study on the Development of Ontology based on the Jewelry Brand Information (귀금속.보석 상품정보 온톨로지 구축에 관한 연구)

  • Lee, Ki-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.13 no.7
    • /
    • pp.247-256
    • /
    • 2008
  • This research is to develop product retrieval system through simplified communication by applying intelligent agent technology based on automatically created domain ontology to present solution on problems with e-commerce system which searches in the web documents with a simple keyword. Ontology development extracts representative term based on classification information of international product classification code(UNSPSC) and jewelry websites that is applied to analogy relationship thesaurus to establish standardized ontology. The intelligent agent technology is applied to retrieval stage to support efficiency of information collection for users by designing and developing e-commerce system supported with semantic web. Moreover, it designs user profile to personalized search environment and provide personalized retrieval agent and retrieval environment with inference function to make available with fast information collection and accurate information search.

  • PDF

An Approach to Automatically Generating Infobox for Wikipedia in Cross-languages through Translation and Webgraph (번역과 웹그래프를 활용한 언어 간 위키피디아 인포박스 자동생성 기법)

  • Kim, Eun-Kyung;Choi, DongHyun;Go, Eun-Bi;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.9-15
    • /
    • 2011
  • 여러 언어로 작성되는 위키피디아의 경우 언어 간에 등록되어 있는 정보의 양과 내용이 달라 언어 간 정보를 상호 추출하고 서로 통합하는 연구에 대한 관심이 증가하고 있다. 특히, 위키피디아의 요약본으로써 의미가 있는 인포박스는 위키피디아 아티클에 존재하는 구조화된 정보 중 가장 근간이 되는 정보로, 본 논문에서는 위키피디아에 존재하는 인포박스를 1)소스 언어 자원으로부터 획득하여 타겟 언어로 번역하고, 2)번역된 결과물과 웹그래프를 이용하여 타겟 언어 데이터에서 획득하는 정보와 결합하는 과정을 통해 자동으로 인포박스를 생성하는 기법에 대하여 설명한다. 웹그래프는 위키피디아에 존재하는 링크 구조를 통해 서로 다른 두 용어간의 관련도를 측정하여 인포박스에 추가될 내용을 파악하는데 사용한다. 본 논문의 기법은 언어 간 인포박스를 생성하는 측면에서, 영어 인포박스 데이터를 입력으로 하여 한국어 인포박스 데이터를 생성하는 방식으로 진행하였다. 평가를 위하여 기존 한국어에 실제 존재하는 인포박스 데이터와 비교 실험하는 방식을 사용하여 평균적으로 40%의 정확률과 83%의 재현율을 나타내었다. 하지만, 기존 한국어에 존재하는 인포박스 데이터의 내용이 인포박스에 포함될 완전한 데이터를 모두 포함했다고 볼 수 없으므로 본 논문에서 제안하는 수행한 실험의 정확률이 상대적으로 낮게 나온 것으로 분석되었다. 실제 사람이 수작업으로 새롭게 생성된 인포박스 데이터의 적합성을 판별한 경우 평균 76%의 정확률과 91%의 재현율을 나타내었다.

  • PDF

A Study on the Faceted Classification Scheme for the Korea-related Records (1950~1979) Collected from UNESCO Archive (유네스코 소장 한국 관련 수집 기록물의 패싯 분류 체계 연구 - 1950~1979년 기록을 중심으로 -)

  • Park, Do Young;Oh, Kyung-Mook
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.31 no.2
    • /
    • pp.99-118
    • /
    • 2020
  • The purpose of this study is to suggest the faceted classification scheme as a new classification scheme for 1,136 records (1950-1979) collected from UNESCO which are related to Korea. After extracting 1,601 nouns from the titles and index terms of the 1,136 records, they were classified and categorized based on the temporarily set fundamental categories. Through repeated classification and categorization, the last category names were derived as facets. As a result, the faceted classification scheme for Korea related records are structured into 10 basic facets and 38 sub-facets.

A Study on Structuring Method of Study Data Supporting Efficient Keyword Search (효율적인 키워드 검색을 지원하는 학습자료의 구조화 방법 연구)

  • Kim, Eun-Kyung;Choi, Jin-Oh
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.1063-1066
    • /
    • 2005
  • Most reading systems that supply various study data generally support keyword search. But the usual keyword matching techniques have a problem to require the exact keyword matching, and could not find similar field materials. Futhermore, testing materials have too little information to apply the keyword matching search. To solve these problems, this thesis proposes the method to extract the important keyword from study data and to construct the database automatically when the data are stored at the storage. And using prepared similar terminology database, we suggest the intelligent and efficient technique to find study materials.

  • PDF

Automatic Text Summarization using Noun-Verb Cooccurrence Pattern (명사-동사 공기패턴을 이용한 문서 자동 요약)

  • Nam, Ki-Jong;Lee, Chang-Beom;Kang, Dae-Wook;Park, Hyuk-Ro
    • Annual Conference of KIPS
    • /
    • 2002.11a
    • /
    • pp.611-614
    • /
    • 2002
  • 문서 자동 요약은 입력된 문서에 대해 컴퓨터가 자동으로 요약을 생성하는 과정을 의미한다. 즉, 컴퓨터가 문서의 기본적인 내용을 유지하면서 문서의 복잡도 즉 문서의 길이를 줄이는 작업이다. 효율적인 정보 접근을 제공함과 동시에 정보 과적재를 해결하기 위한 하나의 방법으로 문서 자동요약에 관한 연구가 활발히 진행되고 있다. 본 논문의 목적은 어휘 연관성 정보를 이용하여 한국어 문서를 자동으로 요약하는 효율적이며 효과적인 모형을 개발하는 것이다. 제안한 방법에서는 신문기사와 같은 특정 부류에 국한되는 단어간의 어휘연관성을 이용하여 명사-명사 공기패턴과 명사-동사 공기패턴을 구축하여 문서요약에 이용한다. 크게 불용어 처리 단계, 공기패턴 구축 단계, 문장 중요도 계산 단계, 요약 생성단계의 네 단계로 나누어 요약을 생성한다. 30% 중요문장 추출된 신문기사를 대상으로 평가한 결과 명사-명사 공기패턴과 빈도만을 이용한 방법보다 명사-동사 공기패턴을 이용한 방법이 좋은 결과를 가져 왔다.

  • PDF

A Study of Facet Classification System Development for Arts and Cultural Education (문화예술교육 패싯 분류체계 설계에 대한 연구)

  • Park, Ok-Nam;Oh, Sam-Gyun;Kim, Se-Young
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.43 no.3
    • /
    • pp.197-219
    • /
    • 2009
  • The study acknowledges the need for classification systems in arts and cultural education. The study constructs a faceted classification system for this domain based on systematic methods. The study utilized iterative collaboration between domain experts and classification system developers. The classification system consists of 13 main facets and terms. The classification system has values to manage information resources effectively and efficiently. It is also beneficial for reducing cultural gaps in arts and cultural education as well as providing an information gateway for users.

Development of Special Documents Classification System using Deep Learning (딥러닝을 이용한 전문분야 문서 분류 시스템 개발)

  • Jin, Sang-Hyeon;Hwang, Sang-Ho;Kang, Won-Seok;Son, Chang-Sik
    • Annual Conference of KIPS
    • /
    • 2019.10a
    • /
    • pp.589-591
    • /
    • 2019
  • 본 논문에서는 고도장비의 운용 및 정비를 위한 교육훈련 시스템 개발을 위해 자연어 처리와 딥러닝 기술을 이용하여 항공정비와 관련된 전문분야의 문서 분류가 가능한 방법을 제안하고자 한다. 문서 분류 모델의 개발을 위해 항공정비 교범을 텍스트 파일로 변환하여 총 4917개의 문서를 생성하였으며, 정비사 개인별 정비능력 관리(IMQC)를 기준으로 12개의 범주로 구분하였다. 수집된 문서는 전문분야의 문서인 점을 고려하여 전문용어 사전을 추가하였으며, KoNLPy를 이용하여 전처리를 수행하였다. 전문분야의 문서는 범주에 상관없이 문서 내용의 유사도가 매우 높은 특징을 가지고 있어, 특정 범주내에서 중요한 정도를 잘 표현 할 수 있는 TF-ICF를 이용하여 특징 추출을 하였다. 이후 합성곱 신경망(CNN)을 이용하여 특징 맵을 생성한 후 완전 결합 계층을 통하여 분류하였으며, 테스트 문서 983건을 분류한 결과 평균 73.6%의 분류성능을 보여주었다.