• Title/Summary/Keyword: 텍스트 연구

Search Result 3,471, Processing Time 0.028 seconds

A Study on Indexing Method using Text Partition (텍스트분할에 의한 색인방법 연구)

  • 강무영;이상구
    • Journal of the Korean Society for information Management
    • /
    • v.16 no.4
    • /
    • pp.75-94
    • /
    • 1999
  • Indexing is a prerequisite function for the information retrieval system in order to retrieve the information of the documents effectively which are saved in database. As a digital data increases in accordance with the development of a computer, the numbers of literatures to be saved in database have also been increased in a large volume. To retrieve such documents of large volume, a lot of system resources and processing time will be required. In this paper, we suggest a advanced indexing method using text partition. This method can retrieve the documents of large volume in short processing time. We applied this suggested indexing method to real information retrieval system, and proved its excellent functions through the demonstration.

  • PDF

Rule-Based Temporal Information Extraction for Korean (규칙 기반 한국어 시간 정보 추출)

  • Jeong, Young-Seob;Do, Hyo-Jin;Lim, Joon-Ho;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.242-246
    • /
    • 2014
  • 웹을 비롯한 다양한 곳에서 기하급수적으로 증가하고 있는 문서들로 인해, 자연어 텍스트로부터의 지식추출의 중요성이 점차 커지고 있다. 이 연구에서는 한국어로 작성된 자연어 텍스트로부터의 시간 정보 추출을 위해 개발된 시스템을 소개하고, 직접 구축한 한국어 데이터셋에 대한 성능 분석을 제공한다. 이 시스템은 사람이 직접 작성한 규칙들에 기반하여 작동하지만, 질의응답시스템 등에 적용될 수 있는 수준의 성능으로 향상시키기 위해 기계학습 기반의 시스템으로 업그레이드하는 등의 작업을 계속할 것이다.

  • PDF

A Study on the Hypertext-space based on the Rhizome characteristic (리좀 특성이 반영된 하이퍼텍스트스페이스에 관한 연구)

  • Ahn, Hyun-Jeong
    • Korean Institute of Interior Design Journal
    • /
    • v.20 no.4
    • /
    • pp.63-73
    • /
    • 2011
  • In the middle of that a information form is being formlessly changed to diverse deirections, a design and a space as physical consequence show not only a allegory but mutually relational charicteristic meaning a nonboundary and nonlinear form by development of modem digital culture. Following development of the modern digital culture, a design and space which are physical results, show a point of correlative specificity, allegory, nonlinear and nonboundary, Not only a design and culture but also various circles handle a hypertext as a representative pivot in this change. this has same contexts as rhizome possessing a asignifiante and nomadic characteristic said by Felix Guattari and Gilles Deleuze. An ideal of rhizome space shows historical decisions, unexpected accidents, a concepts, an individual. a group, social compositions above an contrifugal exterior force, This study examines into surroundings designed by a hypertext and rhizome through a case accordingly and infers an ultramodern characteristic in conventional precognition with synthesizing a peculiarity of the digital generation space.

The Extraction of Effective Index Database from Voice Database and Information Retrieval (음성 데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색)

  • Park Mi-Sung
    • Journal of Korean Library and Information Science Society
    • /
    • v.35 no.3
    • /
    • pp.271-291
    • /
    • 2004
  • Such information services source like digital library has been asked information services of atypical multimedia database like image, voice, VOD/AOD. Examined in this study are suggestions such as word-phrase generator, syllable recoverer, morphological analyzer, corrector for voice processing. Suggested voice processing technique transform voice database into tort database, then extract index database from text database. On top of this, the study suggest a information retrieval model to use in extracted index database, voice full-text information retrieval.

  • PDF

왜 하필 4+3인가?

  • Kim, Chang-Il;Kim, Sin-Jwa
    • Communications of Mathematical Education
    • /
    • v.18 no.1 s.18
    • /
    • pp.45-60
    • /
    • 2004
  • 수학텍스트의 한 부분인 식은 일상 언어, 시각적 표현, 상징 등의 여러 기호와 함께 학생들에게 다양한 수학을 경험을 제공한다. 그러나 이러한 수학텍스트의 다양성은 수학시험 채점시 4+3인가, 4+3=7인가 혹은 부분점수를 줄 것인가의 이슈로서 변질되어 등장한다. 따라서 본 연구에서는 초등학교에서 다루는 식의 의미, 초등학교 아동에게 지도되는 식의 형태, 초등학교 1학년 아동의 식에 대한 이해, 초등학교 교사들의 식에 대한 이해 형태를 서울시 소재 한 초등학교의 1학년 담임교사 9명과 1학년 1 개 학급에 속한 아동과의 면담 및 설문 조사를 통하여 알아보았다. 아울러 제언에서는 수학텍스트의 한 부분인 식의 실제 교육현장에서 어떻게 반영되고 있는가에 대한 탐색을 통하여 식의 의미를 올바르게 전하기 위한 지도 방법, 교사 인식에 대한 방향을 제시하였다.

  • PDF

Applying Method WordNet for Concept based Image Retrieval system (개념 기반 이미지 검색 시스템을 위한 WordNet 적용 방안)

  • 조미영;최준호;김판구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.487-489
    • /
    • 2002
  • 기존의 키워드 기반 이미지 검색에서는 의미적 내용 인식을 위해 일반적으로 어휘적 정보나 텍스트 정보를 인간이 주석 형태로 달아주었다. 그러나 이런 텍스트 정보 기반 이미지 검색은 개념적 매칭이 아닌 스트링 매칭이므로 주석을 달아놓은 단어와 정확한 매칭이 없다면 찾을 수가 없다. 이러한 문제를 해결하기 위해 본 논문에서는 개념 기반 이미지 검색 시스템을 위한 WordNet의 적용 방안에 대해 연구했다. WordNet은 단언형이 아닌 단어의 의미 즉 synset이 구성 요소라는 특징을 이용해 각각의 이미지에 텍스트 정보 대신 적합한 개념의 Synset번호를 저장한다. 그리고 검색시 개념간의 유사성 측정을 이용해 검색어와 개념적으로 유사한 모든 이미지를 검색하도록 한다.

  • PDF

Text Region Extraction of Natural Scene Images using Gray-level Information and Split/Merge Method (명도 정보와 분할/합병 방법을 이용한 자연 영상에서의 텍스트 영역 추출)

  • Kim Ji-Soo;Kim Soo-Hyung;Choi Yeong-Woo
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.6
    • /
    • pp.502-511
    • /
    • 2005
  • In this paper, we propose a hybrid analysis method(HAM) based on gray-intensity information from natural scene images. The HAM is composed of GIA(Gray-intensity Information Analysis) and SMA(Split/Merge Analysis). Our experimental results show that the proposed approach is superior to conventional methods both in simple and complex images.

A Study on the Hypertext Characteristics of Contemporary Architecture space (현대건축공간에 나타난 하이퍼텍스트의 특성에 관한 연구)

  • Lee, Sun-Mi;Shim, Eun-Ju
    • Proceedings of the Korean Institute of Interior Design Conference
    • /
    • 2007.11a
    • /
    • pp.128-133
    • /
    • 2007
  • Modern society changes so fast that it makes the borderlines obscure among all the elements in physical environments as well as culture and economy through rapid flows of Network or new media. Also these flows of changes appears and collides everywhere at the same time, which continuously generates heterogeneous environmental factors. For this reason, architecture is required to correspond with circumstances of the day, but it doesn't keep up with the speed of social changes actually because it features physically fixed construction. This research offers new direction and possibilities of architecture space elements using pluralistic and do-centering attributes of hypertext as a counterplan, and finds out how architecture space should correspond with the moving environment of modern society.

  • PDF

Feature Selection for a Hangul Text Document Classification System (한글 텍스트 문서 분류시스템을 위한 속성선택)

  • Lee, Jae-Sik;Cho, You-Jung
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2003.05a
    • /
    • pp.435-442
    • /
    • 2003
  • 정보 추출(Information Retrieval) 시스템은 거대한 양의 정보들 가운데 필요한 정보의 적절한 탐색을 도와주기 위한 도구이다. 이는 사용자가 요구하는 정보를 보다 정확하고 보다 효과적이면서 보다 효율적으로 전달해주어야만 한다. 그러기 위해서는 문서내의 무수히 많은 속성들 가운데 해당 문서의 특성을 잘 반영하는 속성만을 선별해서 적절히 활용하는 것이 절실히 요구된다. 이에 본 연구는 기존의 한글 문서 분류시스템(CB_TFIDF)[1]의 정확도와 신속성 두 가지 측면의 성능향상에 초점을 두고 있다. 기존의 영문 텍스트 문서 분류시스템에 적용되었던 다양한 속성선택 기법들 가운데 잘 알려진 세가지 즉, Information Gain, Odds Ratio, Document Frequency Thresholding을 통해 선별적인 사례베이스를 구성한 다음에 한글 텍스트 문서 분류시스템에 적용시켜서 성능을 비교 평가한 후, 한글 문서 분류시스템에 가장 적절한 속성선택 기법과 속성 선택에 대한 가이드라인을 제시하고자 한다.

  • PDF