• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.028 seconds

Construction of the Authority Files Using Automatically Indexed Terms (자동색인어를 이용한 전거파일의 구축)

  • 한영균
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.93-96
    • /
    • 1994
  • 본 연구는 자동색인시스템의 색인기능을 통해서 추출된 색인어를 이용해서 검색시스템에서 요구되는 전거파일을 구축하는 작업의 효용성을 확인하기 위한 시험적 연구의 결과를 정리한 것이다. 언론연구원의 KINDS 서비스 시스템의 신문기사 데이터베이스에서 색인시스템을 통해 추출된 약 80만개의 색인어를 기본자료로 삼아 색인어를 하위분류하고, 그것을 이용한 전거파일 구축의 가능성을 타진해 본 것이다.

  • PDF

Books Location Extraction System from Shelves by Image Processing (영상처리에 의한 서고에서의 도서 위치 검출 시스템)

  • Cho, Dong-Uk
    • Annual Conference of KIPS
    • /
    • 2003.05a
    • /
    • pp.695-698
    • /
    • 2003
  • 본 논문에서는 효율적인 전자도서관 구축을 위해 도서들의 위치를 자동으로 파악하는 시스템을 제안하고자 한다. 현재와 같이 일반인들에게 개방하고 있는 공공도서관이나 대형 서점에서 열람자가 도서를 제 자리에 꽂지 않아서 이를 정리하기 위한 지루하고 단순한 작업이 사서에 의해 수행되어야 만 한다. 본 논문에서는 이를 위해 영상처리 기술을 이용하여 도서의 위치를 자동으로 파악하는 시스템에 대해 기술하고자 한다 이는 크게 각 도서들 간의 경계 영역 추출 모듈, 도서들의 타이틀 영역 추출 모듈 그리고 도서 타이틀 영역 인식 모듈로 구성되며 향후 상용화에 성공할 시 해당 분야의 핵심 기술로 자리잡을 수 있을 것으로 사료된다.

  • PDF

Extraction of the Latent Index Terms Using the Word Frequency and Part of Speech in Automatic Indexing (자동색인에서 단어의 품사와 빈도를 이용한 색인후보어 발췌)

  • 이태영;남궁황
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2001.08a
    • /
    • pp.181-184
    • /
    • 2001
  • 본 논문에서는 적합한 색인어를 자동으로 추출해 내기 위해 잘 알려진 통계적 기법과 구문분석적 기법을 혼용하였다. 적용결과를 검색효율로 나타내지 않고 각 방법에 따라 추출된 단어들을 실증적으로 보여주어 성능에 대한 판단을 유도하였다. 빈도나 품사가 단독으로 사용된 것보다 동시에 적용된 것이 보다 좋은 결과를 가져왔다.

  • PDF

Study on Automatic Construction and Evaluation method of Caseframe (격틀 자동구축과 격틀평가 방법에 관한 연구)

  • Choi, Yong-Seok;Lee, Ju-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.272-279
    • /
    • 1999
  • 격틀이란 동사에 대해 필요한 격들과 그 격에 알맞은 단어집합으로 이루어져 있는 것으로 명사와 동사의 의미적 호응을 표현한다. 격틀은 자연언어처리분야에서 주요한 정보로 사용할 수 있다. 의미구분이라든지 번역에서 한국어 생성, 정보검색에서 중요정보 추출 등 잘 구성한 질 높은 격틀은 여러 연구의 질을 높여줄 수 있다. 따라서, 질 좋은 격틀을 구성하기 위한 여러 노력들이 현재 이루어지고 있다. 본 논문에서는 기계 가독형 사전과 말모듬을 이용해서 자동으로 격틀을 구성한다. 자동구성 방법으로 먼저 기계가독형 사전을 이용해서 상위개념 정보를 가지는 분류정보를 구성한다. 말모듬과 사전의 예문들을 형태소 분석한 후에 각각의 예문들을 분류정보를 이용하여 최상위 개념으로 바꾼다. 그리고, 말모듬과 사전의 예문에서 나온 정보들을 통합하므로 해서 자동으로 격틀을 구성한다. 자동으로 격틀을 구성한 후에 수동으로 구성한 격틀과 비교해 본다. 비교하기 위한 평가방법에 대해서 논의한다.

  • PDF

Implementation of Composition and Encoding System Using Effective Object Extraction Algorithm (효율적인 객체분할 알고리즘을 이용한 영상합성 및 부호화 시스템 구현)

  • 유홍연;이지호;홍성훈
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.1948-1951
    • /
    • 2003
  • 본 논문에서는 디지털 멀티미디어 방송 및 양방향 인터넷 방송 등에서 효율적인 객체기반 방송 서비스를 제공하기 위한 비선형 비디오 편집 시스템을 구현하였다. 구현된 시스템은 실시간으로 카메라를 통해 입력되는 영상 데이터에 대해 자동으로 움직이는 객체를 추출하는 자동분할과 HDD(hard Disk) 등에 저장되어 있는 동영상을 사용자의 조력에 의해 분할하는 반자동분할 기능을 제공한다. 그리고 추출된 객체를 저장매체에 저장되어 있는 그래픽 및 실사 배경영상과 합성하고 MPEG으로 부호화 할 수 있다. 또한 정보 유출을 원치 않는 객체에 대한 은닉 기능을 가지고 있다. 따라서 구현된 시스템은 비디오 정보제공자가 편리하게 객체를 분할하고 편집할 수 있으며 비디오 정보를 단기간에 효율적으로 비디오 정보 사용자에게 공급할 수 있는 기능을 제공한다.

  • PDF

Automatic Extraction and Clustering of Concepts for Domain Ontology Construction (도메인 온톨로지 구축을 위한 개념 자동 추출 및 클러스터링)

  • Jung, Hyun-Ki;Kim, Yu-Seop
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.305-309
    • /
    • 2008
  • 기존의 온톨로지 구축에 관한 연구들을 살펴보면 개념의 상 하위 관계와 관련한 연구 또는 기구축된 도메인에 특화된 지식베이스에 기반한 도메인 온톨로지 구축 연구가 주를 이룬다. 그러나 개념과 개념간의 관계는 상 하위 구조와 같은 단순한 계층적 구조로는 그 다양한 특성을 표현할 수 없으며, 도메인 온톨로지를 구축하는 경우에 기구축된 데이터베이스와 같은 개념간 관계가 잘 정의된 데이터는 반드시 필요하였다. 예를 들면, 다양한 지식이 구축되어 있는 데이터베이스나 특정 도메인에 관한 전문 사이트(예 : 의학정보, 약학정보 사이트) 등이 있어야 개념간의 다양한 관계가 표현되어 있는 온톨로지를 구축할 수 있었다. 본 연구에서는 도메인 온톨로지를 구축함에 있어서 이러한 제약을 극복하기 위하여 도메인에 특화된 문서들을 웹 검색을 통하여 수집하였고, 수집된 문서 데이터를 이용하여 자동으로 도메인에 특화된 개념들을 추출하고 이들 개념들을 클러스터링함으로써 개념들간의 다양한 관계를 표현할 수 있는 도메인 온톨로지의 자동 구축 가능성을 제시한다.

  • PDF

Full-automatic Classification Technique of News Video using Domain Ontologies (온톨로지를 이용한 뉴스 비디오의 자동 분류 기법)

  • Kim Ha-Eun;Lee Dong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.193-195
    • /
    • 2005
  • 본 논문은 온톨로지를 이용하여 뉴스 비디오를 분야별로 자동으로 분류하는 효율적인 기법을 제안한다. 이를 위해서 뉴스 비디오를 파싱하여 키프레임(Key frame), 샷(Shot), 씬(Scene)으로 나누고 키프레임과 샷에서 특징 정보를 추출한다. 추출된 특징 정보를 이용하여 샷의 키워드 집합을 만들고 이를 이용하여 씬의 키워드 집합을 만든다. 그리고 씬의 키워드 집합을 어휘 온톨로지와 뉴스 온톨로지에 매칭(추론)하여, 씬의 분야를 결정한다. 또한 이렇게 결정된 분야를 기반으로 서로 유사한 씬들을 자동으로 그룹화하는 방법을 제안한다.

  • PDF

A Method on Relative Relation Extraction based on Ontology (온톨로지 기반 친족관계 추출 방법)

  • Hwang, Myung-Gwon;Choi, Dong-Jin;Kim, Pan-Koo
    • Annual Conference of KIPS
    • /
    • 2009.11a
    • /
    • pp.289-290
    • /
    • 2009
  • 시맨틱 웹의 발전과 더불어 소셜 네트워크 자동 구축에 대한 연구가 활발히 진행되고 있다. 본 논문은 온톨로지를 기반의 소셜 정보 추출에 대한 방법을 다루고 있으며, 특히, 이에 필요한 온톨로지 모델링, 사람들 사이의 관계 추출을 위한 패턴 정의에 대해 기술하고 있다. 온톨로지와 패턴을 기반으로 역사적 인물들의 친족관계를 파악함으로써 소설 정보의 추출에 대한 가능성을 미리 짐작해 본다.

Automatic Segmentation of Stomach from the CT Image (CT 영상에서 위(Stomach)의 자동적인 추출)

  • 박승란;박종원;노승무
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.428-430
    • /
    • 1999
  • 컴퓨터 단층촬영(Computed Tomography : CT)내의 위(stomach)에 대하여 연구하였다. 위는 모양이 변하면서 움직이는 정기이며 음식물로 채워진 부분과 공기로 채워진 부분으로 나뉘어져 있다. 위의 명암 값 정보와 위치 정보를 이용하여 자동적으로 추출을 한 다음, 음식물로 채워진 부분과 공기로 채워진 부분, 그리고 전체적인 위의 체적을 계산할 수 있는 알고리즘을 구현하였다.

  • PDF

Postal Image Filtering Method based on ROI Image Matching (수취인 주소 영역의 영상매칭에 기반 한 유사 우편물 추출 방법)

  • 정창부;박상철;손화정;김수형
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.793-795
    • /
    • 2004
  • 우편물을 배달순서대로 정렬하는 과정을 순로구분이라고 하는데, 우편물의 처리과정에서 가장 많은 시간이 소요되는 부분이 바로 이 순로구분 과정이다. 우정선진국의 순로구분 자동화 시스템은 바코드를 이용하여 순로구분를 자동으로 처리하고 있지만, 국내의 시스템은 순로구분의 전 단계까지만 수행하고 나머지 과정은 배달원이 자신의 경험에 의해 수작업으로 처리하고 있다. 본 논문에서는 우편물을 자동 검증하는 방법으로 바코드 대신에 우편영상 특징기반의 Virtual ID 사용을 위한 유사한 우편영상 추출방법을 제안한다. 제안 방법은 질의영상과 후보영상간의 유사성을 판별할 때, 각 영상의 수취인 영역에서 추출된 문자열 Bounding Box들의 대응되는 쌍을 결정하고 그 쌍들의 영역이 겹치는 정도를 유사도로 측정하는 방법이다 291개의 우편영상에 대하여 실험한 결과, 289개의 영상이 정상적으로 유사한 우편영상으로 추출되었다. 또한, 유사한 우편영상으로 추출된 영상의 평균개수는 3.78개로 비교적 높게 나왔지만 이는 실험 데이터에 동일 DM 발송 우편물이 연속적으로 위치한 경우가 많았기 때문이다.

  • PDF