• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.031 seconds

A Study on the Integration of Information Extraction Technology for Detecting Scientific Core Entities based on Large Resources (대용량 자원 기반 과학기술 핵심개체 탐지를 위한 정보추출기술 통합에 관한 연구)

  • Choi, Yun-Soo;Cheong, Chang-Hoo;Choi, Sung-Pil;You, Beom-Jong;Kim, Jae-Hoon
    • Journal of Information Management
    • /
    • v.40 no.4
    • /
    • pp.1-22
    • /
    • 2009
  • Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In this study, we define scientific as a set of 10 types of named entities and technical terminologies in a biomedical domain. in order to automatically extract these entities from scientific documents at once, we develop a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer, co-reference resolver and terminology extractor. Each module of the integrated system has been evaluated with various corpus as well as KEEC 2009. The system will be utilized for various information service areas such as information retrieval, question-answering(Q&A), document indexing, dictionary construction, and so on.

3D Position Information Extraction of Video Image for Motion Simulation (모션 시뮬레이션을 위한 동영상에서의 3D 위치 정보 추출)

  • 박혜선;강신국;박민호;김항준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.223-225
    • /
    • 2003
  • 패턴을 기반으로 딴 AR(Augmented Reality) 시스템은 실시간 동영상 안에 가상 물체들을 정확하게 올리기(registering) 위한 좋은 방법이다. AR 시스템을 구현하기 위해서는 우선 카메라가 보고 있는 영상의 3D 위치 정보를 추출하여야 한다. 본 논문에서는 카메라가 보고 있는 체스판 영상의 3D 위치 정보를 자동적으로 추출하여 그것과 동기적으로 움직이는 가상의 object를 구현하는 시스템을 제안한다. 제안된 방법은 카메라 1 대를 가지고 어떠한 sensor 나 marker 를 사용하지 않고 시간적 정보만을 이용하여 비교적 정확한 3D 위지 정보를 추출할 수 있고, 추출된 3D 위치 정보를 통해 자연스러운 3D 모션 시뮬레이션을 구현할 수 있다.

  • PDF

Academic Conference Categorization According to Subjects Using Topical Information Extraction from Conference Websites (학회 웹사이트의 토픽 정보추출을 이용한 주제에 따른 학회 자동분류 기법)

  • Lee, Sue Kyoung;Kim, Kwanho
    • The Journal of Society for e-Business Studies
    • /
    • v.22 no.2
    • /
    • pp.61-77
    • /
    • 2017
  • Recently, the number of academic conference information on the Internet has rapidly increased, the automatic classification of academic conference information according to research subjects enables researchers to find the related academic conference efficiently. Information provided by most conference listing services is limited to title, date, location, and website URL. However, among these features, the only feature containing topical words is title, which causes information insufficiency problem. Therefore, we propose methods that aim to resolve information insufficiency problem by utilizing web contents. Specifically, the proposed methods the extract main contents from a HTML document collected by using a website URL. Based on the similarity between the title of a conference and its main contents, the topical keywords are selected to enforce the important keywords among the main contents. The experiment results conducted by using a real-world dataset showed that the use of additional information extracted from the conference websites is successful in improving the conference classification performances. We plan to further improve the accuracy of conference classification by considering the structure of websites.

Event Sentence Extraction for Information Extraction (정보 추출을 위한 이벤트 문장 추출)

  • Kim, Tae-Hyun;Lim, Soo-Jong;Yun, Bo-Hyun;Park, Sang-Gyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.325-331
    • /
    • 2002
  • 정보추출 시스템의 목적은 관심의 대상이 되는 특정 정보를 선택적으로 찾아내 제시하는데 있다. 따라서 도메인 정보에 의존적인 방법으로 정보추출이 이루어질 수밖에 없고, 이에 따른 도메인 정보 구축의 부담이 컸다. 이러한 부담을 줄이기 위해 본 연구에서는 특정 주제영역과 관련한 문서로부터 자동으로 이벤트 문장을 추출하는 시스템을 제안한다. 이벤트 문장이란, 특정도메인에서 다루어지는 이벤트의 구체적인 내용을 포함하고 있는 문장이다. 이러한 문장을 추출함으로써 기본적인 수준의 정보추출 요구를 만족시킬 수 있을 뿐만 아니라, 주출된 이벤트 문장을 도메인 정보 구축에 활용할 수 있을 것이다. 본 연구에서는 동사, 명사, 명사구, 및 3W 자질을 이용하여 문장추출의 성능을 최대화하기 위한 방안을 제안하고, 세 개의 평가 도메인을 대상으로 실험을 수행하였다. 실험 결과, when 및 where 자질과 동사, 명사. 명사구의 가중치를 이용하여 문장 가중치를 계산함으로써 최적의 이벤트 문장추출 성능을 얻을 수 있음을 알 수 있었다.

  • PDF

Auto-focus of Optical Scanning Holographic Microscopy Using Partial Region Analysis (광 스캐닝 홀로그램 현미경에서 부분 영역 해석을 통한 자동 초점)

  • Kim, You-Seok;Kim, Tae-Geun
    • Korean Journal of Optics and Photonics
    • /
    • v.22 no.1
    • /
    • pp.10-15
    • /
    • 2011
  • In this paper, we propose an auto-focusing algorithm which extracts a depth parameter by analyzing a selected part of a hologram, and we use experimental results to show that the algorithm is practical. First, we record a complex hologram using Optical Scanning Holography. Next we select some part of hologram and extract depth information through Gaussian low pass filtering, synthesizing a real-only hologram, power fringe-adjusted filtering and inverting to a new frequency axis. Finally, we reconstruct the hologram automatically using the extracted depth location.

A Study of The Extraction of Road Horizontal Alignment Design Elements in Urban Areas using the Digital Map (수치지도의 도로 중심선을 이용한 토로의 평면선형 설계요소 자동추출에 관한 연구)

  • 김민석;유기윤;김용일;곽태석
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.551-557
    • /
    • 2004
  • 미래의 텔레매틱스(telematics)환경에서 차량항법과 관련된 주요 핵심 기술은 동적 경로 안내 이외에 차량 자체의 지능화를 통해 운전자에게 주행 중인 도로에서 급경사, 급커브 구간에 대한 정보를 사전에 경고함으로써 사고를 방지하는 운전자 보조 및 경고 시스템(driver assistance and warning system) 구현으로 전망되고 있다. 이와 같은 기술이 구현되기 위해서는 현재 차량항법용 수치도로지도에서 도로의 단순 위치정보만으로는 불가능하며 도로의 곡선구간에서 평면 곡선반경과 같은 도로의 선형설계요소에 대한 정보가 필수적이다. 따라서 본 연구에서는 현재 전국적으로 구축되어있는 1/1000 수치지도의 도로중심선을 이용하여 실제 도로의 평면 선형설계요소를 자동으로 추출하기 위한 알고리즘을 개발하였고 이를 GUI 환경의 프로그램으로 구현함으로써 기존 도로의 정확한 평면 선형정보를 경제적이면서 효율적으로 획득할 수 있게 되었다.

  • PDF

A Design of the Automatic Keyword Maker (자동 키워드 제작기 시스템 설계)

  • Lee, Chang-Yeol;Kang, Hyun-Kyu;Jang, Ho-Wook;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.71-77
    • /
    • 1993
  • 본 논문에서는 대규모 텍스트 데이타 베이스를 구축하거나 전자 도서를 구축할 때 중요한 정보에 관한 파일 구축과 정보 검색시 필요한 자동 키워드 제작기의 설계에 대하여 논하였다. 자동 키워드 제작기는 명사 사전과 조사 사전의 도움을 받아서 명사 및 복합 명사를 추출하고 중요한 키워드를 자동으로 색인하는 과정을 설계하였으며 이들 검색에 필요한 속도 및 정확도 향상에 중점을 두었다.

  • PDF

Automatic Camera Control for Automated Digital Cinematography from Text (텍스트로부터의 자동 디지털 영상제작을 위한 카메라 자동제어)

  • 장세민;박종철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.904-906
    • /
    • 2004
  • 영화를 제작하는 과정에 필수적으로 사용되고 있는 대본에는 필요한 부분마다 영상기법이 명시되어 있어서 실제 장면을 구현하는 과정에 원작자가 의도하는 상황을 비교적 정확하게 재현하는 것이 가능하다. 이에 비하여 교통사고 사건보고서나 동화 등을 기반으로 디지털 영상을 자동으로 제작하려는 경우 이러한 영상기법이 명시되어 있지 않다. 그러므로 자연언어로 기술된 자료로부터 디지털 영상을 자동으로 제작하기 위해서는 작가의 의도를 파악하여 적절한 영상기법을 추출하는 방안이 있어야 한다. 본 논문의 선행 연구에서는 동화를 대상으로 하는 애니메이션 자동 생성을 위해서 시간 관리, 참조 해결, 위치 설정, 세부 명령 결정 및 다수 캐릭터 제어 등의 요소 기술이 필요하다는 것을 보이고 특히 시간 관리 중에서 적절한 장면전환이 필요한 경우를 자동으로 파악하는 방안을 제시하였다. 본 논문에서는 결합범주문법을 사용하여 동화 문장에 나타나는 작가의 의도를 분석하고, 이에 부합하는 다양한 카메라 운용기법을 자동으로 파악하여 적용한 디지털 영상 제작 방안을 제시하고 구현한 시스템을 보인다.

  • PDF

Automatic Video Object Segmentation Using Effective Thresholding (효과적인 임계값을 이용한 자동영상 분할 기법)

  • 이지호;유홍연;홍성훈
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.1976-1979
    • /
    • 2003
  • 본 논문에서는 연속영상에서 잡음과 객체가 잘 분할되지 않는 환경 내에 있는 객체를 자동으로 분할하는 차영상 기반 알고리즘을 제안하였다. 기존의 차영상 기반의 단일 임계간을 이용한 방식에는 잡음에 크게 영향을 받고 배경과 객체가 비슷한 밝기 값을 가지는 경우 잘 추출되지 않는 많은 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하고자 임계값을 설정하는 영역을 축소하여 잡음간섭의 최소화를 구성하였고 축소된 영역 내의 윤곽선정보를 이용하여 배경 밝기 값의 유사함에서 나오는 간섭을 최소화함으로써 정밀한 객체를 추출할 수 있었다.

  • PDF

Claim-Evidence Pair Extraction Model using Hierarchical Label Embedding (계층적 레이블 임베딩을 이용한 주장-증거 쌍 추출 모델)

  • Yujin Sim;Damrin Kim;Tae-il Kim;Sung-won Choi;Harksoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.474-478
    • /
    • 2023
  • 논증 마이닝이란 비정형의 텍스트 데이터에서 논증 구조와 그 요소들을 식별, 분석, 추출하는 자연어 처리의 한 분야다. 논증 마이닝의 하위 작업인 주장-증거 쌍 추출은 주어진 문서에서 자동으로 주장과 증거 쌍을 추출하는 작업이다. 본 논문에서는 효과적인 주장-증거 쌍 추출을 위해, 문서 단위의 문맥 정보를 이용하고 주장과 증거 간의 종속성을 반영하기 위한 계층적 LAN 방법을 제안한다. 실험을 통해 서로의 정보를 활용하는 종속적인 구조가 독립적인 구조보다 우수함을 입증하였으며, 최종 제안 모델은 Macro F1을 기준으로 13.5%의 성능 향상을 보였다.

  • PDF