• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.029 seconds

A Semantic Case Scheme and a Feature Set for Processing Prepositional Phrases in English-to-Korean Machine Translation (영한 기계변역에서의 전치사구 처리를 위한 격의미 체계와 의미속성 집합)

  • Kang, Won-Seog;Seo, Jung-Yun;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.177-180
    • /
    • 1994
  • 영한 기계변역에서의 전치사구 처리는 자연어 처리의 중요한 연구과제 중 하나이다. 특히 전치사구의 격의미는 그에 대한 한국어 표현에 중요한 실마리가 된다. 본 논문은 영어의 전치사구에 대한 한국어 표현을 선택하기 위한 격의미 체계를 정의하고 그 격의미 체계를 실험한다. 이 격의미 체계는 전치사구에 대한 한국어의 격의미를 분별함으로 보다 좋은 한국어 격조사를 선택하게 해준다. 본 논문에서는 각 격의미의 구분을 위한 의미속성 집합도 정의한다. 이 의미속성 집합은 WordNet의 시소러스에서 제공한 상하위 관계와 변환표를 근거로 자동적으로 추출된다. 의미속성 집합의 자동획득은 격의미 체계의 표현과 기계변역의 성능 평가에 일반성을 부여한다. 격의미 체계와 의미속성 집합의 자동 획득은 영한 기계변역은 물론 한국어 생성과 자연어 처리에 중요한 기여를 할 것으로 보인다.

  • PDF

구문패턴을 이용한 반자동 구문분석 말뭉치 구축도구

  • Im, Jun-Ho;Park, So-Yeong;Gwak, Yong-Jae;Im, Hae-Chang;Kim, Ui-Su;Gang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.343-350
    • /
    • 2002
  • 본 논문에서는 구문패턴을 이용한 반자동 구문분석 말뭉치 구축도구를 제안한다. 일반적으로 구문분석 말뭉치를 구축하는 작업은 문법전문가의 많은 시간과 노력을 필요로 하고 있다. 본 논문은 구문분석 말뭉치를 구축할 때 수작업을 감소시켜 줄 수 있는 도구를 개발하기 위하여, 사용자가 정의하는 자질집합과 신뢰도를 바탕으로 구문패턴을 자동 추출하고 적용하는 방법을 제안한다. 소량의 말뭉치에서 실험한 결과, 구문패턴의 사용은 30%정도의 수작업을 감소시킬 수 있는 것으로 나타났다.

  • PDF

Design and Implementation of the News Video Retrieval System based on Automatic Indexing (자동 인덱싱에 기반한 뉴스 비디오 검색 시스템의 설계 및 구현)

  • Lee, Jong-Gu;Yang, Myeong-Seop;Yu, Cheol-Jung;Jang, Ok-Bae
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.1
    • /
    • pp.43-52
    • /
    • 1999
  • 현재 사용하는 순차적인 뉴스 비디오 검색 방법은 많은 시간을 소비한다는 문제점을 가지고 있다. 따라서 , 본 논문에서는 이러한 문제점을 해결하기 위해서 뉴스 비디오를 내용(뉴스 사건)단위별로 검색할수 있는 자동 인덱스 모듈과 원격 검색 브라우저 모듈을 제시한다. 인덱싱 모듈은 기본적으로 이미지 프로세싱을 기반으로 하여 뉴스 앵커를 검출하고 뉴스 아이템을 분할한다. 인덱싱 구성요소는 뉴스 비디오 내용에 대한 대표영상(뉴스아이콘)과 부가적인 정보를 포함하는 뉴스 자막으로 구성하였다. 검색 브라우저 모듈은 추출된 인덱싱 요소를 아이콘하여 뉴스사건 단위로 내용을 검색할수 있도록 설계하였다. 본 연구의 결과는 매일 발생되는 뉴스를 자동 인덱싱하여 사용자에게 뉴스서비스의 효율적인 적용이 기대된다.

Malware Classification and Analysis of Automated Malware Analysis System (악성코드 자동 분석 시스템의 결과를 이용한 악성코드 분류 및 분석)

  • Na, Jaechan;Jo, Yeong-Hun;Youn, Jonghee M.
    • Annual Conference of KIPS
    • /
    • 2014.11a
    • /
    • pp.490-491
    • /
    • 2014
  • 쿠쿠 샌드박스(Cuckoo Sandbox)는 가상머신을 이용해 악성코드를 자동으로 동적 분석할 수 있는 도구이다. 우선 악성코드의 MD5값을 이용하여 VirusTotal을 이용해 종류를 분류하고, 쿠쿠 샌드박스로 악성코드 동적을 분석하여 결과파일을 이용해 악성코드에서 호출한 API들에 대한 정보를 추출하고, 다양한 종류별 악성코드 그룹에 대해서 API빈도를 종합하고, 또한 다른 종류군의 악성코드 그룹과 API 빈도를 비교해 특정 종류의 악성코드 그룹에 대한 특징적인 API를 찾아내어 향후 이런 특징 API들을 이용해 악성코드의 종류를 자동으로 판정하기 위한 방법을 제시한다.

Developing an Interactive User Interface System for Adaptive Semantic Information Retrieval (적응적인 시맨틱 정보 추출을 위한 대화형 사용자 질의 인터페이스 개발)

  • 조영현;손진현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.481-483
    • /
    • 2004
  • 기존의 웹 서비스는 않은 애플리케이션으로 개발되었고, 다양한 분야에서 잘 활용되어 왔다. 하지만, HTML을 기반 한 기존의 웹은 더 이상의 기능적 성장은 어렵게 되어 기존 웹 서비스의 성장에도 제악을 가져왔다. 이런 문제점을 극복하기 위해 시맨틱 웹이 대두되었다. 시맨틱 웹은 자원의 공유, 통합, 자동생성의 특징을 가진 기존 웹의 확장이다. 최근 기존의 웹 서비스는 시맨틱 웹의 이런 특성들을 받아들이려는 시도가 있었다. DAML-S가 대표적인 예이다. 본 논문은 기존 웹 서비스 검색처럼 일반 사용자도 편리하게 시맨틱 웹 서비스를 검색할 수 있도록 대화형 사용자 질의 인터페이스를 제시한다. 또, 사용자가 선택한 질의가 시맨틱 질의어(ROQL)로 자동 변환할 수 있는 시맨틱 질의어 자동 생성기 모듈을 제시한다.

  • PDF

Design of Sentence Semantic Model for Cause-Effect Graph Automatic Generation from Natural Language Oriented Informal Requirement Specifications (비정형 요구사항으로부터 원인-결과 그래프 자동 발생을 위한 문장 의미 모델(Sentence Semantic Model) 설계)

  • Jang, Woo Sung;Jung, Se Jun;Kim, R.Young Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.215-219
    • /
    • 2020
  • 현재 한글 언어학 영역에서는 많은 언어 분석 연구가 수행되었다. 또한 소프트웨어공학의 요구공학 영역에서는 명료한 요구사항 정의와 분석이 필요하고, 비정형화된 요구사항 명세서로부터 테스트 케이스 추출이 매우 중요한 이슈이다. 즉, 자연어 기반의 요구사항 명세서로부터 원인-결과 그래프(Cause-Effect Graph)를 통한 의사 결정 테이블(Decision Table) 기반 테스트케이스(Test Case)를 자동 생성하는 방법이 거의 없다. 이런 문제를 해결하기 위해 '한글 언어 의미 분석 기법'을 '요구공학 영역'에 적용하는 방법이 필요하다. 본 논문은 비정형화된 요구사항으로부터 테스트케이스 생성하는 과정의 중간 단계인 요구사항에서 문장 의미 모델(Sentence Semantic Model)을 자동 생성하는 방법을 제안 한다. 이는 요구사항으로부터 생성된 원인-결과 그래프의 정확성을 검증할 수 있다.

  • PDF

Automating Scanned Document Classification Using ColorCode (컬러코드를 이용한 스캔 문서 분류 자동화)

  • Sang-Kil Ahn;Byung-Uk Choi
    • Annual Conference of KIPS
    • /
    • 2008.11a
    • /
    • pp.766-769
    • /
    • 2008
  • 디지털 형태의 문서가 널리 퍼지고 끊임없이 증가함에 따라 이를 자동으로 가공하고 처리하는 문서자동분류의 중요성이 널리 인식되고 있다. 본 논문에서는 복합기에서 컬러코드를 인식하는 모듈을 탑재하여 스캔된 문서를 자동으로 분류하는 시스템을 제안하고자 한다. 복합기에서 컬러코드가 부착된 종이문서를 스캔한 다음 그 컬로코드를 추출하여 인식하고 해당 컬러코드와 관련된 문서관리정보에 따라 스캔문서를 복합기 내부의 지정 폴더에 저장하거나 다른 곳으로 전달하는 시스템이다. 이렇게 함으로써 종이문서를 전자화하는 과정에서 수작업으로 분류하는 시간을 줄일 수 있고 또한 사람에 의한 오류를 줄일 수 있다는 장점이 있다.

The Study on the Development of Historical Data Management System for Realtime EMS Data Storage & Retrieval (실시간 EMS데이터의 효율적인 저장 및 관리를 위한 이력데이터 관리 시스템 설계 및 구현)

  • Jang, Bok-Sun;Kim, Myoung-Ui;Kim, Wan-Hong;Yoon, Yeo-Jun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10b
    • /
    • pp.388-392
    • /
    • 2007
  • 계속적으로 변화하는 방대한 양의 EMS 데이터를 실시간 취득하여, 사용자가 원하는 데이터만 추출해서 원하는 포맷으로 저장하여 추후 활용할 수 있는 HDMS 시스템에 대하여 소개한다. HDMS 시스템은 K-EMS 과제의 일부분으로 개발되었다. 공유메모리를 사용하여 데이터를 처리하는 실시간 DBMS로부터 추출된 대용량 데이터를 고속으로 디스크 DBMS로 입력하고, 데이터 손실에 대한 Risk를 감소시키기 위하여 동적인 파티션 추가삭제를 통하여 자동으로 분산저장하며, 자동 백업 기능을 제공하여 사용자의 편의성을 증진한다. 데이터를 장기간 보관하고, 보관된 데이터에 대한 데이터 검색 기능을 제공하기 위하여 백업과 관련된 메타데이터를 관리한다. 관리된 메타데이터를 이용하여 사용자의 요구에 의해 백업파일을 시스템에 자동으로 복구하여 온라인 보관주기가 경과한 데이터에 대해 조회가 가능하도록 한다. HDMS시스템은 CIM 기반으로 데이터베이스가 구축되어 향후 K-EMS 외의 타 시스템과의 데이터 통합 및 연계가 용이하고 여러 분야에서 데이터 재활용이 가능할 것으로 예상된다.

  • PDF

Construction of Test Collection for Automatically Extracting Technological Knowledge (기술 지식 자동 추출을 위한 테스트 컬렉션 구축)

  • Shin, Sung-Ho;Choi, Yun-Soo;Song, Sa-Kwang;Choi, Sung-Pil;Jung, Han-Min
    • The Journal of the Korea Contents Association
    • /
    • v.12 no.7
    • /
    • pp.463-472
    • /
    • 2012
  • For last decade, the amount of information has been increased rapidly because of the internet and computing technology development, mobile devices and sensors, and social networks like facebook or twitter. People who want to gain important knowledge from database have been frustrated with large database. Many studies for automatic knowledge extracting meaningful knowledge from large database have been fulfilled. In that sense, automatic knowledge extracting with computing technology has been highly significant in information technology field, but still has many challenges to go further. In order to improve the effectives and efficiency of knowledge extracting system, test collection is strongly necessary. In this research, we introduce a test collection for automatic knwoledge extracting. We name the test collection KEEC/KREC(KISTI Entity Extraction Collection/KISTI Relation Extraction Collection) and present the process and guideline for building as well as the features of. The main feature is to tag by experts to guarantee the quality of collection. The experts read documents and tag entities and relation between entities with a tool for tagging. KEEC/KREC is being used for a research to evaluate system performance and will continue to contribute to next researches.

A New Extraction Method of Halftone Cell Information using the Peak Shape and the Characteristics of Halftoning (피크형태와 해프토닝 특성을 이용한 새로운 해프톤 셀 정보 추출 방법)

  • 한영미;김성영;김민환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.239-244
    • /
    • 2000
  • 영상공간에서의 역 해프토닝 성능을 향상시키기 위해서는 정확한 해프톤 셀 정보를 기반으로 최적의 평활화 마스크가 생성되어야 한다. 이에 본 논문에서는, 퓨리에 공간에서 피크형태와 영상공간에서의 해프토닝 특성을 이용해서 정확한 해프톤 셀 정보를 추출하는 새로운 방법을 제안한다. 제안한 방법은 차원분해(dimension decomposition)와 제한된 구간의 자동 탐색에 의해 정확한 해프톤 셀 정보를 효율적으로 추출하므로 역 해프토닝의 성능을 향상 시키며, 전체 영상에서 오차의 누적없이 셀 중심(seed pixel)을 정확하게 찾는 것을 실험을 통해 확인하였다. 정확한 해프톤 셀 정보는 셀 단위의 연산이나 해프톤 영상의 채널 분리 및 모아레 패턴의 존재 여부 판정 시 활용할 수 있다.

  • PDF