• Title/Summary/Keyword: 자동정보 추출

Search Result 1,995, Processing Time 0.035 seconds

building Extraction from Im Resolution Satellite Images through Line Analysis and Matching (1m 해상도 위성영상으로부터 라인분석과 정합을 통한 반자동 건물추출연구)

  • 김태정;임영재;김경옥
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.301-306
    • /
    • 2004
  • 이 논문에서는 1m 해상도 위성영상에서 관측할 수 있는 여러 인공지물 중에서 아파트 및 산업용 건물 등, 비교적 중대형이고 사각형 형태인 건물들을 반자동으로 추출하기 위한 알고리즘을 소개한다. 기존에 연구된 건물추출을 위한 방식으로는 Perceptual Grouping, 스테레오 분석, LIDAR 센서 등에서 얻은 3 차원 정보를 이용하는 방식 등이 있다. 여기서는 단일영상 만을 이용하여 반자동으로 건물을 추출하는 알고리즘을 제안한다 이 알고리즘은 먼저 영상으로부터 라인을 추출한 후, 라인분석을 통하여 건물의 위치와 방향을 결정하고, 탬플릿 정합을 이용하여 이를 개선한다. 그리고 자동으로 추출된 건물외각선에 포함된 오류를 제거하기 위하여 수동편집 단계를 수행한다. 또한 먼저 수행한 건물추출 결과를 활용하여 주변에 유사한 형태의 건물외각선을 빠르게 추출하기 위해 기존에 추출된 건물 외각선 Polygon 을 탬플릿으로 정의하고 정합을 수행하여 건물 외각선을 추출한다. 개발된 알고리즘은 기존의 다른 방식들에 비해 추가적인 영상이나 정보를 요구하지 않고도 빠른 시간에 정확한 사각형형태의 건물을 추출할 수 있었다.

  • PDF

Automatic knowledgebase extraction based smishing SMS detection (자동 지식베이스 추출 기반 스미싱 SMS 탐지)

  • Baek, Seong-Bin;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.564-567
    • /
    • 2021
  • 스미싱은 SMS 문자를 통해 피해자를 현혹시켜 개인정보나 금전 등을 갈취하는 범죄이다. 발전하는 스미싱 범죄 수법에 대응하기 위해선 새로운 스미싱 범죄 사례에서 데이터를 추출하고, 추출한 데이터를 기존 시스템에 통합하여 빠르게 대응할 수 있어야 한다. 본 연구에서는 빠른 스미싱 대응을 위해 전처리를 하지 않은 SMS 문자 텍스트에서 지식베이스를 자동으로 추출하고 저장하는 자동 지식베이스 추출 모듈을 제안하며, 추출 시스템 지식베이스를 바탕으로 입력된 SMS가 스미싱인지 판별하는 스미싱 SMS 탐지 모듈을 통합한 자동 지식베이스 추출 기반 스미싱 SMS 탐지 시스템을 제시한다. 제시된 스미싱 SMS 탐지 모델은 UCI SMS Spam Collection Dataset을 기준으로 90.9 (F1 score)의 성능을 보여주었다.

  • PDF

A Study on the Feature Selection for Automatic Document Categorization (자동문헌분류를 위한 대표색인어 추출에 관한 연구)

  • 황재영;이응봉
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2003.08a
    • /
    • pp.55-64
    • /
    • 2003
  • 인터넷 학술정보자원이 급증하고 있는 가운데 자동문헌분류에 대한 관심과 필요성도 늘어가고 있다. 자동문헌분류에 관한 실험은 전처리 단계인 대표색인어 추출과 추출된 대표색인어의 분류성능 평가 실험으로 구분 할 수 있는데, 본 연구에서는 우선 대표색인어 추출을 위해 다양한 대표색인어(자질) 추출 방법에 따른 색인어 성능평가 실험 및 최적의 대표색인어 개수 선정 실험을 수행하였다.

  • PDF

An Algorithm for extracting English-Korean Transliteration pairs using Automatic I-K Transliteration (자동 음차표기를 이용한 영-한 음차표기 대역쌍의 자동 추출)

  • 오종훈;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.928-930
    • /
    • 2004
  • 지금까지 기계번역과 교차언어 정보검색 등과 같은 자연언어응용에서 사용되는 번역지식을 자동으로 구축하는 연구가 활발히 진행되어 왔다. 번역지식을 자동으로 구축하는 연구는 대역사전에 등재되어 있지 않은 미등록어에 대한 대역정보를 문서에서 자동으로 획득하는 것을 목표로 한다. 최근에는 이러한 미등록어 중 음차표기 번역지식에 대한 연구가 활발히 진행되고 있다. 음차표기는 주로 영어 단어를 발음에 기반하여 비영어권의 언어로 표기하는 것을 의미한다. 음차표기된 단어들은 새로운 개념을 나타내는 신조어가 많기 때문에 사전에 등재되어 있지 않온 경우가 많다. 따라서 효과적인 번역지식 구축을 위해서는 이러한 음차표기 번역지식을 자동으로 획득하는 것은 매우 중요하다. 본 논문에서는 영-한 음차표기 대역쌍을 문서에서 자동으로 추출하는 알고리즘을 제안한다. 본 논문의 기법은 한국어 음차표기의 인식, 영-한 자동음차표기, 한국어 음차표기와 자동음차표기된 영어단어간의 음성적 유사도 비교를 통하여 음차표기 대역쌍을 추출한다. 본 논문의 기법은 약 93%의 정확률과 68%의 재현율을 나타내었다.

  • PDF

Automatic Information Extraction for Structured Web Documents (구조화된 웹 문서에 대한 자동 정보추출)

  • Yun, Bo-Hyun
    • Journal of Internet Computing and Services
    • /
    • v.6 no.3
    • /
    • pp.129-145
    • /
    • 2005
  • This paper proposes the web information extraction system that extracts the pre-defined information automatically from web documents (i.e, HTML documents) and integrates the extracted information, The system recognizes entities without lables by the probabilistic based entity recognition method and extends the existing domain knowledge semiautomatically by using the extracted data, Moreover, the system extracts the sub-linked information linked to the basic page and integrates the similar results extracted from heterogeneous sources, The experimental result shows that the system extracts the sub-linked information and uses the probabilistic based entity recognition enhances the precision significantly against the system using only the domain knowledge, Moreover, the presented system can the more various information precisely due to applying the system with flexibleness according to domains, Because bath the semiautomatic domain knowledge expansion and the probabilistic based entity recognition improve the quality of the information, the system can increase the degree of user satisfaction at its maximum. Thus, this system can satisfy the intellectual curiosity of users from movie sites, performance sites, and dining room sites, We can construct various comparison shopping mall and contribute the revitalization of e-business.

  • PDF

A Study on the Automatic Classification of Non-contour Elements in a Contour Map Image (등고선 지도영상에서의 비등고 성분의 자동 분리에 관한 연구)

  • Kim, Kee-Soon;Kim, Kyung-Hoon;Kim, Joon-Seek
    • Annual Conference of KIPS
    • /
    • 2000.04a
    • /
    • pp.1031-1036
    • /
    • 2000
  • 지리정보시스템(Geographic Information System)분야에서 사회 기반 시설에 대한 요구가 증대되고, 시설물을 관리하기 위한 지리정보 데이터 베이스 구축이 필요하며, 데이터베이스 구축을 위해서는 지도 정보를 필요로 한다. 본 논문에서는 지도 정보를 자동으로 분석하여 등고선과 숫자, 기호를 추출해 내는 알고리즘에 대해 연구하였다. 지도상의 숫자, 기호를 추출하고 효율적으로 분류하기 위해 불필요한 자료를 제거하고 필요한 정보를 추출한 후 손상된 부분을 복원하는 방법과 필요한 정보만을 추출한 후 손상된 부분을 복원하는 방법을 제안하고 결과를 비교하였다. 이렇게 추출한 정보가 의미를 갖는 단위(기호, 숫자)들로 분류되도록 라벨링 방법과 무게 중심을 이용한 물체 추출 방법을 적용하여 숫자 기호들을 자동으로 분류하였으며, 여러 지역의 지형도를 입력하여 모의실험을 통해 제안한 알고리즘의 효율성을 증명하였다.

  • PDF

Study on improving the accuracy of automatic extraction from spatial information and land cover map (공간영상정보와 토지피복분류를 통한 피해지역 자동추출 정확도 향상에 관한 연구)

  • Seo, Jung-Taek;Kim, Kye-Hyun;Kim, Tae-Hoon
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.09a
    • /
    • pp.72-76
    • /
    • 2010
  • 최근 들어 고해상도 항공영상을 활용한 공간정보의 구축 및 활용 사례가 증가하고 있으며, 기 구축된 공간정보의 정확도 향상을 위한 추가적인 노력이 필요시 되고 있는 실정이다. 이에 본 연구에서는 기존의 피해 전 후 항공영상을 이용한 피해지역 자동추출에 있어 결과물의 정확도 향상을 위하여 토지피복도와의 중첩을 통한 피해항목의 선택적 추출과 자동 추출된 결과물의 오차 제거가 가능하도록 하였다. 연구 대상지역은 2008년 7월 말 국지성 집중호우로 인하여 큰 피해를 입은 경상북도 봉화군 춘양면 일대를 선정하였으며, 집중호우에 상당히 취약하고 당시 사유시설 중 피해액이 가장 컸던 농경지에 대해 본 연구를 시범 적용하였다. 결과적으로 토지피복분류를 통해 피해 전 후 영상의 해상도 차이와 시계열적인 차이로 인해 발생하는 자동추출 결과물의 잡음 제거가 가능하였으며, 항공영상정보와 달리 육안으로 피해 항목의 선별이 어려운 자동추출 결과물에서 피해항목의 선별이 가능하였다. 이는 나아가 피해지역의 피해액 산출에 있어 보다 정확한 계산이 가능하게 하며, 추후 국가적 피해조사 사업에 있어 신뢰성 높은 피해정보 생산에 큰 기여를 할 것으로 사료된다.

  • PDF

FastText and BERT for Automatic Term Extraction (FastText 와 BERT 를 이용한 자동 용어 추출)

  • Choi, Kyu-Hyun;Na, Seung-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.612-616
    • /
    • 2021
  • 자연어 처리의 다양한 task 들을 잘 수행하기 위해서 텍스트 내에서 적절한 용어를 골라내는 것은 중요하다. 텍스트에서 적절한 용어들을 자동으로 추출하기 위해 다양한 모델들을 학습시켜 용어의 특성을 잘 반영하는 n 그램을 추출할 수 있다. 본 연구에서는 기존에 존재하는 신경망 모델들을 조합하여 자동 용어 추출 성능을 개선할 수 있는 방법들을 제시하고 각각의 결과들을 비교한다.

  • PDF

Automatic Event Extraction from the Yeast Literature by Pattern Matching (패턴 정보를 이용한 효모 관련 문서에서의 이벤트 자동 추출)

  • 전홍우;황영숙;임해창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.464-466
    • /
    • 2003
  • 생명과학 관련 문서에서 자동으로 이벤트를 추출하는 것은 관련 연구자들의 연구에 많은 도움을 줄 수 있다. 본 논문에서는 생명과학 관련 문서 중 특히 효모와 관련된 문서를 대상으로 간단한 자연언어 처리 기술을 적용하여 유의미한 정보를 추출한 결과를 제시하고자 한다. 실험은 효모 관련 문서에서 고빈도의 이벤트 표현 동사에 대한 패턴 정보를 조사한 후, 패턴 정보에 의거하여 이벤트를 추출하였다. 평가 결과, 비교적 간단한 자연언어 처리 기술 안으로도 유의미한 정보들을 추출할 수 있었다.

  • PDF

Automatic Extraction of Medical Term Definition from Texts (의학 전문용어의 정의문 자동 추출)

  • 김재호;배선미;신효식;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.922-924
    • /
    • 2004
  • 지식 정보의 확산에 따라 기존 전문분야 용어집에 수록되지 않은 용어의 수가 폭발적으로 증가하고 있다 이에 따라 용어집을 자동으로 구축하는 작업이 필요하게 되었다. 본 논문에서는 의학분야 코퍼스에서 주어진 전문용어에 대한 정의문을 자동으로 추출하는 방법을 제안한다. 우선, 정의문의 구문적 패턴과 용어의 어휘구성 패턴을 이용하여 용어의 상위개념을 추정한다. 상위개념별로 구축된 특성 어휘 목록을 이용하여 구문적 패턴으로 뽑힌 문장에 등장하는 어휘의 적합성 여부를 판단하여 정의문을 추출한다. 실험 결과 코퍼스에 정의 정보가 있는 48개의 용어에 대하여 71.43%의 정확률을 보인다.

  • PDF