• Title/Summary/Keyword: 자동추출

Search Result 2,631, Processing Time 0.035 seconds

A Study on Auto-extract of Land Character of Public Land Price by GIS (GIS를 이용한 공시지가 토지특성 자동추출에 관한 연구)

  • 박수홍;홍성언;김현석
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.04a
    • /
    • pp.486-492
    • /
    • 2003
  • 개별공시지가는 현재 자동화 산정 프로그램인 ALPA(Automatic Land Price Appraisal System)에 의해 지가를 산정하고 있다. 그러나 자동화 시스템은 지가를 자동적으로 산출한다는 장점이 있지만 지가의 계산만이 가능하고, 토지특성의 자동 추출에 관한 기능의 부재와 비교 표준지에 대한 취사 선택기능이 없는 등 정확도나 효율성 면에서 많은 문제점을 드러내고 있다. 이러한 문제점에 기인하여, 현재 개별공시지가를 조사ㆍ산정하는데 1년에 약 400억 소요되어 엄청난 국가예산이 소요되고 있다. 또한, 실무자들의 현장 조사와 수작업에 의한 토지특성 조사ㆍ기재로 인하여 개별공시지가 검증과정에서 발견되는 오류 필지의 상당 부분이 토지특성조사 착오로 나타나고 있어 토지특성 조사의 객관성과 정확성이 결여되고 있다. 따라서, 객관적이고 정확한 토지 특성조사와 효율적으로 공시지가를 자동 산정하기 위해서는 토지특성을 정확하게 자동으로 추출할 수 있는 방법론이 시급한 실정이다. 본 연구에서는 토지특성 조사 중 객관성과 정확도 측면에서 가장 문제가 되고 있는 필지의 형상특성과 항(방위)특성에 대해 GIS 소프트웨어인 ArcGIS와 Window기반의 Visual Basic을 이용하여 토지특성을 자동 추출할 수 있는 시스템 프로토타입을 구현하였다. 그리고, 자동 추출된 토지특성을 현행 토지특성과 비교ㆍ분석을 통하여 정확도와 효율성을 제시하고자 한다.

  • PDF

A Study on the Feature Selection for Automatic Document Categorization (자동문헌분류를 위한 대표색인어 추출에 관한 연구)

  • 황재영;이응봉
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2003.08a
    • /
    • pp.55-64
    • /
    • 2003
  • 인터넷 학술정보자원이 급증하고 있는 가운데 자동문헌분류에 대한 관심과 필요성도 늘어가고 있다. 자동문헌분류에 관한 실험은 전처리 단계인 대표색인어 추출과 추출된 대표색인어의 분류성능 평가 실험으로 구분 할 수 있는데, 본 연구에서는 우선 대표색인어 추출을 위해 다양한 대표색인어(자질) 추출 방법에 따른 색인어 성능평가 실험 및 최적의 대표색인어 개수 선정 실험을 수행하였다.

  • PDF

Automatic Cracks Detection System of Concrete Buildings Using Image Processing (영상 처리를 이용한 건축물의 크랙 자동 검출 시스템)

  • Cho, Dong-Uk;Yoon, Mi-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.759-762
    • /
    • 2002
  • 본 논문에서는 건축물의 안전 진단에 최우선 요소로 고려되는 크랙(Crack : 갈라진 틈)을 영상 처리에 의해 자동 검출하고 크랙의 여러 가지 특징들을 자동으로 추출하는 방법에 대해 제안하고자 한다. 이는 우선 카메라로 입력한 건축불의 영상에서 전처리과정을 통해 잡음제거를 행하고 이에 경계 추출과 세선화 과정을 통해 크랙의 영역을 검출한다. 이후 크랙들의 특징을 추출하기 위해 크랙들을 분할하며 분할된 크랙들에 대해 곡선 적합을 통해 크랙들의 방향과 길이 등과 같은 특징들을 추출해 낸다. 본 논문에서 개발코자 하는 시스템은 크랙들의 특징들을 자동으로 추출해 냄으로써 기초적인 건축물의 안전 진단을 자동으로 행하는 시스템이 되리라 여겨진다.

  • PDF

An Algorithm for extracting English-Korean Transliteration pairs using Automatic I-K Transliteration (자동 음차표기를 이용한 영-한 음차표기 대역쌍의 자동 추출)

  • 오종훈;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.928-930
    • /
    • 2004
  • 지금까지 기계번역과 교차언어 정보검색 등과 같은 자연언어응용에서 사용되는 번역지식을 자동으로 구축하는 연구가 활발히 진행되어 왔다. 번역지식을 자동으로 구축하는 연구는 대역사전에 등재되어 있지 않은 미등록어에 대한 대역정보를 문서에서 자동으로 획득하는 것을 목표로 한다. 최근에는 이러한 미등록어 중 음차표기 번역지식에 대한 연구가 활발히 진행되고 있다. 음차표기는 주로 영어 단어를 발음에 기반하여 비영어권의 언어로 표기하는 것을 의미한다. 음차표기된 단어들은 새로운 개념을 나타내는 신조어가 많기 때문에 사전에 등재되어 있지 않온 경우가 많다. 따라서 효과적인 번역지식 구축을 위해서는 이러한 음차표기 번역지식을 자동으로 획득하는 것은 매우 중요하다. 본 논문에서는 영-한 음차표기 대역쌍을 문서에서 자동으로 추출하는 알고리즘을 제안한다. 본 논문의 기법은 한국어 음차표기의 인식, 영-한 자동음차표기, 한국어 음차표기와 자동음차표기된 영어단어간의 음성적 유사도 비교를 통하여 음차표기 대역쌍을 추출한다. 본 논문의 기법은 약 93%의 정확률과 68%의 재현율을 나타내었다.

  • PDF

Automatic Extraction of References for Research Reports using Deep Learning Language Model (딥러닝 언어 모델을 이용한 연구보고서의 참고문헌 자동추출 연구)

  • Yukyung Han;Wonsuk Choi;Minchul Lee
    • Journal of the Korean Society for information Management
    • /
    • v.40 no.2
    • /
    • pp.115-135
    • /
    • 2023
  • The purpose of this study is to assess the effectiveness of using deep learning language models to extract references automatically and create a reference database for research reports in an efficient manner. Unlike academic journals, research reports present difficulties in automatically extracting references due to variations in formatting across institutions. In this study, we addressed this issue by introducing the task of separating references from non-reference phrases, in addition to the commonly used metadata extraction task for reference extraction. The study employed datasets that included various types of references, such as those from research reports of a particular institution, academic journals, and a combination of academic journal references and non-reference texts. Two deep learning language models, namely RoBERTa+CRF and ChatGPT, were compared to evaluate their performance in automatic extraction. They were used to extract metadata, categorize data types, and separate original text. The research findings showed that the deep learning language models were highly effective, achieving maximum F1-scores of 95.41% for metadata extraction and 98.91% for categorization of data types and separation of the original text. These results provide valuable insights into the use of deep learning language models and different types of datasets for constructing reference databases for research reports including both reference and non-reference texts.

Auto fitting Parameter Extraction for Digital Hearing Aids (디지털 보청기의 자동 보정 파라미터 추출)

  • 석수영;정호열;정현열
    • Journal of Korea Multimedia Society
    • /
    • v.3 no.5
    • /
    • pp.495-505
    • /
    • 2000
  • In this paper, we propose an efficient auto-fitting system for digital hearing-aids which automatically adjusts the fitting parameters according to the auditory characteristics of hearing handicapped person. The fitting parameters are extracted from audiogram of hearing handicapped and are applied to digital hearing-aid purposed GM3036 chip. The characteristics of each parameter are compared with those from theoretical 2cc graph. The purposed system has applied to 50 patients and their satisfaction ratios show to the very high. As results, it shows effectiveness of proposed system.

  • PDF

A Study on the Automatic Extraction of Fomulation and Properties in Chemical Field Patent Document by Using Machine Learning Technology (기계학습 기술을 활용한 화학분야 특허문서의 조성/물성 정보 자동추출 방법 연구)

  • Kim, Hongki;Lee, Hayoung;Park, Jinwoo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.277-280
    • /
    • 2019
  • 본 논문에서는 화학분야 특허 문서에 존재하는 도표(TABLE) 데이터를 인공지능 기술을 활용하여 자동으로 추출하고 정형화된 형태로 가공하는 방법을 제안한다. 특허 문서에서 도표 데이터는 실시예에서 실험결과나 비교결과를 간결하고 가시적으로 표현하기 위하여 주로 사용되나, 셀의 속성을 정의하는 헤더부분과 수치가 표현되는 값 부분의 경계가 모호하여 구조화하는데 어려움이 있다. 본 논문에서 제안하는 방법은 소량의 학습데이터를 구축하고 기계학습을 통해 도표에 존재하는 셀의 속성을 예측하고, 예측된 속성을 토대로 조성과 물성 정보를 자동으로 구분하여 추출하는 방법을 제시한다. 제시된 방법을 활용하여 화학 분야 조성물 특허의 도표데이터에 시뮬레이션 결과 각 항목별 98.17%의 속성 예측 정확도를 나타내었으며 기존 규칙기반 연구보다 작업난이도, 예측정확도에서 우수한 성과를 보인다.

  • PDF

Automatic Extraction of protein-protein interaction information from biological literature (생물학 관련 문헌으로부터 상호작용 정보 자동 추출)

  • 정의헌;김민경;박현석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.808-810
    • /
    • 2003
  • 본 논문에서는 생물학 관련 문서에서 단백질 간의 상호작용을 추출하는 방법에 대한 전반적인 기술 동향을 소개하고, 현재 구현된 상호작용 정보 자동추출 시스템의 연구 결과에 대해 기술한다. 일반적으로 이미 알려진 단백질들의 관계를 추출함에 있어서는 단백질의 이름에 대한 특성 구분과 표현의 의미적 해석등에 NLP 기법을 사용하여, 사용자 정의에 따른 룰을 생성하는 방법과 데이터 마이닝 기법을 적용하여, 단백질간의 관계를 자동적으로 추출하는 방법, 또한 위의 이 두가지 방법을 병행하는 방법이 현재 연구되고 있다. 이 논문에서는 자연언어처리 기법과 머신러닝 기법(SVM)을 이용하여, 단백질간의 상호작용에 관한 일반 생물 정보 문헌에서 추출하고, 그 성능을 테스트 해 보겠다.

  • PDF

A Study on Semi-automatic Feature Extraction Using False Color Aerial Image (천연색 항공영상을 이용한 지형요소 반자동 추출에 관한 연구)

  • 김감래;김경록;전호원
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.19 no.2
    • /
    • pp.109-115
    • /
    • 2001
  • Recently, in accordance with the introduction of Digital Photogrammetry Systems the use of Digital ortho-photo images have increased and progressed in the study which extract the features from digital ortho-photo image semi-automatically or automatically. However, there are a limit. It has proved in many studies that recognition of the attribution or the features from panchromatic aerial photo is restricted. In this study, I compared color aerial images with panchromatic aerial images and analyzed the characteristics of color aerial images and feature entities which can be extracted semi-automatically. I analyzed extracted feature entities are compared with digital map at a scale of 1:5,000 have constructed in National Geography Institute. With this result, I analyzed the capability of feature extraction and proposed a plan for the study in the future.

  • PDF

FastText and BERT for Automatic Term Extraction (FastText 와 BERT 를 이용한 자동 용어 추출)

  • Choi, Kyu-Hyun;Na, Seung-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.612-616
    • /
    • 2021
  • 자연어 처리의 다양한 task 들을 잘 수행하기 위해서 텍스트 내에서 적절한 용어를 골라내는 것은 중요하다. 텍스트에서 적절한 용어들을 자동으로 추출하기 위해 다양한 모델들을 학습시켜 용어의 특성을 잘 반영하는 n 그램을 추출할 수 있다. 본 연구에서는 기존에 존재하는 신경망 모델들을 조합하여 자동 용어 추출 성능을 개선할 수 있는 방법들을 제시하고 각각의 결과들을 비교한다.

  • PDF