• Title/Summary/Keyword: 자동정보 추출

Search Result 1,996, Processing Time 0.03 seconds

Probabilistic filtering for a biological knowledge discovery system with text mining and automatic inference (텍스트 마이닝 및 자동 추론 기반 생물학 지식 발견 시스템을 위한 확률 기반 필터링)

  • Lee, Hee-Jin;Park, Jong-C.
    • Journal of the Korea Society of Computer and Information
    • /
    • v.17 no.2
    • /
    • pp.139-147
    • /
    • 2012
  • In this paper, we discuss the structure of biological knowledge discovery system based on text mining and automatic inference. Given a set of biology documents, the system produces a new hypothesis in an integrated manner. The text mining module of the system first extracts the 'event' information of predefined types from the documents. The inference module then produces a new hypothesis based on the extracted results. Such an integrated system can use information more up-to-date and diverse than other automatic knowledge discovery systems use. However, for the success of such an integrated system, the precision of the text mining module becomes crucial, as any hypothesis based on a single piece of false positive information would highly likely be erroneous. In this paper, we propose a probabilistic filtering method that filters out false positives from the extraction results. Our proposed method shows higher performance over an occurrence-based baseline method.

Design and application of effective data extraction technique from Web databases (웹 기반 데이터베이스로부터의 유용한 데이터 추출 기법의 설계 및 응용)

  • Hwang, Doo-Sung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.6 no.4
    • /
    • pp.309-314
    • /
    • 2005
  • This paper analyzes techniques that extract objective information from distributed web databases for bioinformatics based on relationship among information. Moreover, we discuss the design and implementation of a method for knowledge enhancement in respect of protein information. Web data extractor can be constructed by using a manual, semi-automatic, or automatic way. Data extractor generally makes use of identifiers in order to search and extract targeting information from a specified web page. This paper presents a design and implementation for the protein databases of an organism by utilizing web data extraction techniques.

  • PDF

A study on developing a data model to automatically generate input data for water quality simulation (수질모의 입력자료 자동작성을 위한 데이터모델 수립에 관한 연구)

  • Park, Yong-Gil;Kim, Kye-Hyun;Lee, Chol-Young
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.09a
    • /
    • pp.95-98
    • /
    • 2010
  • 수질오염총량제가 도입되면서 각 지방자치단체는 허용배출량을 산정하기 위하여 QUAL2E 수질모델을 이용한 수질모의를 적극적으로 활용하고 있다. 그러나 수질모의 수행에 필요한 입력 자료를 작성하기 위하여 많은 시간이 소요되기 때문에 시간 및 경제적 손실을 가져오고 있다. 따라서 본 연구에서는 수질모의 입력 자료를 자동으로 작성하기 위하여 오염원 DB와 수리계수 DB 및 한국형 리치파일을 연계할 수 있는 데이터모델을 수립하였다. 모델을 이용하여 수질모의 대상하천의 기본 정보를 한국형 리치파일에서 얻은 후 오염원 DB와 표준유역명으로 연계하여 오염원 정보를 추출토록 하였다. 아울러 수리계수 DB에서 하천코드와 상류지점으로부터 누적거리를 이용하여 대상 하천의 수리계수를 추출하였다. 이는 모의대상하천을 선택하였을 때 자동으로 수질모의 입력 자료를 작성할 수 있는 모듈을 개발할 수 있도록 지원이 가능하다. 이러한 모델의 개발을 통하여 다양한 기관에서 중복 구축하던 수질모의 자료의 통합관리가 가능하며, 나아가 수질모의 입력 자료의 작성을 자동화함으로써 시간 및 비용 절감에 기여가 클 것으로 사료된다.

  • PDF

Iris recognition System using Higher Order Local Autocorrelation Features and Back-propagation (고차 국소 자동 상관계수 특징과 신경망을 이용한 홍채 인식 시스템)

  • Jeong, Yu-Jeong;Jung, Chai-Yeoung
    • Annual Conference of KIPS
    • /
    • 2003.05a
    • /
    • pp.579-582
    • /
    • 2003
  • 생체인식을 통한 개인 식별은 새로이 등장한 개념이 아니라 오래 전부터 사용되어왔으나 기존의 화상처리 방법으로는 불필요한 정보까지 포함하여 특징을 추출하여 많은 시간이 소용된다는 문제점이 있었다. 본 논문에서 적용한 고차 국소 자동 상관계수 특징 알고리즘을 이용하여 홍채병변 인식의 수렴속도를 빠르게 하는 신경망을 사용하였으며, 고차 국소 자동 상관계수 특징 알고리즘은 평균 32.5회때 수렴 평균 31.5회때 수렴하였고, 일반 BP 알고리즘은 평균 720.3회때 수렴함과 병변 추출면에서 훨씬 우수함을 보였다.

  • PDF

Automatic Construction Method of Unknown Word Lexical Dictionary (Unknown Word Lexical Dictionary의 자동 생성 방법)

  • Hwang, Myung-Gwon;Youn, Byung-Su;Jeong, Il-Yong;Kim, Pan-Koo
    • Annual Conference of KIPS
    • /
    • 2008.05a
    • /
    • pp.3-6
    • /
    • 2008
  • 본 연구는 의미적 정보 검색을 위한 연구 중의 하나로, 현재까지의 의미적 문서 검색에서 큰 걸림돌이었던 사전에 정의되지 않은 단어(Unknown Word)들의 어휘 사전(Lexical Dictionary)을 자동으로 생성하기 위한 것이다. 이를 위해 UW를 기존의 영어 어휘 사전인 워드넷(WordNet)에 정의되지 않은 단어로 간주하고, 웹 문서의 입력을 통하여 UW와 관련된 단어들을 추출하여 의미적 관련 정도를 확률적, 의미적 방법으로 측정한다. 본 논문에서는 UW Lexical Dictionary를 자동으로 구축하기 위한 방법에 대해서만 기술하였고, 정량적이고 객관적인 평가는 포함하지 않고 있다. 하지만 본 연구의 효용성을 확인하기 위한 몇 가지 문서로부터 추출된 결과는 본 연구가 상당히 의미적이며 가치가 높을 것으로 기대되고 있다.

Design and Implementation of Robot for Updating Automatically Vulnerability Database (취약성 DB 자동 갱신 로봇의 설계 및 구현)

  • 서혜성;최경희;박승규;정기현;이철원;이남훈;한광택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.145-147
    • /
    • 2002
  • 컴퓨터 시스템이나 네트워크의 보안을 강화하는 방안으로 보안상 취약성이 발견되는 보안 취약성을 점검 하는 것이 옳다. 그러나 취약성을 파악하기 위하여 국내외 관련 사이트를 수동적 방법으로 검사하는 것은 대단히 어려운 일이다. 따라서 스스로 관련 사이트의 홈 페이지를 검색하고 취약성 정보를 추출한 후 새로운 취약성 관련 정보가 발견되는 대로 이를 취약성 데이터베이스에 기록하는 이른바 취약성 자동 갱신 시스템[1]은 취약성 탐지 시스템의 핵심 기능이다. 본 논문에서 구현한 취약성 자동 갱신 로봇은 웹 페이지 자동 검색프로그램인 스파이더를 활용하여 구현되었으며, ICAT등과 같은 취약점 정보 제공 사이트들로부터 홈페이지를 검색하고 이에 수록된 정보를 수집 및 분석한 후, 취약성 데이터베이스를 자동으로 갱신한다.

  • PDF

Automatic Coastline Extraction and Change Detection Monitoring using LANDSAT Imagery (LANDSAT 영상을 이용한 해안선 자동 추출과 변화탐지 모니터링)

  • Kim, Mi Kyeong;Sohn, Hong Gyoo;Kim, Sang Pil;Jang, Hyo Seon
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.21 no.4
    • /
    • pp.45-53
    • /
    • 2013
  • Global warming causes sea levels to rise and global changes apparently taking place including coastline changes. Coastline change due to sea level rise is also one of the most significant phenomena affected by global climate change. Accordingly, Coastline change detection can be utilized as an indicator of representing global climate change. Generally, Coastline change has happened mainly because of not only sea level rise but also artificial factor that is reclaimed land development by mud flat reclamation. However, Arctic coastal areas have been experienced serious change mostly due to sea level rise rather than other factors. The purposes of this study are automatic extraction of coastline and identifying change. In this study, in order to extract coastline automatically, contrast of the water and the land was maximized utilizing modified NDWI(Normalized Difference Water Index) and it made automatic extraction of coastline possibile. The imagery converted into modified NDWI were applied image processing techniques in order that appropriate threshold value can be found automatically to separate the water and land. Then the coastline was extracted through edge detection algorithm and changes were detected using extracted coastlines. Without the help of other data, automatic extraction of coastlines using LANDSAT was possible and similarity was found by comparing NLCD data as a reference data. Also, the results of the study area that is permafrost always frozen below $0^{\circ}C$ showed quantitative changes of the coastline and verified that the change was accelerated.

Automatic Extraction of the Building Using IKONOS Ortho-Image (IKONOS 정사영상을 이용한 건물의 자동추출)

  • 이재기;정성혁;임인섭
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.21 no.1
    • /
    • pp.19-26
    • /
    • 2003
  • As recently, high-resolution satellite images of 1m spatial resolution are opened to the public and able to be used commercially, the studies that make ortho-images using them and apply to digital mapping and database of geo-spatial information system are having been progressed actively. Therefore, the purposes of this study are to establish the auto-extraction methods and to develope algorithms for automatically extracting buildings out of man-made structures, after making the IKONOS ortho-image. As the result of this study, we can extract buildings automatically at 72% out of the whole buildings. And we have analyzed the error trend by means of the comparison with ortho-image, digital map and drawing result, then we could know that obtain the good result for extraction of the building through the methods and algorithms of this study.

Automatic Text Categorization Using Term Information of Anchor Text (Anchor Text의 단어 정보를 이용한 자동 문서 범주화)

  • Heo, Hee-keun;Han, Gi-deok;Jung, Sung-won;Lim, Sung-shin;Kwon, Hyuk-chul
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.665-668
    • /
    • 2004
  • 최근의 웹 문서는 텍스트뿐만 아니라 이미지, 사운드 등 다른 여러 형태로 표현되고 있어서 텍스트의 비중이 낮아지고 있다. 그래서 문서 내에서 일정량 이상의 단어 추출이 어려운 문서들에 대해서 기존의 단어 정보만을 이용한 문서 범주화 방법은 좋은 성능을 기대할 수 없다. 그래서 본 논문은 Anchor Text 단어 정보의 자질 적합성 판단에 의한 새로운 자동 문서 범주화 모델을 제안한다. 문서 범주화 모델로는 베이지언 확률 모델을 이용하였으며, 카이제곱 통계량을 사용하여 자질을 선정하였다. 문서 내에서 추출된 단어 자질들이 해당 문서를 판단하는데 부족하다고 판단되면 문서의 링크정보를 이용하여 연결된 문서의 단어 자질과 Anchor Text의 단어 자질을 반영함으로써 성능을 향상시킨다.

  • PDF

Automatic Extraction of Alternative Words using Parallel Corpus (병렬말뭉치를 이용한 대체어 자동 추출 방법)

  • Baik, Jong-Bum;Lee, Soo-Won
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.12
    • /
    • pp.1254-1258
    • /
    • 2010
  • In information retrieval, different surface forms of the same object can cause poor performance of systems. In this paper, we propose the method extracting alternative words using translation words as features of each word extracted from parallel corpus, korean/english title pair of patent information. Also, we propose an association word filtering method to remove association words from an alternative word list. Evaluation results show that the proposed method outperforms other alternative word extraction methods.