• Title/Summary/Keyword: Automatic Information Extraction

Search Result 592, Processing Time 0.034 seconds

A Machine Learning Approach for Automatic Protein Name Extraction from Journal Articles (기계학습 알고리즘에 근거한 단백질 이름의 자동 추출)

  • 김정호;백은옥;이공주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.259-261
    • /
    • 2004
  • 생물학 분야의 문헌으로부터 유전자 및 단백질 이름을 추출하는 기술은 바이오 텍스트 마이닝 분야의 기반 기술로 그 중요성이 점차 증대되고 있다. 이 연구에서는 생물학 분야 문헌의 초록으로부터 하나의 토큰으로 구성된 single gene name은 물론 여러 개의 토큰으로 이루어진 multi gene name까지 유전자나 단백질의 이름을 자동으로 추출하는 시스템 TagGeN(Tagger for Gene Name)을 제안한다. TagGeN은 기존의 태거와 달리, 문자나 숫자 이외의 기호를 포함한 유전자나 단백질 이름의 품사 처리에 있어 개선 방안을 제시하고, 여러 토큰으로 이루어진 이름의 인식에 있어 나란한 두 토큰이 갖는 태그 정보를 이용한 조건부 확률에 근거하여 Markov 모델을 도입한다. 위와 같은 개선방안을 구현한 TagGeN은 성능면에서 기존의 유사시스템에 비해 recall 20.8%, precision 4.7%의 성능향상을 보임으로써 본 연구에서 제안한 방법론의 효과를 입증한다.

  • PDF

Automatic salient-object extraction using the contrast map and salient point (Contrast map과 Salient point를 이용한 중요객체 자동추출)

  • 곽수영;고병철;변혜란
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.808-810
    • /
    • 2004
  • 본 논문에서는 Contrast map과 Salient point를 이용하여 영상에서 중요한 객체를 자동으로 추출하는 방법을 제안한다. 우선 인간의 시각 체계와 유사한 밝기(luminance), 색상(color) 그리고 방향성(orientation) 3가지의 특징정보를 이용하여 각각의 특징정보로부터 feature map을 생성하고 이 3가지의 feature map을 선형 결합하여 contrast map을 생성한다. 이렇게 생성된 하나의 contrast map을 이용하여 대략적인 Attention Window (AW)의 위치를 결정한다. 다음으로, 영상으로부터 웨이블릿 변환을 적용하여 salient point를 찾고, salient point의 분포와 contrast map의 중요도에 따라 AW의 크기를 실제 중요 객체의 크기와 가장 유사하도록 축소시킨다. 이렇게 선택되고 축소된 AW안에서 실제 중요 객체를 추출하기 위해 AW 내부에 존재하는 영상에 대해서만 영상 분할을 하고 불필요한 영역을 제거하여 자동으로 중요객체를 추출하도록 한다.

  • PDF

A Design and study on automatic extraction of kernel data structure to improve performance of rootkit detection tool, Gibraltar. (루트킷 탐지 도구(Gibraltar) 성능 향상을 위한 자동화된 커널 메모리 자료 구조 추출에 관한 연구)

  • Choi, Wonha;Yi, Hayoon;Cho, Yeongpil;Paek, Yunheung
    • Annual Conference of KIPS
    • /
    • 2015.04a
    • /
    • pp.384-387
    • /
    • 2015
  • 하이퍼바이저를 이용한 가상화 검사(Virtual Machine Introspection)의 하나인 Gibraltar[2]는 자동으로 무결성 명세서를 생성할 수 있고, 보안 위협이 높아지고 있는 데이터 영역에 대해서도 방어가 가능하다는 점에 존재하는 어떤 보안 도구보다 효과적인 시스템으로 여겨지고 있다. 본 연구에서는 루트킷 탐지 도구인 Gibraltar를 Linux/ARM 3.14 버전에서 구현하고, 커널 메모리 자료 구조 추출 자동화 툴을 개발함으로써 기존 연구의 문제점을 해결하여 성능을 개선하였다. 이를 바탕으로 향후 Gibraltar 연구의 추가 개선 방향을 제시한다.

Text Categorization Features Automatic Extraction Method Using Chi-squared Statistic (카이제곱 통계량을 이용한 문서분류 자질 자동추출 방법)

  • Park, Jong-Hyun;Park, So-Young;Chang, Ju-No;Kihl, Tae-Suk
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.10a
    • /
    • pp.695-697
    • /
    • 2010
  • 문서에 포함되는 어휘는 문서 분류의 정보를 가지므로 문서를 분석하여 유용한 단어를 추출하는 것은 다양한 서비스와 연계되어 사용될 수 있어 매우 유용한 일이다. 문서 자동 분류에서는 분류자질 선정 방식에 따라 분류정확도가 서로 달라질 수 있으며, 문서에서 추출되는 유용한 단어에 따라 인지되는 분야가 달라질 수 있다. 이에 본 논문에서는 각 문서에 포함되는 단어에 대한 카이제곱 통계량 점수를 사용하여 단어별 문서 분류에 대한 단어의 자질을 평가하고 문서의 분류별 유용한 단어를 자동 추출하는 방법을 제안하고 개발한다.

  • PDF

Automatic Extraction of Pulmonary Vessels to Detect the Pulmonary Nodule and Embolism in CT Image (CT 영상내의 폐 결절과 색전 검출을 위한 폐혈관 자동 추출)

  • Park, Chan;Yu, Hong-Yeon;Hong, Sung-Hoon;Kim, Soo-Hyung;Lee, Guee Sang
    • Annual Conference of KIPS
    • /
    • 2004.05a
    • /
    • pp.699-702
    • /
    • 2004
  • 단층촬영에 의해 획득된 흉부영상의 폐 영역은 기관지, 폐동맥, 폐정맥으로 구성된 복잡한 형태를 가지고 있다. 또한 이들 조직과 폐 영역 내에 존재하는 악성 종양과 같은 질병들 사이의 공간정보의 유사성으로 인해 방사선 전문의조차도 질병을 간단히 구분 해내는데 많은 어려움이 따른다. 따라서 본 논문에서는 이러한 유사한 공간정보를 갖는 폐 영역을 수리형태학 필터인 모폴로지(morphology)와 국부적인 워터쉐드(watershed) 알고리즘을 이용하여 분할하고, 분할된 폐 영역으로부터 색전 또는 종양 등의 결절(nodule)의 정보를 가지고 있는 혈관들을 추출하는 효과적인 알고리즘을 제안한다.

  • PDF

KNE: An Automatic Dictionary Expansion Method Using Use-cases for Morphological Analysis

  • Nam, Chung-Hyeon;Jang, Kyung-Sik
    • Journal of information and communication convergence engineering
    • /
    • v.17 no.3
    • /
    • pp.191-197
    • /
    • 2019
  • Morphological analysis is used for searching sentences and understanding context. As most morpheme analysis methods are based on predefined dictionaries, the problem of a target word not being registered in the given morpheme dictionary, the so-called unregistered word problem, can be a major cause of reduced performance. The current practical solution of such unregistered word problem is to add them by hand-write into the given dictionary. This method is a limitation that restricts the scalability and expandability of dictionaries. In order to overcome this limitation, we propose a novel method to automatically expand a dictionary by means of use-case analysis, which checks the validity of the unregistered word by exploring the use-cases through web crawling. The results show that the proposed method is a feasible one in terms of the accuracy of the validation process, the expandability of the dictionary and, after registration, the fast extraction time of morphemes.

Automatic Background Keyword of Movie Extraction Method from Media Reviews (미디어 리뷰를 이용한 영화 배경 키워드 자동 추출 기법)

  • Kim, Hyung W.;Cho, Joonmyun;Yoo, Jeongju
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.1149-1151
    • /
    • 2013
  • 본 연구는 영화 콘텐츠의 배경(공간적/시간적)에 해당하는 키워드를 자동으로 추출하는 기법을 제안한다. 제안된 기법은 영화 콘텐츠들의 리뷰 텍스트 데이터를 웹 상으로부터 수집하는 과정, 수집된 텍스트 리뷰 데이터의 전처리 과정에 해당하는 형태소 분석 및 개체명인식 과정, 마지막으로 통계적 기법을 이용하여 최종적으로 배경에 해당하는 단어를 선택하는 과정으로 이루어진다. 자동으로 추출된 배경 정보는 사용자 평가를 통하여 정확도를 측정하였으며, 자동 생성된 배경 정보를 이용하여 영화 콘텐츠의 검색 및 추천 등에 다양하게 사용될 수 있을 것으로 예상된다.

Performance Evaluation of Pixel Clustering Approaches for Automatic Detection of Small Bowel Obstruction from Abdominal Radiographs

  • Kim, Kwang Baek
    • Journal of information and communication convergence engineering
    • /
    • v.20 no.3
    • /
    • pp.153-159
    • /
    • 2022
  • Plain radiographic analysis is the initial imaging modality for suspected small bowel obstruction. Among the many features that affect the diagnosis of small bowel obstruction (SBO), the presence of gas-filled or fluid-filled small bowel loops is the most salient feature that can be automatized by computer vision algorithms. In this study, we compare three frequently applied pixel-clustering algorithms for extracting gas-filled areas without human intervention. In a comparison involving 40 suspected SBO cases, the Possibilistic C-Means and Fuzzy C-Means algorithms exhibited initialization-sensitivity problems and difficulties coping with low intensity contrast, achieving low 72.5% and 85% success rates in extraction. The Adaptive Resonance Theory 2 algorithm is the most suitable algorithm for gas-filled region detection, achieving a 100% success rate on 40 tested images, largely owing to its dynamic control of the number of clusters.

Minimum Fuzzy Membership Function Extraction for Automatic Fall Detection (노인낙상 검출을 위한 최소 퍼지소속함수의 추출)

  • Jung K. Uhm;Hyoung J. Jang;Joon S. Lim
    • Annual Conference of KIPS
    • /
    • 2008.11a
    • /
    • pp.13-16
    • /
    • 2008
  • 본 논문은 가중퍼지소속함수 기반신경망(neural network with weighted fuzzy membership functions, NEWFM)기반의 자동 특징 추출기법을 사용하여 인체의 세 방향에서 발생하는 가속도 값으로부터 낙상을 탐지하는 방안을 제시하고 있다. 10명의 피검자로부터 8가지 시나리오로 낙상/비낙상 데이터 800개를 수집하고 웨이블릿 변환(wavelet transform, WT)을 통해 추출한 계수중 비중복면적 분산법에 의해 중요도가 가장 낮은 특징입력을 하나씩 제거하면서 최소의 특징 입력을 선택하였다. 특징입력으로는 가속도 값을 웨이블릿 변환한 11개의 d4계수들 중 비중복면적 분산법에 의해서 중요도가 가장 높은 5개의 계수가 사용되었고, 이들 특징입력을 통해 93%의 전체 분류율을 나타내었다.

Automatic Product Attribute Extraction from Reviews Using Web Search Engine (상품평 데이터와 웹 검색엔진을 이용한 상품별 평가항목 자동 추출)

  • Lee, Woo-Chul;Lee, Hyun-Ah
    • Annual Conference of KIPS
    • /
    • 2008.05a
    • /
    • pp.107-110
    • /
    • 2008
  • 상품평은 인터넷 쇼핑 이용자들의 최종 구매결정에 큰 영향을 미치는 것으로 알려져 있다. 많은 쇼핑몰에서 상품평 활성화를 위해 노력하고 있지만, 상품평을 모으는 것에만 주력할 뿐 기존에 수집된 상품평을 제공하는 방법에 있어서는 원시적인 수준에 그치고 있다. 상품평을 좀 더 효율적으로 제공하려면 사용자들이 상품평에서 찾게 될 평가항목들을 미리 예측하여 그 항목에 따라 상품평을 분류/요약해서 제공하는 방법을 생각할 수 있다. 본 논문에서는 상품평과 웹 검색엔진을 이용하여 각 상품별 평가항목들을 자동으로 추출하는 방법을 제안한다. 상품평 데이터의 특성상 노이즈가 많기 때문에 먼저 데이터를 정제하고, 정제된 상품평 데이터를 형태소 분석하여 후보명사들을 선택한다. 선택된 후보명사를 웹 검색엔진에 질의하여 반환된 결과 값으로 상품 카테고리와 후보명사 간 연관도를 계산하여 평가항목을 추출한다. 실험은 5개 상품 카테고리의 170,294개 실제 상품평을 대상으로 각 카테고리별 평가항목을 추출하였다.