• Title/Summary/Keyword: 단계별추출

Search Result 484, Processing Time 0.029 seconds

Automatic Named Entities Extraction Using the Graph-based Measurement Technique of the Mutual Importance (그래프 기반의 상호 중요도 측정 기법을 이용한 영역별 개체명 자동 추출)

  • Bae, Sangjoon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.17-22
    • /
    • 2008
  • 본 논문에서는 영역별로 자동으로 개체명을 추출하기 위하여 씨앗단어를 이용하고, 웹페이지와 개체명 후보들 간의 상호 중요도를 측정하여 개체명 후보들의 순위를 정하는 방식을 제안한다. 제안된 방식은 크게 세 단계에 의해서 수행되어 지는데 먼저 씨앗단어 정보를 이용하여 웹페이지를 검색하고, 검색되어진 웹 페이지와 씨앗단어 정보를 이용하여 패턴 규칙을 추출한다. 추출된 패턴 규칙을 웹페이지에 적용하여 개체명 후보들을 추출하고 추출된 후보들과 웹페이지 사이의 상호 중요도를 재귀적으로 계산하여 최종적으로 개체명 후보들의 순위가 정해 진다. 한국어와 영어 개체명 영역에 제안된 기법을 적용하여 실험한 결과 한국어에서는 78.72%의 MAP를 얻을 수 있었고, 영어에서는 96.48%의 MAP를 얻었다. 특히 영어 개체명 인식에서의 성능은 구글에서 제공하고 있는 구글셋의 결과보다도 높은 성능을 보였다.

  • PDF

Transformation-based Learning for Korean Comparative Sentence Classification (한국어 비교 문장 유형 분류를 위한 변환 기반 학습 기법)

  • Yang, Seon;Ko, Young-Joong
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.2
    • /
    • pp.155-160
    • /
    • 2010
  • This paper proposes a method for Korean comparative sentence classification which is a part of comparison mining. Comparison mining, one area of text mining, analyzes comparative relations from the enormous amount of text documents. Three-step process is needed for comparison mining - 1) identifying comparative sentences in the text documents, 2) classifying those sentences into several classes, 3) analyzing comparative relations per each comparative class. This paper aims at the second task. In this paper, we use transformation-based learning (TBL) technique which is a well-known learning method in the natural language processing. In our experiment, we classify comparative sentences into seven classes using TBL and achieve an accuracy of 80.01%.

이중 추출 방법을 이용한 단위 무응답의 가중치 조정방법에 관한 연구

  • Yeom, Jun-Geun;Son, Chang-Gyun;Jeong, Yeong-Mi
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.13-18
    • /
    • 2002
  • 이중추출(two-phase)접근방법 이용의 주목적은 관심변수와 보조변수사이의 관계를 이용해서 더 좋은 추정을 하고자 하는 것이다. 특히 이 방법은 층화, 무응답 문제에 적용하는 경우 상당히 효과적이다. 본 논문에서는 무시할 수 있는 무응답이 발생했을 때 이중추출기법을 이용해서 g-가중치와 응답확률을 각 단계별로 조정해줌으로써 무응답 보정추정량과 분산추정량을 구했다.

  • PDF

Analysis of Human Sensibility Ergonomic Corpora for Automatic Indexation - Extraction of informative features - (자동 지표화를 위한 감성공학 분야 코퍼스 분석- 전문적 문서의 특성 정보 추출)

  • 배희숙;김관웅;곽현민;이상태
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2002.11a
    • /
    • pp.53-58
    • /
    • 2002
  • 본 논문은 감성공학 데이터의 지속적인 지표화를 위해 과정의 자동화를 제안하며 자동 지표화가 문서의 자동 요약과 유사하다는 점에 착안하여 문서 자동분류, 정보유형 추출, 특성언어 추출 및 문장 재구성이라는 단계별 기술의 기초가 되는 정보유형 및 핵심어, 그리고 특성표현을 통한 정보문 추출 방법에 대해 연구하였다. 감성공학 코퍼스 분석을 통한 본 연구는 감성공학 분야에서의 지식 관리 시스템과 자동 요약 시스템에 활용될 수 있다.

  • PDF

A Study on Face Expression Recognition using LDA Mixture Model and Nearest Neighbor Pattern Classification (LDA 융합모델과 최소거리패턴분류법을 이용한 얼굴 표정 인식 연구)

  • No, Jong-Heun;Baek, Yeong-Hyeon;Mun, Seong-Ryong;Gang, Yeong-Jin
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.11a
    • /
    • pp.167-170
    • /
    • 2006
  • 본 논문은 선형분류기인 LDA 융합모델과 최소거리패턴분류법을 이용한 얼굴표정인식 알고리즘 연구에 관한 것이다. 제안된 알고리즘은 얼굴 표정을 인식하기 위해 두 단계의 특징 추출과정과 인식단계를 거치게 된다. 먼저 특징추출 단계에서는 얼굴 표정이 담긴 영상을 PCA를 이용해 고차원에서 저차원의 공간으로 변환한 후, LDA 이용해 특징벡터를 클래스 별로 나누어 분류한다. 다음 단계로 LDA융합모델을 통해 계산된 특징벡터에 최소거리패턴분류법을 적용함으로서 얼굴 표정을 인식한다. 제안된 알고리즘은 6가지 기본 감정(기쁨, 화남, 놀람, 공포, 슬픔, 혐오)으로 구성된 데이터베이스를 이용해 실험한 결과, 기존알고리즘에 비해 향상된 인식률과 특정 표정에 관계없이 고른 인식률을 보임을 확인하였다.

  • PDF

Feature Extraction and Classification of High Dimensional Biomedical Spectral Data (고차원을 갖는 생체 스펙트럼 데이터의 특징추출 및 분류기법)

  • Cho, Jae-Hoon;Park, Jin-Il;Lee, Dae-Jong;Chun, Myung-Geun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.19 no.3
    • /
    • pp.297-303
    • /
    • 2009
  • In this paper, we propose the biomedical spectral pattern classification techniques by the fusion scheme based on the SpPCA and MLP in extended feature space. A conventional PCA technique for the dimension reduction has the problem that it can't find an optimal transformation matrix if the property of input data is nonlinear. To overcome this drawback, we extract features by the SpPCA technique in extended space which use the local patterns rather than whole patterns. In the classification step, individual classifier based on MLP calculates the similarity of each class for local features. Finally, biomedical spectral patterns is classified by the fusion scheme to effectively combine the individual information. As the simulation results to verify the effectiveness, the proposed method showed more improved classification results than conventional methods.

Design and Implementation of Efficient Plate Number Region Detecting System in Vehicle Number Plate Image (자동차 번호판 영상에서 효율적인 번호판 영역 검출 시스템의 설계 및 개발)

  • Lee Hyun-Chang
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.5 s.37
    • /
    • pp.87-94
    • /
    • 2005
  • This paper describes the method of detecting the region of vehicle number plate in colored car image with number plate. Vehicle number plate region generally shows formula colors in accordance with type of car. According to this, we use the method to combine a color ingredient H of HSI color model and a color ingredient Q of YIQ color model. However, the defect which a total operation time takes much exists if it uses such method. Therefore, in this paper, the concurrent accomplishes a candidate area extraction operation as draw a color H and Q ingredient among steps of extracting a region of vehicle number Plate. After the above step, as a next step in combination with color H and Q we can accomplish an region extraction fast by comparing to candidate regions extracted from each steps not to do a comparison operation to all of image pixel information. We also show implementation results Processed at each steps and compare with extraction time according to image resolutions.

  • PDF

Design of Study System using Weak Point on Question Types (문제 유형별 약점정보를 이용한 학습시스템의 설계)

  • Park, Hyun-Jung;Son, Ji-Hyun;Moon, Sang-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.235-238
    • /
    • 2003
  • 기존 연구에서 원격교육은 위한 다양한 학습방법들이 제시되었지만 대부분이 학습자의 수준을 고려하여 단순히 평균 점수나 난이도의 조정으로 학습이 이루어진다. 또한, 학습자의 능력과 문제 유형에 따른 학습 평가가 이루어지기 어려우므로 학습자의 개인별 학습 능력을 정확히 평가할 수가 없는 문제점이 있다. 이러한 문제점을 해결하기 위하여, 본 논문에서는 학습자별로 개인적인 학습 능력에 따라 수행할 수 있는 학습 시스템을 제안한다. 세부적으로 문제 유형별에 따른 약점 정보를 평가 단계에서 추출 및 저장하여, 다음 단계의 학습에서 개인별 약점정보로서 활용하도록 한다. 따라서 이 시스템에서는 학습자별로 문제유형에 따른 개인별 약점정보를 활용하여 학습을 반복할 수 있으므로 더욱 효과적인 원격교육을 제공할 수 있다.

  • PDF

Design of System for Remote Instruction using Personal Study Information (개인별 학습정보를 이용한 원격교육 시스템의 설계)

  • 손지현;문상호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11b
    • /
    • pp.901-904
    • /
    • 2003
  • 최근에 웹을 이용한 원격교육에 대한 않은 학습 방법들이 제시되고 있으며, 단순히 학습만을 고려한 방법부터 실시간으로 원격시험을 치르는 방법까지 다양하다 웹 기반의 학습에서 많이 적용되는 방법이 문제를 통한 학습이며, 기존의 학습들은 학습자가 개인 수준에 안는 문제 난이도를 직접 선택하거나, 문제를 동적으로 추출하여 학습하는 방식이다. 그러나 이 방법들은 단순히 출제되는 문제 자체의 차별성을 기반으로 하므로 학습자의 능력별 학습이 이루어지기 어려운 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여, 개인의 문제유형별 약점정보를 기반으로 유형별 추출되는 문제에 난이도를 두어 개인별 학습 능력을 정확히 평가한다. 그리고 다음 단계의 학습에서 개인별 학습정보를 충분히 반영하여 문제들을 출제하므로 학습자의 학습효과를 높일 수 있다. 따라서 이 시스템은 문제유형과 문제난이도에 대한 개인의 정보를 반복적으로 적용하여 학습할 수 있으므로, 더욱 효과적인 원격학습을 제공할 수 있다.

  • PDF