• Title/Summary/Keyword: 논문 분류

Search Result 12,526, Processing Time 0.039 seconds

Dynamic Classifier Selection Using Self-Organizing Maps (자기조직화지도를 이용한 동적 분류기 선택(1))

  • 이관희;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.250-252
    • /
    • 2003
  • 패턴 인식 분야에서 다중 분류기 시스템은 여러 분류기의 결과들을 조합하여 전체 성능을 항상 시키는 시스템이다. 다중 분류기를 사용함으로써 단일 분류기 보다 더 나은 결과를 얻을 수 있음은 이미 널리 알려진 사실이다. 서로 다른 구조를 갖는 분류기들은 상호 보완적인 정보를 제공하기 때문에 각 분류기마다 입력 공간에 대해서 지역적으로 좋은 성능을 갖는다. 본 논문에서는 지역적으로 가장 좋은 성능을 보이는 분류기 선택 방법을 제안한다. 제안하는 방법은 주어진 입력 공간에 비해 각 분류기들을 학습하는 과정에서 자기조직화지도를 생성하고 각 노드별로 평가함으로써 입력이 주어지면, 해당 노드에서 가장 성능이 좋은 분류기를 선택하여 전체 성능을 향상시키는 시스템이다.

  • PDF

E-Mail Classification Using Text and Domain Name (텍스트와 도메인 네임을 이용한 메일 분류)

  • 김원화;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.256-258
    • /
    • 2003
  • 정보화 시대에는 사람들의 모든 활동이 인터넷을 통해서 대부분 이루어진다. 이중에서 전자 메일이 차지하는 비중은 매우 크다. 고객 유치를 위한 기업들의 광고와 배움을 위한 강의, 자신의 관심 분야에 대한 정보 등을 전자 매일로 받아보게 되는 것이 더 많아 질것이다. 이러한 상황에서 사람들은 자신이 필요로 하는 메일과 필요로 하지 않는 메일을 분류하는데 많은 시간을 낭비한다. 사람들은 이러한 시간 낭비를 줄이기 위해서 메일 분류 시스템을 사용한다. 현재 사용되고 있는 매일 분류 시스템은 스팸 매일을 기준으로 하고 있다. 그러나 오분류되는 메일들이 있어 사용자가 스팸 메일을 다시 보는 경우가 있어 한계를 보인다. 본 논문에서는 사람들이 자신이 원하는 메일과 그렇지 않은 메일을 분류하기 위해서 1차 분류로 긍정어와 부정어를 이용하여 전자 메일을 분류하고 2차 분류로 도메인 네임을 이용하여 분류한다.

  • PDF

Performance Comparison by Combining CNN with Various Classification Methods (CNN과 다양한 분류 방법의 결합에 의한 성능 비교)

  • Han, Jung-Soo;Kwak, Keun-Chang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.609-610
    • /
    • 2016
  • 본 논문에서는 컨볼루션 신경회로망(CNN: Convolutional Neural Network)과 다양한 분류기들의 결합을 통해 분류성능을 비교하고자 한다. 현재 일반적인 분류기로 알려진 것은 나이브 베이즈(Naive bayes), 트리(Tree), 판별 분석(Discriminant Analysis), 서포트 벡터 머신(SVM: Support Vector Machine) 등이 존재한다. 분류기들은 각각 다른 원리로 분류하기 때문에, 각각 성능을 비교해볼 필요가 있다. 분류기들의 성능을 비교하기 위한 사용한 데이터는 CNN에서 자주 사용되고 있는 MNIST 데이터를 사용하였다. 실험 결과로는 CNN에 선형 SVM을 결합하여 사용한 것이 분류율과 분류속도 측면에서 다른 분류기들의 성능보다 좋은 성능을 보이는 것을 확인할 수 있었다.

Efficient Document Classification for Web Document Collection (웹 문서 수집을 위한 효율적인 문서 분류)

  • Lee, Jung-Hun;Cheon, Suh-Hyun;Kim, Sun-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.397-401
    • /
    • 2006
  • 최근 다양한 형식의 웹 문서에서 사용자가 원하는 정보만을 검색 하기위해 웹 문서를 주제별로 분류하여 수집하고, 관리하는 것은 필수적인 요소이다. 즉, 정확하고 빠른 정보 검색을 위한 웹 문서 수집은 문서 형식에 따라 분류되어 수집 되어야 한다. 따라서 웹 환경에서 문서를 구성하는 형식을 텍스트나 이미지 데이터로 구분하고 그 형식에 맞는 분류기법을 사용한다면 정확한 정보 검색이 이루어 질수 있다. 본 논문에서는 텍스트와 URL을 이용한 주제 중심의 하이브리드 웹 문서 분류 방법을 제안한다. 텍스트와 URL을 이용한 분류 방법은 텍스트 형식은 주제 중심의 문서 분류방식을 사용하며, 텍스트 정보의 효용성이 낮은 경우 URL의 주제 분포도를 이용하여 분류하며 수집한다. 이를 통해 여러 가지 형식의 웹 문서가 분류 가능하며, 주제에 따른 문서 분류의 정확도가 높아진다.

  • PDF

Classification of Breast Tumor Cell Tissue Section Images Based on Wavelet Transform (Wavelet 변환에 기반한 유방 종양 세포 조직 영상의 분류)

  • 황해길;최현주;최익환;최흥국;윤혜경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.340-342
    • /
    • 2001
  • 본 논문은 유방질환 중에서 Duct(관)에 발생하는 유방 종양을 benign(양성종양)/DCIS (Ductal Carcinoma In Situ)/NOS(Invasive ductal carcinoma)로 자동 분류하기 위한 분류방법을 제안한다. 분류기 생성에서 가장 중요한 단계인 특징 추출단계에서는 wavelet 변환을 적용하였으며, wavelet 변환의 각 depth에 따라 분류기를 생성하여, depth와 생성된 분류기의 분류 정확도와의 상관관계를 비교.분석하였다. 현미경 100배 배율과 400배 배율의 유방 질환 영상을 1, 2, 3, 4단계(depth)의 wavelet 변환을 적용한 후, 분할된 서브밴드에서 GLCM을 이용하여 질감 특징(Entropy, Energy, Contrast, Homogeneity)을 추출하여, 이 특징값들을 조합하여 판별분석에 의해 분류기(classifier)를 생성한 후, 분류 정확도를 검증하였다. Benign/DCIS/NOS를 분류하려면 최소 3단계 이상의 wavelet 변환을 적용해야 하고, 400배 배율 영상보다는 100배 배율의 영상이 더 나은 결과를 보였다.

  • PDF

Markov Models based Classification of Fingerprint Structural Features (마코프 모텔 기반 지문의 구조적 특징 분류)

  • Jung Hye-Wuk;Won Jong-Jin;Kim Moon-Hyun
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2005.11a
    • /
    • pp.33-38
    • /
    • 2005
  • 지문분류는 대규모 인증시스템에 사용되는 지문 데이터 베이스를 종류별로 인덱싱 하거나 인식 시스템에 다양하게 쓰이는 매우 중요한 방법이다. 지문은 일반적으로 융선의 전체모양 등 전역적인 특징을 기반으로 분류하며, 분류방법에는 규칙기반 접근, 구문론적 접근, 구조적 접근, 통계적 접근, 신경망 기반 접근 등이 있다. 본 논문에서는 지문의 구조적인 특징을 바탕으로 관찰되는 특징의 상태가 매순간 변화하는 확률론적 정보추출 방식인 마코프 모델을 적용한 지문분류 방법을 제안한다. 지문 이미지의 전처리 과정을 거친 후 각 클래스 분류를 위해 대표 융선을 찾아 방향정보를 추출하고 이를 이용하여 5가지 클래스로 분류될 수 있도록 설계하였다. 좋은품질(Good)과 나쁜품질(Poor)의 데이터를 포함한 훈련집합을 사용하여 각 클래스별로 학습된 마코프 모델은 임의의 지문이미지 분류시 높은 분류율을 보였다. 또한 기존의 구조적 접근방법에 비하여 다양한 품질의 지문이미지의 방향성 정보를 이용한 확률론적 방법이기 때문에 예외적인 지문이미지 분류시 잘 적용될 수 있다.

  • PDF

Automatic Text Classification Method Using Keywords and Unlabeled Text (주제어와 미분류 문서들을 이용한 문서의 자동 분류 방법)

  • Lee Kang-Il;Lee Chang-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.592-594
    • /
    • 2005
  • 문서를 분류하기 위해서는 분류주제에 맞춰 미리 분류가 된 자료(labeled data)가 필요하다. 하지만 미리 분류가 된 자료를 만들기 위해서는 사람이 직접 그 문서의 의미를 해석하고 일일이 분류를 해야 하기 때문에 시간이 많이 소모가 된다. 본 논문에서는 비록 사랑이 직접 분류한 자료를 이용하는 것에 비해서 분류 정확도는 조금 떨어지지만, 대신 주제어와 미분류 문서(unlabeled data)를 이용해서 문서를 분류하는 방법을 제시하려고 한다. 이와 같은 주제어와 미분류 문서의 경우에는 구하기가 쉽고, 사랑이 일일이 분류하는 작업이 필요로 하지 않기 때문에 비용과 시간이 크게 절약이 된다는 장정이 있다.

  • PDF

Multiple Optimal Classifiers based on Speciated Evolution for Classifying DNA Microarray Data (DNA 마이크로어레이 데이터의 분류를 위한 종분화 진화 기반의 최적 다중 분류기)

  • 박찬호;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.724-726
    • /
    • 2004
  • DNA 마이크로어레이 기술의 발전은 암의 조기 발견 및 예후 예측을 가능하게 해주었으며, 이와 관련된 많은 연구가 진행 중이다. 마이크로어레이 데이터의 분류에서 관련 유전자들의 선택은 필수적이며, 유전자 선택방법은 분류기와 짝을 이루어 특징-분류기를 형성한다. 이제까지 여러 가지 특징-분류기를 사용하여 마이크로어레이 데이터를 분류해 왔지만, 알고리즘의 한계와 데이터의 결함 등으로 인하여 최적의 특징-분류기를 찾기 어려웠다. 따라서 앙상블 분류기를 이용하여 높은 분류성능을 얻는 방법이 시도되어왔으며. 최적의 것을 찾기 위하여 유전자 알고리즘이 사용되기도 했다. 본 논문에서는 이를 발전시켜 다양한 최적의 앙상블을 생성하기 위해 종분화 방법을 사용한다. 림프종 암 데이터에 대하여 leave-one-out cross-validation을 적용한 결과, 제안한 방법으로 다양한 최적해를 탐색하는 것을 확인할 수 있었다.

  • PDF

Cancer Histopathological Image Classification based on Convolutional Neural Network (CNN 기반 암세포 현미경 이미지 분류)

  • Kim, Shin;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.46-48
    • /
    • 2018
  • 최근 수 년간 뉴럴 네트워크 기반 이미지 분류 기법의 성능이 눈에 띄게 향상되었다. 특히 CNN 은 딥 러닝기법을 도입하면서 이미지 분류 정확도가 향상되었으며, 이는 의학 분야 등 다른 분야에도 영향을 주게 되었다. 의학용 이미지의 분류 시스템의 경우, 오분류가 치명적인 결과를 초래할 수 있기 때문에 높은 정확도의 이미지 분류 시스템을 필요로 하게 된다. 본 논문에서는 CNN 기반 암세포 현미경 이미지 분류 기법에 대해 제안한다. 사전에 훈련된 뉴럴 네트워크의 가중치의 일부를 다시 계산하고, 재계산을 통해 얻은 가중치를 기반으로 암세포 현미경 이미지를 분류하며, 분류결과 높은 정확도로 이미지를 분류하는 것을 확인할 수 있다.

  • PDF

BKS Fusion of Classifier Ensemble for Prediction of Diabetes (당뇨병의 예측을 위한 분류기 앙상블의 BKS 결합)

  • 박한샘;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.265-267
    • /
    • 2004
  • 경제 여건의 향상 및 생활양식의 변화로 최근 우리나라에서도 당뇨병 환자가 늘어남에 따라 당뇨병의 예측 및 치료가 중요한 관심사가 되고 있다. 본 논문은 1993년과 1995년 두 차례에 걸쳐 경기도 연천 지역 주민들의 여러 가지 신체 지수 등을 조사한 데이터를 대상으로, 1차 년도의 데이터로부터 동일한 환자가 2차 년도에 정상상태를 유지하는지 흑은 당뇨병으로 진행이 되는지를 예측하는 문제를 다룬다. 혈당량, 허리둘레 등의 수치가 당뇨병의 발병에 영향을 끼치는 것은 알려진 사실이므로, 현재의 데이터로부터 앞으로의 발병 가능성을 예측하는 것이 가능하며, 이는 환자에게 보다 정확한 정보를 알려줄 수 있으므로 의미가 있는 일이다. 예측을 위해 본 논문에서는 분류기를 사용하며, 예측율을 높이기 위해 여러 분류기를 BKS로 결합하였다. BKS (behavior knowledge space) 결합 방법은 분류기간의 독립 가정이 필요 없으며, 데이터 크기가 크고 전형적인 경우에 좋은 결과를 낼 수 있는 방법이다. BKS 결합 방법을 통해 실험을 해본 결과 단일 분류기로 실험을 한 결과보다 향상된 성능을 얻을 수 있었으며, 투표 결합 방법과 비교하여 더 좋은 성능을 보였다.

  • PDF