• Title/Summary/Keyword: 점진적 분류

Search Result 150, Processing Time 0.021 seconds

A Study on Incremental Learning Model for Naive Bayes Text Classifier (Naive Bayes 문서 분류기를 위한 점진적 학습 모델 연구)

  • 김제욱;김한준;이상구
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.331-341
    • /
    • 2001
  • 본 논문에서는 Naive Bayes 문서 분류기를 위한 새로운 학습모델을 제안한다. 이 모델에서는 라벨이 없는 문서들의 집합으로부터 선택한 적은 수의 학습 문서들을 이용하여 문서 분류기를 재학습한다. 본 논문에서는 이러한 학습 방법을 따를 경우 작은 비용으로도 문서 분류기의 정확도가 크게 향상될 수 있다는 사실을 보인다. 이와 같이, 알고리즘을 통해 라벨이 없는 문서들의 집합으로부터 정보량이 큰 문서를 선택한 후, 전문가가 이 문서에 라벨을 부여하는 방식으로 학습문서를 결정하는 것을 selective sampling이라 한다. 본 논문에서는 이러한 selective sampling 문제를 Naive Bayes 문서 분류기에 적용한다. 제안한 학습 방법에서는 라벨이 없는 문서들의 집합으로부터 재학습 문서를 선택하는 기준 측정치로서 평균절대편차(Mean Absolute Deviation), 엔트로피 측정치를 사용한다. 실험을 통해서 제안한 학습 방법이 기존의 방법인 신뢰도(Confidence measure)를 이용한 학습 방법보다 Naive Bayes 문서 분류기의 성능을 더 많이 향상시킨다는 사실을 보인다.

  • PDF

지형정보를 이용한 VR 환경구축

  • 박지원;고연희
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2001.05a
    • /
    • pp.125-125
    • /
    • 2001
  • 실 지형정보를 이용한 3D 가상환경은 사용자에게 좀 더 현실에 가까운 교육환경을 제공한다. 3D 가상환경에 사용되는 지형정보는 mesh를 생성하기 위한 고도 data와 mapping을 위한 위성영상이나 항공사진 등이 사용된다. 고도 데이터는 DEM,DTED와 같은 데이터 포맷이 있는데 해상도에 따라 초단위 또는 M 단위로 다양하게 분류되어 있으며 위성영상이나 항공사진도 해상도에 따라 50M∼10Cm 까지 다양하여 사용목적에 맞는 데이터 선택이 필요하다. 고도데이터와 mapping 데이터를 이용하여 기본적인 3D 지형을 생성한 후에 안개나 비, 눈, 빛, 구름과 같은 기상환경을 시뮬레이션하거나 건물이나 이정표, 또는 텍스트 같은 사용자 정보를 Vector overlay 하여 좀 더 현실감 있는 3D 가상환경을 만들 수 있다. 최근에는 인터넷이 일반화되면서 네트웍을 통해 지명데이터를 전송하고 렌더링 하고자 하는 요구가 발생하고 있다. 그러나 3차원 가상환경을 위한 지형 데이터는 2D 데이터에 비해 크기가 크고 고사양의 하드웨어사양을 필요로 하여 네트웍을 통해 전송하고 랜더링 하기에는 여러 가지 제약이 따른다. 이러한 재약을 극복하기 위해 데이터를 한꺼번에 전송하지 않고 점진적으로 전송하고자 하는 연구가 많이 있어 왔으며 점진적 메쉬나 딜로니 규칙에 기반한 TIN 압축 점진적 시각화 기법, DEM 웨이블릿 변환을 적용한 저장, 전송 렌더링 하고자 하는 연구가 시도되어 왔다.

  • PDF

Progressive Reconstruction of 3D Objects from a Single Freehand Line Drawing (Free-Hand 선화로부터 점진적 3차원 물체 복원)

  • 오범수;김창헌
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.30 no.3_4
    • /
    • pp.168-185
    • /
    • 2003
  • This paper presents a progressive algorithm that not only can narrow down the search domain in the course of face identification but also can fast reconstruct various 3D objects from a sketch drawing. The sketch drawing, edge-vertex graph without hidden line removal, which serves as input for reconstruction process, is obtained from an inaccurate freehand sketch of a 3D wireframe object. The algorithm is executed in two stages. In the face identification stage, we generate and classify potential faces into implausible, basis, and minimal faces by using geometrical and topological constraints to reduce search space. The proposed algorithm searches the space of minimal faces only to identify actual faces of an object fast. In the object reconstruction stage, we progressively calculate a 3D structure by optimizing the coordinates of vertices of an object according to the sketch order of faces. The progressive method reconstructs the most plausible 3D object quickly by applying 3D constraints that are derived from the relationship between the object and the sketch drawing in the optimization process. Furthermore, it allows the designer to change viewpoint during sketching. The progressive reconstruction algorithm is discussed, and examples from a working implementation are given.

A Feature Selection Technique for Multi-lingual Character Recognition (TV 제어 메뉴의 다국적 언어 인식을 위한 특징 선정 기법)

  • Kang, Keun-Seok;Park, Hyun-Jung;Kim, Ho-Joon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2005.11a
    • /
    • pp.199-202
    • /
    • 2005
  • TV OSD(On Screen Display) 메뉴 자동검증 시스템에서 다국적 언어의 문자 인식은 표준패턴의 구조적 분석이 쉽지 않을 뿐만 아니라 학습패턴 집합의 규모와 특징의 수가 증가함으로 인하여 특징추출 및 인식 과정에서 방대한 계산량이 요구된다. 이에 본 연구에서는 학습 데이터에 포함되는 다량의 특징 집합으로부터 인식에 필요한 효과적인 특징을 선별함으로써 패턴 분류기의 효율성을 개선하기 위한 방법론을 고찰한다. 이를 위하여 수정된 형태의 Adaboost 기법을 제안하고 이를 적용한 실험 결과로부터 그 유용성을 고찰한다. 제안된 알고리즘은 초기의 특징 집합을 취약한 성능을 갖는 다수의 분류기(classifier)로서 고려하며, 이로부터 반복학습을 통하여 개선된 분류기를 점진적으로 선별해 나가게 된다. 학습의 원리는 주어진 학습패턴 집합에 기초하여 일종의 교사학습(supervised learning) 방식으로 이루어진다. 각 패턴에 할당된 가중치 값은 각 단계에서 산출되는 분류결과에 따라 적응적으로 수정되어 반복학습이 진행됨에 따라 점차 보완적 성능을 갖는 분류기를 선택할 수 있게 한다. 즉, 주어진 각 학습패턴에 대하여 초기에 균등한 가중치가 부여되며, 반복학습의 각 단계에서 적용되는 분류기의 출력을 분석하여 오분류된 패턴의 가중치 분포를 증가시켜 나간다. 본 연구에서는 실제 응용으로서 OSD 메뉴검증 시스템을 대상으로 제안된 이론을 적용하고 그 타당성을 평가한다.

  • PDF

Design of Prediction System based on Classification Method (분류기법을 이용한 예측 시스템 설계)

  • 김대진;이준욱;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.154-156
    • /
    • 2002
  • 정보화시대에 들어서면서 나날이 급증하는 데이터에 대한 재가용성을 위한 많은 연구가 이루어지고 있다 이러한 연구들은 의사결정지원, 예측, 추정 등의 분야에서 적용되고 있으나, 실생활에 활발히 적용되기까지 앞으로 많은 연구 및 개발이 요구된다. 이 논문에서는 수집된 데이터로부터 패턴을 추출하여 예측결과를 제공할 수 있는 시스템 모델과 모델에 적합한 점진적 규칙갱신 알고리즘을 제안하였다. 제안하는 예측 모델의 특징은 새로 입력되는 정보에 대한 반복 학습시 수치데이터에 대한 평균근사치 할당방법을 적용하여 규칙갱신을 용이하게 하였으며 각 클래스의 수치데이터에 대한 분류를 용이하도록 하였다.

  • PDF

An Effective Incremental Text Clustering Method for the Large Document Database (대용량 문서 데이터베이스를 위한 효율적인 점진적 문서 클러스터링 기법)

  • Kang, Dong-Hyuk;Joo, Kil-Hong;Lee, Won-Suk
    • The KIPS Transactions:PartD
    • /
    • v.10D no.1
    • /
    • pp.57-66
    • /
    • 2003
  • With the development of the internet and computer, the amount of information through the internet is increasing rapidly and it is managed in document form. For this reason, the research into the method to manage for a large amount of document in an effective way is necessary. The document clustering is integrated documents to subject by classifying a set of documents through their similarity among them. Accordingly, the document clustering can be used in exploring and searching a document and it can increased accuracy of search. This paper proposes an efficient incremental cluttering method for a set of documents increase gradually. The incremental document clustering algorithm assigns a set of new documents to the legacy clusters which have been identified in advance. In addition, to improve the correctness of the clustering, removing the stop words can be proposed and the weight of the word can be calculated by the proposed TF$\times$NIDF function.

An Effective Increment리 Content Clustering Method for the Large Documents in U-learning Environment (U-learning 환경의 대용량 학습문서 판리를 위한 효율적인 점진적 문서)

  • Joo, Kil-Hong;Choi, Jin-Tak
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.9
    • /
    • pp.859-872
    • /
    • 2004
  • With the rapid advance of computer and communication techonology, the recent trend of education environment is edveloping in the ubiquitous learning (u-learning) direction that learners select and organize the contents, time and order of learning by themselves. Since the amount of education information through the internet is increasing rapidly and it is managed in document in an effective way is necessary. The document clustering is integrated documents to subject by classifying a set of documents through their similarity among them. Accordingly, the document clustering can be used in exploring and searching a document and it can increased accuracy of search. This paper proposes an efficient incremental clustering method for a set of documents increase gradually. The incremental document clustering algorithm assigns a set of new documents to the legacy clusters which have been identified in advance. In addition, to improve the correctness of the clustering, removing the stop words can be proposed.

  • PDF

Design of Moa Contents Curation Service System Based on Incremental Learning Technology (점진적 학습 기반 모아 콘텐츠 큐레이션 서비스 시스템 설계)

  • Lee, Jeong-won;Min, Byung-Won;Oh, Yong-Sun
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2018.05a
    • /
    • pp.401-402
    • /
    • 2018
  • 콘텐츠 큐레이션 서비스를 위해서 대용량 데이터를 학습하는 과정에서 발생하는 메모리부족 문제, 학습소요시간 문제 등을 해결하기 위한 "대용량 문서학습을 위한 동적학습 파이프라인 생성기술 중 빅데이터 마이닝을 위한 점진적 학습 모델" 기술이 필요하며, 본 논문에서 제안한 콘텐츠 큐레이션 서비스는 온라인상의 수많은 콘텐츠들 중 개인의 주관이나 관점에 따라 관련 콘텐츠들을 수집, 정리하고 편집하여 이용자와 관련이 있거나 좋아할 만한 콘텐츠를 제공하는 서비스이다. 본 논문에서 설계된 모아 큐레이션 서비스는 대용량의 문서를 학습함에 있어서 메모리 부족 문제, 학습 소요시간 문제 등을 해결하기 위해 학습데이터의 용량 제한이 없는 문서를 자유롭게 학습하고 부분적인 자질추가/변경 시에 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법 등을 제시하였다.

  • PDF

A Study on the Evolutionary Model for Ubiquitous Service (유비쿼터스 서비스의 단계적 진화 모델에 관한 연구)

  • Jin, Hui-Chae;Kim, Do-Hyun
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2005.11a
    • /
    • pp.121-134
    • /
    • 2005
  • 본 논문에서는 u-Korea를 구축하기 위한 유비쿼터스 서비스의 단계별 진화모델을 개발하고자 한다. u-Korea 서비스의 단계별 모델을 개발하기 위하여 우선 유비쿼터스 소요 기술을 분류하여야 하고 이것은 네트워크, 미들웨어, 단말 및 응용으로 구성된 각 계층 유비쿼터스 기술구조로 구분될 수 있다. 그리고 각 기술의 발전 방향 등을 토대로 각 계층에 대한 로드맵을 작성 한다. 다음 단계에서는 소요 기술의 개발 수준과 구성 요소를 기반으로 유비쿼터스 서비스를 위한 참조모델을 제안하고, 각 서비스의 지능화 수준과 서비스 기술 로드맵에 따라 첫번째 P-to-M 커뮤니케이션, 두 번째 상황인지, 세 번째 자율성 단계로 유비쿼터스 서비스의 점진적 3단계 발전 방안을 제시한다. 그 후 제시된 진화 방법에 따라서 보건 복지 분야의 국내외 유비쿼터스 서비스 사례를 분석하고, 점진적으로 개발되어지는 유비쿼터스 모형을 적용하여 보도록 한다.

  • PDF

Incremental view maintenance for aggregation operator in sensor networks (센서 네트워크에서 집계 연산을 위한 점진적 뷰 관리)

  • Choi, Ju-Ree;Lee, Min-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.172-174
    • /
    • 2005
  • 센서 네트워크에서 집계(aggregation) 연산은 센서 네트워크를 데이터베이스로 구현하는데 있어서 중요하게 제공되어져야 하는 서비스이다 현재 연구되고 있는 것으로 집계 연산을 센서 네트워크의 특징상으로 분류하여 근접한 결과값을 받는 것을 허용하고 집계 값을 자식노드가 부모노드로 보내는 기간을 부모노드가 자식노드에게 나누어 할당하여 센서 네트워크상에 적절히 구현하는 것에 대해 알아보고 집계 그루핑을 하는 과정에서 데이터웨어하우징 연구의 최신기술인 점진적인 덜 관리 기법을 통해 센서노드들의 평균값에 대해 새로운 값이 추가될 때 다시 모든 값을 계산하기 않고 변경된 값만 적용하여 계산함으로 좀더 에너지 효율적으로 확장하는 것을 제안하였다.

  • PDF