• 제목/요약/키워드: 동적 분류 체계

Search Result 54, Processing Time 0.031 seconds

비음수 행렬 분해와 동적 분류체계를 사용한 이메일 분류 (Email Classification using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.35-39
    • /
    • 2009
  • 이메일의 사용증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factrazation)를 기반으로 한 자동 분류 주제 생성 방법과 동적 분류 체계(DCH, Dynamic Category Hierachy) 방법을 결합한 새로운 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 분류 결과 사용자의 요구사항을 만족하지 못하면 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

주성분 분석과 동적 분류체계를 사용한 자동 이메일 분류 (Automatic e-mail classification using Dynamic Category Hierarchy and Principal Component Analysis)

  • 박선;김철원;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.576-579
    • /
    • 2009
  • 인터넷 사용의 보편화로 이메일의 양이 급속히 증가하고 있다. 따라서 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 주성분 분석(PCA, Principal Component Analysis)을 기반으로 한 자동 카테고리 생성 방법과 동적 분류 체계 방법을 결합한 새로운 자동 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

교육용 자원 저장소를 위한 의미적 분류 모델 (A Semantic Classification Model for Educational Resource Repositories)

  • 최명회;정동원
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.35-45
    • /
    • 2007
  • 이 논문에서는 교육용 저장소 자원의 체계적인 관리를 위한 분류 모델을 제안한다. 생성되는 자원들에 대한 체계적인 저장 및 관리, 정확한 검색, 그리고 활용성을 극대화하기 위해서는 정확한 분류 체계가 요구된다. 그러나 교육용 저장소 자원을 위한 분류 체계나 분류 모델에 대한 연구는 미비한 수준이다. 이는 교육 자원의 비효율적 관리, 부정확한 검색 및 낮은 활용성 등의 문제점을 초래한다. 상품 정보와 관련된 분야에서는 다양한 분류 체계에 대한 연구가 이루어져 왔다. 그러나 교육 자원 정보와 기존연구 분야의 정보는 서로 다른 특성을 지닌다. 따라서 교육용 저장소 내 자원 관리를 위한 분류 체계 및 분류 모델에 대한 연구가 요구된다. 교육 자원들에 대한 효율적이고 편리한 활용을 위해서는 여러 관점을 반영하는 분류 체계에 따라 자원들을 일관성 있게 유지 관리하여야 한다. 이 논문에서는 교육 자원의 체계적인 관리 및 활용성 향상을 위한 분류 모델을 제안한다. 즉, 교육용 저장소의 자원들에 대한 분류 체계를 다양한 관점에 따라 동적으로 유지할 수 있는 분류 모델을 제안한다. 이러한 목적을 위해 먼저 관련된 과학기술분야 분류 체계들을 바탕으로 구현 자원들에 적합한 분류 체계를 정의한다. 특히 정의된 분류 체계를 동적으로 유지 관리할 수 있는 분류 모델을 정의한다. 제안된 분류 체계 및 분류 모델은 보다 정확하고 체계적인 구현 자원에 대한 관리를 가능하게 하며 또한 활용의 용이성을 향상시킨다.

상품 데이터베이스의 동적 특성을 지원하는 분류 모형 (A Classification Model Supporting Dynamic Features of Product Databases)

  • 김동규;이상구;최동훈
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.165-178
    • /
    • 2005
  • 상품 분류체계는 상품 데이터베이스를 설계하는 토대이며 전자상거래에서 상품 정보의 관리 및 활용에 관한 거의 모든 면에서 중심적 역할을 한다. 상품 정보의 효율적이고 편리한 활용을 위해 각 사용자의 관점에 따른 다양한 뷰를 제공할 필요가 있다. 새로운 상품이 출현하고 기존 상품이 사라짐에 따라 분류체계도 이에 따라 일관성을 유지하면서 변경 및 진화해야 한다. 또한 이질적인 다른 분류체계와 매핑되거나 병합될 필요가 있으며, 이 때 정보의 손실을 줄이는 것이 중요하다. 이들 요구사항에 대해, 분류체계는 제한된 시간 및 비용 내에서 수용할 수 있도록 충분히 동적이어야 한다. 그러나, UNSPSC 및 eCl@ss와 같이 현재 널리 사용중인 분류체계는 이러한 동적인 특성에 대한 요구사항을 만족시키지 못한다. 상품 정보는 재료, 시간, 장소 통의 속성과 무결성 조건과 같은 많은 의미를 지니고 있다. 이 논문에서는 상품 데이터베이스의 동적 특성 및 이에 대한 기존 코드 기반 분류 체계의 한계점을 분석하고, [1]에서 제안된 의미적 분류 모형이 상품 데이터베이스의 동적 특성에 관한 요구사항을 만족시킨다는 것을 설명한다. 이 모형은 상품 클래스를 명시적이고 형식적으로 정의할 수 있는 수단을 제공하며, 상품 클래스 간의 관계를 그래프로 구성한다.

비음수 행렬 분해와 동적 분류 체계를 사용한 자동 이메일 다원 분류 (Automatic Email Multi-category Classification Using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.378-385
    • /
    • 2010
  • 이메일 사용의 증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 늘고 있다. 현재의 이메일 분류는 SVM, 베이지안 분류자, 규칙 기반 분류자 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 그러나 이러한 지도 학습 방법들은 적합한 이메일을 인식하기 위하여서 사용자가 규칙이나 색인어 목록을 작성해야 한다. 비지도 학습 방법으로 군집을 이용한 다원 분류 방법은 메일의 분류 주제를 설정해주어야 한다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factorization)를 기반으로 한 자동 분류 주제 생성 방법과, 동적 분류 체계(DCH, Dynamic Category Hierarchy) 방법을 이용한 분류 주제 내에 이메일을 재구성하는 방법을 결합한 새로운 이메일 다원 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 다원 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 사용자가 분류 결과를 만족하지 못하면 분류 주제 내의 이메일을 동적으로 재구성하여 분류의 정확률을 높인다.

교육용 저장소 시스템을 위한 분류 모델 (A Classification Model for the Educational Repository System)

  • 최명회;정동원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.76-78
    • /
    • 2006
  • 이 논문에서는 교육용 저장소 관리 시스템의 자원들을 위한 분류체계를 제안한다. 생성되는 자원들에 대한 체계적인 저장관리, 정확한 검색 및 활용을 위해서는 적절한 분류체계가 우선적으로 요구된다. 여러 가지 자원들에 대한 효율적이고 편리한 활용을 위하여 자원들의 관점에 따른 다양한 뷰를 제공해야 하고 뷰가 생성과 소멸에 따라 분류체계도 일관성 있게 유지 및 변경되어야 한다. 이 논문에서는 교육 자원들 중에서 학습활동에서 생성되는 구현자원들에 대한 체계적인 관리 및 활용성 향상을 위한 분류체계를 제안한다. 관련된 과학기술분야 분류체계들을 바탕으로 구현자원들에 적합한 분류체계를 정의하며 동적 분류체계 관리 방법을 제안한다. 제안된 분류체계 및 관리 모델은 보다 정확하고 체계적인 구현자원에 대한 관리를 가능하게 하며 또한 활용의 용이성을 향상시킨다.

  • PDF

동적분류체계를 사용한 웹 검색엔진의 설계 및 구현 (Design and Implementation of Web Search Engine Using Dynamic Category Hierarchy)

  • 박선;최범기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.747-750
    • /
    • 2003
  • 분류검색 방법은 색인검색 방법과 함께 중요한 요소로서 웹 검색 엔진에서 지원되고 있다. 색인검색 방법에서는 검색결과의 재현율이 높지만 검색결과가 너무 많이 나오기 때문에 원하는 검색결과를 찾아내는 것이 어렵다는 단점이 있다. 또한 능숙한 컴퓨터 사용자는 색인검색을 자주 사용하지만, 컴퓨터에 익숙하지 않은 대부분의 사람들은 분류검색 방법을 사용한다. 이러한 이유 때문에 검색엔진에서 분류검색 방법이 반드시 필요하다. 그러나 분류검색 방법은 찾고자 하는 문서의 해당분류가 애매모호하거나 명확하게 알지 못할 때에는 문서를 찾지 못하는 경우가 빈번히 발생한다. 즉, 검색결과의 정확도는 높으나 재현율이 떨어지는 단점이 있다. 본 논문은 이러한 분류검색에 대한 문제점을 해결하기 위해서 분류와 검색어간의 관계를 퍼지논리를 이용하여 정량적으로 계산하고 이를 바탕으로 분류간의 함의관계를 유도함으로써 동적인 분류체계를 구성하는 새로운 웹 검색엔진을 설계하고 구현하였다. 구현된 검색엔진은 분류간의 함의관계를 유사한 하위분류로서 간주함으로써 분류검색 결과의 재현율을 높일 수 있다.

  • PDF

분류 주제 자동 생성 및 동적분류체계 방법을 이용한 이메일 분류 (E-mail Classification Using Dynamic Category Hierarchy and Automatic Generation of Category Label)

  • 안찬민;박선;박상호;최범기;이주홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.439-441
    • /
    • 2004
  • 이메일 사용이 보편화됨에 따라 점차 수신되는 메일의 량이 증가하고 있다. 이러한 메일 량의 증가는 사용자로 하여금 이메일을 좀더 효율적으로 분류할 수 있는 방법을 필요하게 한다. 그러나 현재의 이메일 분류는 규칙기반, 베이시안, SVM 등을 이용하여 스팸메일을 필터링 하는 이원분류가 주로 연구되고 있다. 이외에도 다원분류에 대한 연구로는 클러스터링을 이용한 방법이 있으나, 이는 단순히 유사도에 의해 메일을 묶는 수준에 그치고 있다. 본 논문에서는 벡터모델의 유사도를 기반으로 한 분류 주제 자동 생성 알고리즘과 동적분류체계 방법을 결합하여 새로운 이메일 자동 다원분류 방법을 제안했다. 본 논문에서 제안한 방법은 이메일을 자동으로 분류하여, 분류된 결과를 색인검색과 디렉토리 검색 방법을 지원하며 대량의 메일도 효율적으로 관리할 수 있다. 또한 메시지를 동적으로 재분류 할 수 있게 함으로써 디렉토리 검색시 재현율을 높였다.

  • PDF

웹 검색 분류어의 동적인 분류 (Dynamic Classification of Web Search Categories)

  • 최범기;박선;이주홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.521-523
    • /
    • 2003
  • 본 논문은 웹 탐색 중 디렉토리 검색엔진의 분류검색에 대한 문제점을 해결하기 위해서 분류와 검색어간의 관계를 퍼지논리를 이용하여 계산하고 분류간의 함의관계를 유도함으로써 동적인 분류체계를 구성하는 새로운 방법을 제시한다. 이 방법의 장점은 분류간의 함의관계를 유사한 하위분류로서 간주함으로써 분류검색 결과의 재현율을 높일 수 있다는 것이다.

  • PDF

문서요약 및 동적 분류체계를 사용한 E-mail 분류의 재구성 (Reconstruction of E-mail Category Using Dynamic Category Hierarchy and Document Summarization)

  • 안찬민;박선;김태순;최범기;이주홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.511-514
    • /
    • 2004
  • 현재의 이메일 분류는 규칙기반, 베이시안, SVM 등을 이용하여 스팸메일을 필터링 하는 이원분류가 주로 연구되어지고 있고, 이외에도 다원분류에 대한 연구로는 클러스터링을 이용한 방법이 있다. 그러나 클러스터링에 의한 방법은 단순히 유사도에 의해 메일을 묶는 수준에 그치고 있다. 본 논문에서는 자동 문서요약 방법과 동적분류체계 방법을 결합하여 새로운 이메일 자동 다원분류 방법을 제안했다. 본 논문에서 제안한 방법은 이메일을 자동으로 분류하며 분류한 결과를 검색할 때 사용자의 요구사항을 만족하지 못하면 재분류하여 분류 빛 검색의 정확성을 높였다.

  • PDF