• 제목/요약/키워드: 계층 분류

검색결과 926건 처리시간 0.029초

계층적 클러스터링에서 분류 대표어 선정에 관한 연구 (A Study on Cluster Topic Selection in Hierarchical Clustering)

  • 이상선;이신원;안동언;정성종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.669-672
    • /
    • 2004
  • 정보의 양이 많아지면서 정보 검색 시스템에 검색 결과를 자동으로 구조화하는 계층적 클러스터링을 적용하는 시도가 늘고 있다. 계층적 클러스터링은 문서 간의 유사도를 통해 클러스터를 계층 구조로 만들어 검색 성능을 높이고 결과를 사용자에게 이해하기 쉽게 보여준다. 계층 구조는 검색 결과를 요약하는 것이기 때문에 클러스터의 내용을 효과적으로 함축할 수 있는 대표어의 선정이 중요하다. 각 클러스터의 대표어를 선정하기 위해 대표어에 명사인 단어만 추출하고 상위 클러스터 대표어에 사용된 단어는 하위 클러스터에 사용하지 않는 방법을 적용하여 대표어의 질을 높였다.

  • PDF

의미 있는 태그 클러스터 구축을 위한 설계 방안 (A Design of Building a Meaningful Tag Cluster)

  • 박병재;우종우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.658-661
    • /
    • 2008
  • 태깅은 웹 2.0의 핵심 기술 중 하나로, 매우 유연하고 역동적인 분류 체계를 제공한다. 하지만 유연성과 역동성의 확보에 의해 계층 구조나 연관 관계와 같은 태그의 관계성이 부족하거나 존재하지 않는 한계점을 가지고 있는 것 또한 사실이다. 이런 한계점을 보완하기 위한 방법으로 계층 관계를 형성하기 위한 계층 클러스터링 방법과, 연관 관계를 형성하기 위한 협업 필터링 방법이 존재한다. 이 두 가지 방법은 태그의 관계성을 제공하지만, 연관 관계와 계층 관계 중 하나만 제공한다는 단점을 가진다. 본 논문에서는 태그 검색 시 연관 관계뿐 아니라 계층 구조의 탐색을 제공해주기 위한 태그 클러스터링 알고리즘을 설계하였다. 제안한 알고리즘은 사용자 태그셋을 활용하여 태그의 유사성을 계산하는 방법을 제시하고, 기존의 시각화 방법(태그 구름)과 다른 새로운 형태로 시각화 할 수 있는 결과 데이터를 제공한다.

상위어 관계를 이용한 개념 계층의 생성 (Concept Hierarchy Creation Using Hypernym Relationship)

  • 신명근
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.115-125
    • /
    • 2006
  • 개념 계층은 지식을 그룹화하여 다단계로 표현하며, 이는 자료의 분류, 저장 및 검색을 효율적으로 지원해 준다. 일반적으로 도메인 전문가의 수작업을 통해 개념 계층이 생성되었으며, 이는 생성과 유지에 많은 비용이 소요되면서도 일관성 유지가 어려운 단점이 있다. 본 논문은 미리 정의된 상위어 관계를 이용하여 문자형 자료의 개념 계층을 자동으로 생성하는 방법에 대한 연구이다. 개념 계층의 자동 생성을 위해서는, 다중 의미로 사용되는 단어에서 적절한 의미를 찾아 내어 모호성을 제거해야 하며, 외부 정보를 이용하여 모호성이 제거된 단어를 그룹화하고 계층을 생성하는 작업이 필요하다. 우리는 워드넷 (WordNet)의 다중 의미에 대한 설명 및 상위어 관계를 이용하여 모호성을 제거하고 개념 계층을 생성하는 방법을 제안 한다.

  • PDF

RAG 기반 계층 분류 (2) (RAG-based Hierarchical Classification)

  • 이상훈
    • 대한원격탐사학회지
    • /
    • 제22권6호
    • /
    • pp.613-619
    • /
    • 2006
  • 본 연구는 원격 탐사의 영상 처리에서 영상 분할의 상위 수준으로 응집 계층 clustering의 dendrogram을 통한 무감독 영상 분류를 제안한다. 제안된 알고리즘은 분광 영역에서 정의된 RAG (Regional Agency Graph)와 min-heap 자료 구조를 이용하여 MCSNP (Mutual Closest Spectral Neighbor Pair)의 집합을 검색하면서 합병을 수행하는 계층 clustering 방법이다. 계산 시간과 저장 기억의 사용에 대한 효율을 증가시키기 위해 분광적 인접성을 정의하는 분광 공간(spectral space)내의 다중 창을 사용하였고 RNV (Region Neighbor Vector)을 이용하여 합병에 의하여 변하는 RAG 갱신하였고 적정한 단계 수가 주어진다면 제안된 알고리즘은 집단 합병의 계층적 관계를 쉽게 해석 할 수 있는 dendrogram을 생성한다. 본 연구는 simulation 자료를 사용하여 광범위하게 제안된 알고리즘에 대한 평가 실험을 수행 하였으며 실험 결과는 알고리즘의 효율성을 입증하였다. 또한 한반도에서 관측된 방대한 크기의 QuickBird 영상의 적용 결과는 제안된 알고리즘이 무감독 영상 분류를 위한 강력한 수단임을 보여준다.

소프트웨어 개요

  • 천유식
    • ETRI Journal
    • /
    • 제8권2호
    • /
    • pp.75-82
    • /
    • 1986
  • 소프트웨어의 개발환경에 관련하여 개발과정, work methods, 업무구조를 논하였다. TDX-1 소프트웨어를 성격에 따른 분류와 기능에 따른 분류로 대별하여 설명한 후 중점적으로 교환기(Exchange) 소프트웨어에 대하여 그 특성과 구조를 논하였다. 특성에서는 계층분산 구조, 분산다중처리 등 4개의 특성을 논하였으며 구조에서는 프로세서의 구성, 각 프로세서의 기능, 논리적 구조로 나누어 설명하였다.

  • PDF

단백질 구조 분류의 통합 검색을 위한 웹 정보시스템 (A Web-Based Information System for the Integrated Search for Protein Structure Classifications)

  • 신원준;황의윤;김진홍;안건태;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.274-276
    • /
    • 2004
  • 단백질은 대부분 공간상의 특징을 고려할 때 유사한 부분을 기준으로 분류되는 경우가 많다 단백질 구조 분류 데이터베이스는 단백질이 가지는 다양한 구조 정보를 바탕으로 단백질 구조 분류 정보를 제공하고 있다. 대표적인 단백질 구조 분류 데이터베이스에는 CATH와 SCOP 데이터베이스가 있다. 이들 데이터베이스는 서로 다른 구조 분류 기준으로 단백질 구조를 분류하고 있으며, 단백질 구조 분류 정보를 검색하는 웹 서비스를 개별적으로 제공하고 있다. 따라서 여러 종류의 단백질 구조 분류 정보를 하나의 웹 사이트에서 검색할 수 있으면 유용할 것이다. 본 논문에서는 CATH와 SCOP에서 정의한 단백질 구조 분류 정보의 통합적인 검색 기능 일 통계 정보를 체계적으로 제공하는 웹 정보시스템에 관하여 기술한다. 제안된 시스템은 CATH와 SCOP에서 제공하는 각각의 데이터를 가공하여 효과적인 구조 분류 검색을 지원하는 구조화된 데이터베이스를 구축하였다. 개발된 시스템은 PDB 식별자, CAT터 식별자. 그리고 SCOP 식별자 또는 단백질 분류 이름으로 한번의 검색으로 두 데이터베이스에서 제공하는 계층적 구조 분류 정보를 제공한다. 또한, 단백질 구조에 대한 유용한 통계 정보를 제공한다.

  • PDF

액세스 망에서의 DiffServ 기반 가입자 대역 보장 방법 연구 (A Study on a Bandwidth Guarantee Method of Subscriber-based DiffServ in Access Networks)

  • 박혜숙;김해숙;윤청
    • 정보처리학회논문지C
    • /
    • 제12C권5호
    • /
    • pp.709-716
    • /
    • 2005
  • 본 논문은 광가입자 망의 QoS(Quality of Service)에 관한 것으로 액세스 망의 구조를 설명하고, QoS 요구사항에 따른 가입자 및 서비스의 대역을 동시에 보장하기 위한 방안을 제시한다 먼저, 서비스뿐 만 아니라 가입자 대역을 동시에 보장할 수 있는 방안에 관한 연구로 2계층 분류 방식을 제안한다. 2계층 분류 방식은 서비스를 분류하는 서비스 분류 테이블과 가입자를 분류하는 가입자 분류 테이블의 구성을 통한 두 단계의 분류 방식으로 가입자 대역을 보장할 수 있다. 또한, 플로우의 손실율을 최소화하는 분류 테이블의 엔트리 수를 M/G/k/k의 큐잉모델로 도출한다. 그리고, 가입자들의 공평성을 보장하기 위해 가입자 단위의 가상 큐잉과 스케줄링을 통해 시스템이 목표로 하는 지연범위를 만족시키는 큐의 수를 도출하였다.

배치 정규화와 CNN을 이용한 개선된 영상분류 방법 (An Improved Image Classification Using Batch Normalization and CNN)

  • 지명근;전준철;김남기
    • 인터넷정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.35-42
    • /
    • 2018
  • 딥 러닝은 영상 분류를 위한 여러 방법 중 높은 정확도를 보이는 방법으로 알려져 있다. 본 논문에서는 딥 러닝 방법 가운데 합성곱 신경망 (CNN:Convolutional Neural Network)을 이용하여 영상을 분류함에 있어 배치 정규화 방법이 추가된 CNN을 이용하여 영상 분류의 정확도를 높이는 방법을 제시하였다. 본 논문에서는 영상 분류를 더 정확하게 수행하기 위해 기존의 뉴럴 네트워크에 배치 정규화 계층 (layer)를 추가하는 방법을 제안한다. 배치 정규화는 각 계층에 존재하는 편향을 줄이기 위해 고안된 방법으로, 각 배치의 평균과 분산을 계산하여 이동시키는 방법이다. 본 논문에서 제시된 방법의 우수성을 입증하기 위하여 SHREC13, MNIST, SVHN, CIFAR-10, CIFAR-100의 5개 영상 데이터 집합을 이용하여 영상분류 실험을 하여 정확도와 mAP를 측정한다. 실험 결과 일반적인 CNN 보다 배치 정규화가 추가된 CNN이 영상 분류 시 보다 높은 분류 정확도와 mAP를 보임을 확인 할 수 있었다.

러프집합과 계층적 분류구조를 이용한 데이터마이닝에서 분류지식발견

  • 이철희;서선화
    • 한국지능시스템학회논문지
    • /
    • 제12권3호
    • /
    • pp.202-209
    • /
    • 2002
  • 본 논문은 제어 시스템에서 규칙기반과 데이터 마이닝에서의 분류규칙의 명료함에 대해 다룬다. 대용량의 데이터로부터 유용한 정보를 얻어내는 데이터 마이닝은 중요한 이슈가 되고 있다. 인공지능에 기반을 둔 데이터 마이닝 분류기법에는 신경망, 의사결정나무 등 여러가지가 있지만 그 결과는 명확하고 이해하기 쉽고 분류규칙이 간단명료해야 한다. 러프집합이론은 불충분하고 비일관적인 데이터로부터 의미있는 지식을 추출하는데 효과적인 기법이고, 다양한 속성들을 효과적으로 사용함으로써 분류와 근사화에 대한 좋은 해법을 제시한다. 본 논문에서는 러프집합이론의 근사화를 이용하여 알갱이 속에 숨겨져 있는 지식들을 찾아내는데 있어 효과적인 접근을 하였으며, 최상위 레벨에 코어를 적용하여 계층적 분류를 함으로써 대량의 데이터를 효율적으로 처리할 수 있도록 하였다. 제안된 분류방법은 정보시스템의 해석을 용이하게 하고 최소의 분류규칙을 만든다.