Text Categorization Using a Helmholtz Machine

;;;

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
/
Pages.466-468
/
2000
/
1598-5164(pISSN)

한국정보과학회 (Korean Institute of Information Scientists and Engineers)

Helmholtz Machine 학습에 기반한 문서 분류

Text Categorization Using a Helmholtz Machine

장정호 (서울대학교 컴퓨터공학부) ;
장병탁 (서울대학교 컴퓨터공학부) ;
김영택 (서울대학교 컴퓨터공학부)

발행 : 2000.04.01

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

이 논문에서는 Helmholtz machine을 사용하여 데이터의 분포 추정을 함으로써 문서 분류기를 학습하는 방법 제안한다. Helmholtz machine 은 생성 모델과 인식 모델로 구성된 그래프 모델로서, 그래프 모델에서의 분포 추정을 보다 가능하게 하기 위한 근사 방법 중의 하나이다. Helmholtz machine에서의 각 입력 노드는 문서를 구성하는 하나의 단어에 대응하는 이진 노드이다. 입력 노드의 개수가 많아지면 그만큼 학습 시간이 증가하기 때문에, 학습 시간을 줄이면서 적정 수준의 성능을 유지하기 위해 자질 선정이 필요하다. 이러한 요구 사항을 충족시키기 위해 정보획득량(information gain)기준을 이용하였으며, 뉴스 그룹 데이터에 대해 그 성능을 측정하고 Naive Bayes를 이용한 것과 비교한다.

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

Helmholtz Machine 학습에 기반한 문서 분류

Text Categorization Using a Helmholtz Machine

초록

키워드

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)