한국정보처리학회:학술대회논문집 (Proceedings of the Korea Information Processing Society Conference)
- 한국정보처리학회 2016년도 추계학술발표대회
- /
- Pages.746-749
- /
- 2016
- /
- 2005-0011(pISSN)
- /
- 2671-7298(eISSN)
DOI QR Code
메타 속성을 융합한 기계 학습 기반 화재 뉴스 필터링 기법
Machine Learning Based Fire News Filtering Technique Incorporating Meta-features
- Kim, Tae-Jun (School of Electrical and Computer Engineering, University of Seoul) ;
- Kim, Han-joon (School of Electrical and Computer Engineering, University of Seoul)
- 발행 : 2016.10.27
초록
주제 기반 크롤링(Topical Crawling)으로 수집된 문서들은 서로 비슷한 단어들을 가지고 있기 때문에 정작 주어진 주제에 적합하지 않은 문서 들을 포함할 수 있다. 이를 해결하기 위해 특정 주제에 해당하는 문서만을 필터링하는 작업이 필요하다. 본 논문은 화재 뉴스 기사에 대한 필터링을 위해 단어 기반 속성과 어울려 화재 뉴스 기사의 특성을 고려한 메타 데이터 속성을 추출하여 이에 특화된 기계학습 메커니즘을 제안하였다. 제안 기법의 F1-측정치는 92.1 %로서, 현재 최고의 성능을 보이는 SVM, 나이브베이즈 알고리즘보다. 2~3% 개선된 것이다.
키워드