• Title/Summary/Keyword: 카테나

Search Result 487, Processing Time 0.046 seconds

Classification using Hierarchical Sampling in Large Classification System (대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류)

  • Hong, SungMo;Jang, HeonSeok;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.51-55
    • /
    • 2017
  • 대규모 분류체계를 사용하는 경우, 기존 방법의 딥 러닝으로는 분류 정확도가 현저히 떨어진다. 이를 해결하기 위해 계층 구조를 활용한 네거티브 샘플링 방법을 제안한다. 학습 문서가 속한 카테고리의 상위 카테고리와 일정부분 겹치는 범위에서 네거티브 샘플을 선택하면, 하나의 큰 문제를 다수개의 하위 문제로 쪼개서 해결하는 학습 효과가 있다. 소규모 분류 체계와 대규모 분류체계 각각에서 샘플링 전략을 차용하였을 때를 비교한 결과, 대규모에서 효과가 좋았으며 그 때의 정확도가 150배 이상 차이가 나는 것을 보였다.

  • PDF

Sentiment lexicon modeling for consumer analysis (소비자 분석을 위한 감성사전 모델링)

  • Lee, Jae-Woong;Yun, Hyun-Noh;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.850-853
    • /
    • 2017
  • 본 논문은, 크롤링을 통해 얻은 비정형 데이터를 'Python'의 'KoNLPy' 라이브러리를 사용해 형태소 분석한 후 텍스트 마이닝을 통한 감성사전 구축을 목표로 하고 있으며, 형태소들의 빈도수를 기반으로 가중치로 두어 선별된 단어들을 이용해 긍정과 부정으로 나누어 카테고리화 한다. 이후, 선별한 카테고리에 단어의 극성을 판단하여 감성사전을 모델링한다. 실험을 위하여, 온라인 쇼핑몰 리뷰를 크롤링하여 비정형 데이터를 수집하고, 수집한 데이터를 분석, 가공 과정을 거쳐 정형화된 단어를 추출한다. 그 후에, 리뷰에 자주 사용되는 단어를 바탕으로 카테고리를 구성하였다. 구성된 카테고리 별로 단어의 극성을 판단하여 소비자 성향을 분석한 결과, 단순히 긍정과 부정을 표현하는 범용 감성사전보다 더 세분화된 감성 사전을 구축 할 수 있었다.

Optimization Categories Design for Mobile UCC Service (모바일 UCC 서비스를 위한 최적화 카테고리 설계)

  • Byeon, Jae-Hee;Kim, Kyung-Rog;Kim, Hyung-Hwan;Moon, Nam-Mee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.07a
    • /
    • pp.160-163
    • /
    • 2010
  • UCC 서비스가 등장한 후 WiFi 등 통신망의 발전으로 웹 이외의 다양한 단말에서 UCC 서비스를 즐길 수 있게 되었다. 특히 모바일 환경에서는 스마트폰이 대두되면서 풀 브라우징 환경에서 촬영한 영상을 편집하여 손쉽게 UCC를 올리고, 수많은 UCC 서비스 웹사이트의 콘텐츠를 즐길 수 있게 되었다. 하지만 모바일 단말은 저처리 속도, 화면크기의 제한, 불편한 입력방식을 가지고 있어 웹서비스를 모바일 단말에 최적화 시켜야한다. 본 연구에서는 다양한 UCC 서비스 웹사이트의 카테고리를 분석하여 모바일 환경에 최적화 된 UCC 메타 서비스 카테고리를 제안하고자 한다.

  • PDF

Classification using Hierarchical Sampling in Large Classification System (대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류)

  • Hong, SungMo;Jang, HeonSeok;Kang, Inho
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.51-55
    • /
    • 2017
  • 대규모 분류체계를 사용하는 경우, 기존 방법의 딥 러닝으로는 분류 정확도가 현저히 떨어진다. 이를 해결하기 위해 계층 구조를 활용한 네거티브 샘플링 방법을 제안한다. 학습 문서가 속한 카테고리의 상위 카테고리와 일정부분 겹치는 범위에서 네거티브 샘플을 선택하면, 하나의 큰 문제를 다수개의 하위 문제로 쪼개서 해결하는 학습 효과가 있다. 소규모 분류 체계와 대규모 분류체계 각각에서 샘플링 전략을 차용하였을 때를 비교한 결과, 대규모에서 효과가 좋았으며 그 때의 정확도가 150배 이상 차이가 나는 것을 보였다.

  • PDF

Automatic Text Categorization using difference TTF and ITTF (TTF와 ITTF의 차를 이용한 자동 문서 분류)

  • 이상철;하진영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.133-135
    • /
    • 2001
  • 본 논문에서는 일반적으로 Word Based Matching 방법에서 많이 쓰이는 TFIDF 방법대신에 TTF(Total Term Frequency)와 ITTF(Inverse Total Term Frequecy) 에 가중치를 주어 문서분류의 정확도를 높이는 방법을 제안하고자 한다. TFIDF방법에서 IDF는 역문헌빈도를 나타내는데 Term에 대한 빈도비율의 공정성이 떨어져 문서 분류의 정확도에 한계가 있다. 본 논문에서 제시하는 문서 분류방법은 TTF와 ITTF에 각각의 가중치를 준 후에 차연산 이용하여 문서를 분류하는 것이다. 이러한 방법의 특징은 IDF를 사용할 때 보다 각 카테고리에 있는 term, 즉 단어의 중요도에 대한 가중치를 좀 더 공평하게 줌으로써 문서의 분류를 높일 수 있다. 본 논문에서는 조선일보의 카테고리를 사용하였으며 조선일보의 기사를 대상으로 문서 자동 분류 실험을 수행하였다. 실험 결과 TFIDF보다 본 논문에서 제안한 방법이 문서 분류에 높은 정확도를 나타냄을 보였다.

  • PDF

Performance Evaluation of Interworking IP over ATM Models in power telecommunication network (전력정보통신망에서의 ATM과 IP 연동모델 성능분석)

  • 김선익;박명해;오도온;이진기;우희곤
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.384-386
    • /
    • 1999
  • ATM 통신망의 성공 및 확산을 위해서는 신규서비스의 창출과 함께 기존 서비스의 가격 경쟁력 있는 수용이 요구되는데, 인터넷 (IP)은 그 사용자 및 서비스의 수요를 고려할 때 ATM 망에서 가장 먼저 수용해야 할 서비스로서 현재 ATM 통신망에서의 인터넷 수용방안이 다양하게 논의되고 있다. 본 논문에서는 전력정보통신망을 전제로 하여 ATM WAN 통신망에서의 IP 서비스 수용에 관심을 두고 이를 위한 두 가지 방안으로 LAN Emulation 모델과 간단한 형태의 IP Internetworking 모델을 설정하고, LAN 과 WAN 접속구간의 서비스 카테고리가 ABR(Available Bit Rate)과 UBR(Unspecified Bit Rate)인 경우에 대해서 각 모델별로 적용하여 시뮬레이션을 수행하였다. 성능 비교를 위해 TCP 계층과 ATM 계층에서의 end-to-end delay를 분석한 결과, LAN-Emulation 모델을 적용하는 경우 간단한 형태의 IP Internetworking 모델에서 보다 성능효율이 우수하고, LAN과 WAN 접속구간의 서비스 카테고리는 백본 ATM 교환기와 Edge 단말에서의 버퍼크기가 동일한 경우 ABR이 UBR보다 성능효율이 우수함을 알 수 있었다.

  • PDF

A Study on Product Recommendation Service using Purchasing Pattern of Buyer (구매자의 구매 패턴을 이용한 상품추천서비스에 대한 연구)

  • Shin, Min-Su;Hwang, Jun-Won;Kim, Sung-Hak;Lee, Chang-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.313-316
    • /
    • 2000
  • 대부분의 온라인 전자상거래에서 상품 추천 서비스는 사용자의 정보 또는 구매 이력을 가지고 카테고리를 중심으로 상품을 추출하여 추천을 하는 구조이다. 또, 카테고리를 중심으로 추천을 하다 보니 단일한 구매 패턴에 의해서만 추천을 하게 되고, 상품에 각각에 대한 연관성을 찾아보기 힘들다. 또 단일 구매 패턴은 계산 비용이 작기는 하지만 사용자의 구매 패턴을 정확하게 반영하기 어렵다. 본 논문에서는 이러한 문제를 해결하기 위하여 카테고리 독립적이고, 다중 구매패턴을 고려한 상품추천 서비스의 설계를 제안한다 이를 위하여 단일 항목간의 구조화를 통하여 항목간의 연계성을 고려한 구조를 설계한다.

  • PDF

Web Service Information Clustering using Genetic Algorithm and Neural Network (유전자알고리즘과 신경망을 이용한 웹 서비스 정보 클러스터링)

  • Kim, Jin-Sung;Jeong, Hye-Jin;Yoo, Chun-Sik;Kim, Yong-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.447-450
    • /
    • 2005
  • 오늘날 웹서비스에 대한 정보 검색 시스템들은 UDDI 레지스트리에 대한 전문적인 지식을 필요로 한다. 즉 웹서비스를 명세하기 위해 사용된 카테고리와 이에 대한 값, 이름 등을 사전에 알고 있어야만 검색이 가능하다. 그러나 일반 사용자들은 이러한 사전지식을 충분히 알고 있지 못하기 때문에 웹서비스에 대한 정보 검색이 쉽지가 않다. 그러므로 일반 사용자들을 위해 웹서비스에 대한 정보를 카테고리에 맞게 분류하면 웹서비스 검색을 보다 용이하게 할 수가 있다. 따라서 본 논문에서는 유전자 알고리즘과 신경망을 이용하여 보다 효율적으로 웹서비스 정보를 분류하는 클러스터링 기법을 제안한다.

  • PDF

Implementation of Image electronic Dictionary to Study Language for Speech Disorders (언어장애인의 언어학습을 위한 이미지 전자사전의 구축)

  • Cho, Jin-Kyoung;Ryu, Je;Han, Kwang-Rok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.669-672
    • /
    • 2005
  • 단어가 지니는 의미를 이미지로 처리하면 그 단어의 이미지가 단순화되면서 높은 인식률을 가질 수 있다는 장점을 지닌다. 이러한 장점을 이용하여 언어장애인들을 위한 유용한 보완대체 의사소통 학습도구에 하나로 이미지 전자 사전을 구축하고자 한다. 우선 동사와 조합되는 용어들의 패턴들을 면밀히 조사하여 그 패턴들을 영역과 자질의 카테고리로 분류하고, 그 카테고리에 속하는 기본 데이터들을 정리하여 분류된 데이터를 하위범주화 방식을 통해 검색을 보다 용이하게 하였다. 더욱이 언어장애인들이 많이 쓰이는 단어를 조사하고, 그 단어를 중심으로 한 모듈을 이용하여, 각각에게 해당되는 이미지를 수집함으로 단어들의 의미를 표현하고 인식할 수 있도록 하는 인터페이스를 구축하는데 중점을 두었다. 또한 언어장애인이 직접 명사와 동사를 조합하여 그 완성여부를 검토할 수 있는 학습기능을 추가함으로 인해 보다 실생활에 유용하고 교육적인 이미지 전자 사전을 구축하였다.

  • PDF