• Title/Summary/Keyword: 분류검색

Search Result 1,722, Processing Time 0.025 seconds

Effective User Clustering Algorithm for Collaborative Filtering System (협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘)

  • Go, Su-Jeong;Im, Gi-Uk;Lee, Jeong-Hyeon
    • The KIPS Transactions:PartB
    • /
    • v.8B no.2
    • /
    • pp.144-154
    • /
    • 2001
  • 협력적 여과 시스템은 사용자가 검색하고 읽었던 웹문서를 기반으로 사용자 군집을 생성하여 웹문서의 정확한 추천을 가능하게 한다. 이러한 목적으로 설계된 다양한 알고리즘이 있으나 속도가 느리거나 정확도가 낮다는 등의 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘인 CUG알고리즘은 사용자 군집을 생성하기 위해 Apriori 알고리즘, Native Bayes 알고리즘을 이용한다. Apriori 알고리즘은 연관 단어 지식 베이스를 구축하고, Native Bayes 알고리즘은 구축된 연관 단어 지식 베이스에 가중치를 추가하며, 사용자가 검색하여 읽은 웹문서를 클래스별로 분류한다. CUG 알고리즘은 분류된 웹문서를 기반으로 하여 사용자 군집을 만든다. 이러한 방법으로 설계된 CUG 알고리즘은 사용자들이 사용할 문서를 미리 검색하여 저장함에 의해 정보검색의 효율성을 향상시키는데 사용될 수 있다. 본 논문에서 설계한 CUG 알고리즘의 선능을 평가하기 위하여 기존의 K-means 방법과 Gibbs샘플링 방법에 의한 군집과 비교한다.

  • PDF

Construction of Answer Sets using Automatic Categorization (자동분류를 이용한 정답문서집합 구축)

  • Chang, Moon-Soo;Oh, Hyo-Jung;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.494-499
    • /
    • 2001
  • 최근의 인터넷 정보검색은 방대한 정보의 수용과 지능적이고 개인화된 검색 결과 요구라는 사뭇 상반된 요구를 만족시켜야 한다. 기계적으로 키워드를 매칭시켜 나오는 문서를 사용자에게 맡기는 식의 검색은 더 이상 환영을 받지 못한다. 우리는 이러한 추세에 맞추어 의미기반 정보검색에 필요한 개념망과 정답문서집합으로 구성된 지식베이스를 제안한 바 있다. 본 논문에서는 방대한 구조의 개념망과 연결되는 정답문서집합을 유동적인 인터넷 환경에 적용하기 위해 자동으로 구축하는 시스템을 제시한다. 자동구축은 문서분류(document categorization) 기술을 활용하여 개념어에 문서를 할당하는 방법과 속성에 문서를 할당하는 방법으로 나누어 이루어진다. 제시한 방법은 실험을 통하여 기본적인 속성 할당에는 상당한 효과가 있는 것으로 판단되었고, 일부 미할당 문서에 대해서는 클러스터링과 같은 다른 알고리즘이 필요하다.

  • PDF

Web Service Information Clustering using Genetic Algorithm and Neural Network (유전자알고리즘과 신경망을 이용한 웹 서비스 정보 클러스터링)

  • Kim, Jin-Sung;Jeong, Hye-Jin;Yoo, Chun-Sik;Kim, Yong-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.447-450
    • /
    • 2005
  • 오늘날 웹서비스에 대한 정보 검색 시스템들은 UDDI 레지스트리에 대한 전문적인 지식을 필요로 한다. 즉 웹서비스를 명세하기 위해 사용된 카테고리와 이에 대한 값, 이름 등을 사전에 알고 있어야만 검색이 가능하다. 그러나 일반 사용자들은 이러한 사전지식을 충분히 알고 있지 못하기 때문에 웹서비스에 대한 정보 검색이 쉽지가 않다. 그러므로 일반 사용자들을 위해 웹서비스에 대한 정보를 카테고리에 맞게 분류하면 웹서비스 검색을 보다 용이하게 할 수가 있다. 따라서 본 논문에서는 유전자 알고리즘과 신경망을 이용하여 보다 효율적으로 웹서비스 정보를 분류하는 클러스터링 기법을 제안한다.

  • PDF

Automatic English-Korean Address Translation System for Extremely Unpredictable Error Generating Language Environments (극한 언어 환경에 대응 가능한 영한 자동 주소번역 시스템)

  • Jin, Jingzhi;Hwang, Myeongjin;Lee, Seungphil
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.239-242
    • /
    • 2016
  • 데이터베이스 기반 자동 주소번역은 입력 오류에 취약하며 범용 기계번역을 이용한 주소번역은 입력 및 번역 주소에 대한 품질 평가가 어렵다. 본 논문에서는 예측할 수 없는 입력 오류에도 대응할 수 있는 자동 주소번역 시스템을 제안한다. 제안 시스템은 n-gram 기반 검색, 미검색/오검색 분류, 번역, 신뢰도 자동평가로 구성된다. 신뢰할 수 있는 입력으로 자동 분류한 영문 국내주소를 국문으로 번역한 결과 95%이상의 정확도를 보였다.

  • PDF

A Proposal of Motion Recognition-based Video Search System using Machine Learning (기계학습을 이용한 동작인식 동영상 검색시스템 제안)

  • Seo, Won-Seoung;Lee, Kang-Hee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.01a
    • /
    • pp.463-464
    • /
    • 2019
  • 본 논문은 기계학습을 기반으로 아두이노와 시리얼통신을 통한 사용자의 동작인식을 이용해 보다 간단하게 인터넷상의 원하는 동영상을 찾을 수 있는 검색시스템을 제작하고자 하였다. 이 검색시스템은 Python을 기반으로 SVM(Support Vector Machine)을 이용한 패턴 분류를 사용하였으며 이를 통해 사용자의 동작을 입력받아 문자를 예측 할 수 있다. 사용자는 이 검색시스템을 사용하기 위하여 우선 문자에 대한 사용자의 동작입력을 통해 학습 데이터 셋을 만들어야 하며 그것을 SVM을 이용하여 학습 모델과 식별자를 만들고, 만들어진 분류기를 통하여 동작인식을 바탕으로 문자의 결과를 예측 할 수 있다. 최종적으로 사용자의 동작인식을 거쳐 만들어진 문자열을 이용해 인터넷 동영상 사이트인 Youtube를 통해 웹 크롤링하여 문자열과 관련 있는 동영상을 찾아준다.

  • PDF

A study on the Design of Subject Gateway of Web Information Resource Using Metadata in Mechanical Engineering (베타데이터를 이용한 기계공학분야 웹 정보자원의 주제 게이트웨이 설계에 관한 연구)

  • 송재윤;이응봉
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.131-138
    • /
    • 2002
  • 본 고에서는 공학분야 중에서도 그 응용범위가 가장 광범위하다고 할 수 있는 기계공학분야의 이용자에게 수준 높은 웹 정보자원을 효율적으로 제공하기 위하여 검색엔진을 통하여 자동 수집된 웹 정보자원을 기계공학분야 주제전문가의 평가를 통해 핵심정보를 선정하고 이를 더블린코어 메타데이터를 응용한 베타데이터 요소에 따라 조직하여 웹 상의 검색 인터페이스에 의해 이용될 수 있도록 주제 게이트웨이 시스템을 설계하였다. 정보자원의 검색방법으로는 키워드 검색과 주제분류체계에 따른 브라우징 검색 등 두 가지 방법을 이용하였다.

  • PDF

Object-Oriented Modeling of Metadata for Content-based Retrieval on News On Demand (News On Demand의 내용기반 검색을 위한 메타데이타의 객체지향 모델링)

  • 김용걸;이훈순;진성일;최동훈
    • Proceedings of the Korea Database Society Conference
    • /
    • 1997.10a
    • /
    • pp.463-471
    • /
    • 1997
  • 비디오 데이타는 다양하고 방대한 양의 의미를 포함하고 있어 효율적인 내용기반 검색을 지원하기 위해서는 비디오 데이타를 기술하는 구조적이고 체계화된 형태의 메타데이타가 요구된다. 이러한 메타데이타는 검색 시 색인과 같은 역할을 수행하게 되므로 내용 기반검색의 가장 기본적이고 필수적인 데이타이다. 본 논문에서는 뉴스 응용 분야(News On Demand:NOD)를 적용한 비디오 데이터베이스 시스템의 효율적인 내용 기반 검색을 위한 메타데이타를 분류하고, Rambaugh의 OMT기법을 이용하여 메타데이타를 모델링한 후 질의 유형에 따라 모델의 접근 경로를 검사하여 모델을 검증하였다.

  • PDF

화상 정보의 DB 구축과 검색 요소

  • 안용남
    • Journal of the Korean Society for information Management
    • /
    • v.8 no.2
    • /
    • pp.108-124
    • /
    • 1991
  • 정보량이 많은 사진과 같은 화상 정보는 대용량을 갖고 있는 광 디스크에 축적시켜 DB를 구축하고 이는 컴퓨터를 이용해 고속 검색할 수 있다. 사진 DB 구축은 사진의 양, 구 축 목적, 이용 대상, 활용 방법 등에 따라 방법을 달리할 수 있으며 이의 검색 요소에는 촬 영 행위, 촬영 조건, 표제, 주제의 4가지 요소가 있고 그 중 가장 중요시되는 주제 요소에는 감각 정보, 주제 분류, 키워드가 있다.

  • PDF

A Study on Implementation for Web Search Program in Specific Web Site (특정 사이트내의 검색 프로그램 구현에 관한 연구)

  • Jang, Doc-Sung;Gu, Se-Wan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1243-1246
    • /
    • 2002
  • 본 논문은 검색엔진을 이용하여 대상 웹사이트의 링크 사이트 전체를 수집하고, 각 링크 사이트의 페이지를 인덱싱하여 데이터베이스화하는데, 특히 가장 최신의 페이지를 분류하여 시간에 의해 검색단어의 정확도가 가려지는 경우, 이를 이용할 수 있도록 하였다. 본 논문은 검색엔진에 의해 검색 서비스를 제공하는 기본적인 웹 로봇의 구현에 대한 연구이며, 웹 로봇의 역할은 크게 링크 사이트를 수집하는 것 이외에 제목, 메타태그, 멀티미디어 다운로드등의 역할들을 수행하며 이를 인덱싱 하여 데이터베이스화한다.

  • PDF

A Study on Clustering Algorithm Using Design Pattern Structure (디자인 패턴 구조를 이용한 클러스터링에 관한 연구)

  • 한정수;김귀정
    • The Journal of the Korea Contents Association
    • /
    • v.2 no.1
    • /
    • pp.68-76
    • /
    • 2002
  • Clustering is representative method of components classification. But, previous clustering method that use cohesion and coupling can not be effective, because design pattern has consisted by relation between classes. In this paper, we classified design patterns with special quality of pattern structure. Classification by clustering had expressed higher correctness degree than classification by facet. Therefore, can do that it is effective that classify design patterns using clustering algorithms that is automatic classification method. When we are searching design patterns, classification of design patterns can compare and analyze similar patterns because similar patterns is saved to same category. Also we can manage repository efficiently because of using and storing link information of patterns.

  • PDF