• Title/Summary/Keyword: 내용기반 필터링

검색결과 140건 처리시간 0.03초

시맨틱 웹에서 다중 혼합필터링을 이용한 개인화된 의상 코디 시스템 (Personalized Apparel Coordi System using Multiple Hybrid-Filtering on Semantic Web)

  • 은채수;송창우;이승근;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.178-182
    • /
    • 2006
  • 인터넷과 웹이 일상생활의 일부가 되면서 온라인상에는 방대한 양의 정보가 쌓이게 되었다. 이러한 흐름 속에서 정보의 양은 급속도로 늘어나는 현상을 보이며, ‘개인화’ 를 통해 수많은 데이터들 사이에서 원하는 정보를 자동으로 찾아내는 기술의 중요성이 부각되고 있다. 이를 ‘추천시스템’ 이라 부르며, 내용기반 필터링과 협력적 필터링 등의 연구가 활발히 이루어지고 있다. 그러나 사용자에게 가장 중요한 영향을 미치는 또래의 선호도, 지역, 시대 등의 복합적인 환경을 반영하는데 아직까지 어려움을 지니고 있다. 따라서 본 논문에서는 기존의 필터링들을 조합하고 좀더 편리하게 정보를 공유하고 학습할 수 있는 시맨틱 웹에서 연관 이웃 마이닝 기법을 통해 개인화된 추천 시스템을 설계한다. 생활에서 흔히 접할 수 있는 의상을 다양한 사용자에게 특화되어 코디해주는 시스템을 웹에서 제공한 결과 불필요한 검색시간이 줄어들고 사용자의 피드백을 통해 점차 만족도가 향상됨을 알 수 있었다.

  • PDF

NFA 표현을 사용한 문서-중심적 XML의 키워드 기반 필터링 기법 (A Keyword-based Filtering Technique of Document-centric XML using NFA Representation)

  • 이경한;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.437-452
    • /
    • 2006
  • XPath 명세는 XML 원소 내용을 필터링하기 위한 질의어 작성이 어렵다. 본 논문은 이러한 문제점을 해결하기 위해 SQL의 LIKE 연산자에서 사용되던 특별한 매칭 문자 '%'를 허용한 확장된 XPath 명세와 그것을 표준 질의어로 사용하는 문서-중심적 XML 필터링 기법인 Pfilter를 제안한다. Pfilter는 값-기반 술어(value-based predicate)에서 피연산자의 공통 앞부분 문자를 공유하여 값-기반 술어의 처리 성능을 향상시킨다. 또한 본 논문은 Pfilter와 대표적인 데이타-중심적 XML 필터링 기법인 Yfilter를 값-기반 술어 처리의 확장성과 효율성에 대해 비교하고 Pfilter의 값-기반 술어 삽입, 삭제, 처리 결과를 제공한다. 본 논문에서 제안한 Pfilter는 XML 필터링 시스템에서 XPath의 contains() 함수를 평가(evaluation)하기 위한 핵심 알고리즘으로 사용할 수 있으며, XML 기반의 분산 정보 시스템을 구축하기 위한 기초 연구로 활용될 수 있다.

본문과 덧글의 동시출현 자질을 이용한 역 카이제곱 기반 블로그 덧글 스팸 필터 시스템 (A Comment Spam Filter System based on Inverse Chi-Square Using of Co-occurrence Feature Between Comment and Blog Post)

  • 전희원;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.122-127
    • /
    • 2007
  • 최근 대표적인 1인 미디어의 형태인 블로그는 개인 기록의 수단뿐만 아니라 기업의 홍보에까지 널리 사용되는 인터넷 미디어이다. 그러나 누구나 글을 쓸 수 있다는 자유로움 이면에 이를 이용한 덧글 스팸이 성행이 성행하고 있다. 일반적인 스팸 필터의 경우 그 해당 덧글만을 가지고 스팸 필터링을 한다. 그러나 특성상 스팸인 덧글이 정상인 덧글보다 상대적으로 짧기 때문에 일반적인 덧글 자체만의 필터링 방법으로는 높은 정확도를 기대하기 힘든 단점이 있다. 본 논문에서는 정상인 덧글과 본문간의 내용상의 유사도가 있음을 가정해 이런 정보를 역카이제곱 분류기에 동시출현(co-occurrence) 정보로 부여함으로써 스팸 필터의 정확도를 높이고자 했으며, 실제 그러한 정보를 추가함으로 단순한 확률기반 스팸 필터링 방법을 사용하는 것보다 스팸 필터의 전반적인 성능이 상승되었음을 실험 결과를 통해 알 수 있었다.

  • PDF

정렬을 이용한 내용기반 문서탐색 시스템의 전처리 과정 개선 (Improving Preprocessing step for Document retrieval system based on String Alignment)

  • 김형준;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.248-251
    • /
    • 2008
  • 문서 표절이 사회적으로 이슈가 됨에 따라 표절 문서를 판별할 수 있는 시스템의 필요성이 대두되었다. 문서 표절 검사 시스템에서 가장 중요한 이슈는 성능과 속도인데 이 두 가지를 모두 만족시키기 위해서는 표절을 상세하게 검사하기 전에 표절 의심 문서에 대한 비교 문서군이 크기를 최적화하여 표절 검사 범위를 최대한 작게 만들어야 한다. 비교 문서군의 크기를 최적화하기 위해서는 표절 의심 문서와 상관이 없는 문서를 필터링 하는 작업이 필요하다. 이 논문에서는 문서를 빠르게 필터링 하기 위해서 웹 문서 검색에 사용되는 Inverted Index을 이용하여 적당한 시간 안에 비교 문서군의 크기를 최적화 하는 방법들을 알아보고 각각의 방법들의 성능을 비교 분석하는 방법을 제시하며 그 방법들을 바탕으로 성능을 분석하여 최적화된 문서 필터링 방법을 알아본다.

  • PDF

사용자 프로파일 정보와 실시간 컨텍스트 정보를 이용한 협력적 필터링 (Collaborative Filtering using User Profiles Informal ion and Real-Time Context Information)

  • 이세일;이상용
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.336-339
    • /
    • 2006
  • 추천시스템에서 가장 많이 사용하고 있는 협력적 필터링 방법을 모바일 기기 등에서 사용하려면 추천 정보와 사용자들의 평가 정보가 부족하여 추천의 질이 떨어지게 된다. 이러한 문제를 해결하기 위해 실시간으로 얻어진 컨텍스트 정보를 정량화하여 협력적 필터링에 적용함으로써 보다 나은 추천 결과를 얻을 수 있었다. 그럼에도 불구하고 평가를 하기 위한 컨텍스트 정보가 충분하지 못한 경우 부정확한 결과를 가져올 수 있다. 또한 사용자 정보 평가 과정 중 정량화 단계의 분류 과정을 단순히 하게 되면 서비스 받는 사용자가 정확한 그룹에 분류되어 정확도가 결여되는 문제가 발생한다. 본 논문에서는 실시간으로 얻을 수 있는 컨텍스트 정보가 부족한 경우, 내용 기반 필터링에서 많이 사용하고 있는 사용자 프로파일 정보를 실시간 컨텍스트 정보와 결합한다. 그리고 정량화 단계를 개선하여 협력적 필터링함으로써 기존의 방법보다 향상된 결과를 얻을 수 있다.

  • PDF

세그먼트 기반의 XML 문서 필터링 (XML Document Filtering based on Segments)

  • 권준호;;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.368-378
    • /
    • 2008
  • 최근 XML 문서 필터링에 기반한 출판-구독(publish-subscribe) 시스템이 많은 관심을 받고 있다. 전형적인 출판-구독 시스템에서, 구독자들은 XPath 언어로 명세된 프로파일로 자신들의 관심을 표현하고, 새로운 내용들은 사용자 프로파일에 대하여 매칭 여부를 판단하여 관심을 가지고 있는 사용자들에게만 배달된다. 구독자의 수와 그들의 프로파일이 증가할수록, 시스템의 확장성이 출판-구독 시스템의 중요한 성공 요소가 된다. 이 논문에서는 FiST 시스템을 확장한 세그먼트 기반의 XML 문서 필터링 시스템인 SFiST 시스템을 제안한다. SFiST 시스템은 XML 문서 필터링에서 중복된 처리를 없애기 위해서 가지형 패턴의 사용자 프로파일에서 세그먼트를 추출하여 해시 기반의 세그먼트 테이블에 저장하고 유지한다. 이 세그먼트는 사용자 프로파일을 터스 시퀀스 형태로 표현하는데 이용되고, 효율적인 필터링을 위한 컴팩트 시퀀스 인덱스에도 사용된다. 실험을 통하여 세그먼트 기반의 SFiST 시스템이 이전의 연구인 FiST 시스템보다 좋은 성능을 가지고 있음을 보였다.

협업적 필터링 및 퍼지시스템 기반 사용자 성향분석에 의한 영화평가 예측 시스템 (A Movie Rating Prediction System of User Propensity Analysis based on Collaborative Filtering and Fuzzy System)

  • 이수진;전태룡;백경동;김성신
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.242-247
    • /
    • 2009
  • 지능형 추천 시스템은 사용자의 요청에 응답하는 수동적인 시스템이 아닌 사용자가 원하는 서비스를 제안하는 시스템으로서 최근 콘텐츠 서비스 분야에 많이 개발되고 있다. 이러한 지능형 추천 시스템은 콘텐츠 개인화 서비스에 응용되고 있으며 대표적인 추천기법으로 내용기반과 협업적 필터링 기법이 있다. 본 연구에서는 협업적 필터링 및 퍼지 시스템을 이용하여 추천 시스템의 기반 기술인 예측 시스템을 제안하였다. 제안한 예측 시스템은 사용자의 과거 영화평가 정보를 바탕으로 영화에 대한 평가점수를 예측한다. 영화평가 예측시스템의 성능은 영화 평가점수의 실제값과 예측값의 오차를 RMSE(root mean square error) 방법으로 계산한 후 기존의 영화평가 시스템 RMSE 값과 비교하여 평가하였다. 본 연구를 통해 제안한 영화평가 예측시스템이 추천 시스템의 기반 기술로서 활용이 가능하고 다른 멀티미디어 컨텐츠 서비스 추천에도 응용이 가능할 것으로 기대한다.

하이브리드 인식을 이용한 불법 콘텐츠 추적시스템 설계 및 구현 (Design and Implementation of Illegal Content Tracking System Using Hybrid Content Recognition)

  • 김원겸;박경수;김상진;유원영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1555-1558
    • /
    • 2011
  • 본 논문에서는 멀티미디어 데이터에 대한 내용기반 인식 기법을 이용하여 인터넷에 불법으로 배포되어 있는 콘텐츠를 추적하는 기법을 소개한다. 내용기반 인식 기법은 콘텐츠의 원신호에서 내용기반 해쉬나 혹은 축약된 형태의 특징벡터를 추출하여 콘텐츠를 인식하는 기술로 저작권보호 분야에서 불법 저작물을 필터링하는데 많이 활용되고 있다. 불법 콘텐츠 추적시스템은 인터넷에서 광범위하게 유포되어 있는 저작물을 검색하여 그 내용을 기반으로 인식하여 불법 여부를 판단한 후 삭제메일이나 재전송 중지 등의 후속 조치를 자동으로 수행하는 저작권보호 시스템이다. 본 논문에서는 오디오, 비디오, 어문, 게임 콘텐츠에 대해 내용을 기반으로 인식을 수행하고 불법 여부를 판단하여 재전송 중지 조치를 취하는 능동적 저작물 추적 시스템을 제안한다. 제안된 시스템에서는 검색모듈에 의해 수집된 다양한 저작물에 대해 저작물별 독립적으로 인식 기능을 수행하는 기능을 제공한다.

형태 전역특징과 히스토그램을 이용한 내용 기반 영상 검색 시스템 (Content based Image Retrieval System by Shape Global Feature and Histogram)

  • 정성호;이상열;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.323-329
    • /
    • 2002
  • 멀티미디어 정보검색 중 내용 기반 영상검색은 색상, 질감, 형태 등의 영상 내용 특징들을 이용하여 검색하는 방법으로, 색상과 질감 특징을 이용한 검색 시스템이 일반적으로 널리 소개되고 있다. 그러나 형태가 서로 다른 영상에서는 색상과 질감 특징에 의한 검색 방법은 유사 영상검색에서 오류를 수반할 수 있다. 그래서 본 논문에서는 영상의 윤곽선 에 의한 전역 형태 특징으로 허용 가능한 범주 이내로 유사도 영상을 필터링한 후 형태정보의 히스토그램을 이용하여 유사도 검색을 함으로써 정확도를 놀일 수 있는 시스템을 개발한다.

  • PDF

분류 속성과 Naive Bayesian을 이용한 사용자와 아이템 기반의 협력적 필터링 (User and Item based Collaborative Filtering Using Classification Property Naive Bayesian)

  • 김종훈;김용집;임기욱;이정현;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권11호
    • /
    • pp.23-33
    • /
    • 2007
  • 협력적 필터링은 피어슨 상관 계수에 의해 유사도를 구하고, 선호도를 기반으로 이웃 선정 방법을 사용하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 및 확장성의 문제를 가지고 있다. 이러한 문제점을 개선하기 위하여 아이템 기반 협력적 필터링이 실용화되었으나 아이템의 속성을 반영하지는 못한다. 본 논문에서는 기존 추천 시스템의 문제점을 보완하기 위하여 분류 속성과 Naive Bayesian을 이용한 사용자와 아이템 기반의 협력적 필터링을 제안하였다. 제안한 방법에서는 희박성 문제를 해결하기 위하여 명시적 데이터에 기반한 아이템 유사도와 묵시적 데이터에 기반한 사용자 유사도를 복합적으로 참조한다. 참조 결과에 대해 Naive Bayesian을 적용한다. 또한 속성을 반영하기 위해 아이템 분류속성간의 유사관계 순위를 아이템 유사도 계산에 반영함으로써 정확성을 높일 수 있었다.