• 제목/요약/키워드: 상위 N 추천

검색결과 8건 처리시간 0.024초

상위 N개 항목의 추천 정확도 향상을 위한 효과적인 선호도 표현방법 (An Effective Preference Model to Improve Top-N Recommendation)

  • 이재웅;이종욱
    • 정보과학회 논문지
    • /
    • 제44권6호
    • /
    • pp.621-627
    • /
    • 2017
  • 협업필터링은 사용자들이 평가한 항목들의 유사성을 기반으로 평가되지 않은 항목을 효과적으로 추천해주는 기법이다. 기존에는 사용자가 평가하지 않은 항목 중 상위 N개 항목의 추천 정확도를 높이기 위하여 사용자의 항목의 대한 상대적 선호도를 반영하는 쌍 기반 선호도(pair-wise preference)와 목록 기반 선호도(list-wise preference)가 제안되었다. 하지만 이러한 방법들은 사용자가 평가한 항목 간의 상대적인 선호도를 표현하는데 한계가 있으며, 각각의 항목들의 중요도를 반영할 수 없는 단점이 있다. 본 논문에서는 유사도 및 순위 값을 계산할 때 평점 선호도 표현 방법과 역 사용자 빈도수(inverse user frequency)를 이용하여 사용자의 잠재된 선호도를 표현하는 새로운 방법을 제안한다. 제안 방법을 메모리 기반 협업필터링에 적용하여 비교한 결과 기존 방법보다 최대 2배 이상 정확도가 향상되는 것을 확인할 수 있었다.

어휘 빈도를 활용한 지식 검색에서의 답변 추천 시스템 (Answer Recommendation for Knowledge Search using Term Frequency)

  • 이호창;탁현기;이현아
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.315-317
    • /
    • 2012
  • 지식iN 등의 지식검색 서비스는 잘못된 답변으로 인한 낮은 신뢰성과 다수의 중복 답변 등의 문제점을 가진다. 질의문 '세상에서 가장 큰 나라'에 대해서 관련된 모든 질문과 답변을 제시하지 않고 질의문과 관련된 다수의 답변을 분석하여 답변 '러시아'를 추천하여 제시할 수 있다면 지식검색의 효용성과 신뢰성이 크게 향상될 수 있다. 본 논문에서는 질문-답변의 유형을 단어, 글, 도표, 목록의 네가지로 분류하고, 그 중 단어 유형에 대한 답변 추천 방법을 제시한다. 질의문에 대해 검색된 질문을 군집화하고, 질문에 대한 답변들에 대해서 TF, IDF, 어휘간 거리 정보를 다양하게 결합하여 어휘의 점수를 계산한다. 각 군집에서 가장 높은 점수를 가지는 어휘를 해당 군집에서 가장 중요한 어휘로 보고 추천 정답으로 제시한다. 단어 유형인 질문 100개에 대한 네이버 지식iN에 대한 시스템 평가에서 추천된 상위 1위에 대해서는 68%의 정답률을, 상위 5위까지에 대해서는 89%의 정답률을 보였다.

키워드 기반 블로그 마케팅을 위한 연관 키워드 추천 시스템 (Associated Keyword Recommendation System for Keyword-based Blog Marketing)

  • 최성자;손민영;김영학
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권5호
    • /
    • pp.246-251
    • /
    • 2016
  • 최근에 SNS와 온라인 매체의 영향력이 커지면서 이를 이용한 마케팅에 대한 관심이 증가하고 있다. 블로그 마케팅은 대형 포털 사이트의 키워드 검색 결과에 따라 상위 노출을 함으로서 비교적 저렴한 비용으로 마케팅의 파급효과와 정보 전달력을 높일 수 있다. 그러나 일부 특정 키워드의 검색 결과의 경우 상위에 노출되려는 경쟁이 과열될 수 있기 때문에, 블로그를 상위에 노출하기 위해서는 장기적이고 적극적인 노력이 필요하다. 따라서 본 연구에서는 블로그의 상위 노출 가능성이 높은 연관 키워드 그룹을 추천하는 새로운 방법을 제안한다. 제안된 방법은 먼저 타겟 키워드의 검색 결과에 포함된 블로그 문서들을 수집하여 단어의 빈번도와 위치정보를 고려하여 연관성이 높은 키워드를 추출하고 필터링한다. 다음에 각 연관 키워드를 타겟 키워드와 비교하여 그들의 연관성, 월간 연관 키워드 검색 량, 검색에 포함된 블로그의 개수, 블로그의 평균 작성 일을 고려하여 상위 노출의 가능성이 높은 연관 키워드 그룹을 추천한다. 본 연구에서 실험을 통하여 제안된 방법이 연관성이 높은 키워드 그룹을 추천함을 보인다.

계층적 행동선택 네트워크를 이용한 일정추천 에이전트 (A Schedule Recommendation Agent using Hierarchical Behavior Selection Network)

  • 양견모;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.390-392
    • /
    • 2012
  • 인공비서 에이전트는 일정관리 및 추천을 할 때 일정이 비어 있는 시간을 계산하는 비교적 간단한 방식을 사용하는데, 보다 유용한 추천을 위해서는 사용자의 상황과 일정의 수행 조건을 고려하여야 한다. 본 논문에서는 환경의 변화에 유연하게 대응할 수 있는 행동선택 네트워크를 사용하는 일정추천 에이전트를 개발한다. Maes가 제안한 행동선택 네트워크를 현실적인 문제에 적용하는 데는 목적과 행동 노드의 개수가 크게 늘어나면 문제가 있다. 이를 해결하기 위해 행동선택 네트워크를 모듈화 하여 목적간의 충돌을 방지하고, 모듈화를 할 때 선행 행동 연결을 통한 모듈간의 사라진 연결을 보완하며, 목적들 간의 연관관계를 표현하기 위한 상위 행동선택 네트워크를 두는 계층적 행동선택 네트워크 방식을 제안한다. 제안하는 방법을 사용하여 몇가지 시나리오에 따른 일정추천 실험을 통하여 제안한 에이전트의 유용성을 확인하였다.

빅 데이터 처리 기법을 적용한 추천 시스템에 관한 연구 (Recommendation System Using Big Data Processing Technique)

  • 윤소영;윤성대
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1183-1190
    • /
    • 2017
  • 네트워크와 IT 기술의 발전으로 사용자들은 장소에 구애 받지 않고 어디서든 본인이 원하는 아이템을 검색하고 구매하고 있다. 이에 따라 추천시스템에서 급증하는 데이터로 인한 확장성 문제를 어떻게 해결할 것인가에 대한 연구들이 다양하게 진행되고 있다. 본 논문에서는 Tag 가중치를 적용한 아이템 기반 협업 필터링 기법과 분산 병렬 처리 방식인 MapReduce 방법을 적용한 추천 기법을 제안한다. 제안하는 기법은 속도 향상과 효율성을 위해 전처리 과정에서 아이템을 카테고리별로 분류하고 노드 수에 맞게 그룹지은 후 사용한다. 각 분산 노드에서 4번의 Map-Reduce 단계를 통해 데이터 처리를 진행하는데 사용자에게 더 나은 아이템을 추천하기 위해 유사도 계산에서 아이템 Tag 가중치를 사용한다. 마지막 Reduce 단계를 거쳐 출력된 예측값 중 상위 N개의 아이템을 추천에 사용한다. 실험을 통해 제안 하는 기법이 대량의 데이터를 효율적으로 처리하며 기존의 아이템 기반 기법보다 추천의 적합성도 향상되는 것을 확인하였다.

사용자 로그 분석과 클러스터 내의 문서 유사도를 이용한 동적 추천 시스템 (A Dynamic Recommendation System Using User Log Analysis and Document Similarity in Clusters)

  • 김진수;김태용;최준혁;임기욱;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.586-594
    • /
    • 2004
  • 웹 문서들은 빠른 생성과 소멸의 특징 때문에, 사용자는 찾고자하는 웹 문서를 신속하고 정확하게 추천해 줄 시스템을 요구하고 있다. 정제되지 않은 웹 데이타에는 사용자들의 축적된 경험들을 포함하는 유용한 정보들을 포함하고 있다. 현재, 이러한 유용한 정보를 마이닝 기법이나 통계학적 측정 방법 등을 가지고 정제하여 추천 시스템을 통해 사용자에게 제공하려는 노력이 시도되고 있다. 기존의 정보 필터링 방식은 사용자들의 프로파일을 반드시 이용해야 하는 문제점을 갖고 있으며, 협력적 필터링 방식은 First Rater 문제와 Sparsity 문제가 있다. 또한 사용자 브라우징 패턴을 이용하는 동적 추천 시스템은 연관성이 없는 웹 문서들을 결과로서 제공한다는 문제점이 있다. 본 논문에서는 웹 문서 형식에 따라 웹 문서 사이의 유사도를 이용하여 웹 문서를 분류하고, 웹 서버에 기록된 로그 파일을 이용하여 사용자 브라우징 순차 패턴 DB를 생성한다. 이렇게 생성된 정보들과 사용자들의 세션 정보를 이용하여, 사용자가 웹 문서에 접근했을 때 현재 웹 문서와 유사도가 높은 상위 N개의 연관 웹 문서 집합을 제공하고, 순차적인 특성을 갖는 웹 문서를 추천 문서로 제공하는 시스템을 제안한다.

유사 단어 커뮤니티 기반의 질의 확장 (Query Expansion based on Word Sense Community)

  • 곽창욱;윤희근;박성배
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1058-1065
    • /
    • 2014
  • 질의 확장은 입력된 질의와 관련된 키워드를 사용자에게 제시하여 검색 활동에 도움을 주는 방법이다. 최근에는 사용자가 검색한 내용에서 군집화 방법을 이용하여 도메인을 찾고 키워드를 제시하는 연구가 많이 이루어졌다. 하지만 군집화 방법은 군집의 개수를 정해야하기 때문에 다양한 도메인을 나타내는데 적절하지 않다. 따라서 본 논문은 커뮤니티 인지 알고리즘으로 검색 문서에서 질의마다 다양한 수의 도메인을 찾고 키워드로 선택하여 제시하는 방법을 제안한다. 이를 위해 사용자가 검색한 결과 중 상위 30개 문서를 대상으로 단어를 추출하여 그래프 기반의 커뮤니티를 만들고, 각 커뮤니티에서 키워드를 추출하여 이를 질의 확장에 이용하였다. 본 논문에서 제안한 방법은 구글 검색 엔진과 검색된 문서의 tf-idf를 이용한 키워드 추천 방법과 비교하였다. 제안한 방법이 다른 비교 대상들에 비해 더 다양한 키워드를 추천할 수 있었다.

프로세스 마이닝을 이용한 공공서비스의 품질 측정: N시의 건축 인허가 민원 서비스를 중심으로 (Measuring the Public Service Quality Using Process Mining: Focusing on N City's Building Licensing Complaint Service)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.35-52
    • /
    • 2019
  • 전자정부를 포함한 다양한 형태의 공공서비스가 제공됨에 따라 공공서비스 품질에 대한 국민의 요구 수준이 점점 높아지고 있다. 공공서비스의 품질을 높이기 위해서 공공서비스 품질에 대한 상시적 측정과 개선이 필요함에도 불구하고 전통적인 설문조사는 비용과 시간이 많이 소요되어 한계가 있다. 따라서 공공서비스에서 발생하는 데이터를 기반으로 원하는 시점에 언제라도 공공서비스의 품질을 빠르고 정확하게 측정할 수 있는 분석적 기법이 필요하다. 본 연구에서 공공서비스의 품질을 데이터 기반으로 분석하기 위해 N시의 건축 인허가 민원 서비스를 대상으로 프로세스 마이닝 기법을 이용하여 분석하였다. N시의 건축 인허가 민원 서비스는 분석에 필요한 데이터를 확보할 수 있고 공공서비스 품질관리를 통해 타 기관으로 확산 가능할 것으로 판단되었기 때문이다. 본 연구는 2014년 1월부터 2년 동안 N시에서 발생한 총 3678건의 건축 인허가 민원 서비스에 대해 프로세스 마이닝을 실시하여 프로세스 맵을 그리고 빈도가 높은 부서와 평균작업시간이 긴 부서를 파악하였다. 분석 결과에 따르면 특정 시점에 한 부서별로 업무가 몰리거나 상대적으로 업무가 적은 경우가 발생하였다. 또한 민원의 부하가 늘 경우 민원완료까지 걸리는 시간이 늘어날 것이라는 합리적인 의심을 하였으나 분석 결과 상관관계는 크게 없었다. 분석 결과에 따르면 민원완료까지 걸리는 시간은 당일처리에서 1년 146일까지 매우 다양하게 분포하였다. '하수처리과,' '수도과,' '도시디자인과,' '녹색성장과'의 상위 4개 부서의 누적빈도가 전체의 50%를 넘고 상위 9개 부서의 누적빈도가 70%를 넘어서는 등 빈도가 높은 부서는 한정적이며 부서 간 부하의 불균형이 심했다. 대부분의 민원 서비스는 서로 다른 다양한 패턴의 프로세스를 갖고 있었다. 본 연구의 결과를 활용하면 특정 시점에 민원의 부하가 큰 부서를 찾아내 부서 간 인력 배치를 탄력적으로 운영할 수 있을 것이다. 또한 민원 특성별 협의에 참여하는 부서의 패턴을 분석한 결과, 협의 부서 요청 시 자동화 혹은 추천에 활용할 수 있는 가능성이 보인다. 본 연구는 민원 서비스에 대한 프로세스 마이닝 분석을 통해 향후 공공서비스 품질 개선방향을 제시하는데 활용될 것으로 기대한다.