• 제목/요약/키워드: 검색 키워드 추출

검색결과 293건 처리시간 0.028초

소셜 북마킹 서비스의 태그를 이용한 개인화 콘텐츠 (Personalized Contents using the Tags of the Social Bookmarking Service)

  • 한주현;정문열
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.267-272
    • /
    • 2009
  • 웹 2.0 이라 불리는 현 웹의 패러다임은 개방, 공유, 참여로 압축하여 말할 수 있다. 이 속에서는 사용자의 참여와 공유로 콘텐츠가 생산 또는 재생산된다. 이러한 콘텐츠는 사용자의 관심을 반영하기 때문에 사용자가 어떠한 콘텐츠를 만들어 냈는지, 수집했는지 등을 분석하면 사용자의 관심 범주를 추출할 수 있다. 본 논문에서는 사용자가 소셜 북마킹 서비스를 이용하며 생성한 태그를 바탕으로 사용자의 관심 범주를 추출하여 이를 통해 개인화 콘텐츠 제공 서비스를 제안한다. 우선, 웹 서비스에서 제공하는 피드를 이용하여 사용자가 생성한 태그 중 가장 많이 쓰인 10개의 태그와 그것들과 관련 있는 태그들만 모아서 관심 범주을 추출하기 위한 태그 집합을 구성한다. 구성된 태그 집합을 바탕으로 피어슨 상관 계수를 통해 태그 간 동시 사용률을 조사한다. 이후 사용자 흥미에 부합하는 콘텐츠를 검색하기 위해 조사된 동시 사용률을 바탕으로 검색 키워드 그룹을 추출한다. 이렇게 만들어진 키워드 그룹들은 사용자의 평소 관심사와 관련된 콘텐츠를 검색하는데 사용되며, 이를 통해 사용자의 관심 있는 내용의 콘텐츠를 사용자의 특별한 검색 절차 없이 제공받는다. 이러한 방식을 통해 사용자가 원하는 정보를 입력하는 절차 없이도 웹에 축적된 사용자의 정보를 사용하여 자동으로 개인화된 콘텐츠를 제공할 수 있을 것으로 기대 된다.

  • PDF

DER 테이블을 이용한 고속 키워드 탐색 (A Study about Fast Keyword Retrieval using AC DER table)

  • 정규철;장혜숙;이진관;박기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.761-764
    • /
    • 2003
  • 효율적인 키워드 추출이 정보검색 시스템에서 매우 중요한 일임에도 불구하고 원하는 목적의 적당한 키워드를 결정하는 것은 매우 어렵다. 왜냐하면 많은 복합어를 가지고 있기 때문이다. 기존 방법에서는 AC 머신의 경우 단일 키워드를 가지고 복합 키워드를 검색하지 못한다. 이러한 문제를 해결한 DER 구조의 경우에는 많은 검색시간이 걸리는 문제점을 가지고 있다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해 이들을 기반으로 한 DERtable (DER 구조의 검색방법을 가지고 테이블로 구성)구조를 제안한다.

  • PDF

수식 관계를 이용한 키워드 추출을 통한 검색 과정의 효율성 향상 (Keyword Extraction Using Modifying Relation to Improve Search Experience)

  • 문욱성;이신목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.228-232
    • /
    • 2007
  • 정보화 시대에 방대한 양의 정보에서 필요한 정보를 효율적으로 찾아내는 것은 그 무엇보다도 중요하다. 이를 위해 많은 검색 엔진이 효율적인 검색 결과 제공을 위해 노력하고 있지만 그 인터페이스의 문제로 인하여 사용자가 검색결과를 효율적으로 받아들이기 어려우며 또한 원하는 정보를 검색하기 위해서는 일정 수준 이상의 검색 능력을 필요로 한다. 이 논문에서는 기존의 검색 엔진의 인터페이스 변경을 통하여 시각적인 연관성 정보를 제공하며 이를 통해 사용자가 검색 능력에 구애받지 않고 정확한 답을 얻을 수 있도록 유도한다. 또한 이 과정에서 기존의 키워드 추출 알고리즘의 문제점을 발견하여 이를 단어간의 수식 관계를 이용하여 해결하였다. 또한 단어간의 수식 관계를 이용하여 효율적으로 문서간의 연관성을 생성할 수 있는 알고리즘을 제시하였다.

  • PDF

키워드 요약의 세 가지 방법론 비교 (Compare Three Method for Keyword Summary)

  • 강종렬;남지성;박지나;김웅섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.852-854
    • /
    • 2019
  • 본 논문은 정확한 연관검색어를 보여주지 못하는 기존의 검색에서 벗어나기 위해 이미지와 PDF에서 텍스트를 추출하고 키워드 요약하는 방법을 사용하였다. 텍스트를 키워드로 요약하는 알고리즘으로는 TextRank, LSA, MMR을 사용하였고, 세 가지 방법으로 키워드를 요약하고 키워드 요약 결과와 Query의 코사인 유사도를 이용하여 추출한 문서와 Query와의 연관성을 확인하여 세 가지 알고리즘을 비교하였다.

키워드 가중치를 이용한 뉴스 기사에서의 이슈 키워드 자동 추출 시스템 (Automatic Keyword Extraction in News Articles for Trend Tracking)

  • 김미지;이재원;장달원;이종설
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.150-152
    • /
    • 2018
  • 본 논문에서는 포털 사이트에 게재된 뉴스 기사 집합에서 이슈가 된 키워드들을 자동으로 추출하는 시스템을 소개한다. 포털 사이트에서 사용하는 기존의 키워드 추출 시스템은 검색 횟수를 기반으로 하고 있으며, 뉴스 기사에서 단어 간의 상대적 중요성을 반영하지 못하고, 외부로부터 영향을 받아 순위 조작과 같은 문제점을 수반할 수 있다. 제안하는 시스템에선 TF-IDF 모델을 사용하여 단어 간의 상대적인 중요성에 기반하고, 추출된 키워드들의 시각적 변화를 반영하여 이슈 키워드를 추출한다. 제안한 시스템의 효용성 확인을 위해 58,996 개의 정치 뉴스 기사를 수집하였으며, TF-IDF 기반의 제안 방식과 TF 기반의 기존 방식을 비교하였다. 제안한 시스템이 기존 방식보다 시간에 따른 정치 뉴스의 이슈 변화를 분석하는 데 효과적인 것을 확인하였다.

  • PDF

인접한 단어와 키워드 주제어 정보에 기반한 유사 문헌 검색 시스템 개발 (Development of Similar Bibliographic Retrieval System based on Neighboring Words and Keyword Topic Information)

  • 김광영;곽승진
    • 한국도서관정보학회지
    • /
    • 제40권3호
    • /
    • pp.367-387
    • /
    • 2009
  • 유사 문헌 검색 시스템은 추출된 색인어 중에서 어떤 것을 선택하는가에 따라 검색 결과에 많은 차이점이 발생한다. 본 연구에서는 추출된 후보 색인어의 선정의 오류를 최소한으로 하는 방법을 제공한다. 본 연구에서는 유사문헌에서 추출된 후보 색인어들을 이용하여 인접한 단어들의 정보와 추출된 키워드 주제어 정보를 이용하였다. 그리고 관련 저자들 정보와 검색 결과의 재순위화 방법을 이용하여 보다 정확도가 높은 유사 문헌 검색 시스템을 개발하였다. 본 논문에서는 과학기술 학회마을 데이터베이스를 이용하여 실험하였다. 실험과 사용자 평가를 통해서 유사 문헌 검색 시스템의 성능을 입증하였다.

  • PDF

TFIDF를 이용한 키워드 추출 시스템 설계 (Design of Keyword Extraction System Using TFIDF)

  • 이말례;배환국
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.1-11
    • /
    • 2002
  • 본 논문에서는 먼저 Anchor Text의 단어들이 키워드로 적합한지 TFIDF를 이용하여 테스트하였다. 그 결과는 가중치가 높아서 키워드로 적합한 단어가 있었는가 하면. 아예 문서에 나오지도 않는 단어가 있어 키워드로 적합하지 않은 단어도 있었다. 이를 해결하기 위하여 새로운 키워드 추출 방법을 제시하였다. 본 논문에서는 적합하지 않은 키워드를 제거함으로써 새로운 키워드를 만들어 내고 TFIDF값을 각 키워드의 가중치로 이용하여 Ranking이 가능하게 하였다. 이렇게 추출된 키워드는 기존의 방법보다 정확도가 높아졌음 증명했다.

  • PDF

유사 단어 커뮤니티 기반의 질의 확장 (Query Expansion based on Word Sense Community)

  • 곽창욱;윤희근;박성배
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1058-1065
    • /
    • 2014
  • 질의 확장은 입력된 질의와 관련된 키워드를 사용자에게 제시하여 검색 활동에 도움을 주는 방법이다. 최근에는 사용자가 검색한 내용에서 군집화 방법을 이용하여 도메인을 찾고 키워드를 제시하는 연구가 많이 이루어졌다. 하지만 군집화 방법은 군집의 개수를 정해야하기 때문에 다양한 도메인을 나타내는데 적절하지 않다. 따라서 본 논문은 커뮤니티 인지 알고리즘으로 검색 문서에서 질의마다 다양한 수의 도메인을 찾고 키워드로 선택하여 제시하는 방법을 제안한다. 이를 위해 사용자가 검색한 결과 중 상위 30개 문서를 대상으로 단어를 추출하여 그래프 기반의 커뮤니티를 만들고, 각 커뮤니티에서 키워드를 추출하여 이를 질의 확장에 이용하였다. 본 논문에서 제안한 방법은 구글 검색 엔진과 검색된 문서의 tf-idf를 이용한 키워드 추천 방법과 비교하였다. 제안한 방법이 다른 비교 대상들에 비해 더 다양한 키워드를 추천할 수 있었다.

SNS를 이용한 잠재적 광고 키워드 추출 시스템 설계 및 구현 (Design and Implementation of Potential Advertisement Keyword Extraction System Using SNS)

  • 서현곤;박희완
    • 한국융합학회논문지
    • /
    • 제9권7호
    • /
    • pp.17-24
    • /
    • 2018
  • 빅데이터 처리 분야에서 중요한 이슈 중 하나는 인터넷의 주요 키워드를 추출하고 이것을 이용하여 필요한 정보를 가공하는 것이다. 현재까지 제안된 대부분의 키워드 추출 방법들은 대형 포털 사이트의 검색기능을 기반으로 이미 게시된 글이나 작성된 문서 또는 고정된 내용에 기반하고 있다. 본 논문에서는 SNS에 게시되는 다양한 이슈, 대화, 관심 분야, 의견 등 동적인 메시지를 기반으로 이슈 키워드 및 연관 키워드를 추출하여 잠재적 쇼핑 연관 키워드 광고 마케팅에 도움을 주는 시스템(KAES: Keyword Advertisement Extraction System based on SNS)을 개발한다. KAES 시스템은 특정 계정 리스트를 작성하여 SNS에서 빈도수가 가장 많은 핵심 키워드 및 연관 키워드를 추출한다.

키워드 기반 블로그 마케팅을 위한 연관 키워드 추천 시스템 (Associated Keyword Recommendation System for Keyword-based Blog Marketing)

  • 최성자;손민영;김영학
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권5호
    • /
    • pp.246-251
    • /
    • 2016
  • 최근에 SNS와 온라인 매체의 영향력이 커지면서 이를 이용한 마케팅에 대한 관심이 증가하고 있다. 블로그 마케팅은 대형 포털 사이트의 키워드 검색 결과에 따라 상위 노출을 함으로서 비교적 저렴한 비용으로 마케팅의 파급효과와 정보 전달력을 높일 수 있다. 그러나 일부 특정 키워드의 검색 결과의 경우 상위에 노출되려는 경쟁이 과열될 수 있기 때문에, 블로그를 상위에 노출하기 위해서는 장기적이고 적극적인 노력이 필요하다. 따라서 본 연구에서는 블로그의 상위 노출 가능성이 높은 연관 키워드 그룹을 추천하는 새로운 방법을 제안한다. 제안된 방법은 먼저 타겟 키워드의 검색 결과에 포함된 블로그 문서들을 수집하여 단어의 빈번도와 위치정보를 고려하여 연관성이 높은 키워드를 추출하고 필터링한다. 다음에 각 연관 키워드를 타겟 키워드와 비교하여 그들의 연관성, 월간 연관 키워드 검색 량, 검색에 포함된 블로그의 개수, 블로그의 평균 작성 일을 고려하여 상위 노출의 가능성이 높은 연관 키워드 그룹을 추천한다. 본 연구에서 실험을 통하여 제안된 방법이 연관성이 높은 키워드 그룹을 추천함을 보인다.