• Title/Summary/Keyword: 키워드 기반 기법

Search Result 299, Processing Time 0.03 seconds

Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method (이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안)

  • Jeong, Do-Heon
    • Journal of the Korean Society for information Management
    • /
    • v.36 no.4
    • /
    • pp.83-105
    • /
    • 2019
  • This study aims to suggest an effective method for the automatic classification of keywords with similar patterns by calculating pattern similarity of temporal data. For this, large scale news on the Web were collected and time series data composed of 120 time segments were built. To make training data set for the performance test of the proposed model, 440 representative keywords were manually classified according to 8 types of trend. This study introduces a Dynamic Time Warping(DTW) method which have been commonly used in the field of time series analytics, and proposes an application model, MA-DTW based on a Moving Average(MA) method which gives a good explanation on a tendency of trend curve. As a result of the automatic classification by a k-Nearest Neighbor(kNN) algorithm, Euclidean Distance(ED) and DTW showed 48.2% and 66.6% of maximum micro-averaged F1 score respectively, whereas the proposed model represented 74.3% of the best micro-averaged F1 score. In all respect of the comprehensive experiments, the suggested model outperformed the methods of ED and DTW.

Hot issue extraction method using FOAF and Social Network Analysis (FOAF및 소셜 네트워크 분석을 이용한 핫 이슈 추출 기법)

  • Wang, Qing;Sohn, Jongsoo;Chung, InJeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.531-534
    • /
    • 2010
  • 웹 2.0의 적극적인 도입에 따라 소셜 네트워크 기반 커뮤니티 사이트에서는 관련된 콘텐츠를 적절하게 추천하는 것은 중요한 문제로 부각되고 있으며 이로 인해 사용자들의 동향 및 이슈 추출 기법이 중요하게 작용하고 있다. 이러기 위해서 지금까지의 연구에서는 콘텐츠에 포함된 키워드 매칭 방법을 이용하고 있으나 사용자들 간의 연결 관계와 키워드의 중요도를 고려하지 못하고 있다. 본 논문에서는 FOAF 기반의 소셜 네트워크와 del.icio.us에서 제공하는 소셜 북마크 데이터를 기초로 소셜네트워크 분석을 보이며 이를 통한 사용자들 사이에서 중요하게 부각되는 핫 이슈를 추출하는 방법을 제안한다. 본 논문에서 제안하는 핫 이슈 추출 방법을 활용하면 사용자들의 관심 분야 동향파악을 효율적으로 수행할 수 있으며 이를 통해 맞춤형 마케팅 및 콘텐츠 추천이 가능해 진다.

A Relationship Search in News Articles Using a Keyword Association Frequency (키워드 관련도를 이용한 뉴스기사의 연관검색 기법)

  • Kim, Ji-Hye;Jang, Jae-Young;Yune, Hong-June;Kim, Han-Joon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.53-57
    • /
    • 2010
  • 현재 많은 포털 사이트에서는 인기가 있거나 중요도가 높은 키워드에 대해 정보를 제공해주는 태그 클라우드나 연관 검색어 등의 기능이 제공되고 있다. 하지만 대부분의 뉴스기사 페이지들은 날짜와 분야별로 기사들이 나열되어 있으며 사용자는 카테고리별로 나누어진 기사를 읽을 수만 있을 뿐 그 기사와 연관된 다른 기사의 정보에 대해서 한눈에 알아 볼 수 있는 방법은 미흡한 실정이다. 또한 연관 검색어 서비스도 사용자가 검색한 입력 내용을 기반으로 연관성 정도를 분석하여 객관성을 보장하지 못하고 있다. 본 논문에서는 기존의 태그 클라우드 방식에서 좀 더 나아가 축적된 뉴스 기사로 부터 검색 키워드와 밀접히 연관된 키워드를 추출하여 제공하는 기사 검색 시스템을 소개한다. 이 시스템은 사용자가 기사 검색을 하였을 때, 키워드와 가장 밀접한 기사를 검색해 주는 것뿐만 아니라 검색어와 관련된 연관 키워드들을 보여주고 연관된 키워드간의 관계성을 보여줌으로써 뉴스 기사들 속에 숨겨진 연관정보의 탐색을 가능하게 한다.

  • PDF

Identification of sentiment keywords association-based hotel network of hotel review using mapper method in topological data analysis (Topological Data Analysis 기법을 활용한 호텔 리뷰데이터의 감성 키워드 기반 호텔 관계망 구축)

  • Jeon, Ye-Seul;Kim, Jeong-Jae
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.1
    • /
    • pp.75-86
    • /
    • 2020
  • Hotel review data can extract various information that includes purchasing factors that lead to consumption, advantages, and disadvantages for hotels. In particular, the sentiment keyword of the review data helps consumers understand the pros and cons of hotels. However, it is not efficient for consumers to read a large number of reviews. Therefore, it is necessary to offer a summary review to customers. In this study, we suggest providing summary information on sentiment keywords association as well as a network of hotels based on sentiment keywords. Based on a sentiment keyword dictionary, the extracted sentiment keywords associations construct the hotel network through topological data analysis based mapper. This hotel network allows a consumer to find some hotels associated with specific sentiment keywords as well as recommends the same related hotels. This summary information provides users with a summarized emotional assessment of hotels and helps hotel marketing teams understand consumers' perceptions of their hotel.

Graph-based Event Detection Scheme Considering User Interest in Social Networks (소셜 네트워크에서 사용자 관심도를 고려한 그래프 기반 이벤트 검출 기법)

  • Kim, Ina;Kim, Minyoung;Lim, Jongtae;Bok, Kyoungsoo;Yoo, Jaesoo
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.7
    • /
    • pp.449-458
    • /
    • 2018
  • As the usage of social network services increases, event information occurring offline is spreading more rapidly. Therefore, studies have been conducted to detect events by analyzing social data. In this paper, we propose a graph based event detection scheme considering user interest in social networks. The proposed scheme constructs a keyword graph by analyzing tweets posted by users. We calculates the interest measure from users' social activities and uses it to identify events by considering changes in interest. Therefore, it is possible to eliminate events that are repeatedly posted without meaning and improve the reliability of the results. We conduct various performance evaluations to demonstrate the superiority of the proposed event detection scheme.

Full-automatic high-level concept extraction for image using domain ontologies (온톨로지를 이용한 이미지의 고수준 의미 정보 자동 추출 기법)

  • Park Kyung-Wook;Lee Dong-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.88-90
    • /
    • 2005
  • 최근 인터넷의 급속한 성장은 이미지와 같은 멀티미디어 정보의 급격한 증가를 가져왔다. 따라서 사용자로 하여금 원하는 이미지를 검색하는데 있어서 좀 더 효율적이고 정확한 검색 방법의 필요성이 대두되어 왔다. 일반적으로 이미지 검색 방법에는 키워드 기반 방식과 내용 기반 방식이 존재한다. 그러나 위 두 방법은 지금의 대용량 이미지 데이터베이스 검색에 있어서 여러 문제점들을 가지고 있다. 특히, 키워드 기반 방식을 보완하기 위해서 제안되어진 내용 기반 방식의 경우, 사람이 인식할 수 있는 의미 정보가 아닌 시각 정보만을 이용하기 때문에 시맨틱 갭(semantic gap) 문제가 발생하게 된다. 본 논문에서는 이미지 객체의 시각 정보들에 대한 중간 의미값으로 구성된 시각 정보 온톨로지와 동물에 대한 분류 정보를 표현하고 있는 동물 온톨로지를 구축하고, 이를 이용하여 이미지로부터 .고수준의 의미 정보를 완전 자동으로 추출하는 효율적인 방법을 제안한다.

  • PDF

C-Chord: The DHT-based P2P System for the Categorized Search (C-Chord: 분류 검색을 위한 DHT 기반의 P2P 시스템)

  • Kim Sam-Young;Park Jae-Hyun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.343-345
    • /
    • 2005
  • P2P 시스템들의 주요한 이슈는 효율적인 검색 기법에 있다. 기존의 DHT(distributed hash table) 방식의 P2P 시스템들은 단순 쿼리에 이용되는 단일 키워드 일치를 통한 검색 기법에만 머물렀다. 본 논문에서는 이러한 단순 쿼리 기반의 검색 기법을 개선하기 위해 DHT 기반의 도큐먼트 라우팅 모델에서 다중 링 토폴로지를 이용한 분류 탐색 기법을 제안한다. 제안된 기법은 Chord[1] 프로토콜을 기반으로 구현하였으며, 분류 검색의 지원 이후에도 로드 밸런싱에 있어 기존 시스템과 유사한 성능을 보임을 확인한다.

  • PDF

Exploring 'Tradition' Terminology Trends based on Keyword Analysis (1920~2017) (키워드 분석 기반 '전통' 용어의 트렌드 분석 (1920~2017))

  • Kim, Min-Jeong;Kim, Chul Joo
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.12
    • /
    • pp.421-431
    • /
    • 2018
  • The purpose of this study is to analyze the trends of 'traditional' terminology in Korea. We focus on an empirical investigation of how media reports are conveying 'tradition' terminology in our society by applying text mining and social network analysis techniques. The analysis covered 2,481,143 news articles related to 'tradition' terminology that appeared in the media since the 1920's. In this research, frequency analysis, association analysis and social network analysis were used on articles related to 'tradition' terminology from 1920 to 2017 by decade. By applying these data science techniques, we can grasp the meaning of social culture phenomenon related 'tradition' with objective and value-neutral position and understand the social symbolism which contains the tradition of the times.

Assocate Object Extraction Using personalized user Learning (개인화된 사용자 학습을 위한 연관 객체 추출 설계 및 구현)

  • 유수경;김교정
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.636-639
    • /
    • 2004
  • 본 논문은 웹 도큐먼트를 기반으로 사용자에게 의미 있는 정보를 찾아주기 위한 연관 객체 추출 기법인 PMPL(Personalized Multi-Strategey Pattern Loaming) 시스템을 제안하고자 한다. PMPL 모듈은 인터넷의 정보를 여과하여 필터링하고, 사용자 개인화의 키워드를 중심으로 연관된 객체를 추출한다. 이때 연관된 객체 추출 시 대용량 데이터에서 시간적, 공간적면에서 효율적인 연관 탐색 기법인 Fp-Tree와 Fp-Growth 알고리즘을 적용시켰으며, 연관규칙 탐색을 보완하기 위해 가중치 기법인 만유인력 기법을 적용시켰다. PMPL 시스템을 실행한 결과 개인화된 사용자 중심어 기초로 기존의 단일 학습 기법에 비해 더 많은 의미 있는 연관 지식을 추출한 결과가 보였다.

  • PDF

정박 중 준해양사고 원인에 대한 빅데이터 분석 연구

  • No, Beom-Seok;Kim, Tae-Hun;Gang, Seok-Yong
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2018.05a
    • /
    • pp.144-146
    • /
    • 2018
  • 준해상사고를 줄이기 위하여 준해양사고 등을 분석하여 사고 예방에 활용하였다. 하지만 준해양사고 건수가 많은 대신 주내용이 정성적이기 때문에 다양한 정량적 데이터로 분석하기에는 현실적 어려움이 있었다. 이러 장단점을 고려하여 준해양사고에 대해서 그동안 단순한 내용 검토 방식에서 통계적 분석과 이를 통한 객관적 결과 토출이 가능한 빅데이터 기법를 적용한 연구가 필요하다. 이를 위해 10,000여건의 준해양사고 보고서를 전처리 작업을 통해 통일된 양식으로 정리하였다. 이 데이터를 기반으로 1차로 텍스트마이닝 분석을 통해 정박 중 준해양사고 발생 원인에 대한 주요 키워드를 도출하였다. 주요 키워드에 대해 2차로 시계열 및 클러스터 분석을 통해 발생할 수 있는 준해양 사고 상황에 대한 경향 예측을 도출하였다. 이번 연구에서는 정성적 자료인 준해양사고 보고서를 빅데이터 기법을 활용하여 정량화된 데이터로 전환할 수 있고 이를 통해 통계적 분석이 가능함을 확인하였다. 또한 빅데이터 기법을 통해 차 후 발생할 수 있는 준해양사고 객관적인 경향을 파악함으로써 예방 대책에 대한 정보 제공이 가능함을 확인할 수 있었다.

  • PDF