• Title/Summary/Keyword: 검색 키워드 추출

Search Result 293, Processing Time 0.033 seconds

A Design of Intelligent Web Image Retrival System using Texture and Color Information (질감과 칼라 정보를 이용한 지능적 웹 이미지 검색 시스템 설계)

  • 홍성용;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.61-63
    • /
    • 2001
  • 최근들어, 인터넷상의 E-business나 쇼핑몰사이트와 같은 웹 사이트에서 멀티미디어 정보를 많이 사용하고 있다. 멀티미디어 정보 중에서도 이미지 정보가 가장 많이 사용되고 있으며, 이는 사용자들이 가장 많이 접하는 정보이다. 기존의 이미지 검색 기법은 내용 기반 검색이나 키워드를 이용한 검색 방법을 지원하지만, 사용자의 의도를 적용하지는 못하고 있다. 본 논문에서는 웹에서 사용자가 이미지를 검색하고 접근하는 패턴을 이미지의 칼라와 질감을 특징으로 한 벡터를 기반으로 시스템에 학습 시키고 사용자의 검색 성향을 분석하여 시스템에 적용한다. 이미지 검색의 효율을 높이기 위하여 질감을 기반으로 비트 벡터 인덱스(bit vector index) 기법을 적용하며, 인덱스에 의한 이미지 자동 분류 기법을 제안한다. 또한 이미지 칼라의 정보를 영역별로 추출하여 칼라 부분매칭 검색을 가능하게 한다. 이러한 이미지 검색 시스템을 사용하는 사용자의 정보를 시스템에 학습시키고 학습된 결과를 이용해서 사용자가 검색 하고자 하는 이미지 정보에 편리성을 제공하고 검색의 효율성을 증대시킨다.

  • PDF

Implementation of a Video Retrieval System Using Annotation and Comparison Area Learning of Key-Frames (키 프레임의 주석과 비교 영역 학습을 이용한 비디오 검색 시스템의 구현)

  • Lee Keun-Wang;Kim Hee-Sook;Lee Jong-Hee
    • Journal of Korea Multimedia Society
    • /
    • v.8 no.2
    • /
    • pp.269-278
    • /
    • 2005
  • In order to process video data effectively, it is required that the content information of video data is loaded in database and semantics-based retrieval method can be available for various queries of users. In this paper, we propose a video retrieval system which support semantics retrieval of various users for massive video data by user's keywords and comparison area learning based on automatic agent. By user's fundamental query and selection of image for key frame that extracted from query, the agent gives the detail shape for annotation of extracted key frame. Also, key frame selected by user becomes a query image and searches the most similar key frame through color histogram comparison and comparison area learning method that proposed. From experiment, the designed and implemented system showed high precision ratio in performance assessment more than 93 percents.

  • PDF

Patent data analysis using clique analysis in a keyword network (키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석)

  • Kim, Hyon Hee;Kim, Donggeon;Jo, Jinnam
    • Journal of the Korean Data and Information Science Society
    • /
    • v.27 no.5
    • /
    • pp.1273-1284
    • /
    • 2016
  • In this paper, we analyzed the patents on machine learning using keyword network analysis and clique analysis. To construct a keyword network, important keywords were extracted based on the TF-IDF weight and their association, and network structure analysis and clique analysis was performed. Density and clustering coefficient of the patent keyword network are low, which shows that patent keywords on machine learning are weakly connected with each other. It is because the important patents on machine learning are mainly registered in the application system of machine learning rather thant machine learning techniques. Also, our results of clique analysis showed that the keywords found by cliques in 2005 patents are the subjects such as newsmaker verification, product forecasting, virus detection, biomarkers, and workflow management, while those in 2015 patents contain the subjects such as digital imaging, payment card, calling system, mammogram system, price prediction, etc. The clique analysis can be used not only for identifying specialized subjects, but also for search keywords in patent search systems.

A Study for Effective Retrieval Method Through Definition of Component Metadata (컴포넌트 메타데이터의 정의를 통한 효율적인 검색 방법에 관한 연구)

  • 김병준;김행곤;차정은;김철홍
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.507-509
    • /
    • 2000
  • 소프트웨어 공학의 새로운 패러다임인 컴포넌트가 지니는 다양한 속성들과 장점은 아직 많은 문제점들이 남아있는 상태이지만 소프트웨어 개발시의 높은 생산성과 효율성, 그리고 재사용성과 유지보수의 이점으로 크게 주목받고 있다. 컴포넌트의 뛰어난 장점들을 효과적으로 이용하기 위해선 우선 표준화된 명세를 통해 컴포넌트가 개발되어 유통업체나 벤더의 저장소에 저장되어 있어야 하며 구축된 저장소에서 사용자는 컴포넌트 검색 서비스를 이용하여 자신의 요구에 적합한 컴포넌트를 구매, 사용할 수 있는 체계화된 프로세스가 필요하다. 따라서 본 논문에서는 컴포넌트 검색을 위한 선행 작업으로서, 검색용 메타데이터를 메타데이터가 가져야 하는 원칙을 적용하여 정의한다. 컴포넌트가 가지는 일반적인 속성과 성질로부터 사용자가 컴포넌트를 검색하고자 할 때 사용되어질 수 있는 키워드를 메타데이터의 항목으로 추출하였으며 이렇게 정의된 메타데이터를 바탕으로 일반적인 정보의 분류에 적합한 기존 웹 검색과는 다른 컴포넌트만의 검색을 다루는 새로운 검색 시스템을 설계하였다. 따라서 효과적인 컴포넌트 재사용을 위해 검색용 메타데이터와 이를 바탕으로 한 컴포트 검색 시스템을 제안하고자 한다.

  • PDF

Document Content Similarity Detection Algorithm Using Word Cooccurrence Statistical Information Based Keyword Extraction (단어 공기 통계 정보 기반 색인어 추출을 활용한 문서 유사도 검사 알고리즘)

  • Kim, Jinkyu;Yi, Seungchul;Park, Kibong;Haing, Huhduck
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.01a
    • /
    • pp.111-113
    • /
    • 2016
  • 빠른 속도로 쏟아지고 있는 각종 발행물, 논문들에 대한 표절 검토는 표절 검출 알고리즘을 통해 직접적인 복제, 짜깁기, 말 바꾸어 쓰기 등을 검토하거나 표절 검토자가 직접 해당 문서의 키워드를 검색하여 확인하는 방식으로 이루어지고 있다. 하지만 점점 더 늘어나는 방대한 양의 문서들에 대한 표절 검토 작업은 더욱 정교한 검토 방법론을 필요로 하고 있으며, 이를 돕기 위해 문서의 직접적인 단어나 복제 비교에서 더 나아가 문서의 내용을 비교하여 비슷한 내용의 문서들을 필터링 및 검출할 수 있는 방법을 제안한다. 문서의 내용을 비교하기 위해 키워드 추출 알고리즘을 선행하며, 이를 통해 문서의 핵심 내용을 비교할 수 있는 기반을 마련하여 표절 검토자의 작업의 정확성과 속도를 향상시키고자 한다.

  • PDF

Automatic Background Keyword of Movie Extraction Method from Media Reviews (미디어 리뷰를 이용한 영화 배경 키워드 자동 추출 기법)

  • Kim, Hyung W.;Cho, Joonmyun;Yoo, Jeongju
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1149-1151
    • /
    • 2013
  • 본 연구는 영화 콘텐츠의 배경(공간적/시간적)에 해당하는 키워드를 자동으로 추출하는 기법을 제안한다. 제안된 기법은 영화 콘텐츠들의 리뷰 텍스트 데이터를 웹 상으로부터 수집하는 과정, 수집된 텍스트 리뷰 데이터의 전처리 과정에 해당하는 형태소 분석 및 개체명인식 과정, 마지막으로 통계적 기법을 이용하여 최종적으로 배경에 해당하는 단어를 선택하는 과정으로 이루어진다. 자동으로 추출된 배경 정보는 사용자 평가를 통하여 정확도를 측정하였으며, 자동 생성된 배경 정보를 이용하여 영화 콘텐츠의 검색 및 추천 등에 다양하게 사용될 수 있을 것으로 예상된다.

A Method for Improving Recall Precision on Information Retrieval Systems Using Multiple Terms (다중단어를 사용한 정보검색 시스템에서의 재현정확도 향상방법)

  • 최종희;최동시;박세영;오희국
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.150-152
    • /
    • 1998
  • 정확한 정보를 검색하기 위해 단일단어를 사용하는 대신에 다중단어를 사용하는 정보검색 시스템에 대한 연구가 활발히 진행되고 있다. 그러나 아직까지 다중단어를 이용한 검색시스템은 그리 많지 않다. 다중단어를 이용한 정보검색시스템의 한 예가 키팩트를 이용한 정보검색 시스템이다. 키팩트란 키워드뿐만 아니라 관련정보를 같이 포함하고 있는 다중단어의 하나다. 키팩트에 기반한 정보검색 시스템은 현재 문서의 색인과정과 질의어의 키팩트 추출과정에서 같은 가중치를 가진 키팩트를 생성한다. 그러나, 하나의 명사구는 그것이 갖는 의미에 따라 각기 다른 다양한 키팩트를 생성하기 때문에, 이들의 결과에 기존의 정보검색 방법을 적용하는 것은 문제가 많다. 따라서 본 논문에서는 색인시에 생성되는 각각의 키팩트에 적절한 가중치를 부여함으로써 보다 정확한 정보검색이 이루어지도록 하는 방법을 제안한다.

  • PDF

An Efficient Frequent Melody Indexing Method to Improve Performance of Query-By-Humming System (허밍 질의 처리 시스템의 성능 향상을 위한 효율적인 빈번 멜로디 인덱싱 방법)

  • You, Jin-Hee;Park, Sang-Hyun
    • Journal of KIISE:Databases
    • /
    • v.34 no.4
    • /
    • pp.283-303
    • /
    • 2007
  • Recently, the study of efficient way to store and retrieve enormous music data is becoming the one of important issues in the multimedia database. Most general method of MIR (Music Information Retrieval) includes a text-based approach using text information to search a desired music. However, if users did not remember the keyword about the music, it can not give them correct answers. Moreover, since these types of systems are implemented only for exact matching between the query and music data, it can not mine any information on similar music data. Thus, these systems are inappropriate to achieve similarity matching of music data. In order to solve the problem, we propose an Efficient Query-By-Humming System (EQBHS) with a content-based indexing method that efficiently retrieve and store music when a user inquires with his incorrect humming. For the purpose of accelerating query processing in EQBHS, we design indices for significant melodies, which are 1) frequent melodies occurring many times in a single music, on the assumption that users are to hum what they can easily remember and 2) melodies partitioned by rests. In addition, we propose an error tolerated mapping method from a note to a character to make searching efficient, and the frequent melody extraction algorithm. We verified the assumption for frequent melodies by making up questions and compared the performance of the proposed EQBHS with N-gram by executing various experiments with a number of music data.

A Study of the Personalized Information Service merges the Social Network and Portal Service (소셜 네트워크와 포탈 서비스를 융합한 개인화 된 정보제공서비스)

  • Byeon, Jaehee;Hong, In Hwa;Kim, Chan Gyu;Moon, Nam-Mee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.55-56
    • /
    • 2010
  • 소셜 네트워크가 웹 2.0의 대표적 서비스로 자리 잡으면서 이를 이용한 다양한 서비스가 등장하고 있으며 그 중 포탈 서비스도 예외는 아니다. 하지만 포탈과 소셜 네트워크의 융합은 마이크로 블로그 형태의 소셜 네트워크 서비스를 포탈 화면에 실시간 검색으로 공개하는 정도에 그치고 있을 뿐이다. 본 논문에서는 마이크로 블로그의 open API 서비스를 이용하여 사용자의 인적 네트워크와 윈도우업 데이터를 추출한 후 키워드 도출 가중치 식을 통해 소셜 네트워크 내의 이슈가 되는 키워드를 도출한다. 도출된 키워드는 포탈 서비스에 융합되어 사용자의 소셜 네트워크 내 이슈 키워드와 관련된 정보제공서비스를 할 수 있다.

  • PDF

A Study on Ontology Based Knowledge Representation Method with the Alzheimer Disease Related Articles (알츠하이머 관련 논문을 대상으로 하는 온톨로지 기반 지식 표현 방법 연구)

  • Lee, Jaeho;Kim, Younhee;Shin, Hyunkyung;Song, Kibong
    • Journal of Internet Computing and Services
    • /
    • v.15 no.3
    • /
    • pp.125-135
    • /
    • 2014
  • In the medical field, for the purpose of diagnosis and treatment of diseases, building knowledge base has received a lot of attention. The most important thing to build a knowledge base is representing the knowledge accurately. In this paper we suggest a knowledge representation method using Ontology technique with the datasets obtained from the domestic papers on Alzheimer disease that has received a lot of attention recently in the medical field. The suggested Ontology for Alzheimer disease defines all the possible classes: lexical information from journals such as 'author' and 'publisher' research subjects extracted from 'title', 'abstract', 'keywords', and 'results'. It also included various semantic relationships between classes through the Ontology properties. Inference can be supported since our Ontology adopts hierarchical tree structure for the classes and transitional characteristics of the properties. Therefore, semantic representation based query is allowed as well as simple keyword query, which enables inference based knowledge query using an Ontology query language 'SPARQL'.