• Title/Summary/Keyword: 키워드추출 시스템

Search Result 287, Processing Time 0.027 seconds

A Study on Development of Intergrated OPAC Using Hypermedia (하이퍼미디어를 이용한 통합OPAC구현에 관한 연구)

  • 안태경;김현희
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1995.08a
    • /
    • pp.51-54
    • /
    • 1995
  • 본 연구에서 구축하고자 하는 통합OPAC은 특정 주제의 문헌정보원, 전문가정보원, 통계정보원을 제시해 주는 참고봉사 전문가 시스템, 온라인 열람목록(OPAC), 이용 안내, 외부데이타베이스의 검색 모듈이 결합된 시스템이다. 지식베이스는 문헌정보원 지식베이스, 전문가정보원 지식베이스, 통계정보원 지식베이스로 구성된다. 지시베이스의 추론방법은 전진추론(forword chining) 방식을 채택하였다. 시스템의 구현 환경은 먼저 하드웨어는 IBM 호완기종의 개인용 컴퓨터들(IBM386-DX33이상)을 사용하고 시스템 개발도구로는 전문가시스템과 하이퍼텍스트가 결합된 쉘(shell)인 KPWin++를 이용하였고 문헌정보원, 전문가정보원, 통계정보원에서의 키워드추출 등 정보처리 작업은 터보C를 사용하였다.

  • PDF

REALM for Open-domain Question Answering of Korean (REALM을 이용한 한국어 오픈도메인 질의 응답)

  • Kan, Dong-Chan;Na, Seung-Hoon;Choi, Yun-Su;Lee, Hye-Woo;Chang, Du-Seong
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.192-196
    • /
    • 2020
  • 최근 딥러닝 기술의 발전에 힘입어 오픈 도메인 QA 시스템의 발전은 가속화되고 있다. 특히 IR 시스템(Information Retrieval)과 추출 기반의 기계 독해 모델을 결합한 접근 방식(IRQA)의 경우, 문서와 질문 각각을 연속 벡터로 인코딩하는 IR 시스템(Dense Retrieval)의 연구가 진행되면서 검색 성능이 전통적인 키워드 기반 IR 시스템에 비해 큰 폭으로 상승하였고, 이를 기반으로 오픈 도메인 질의응답의 성능 또한 개선 되었다. 본 논문에서는 경량화 된 BERT 모델을 기반으로 하여 Dense Retrieval 모델 ORQA와 REALM을 사전 학습하고, 한국어 오픈 도메인 QA에서 QA 성능과 검색 성능을 도출한다. 실험 결과, 키워드 기반 IR 시스템 BM25를 기반으로 했던 이전 IRQA 실험결과와 비교하여 더 적은 문서로 더 나은 QA 성능을 보였으며, 검색 결과의 경우, BM25의 성능을 뛰어넘는 결과를 보였다.

  • PDF

Keyword-based networked knowledge map expressing content relevance between knowledge (지식 간 내용적 연관성을 표현하는 키워드 기반 네트워크형 지식지도 개발)

  • Yoo, Keedong
    • Journal of Intelligence and Information Systems
    • /
    • v.24 no.3
    • /
    • pp.119-134
    • /
    • 2018
  • A knowledge map as the taxonomy used in a knowledge repository should be structured to support and supplement knowledge activities of users who sequentially inquire and select knowledge for problem solving. The conventional knowledge map with a hierarchical structure has the advantage of systematically sorting out types and status of the knowledge to be managed, however it is not only irrelevant to knowledge user's process of cognition and utilization, but also incapable of supporting user's activity of querying and extracting knowledge. This study suggests a methodology for constructing a networked knowledge map that can support and reinforce the referential navigation, searching and selecting related and chained knowledge in term of contents, between knowledge. Regarding a keyword as the semantic information between knowledge, this research's networked knowledge map can be constructed by aggregating each set of knowledge links in an automated manner. Since a keyword has the meaning of representing contents of a document, documents with common keywords have a similarity in content, and therefore the keyword-based document networks plays the role of a map expressing interactions between related knowledge. In order to examine the feasibility of the proposed methodology, 50 research papers were randomly selected, and an exemplified networked knowledge map between them with content relevance was implemented using common keywords.

Music Recommendation System Based on User Preference Analysis Using Hidden Markov Model (은닉 마코프 모델을 이용한 사용자 선호도 분석 기반의 음악 추천 시스템)

  • Kim, Geon-Su;Lee, Dong-Hun;Yun, Tae-Bok;Lee, Ji-Hyeong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.56-59
    • /
    • 2008
  • 현재의 음악 서비스들의 대부분은 음악을 가수 이름이나 장르와 같은 키워드들로 구분하여 사용자에게 제공한다. 하지만 음악의 장르가 다양해지고, 장르별로 음악의 유형도 다양해짐에 따라 키워드 기반은 음악 제공 방법만으로는 사용자가 원하는 음악을 제공하는데 한계가 있다. 이런 한계점을 극복하기 위하여 음악 자체의 성질을 기반으로 음악을 분석하는 컨텐츠 기반의 음악 분석 방법이 필요하다. 또한 사용자가 원하는 음악을 제공 받을 수 있도록 사용자의 음악 선호도를 분석하여 그에 맞는 음악을 제공하는 방법도 필요하다. 본 논문에서는 음악의 시퀀스 정보와 특징을 추출하여 음악 모델을 구축하고, 이를 사용하여 사용자의 음악 선호도를 분석하는 방법을 제안하고, 사용자의 선호도에 맞는 음악을 제공하기 위하여 선호도 분석 방법을 통해 음악을 추천해주는 시스템을 제안한다.

  • PDF

Quest ion and Answer ing System of Educational Administration Using Natural Language Processing (자연어처리를 이용한 교육행정의 질의응답시스템)

  • Lee Mi-Na;Youn Sung-Dae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.805-807
    • /
    • 2005
  • 정보통신 기술의 발달로 일반기업체 뿐만 아니라 공공기관 등 행정업무가 필요한 곳에서는 대부분 웹사이트를 통해 사용자에게 원하는 정보를 제공해 주고 있다. 그러므로 대부분의 상업용 사이트들은 사용자에게 보다 편리하게 정보를 제공해 주기 위하여 다양한 정보검색의 접근 방법을 사용하고 있다. 그러나 현재 교육행정의 업무처리 분야에서 정보제공은 웹사이트의 단순 키워드검색을 통하여 사용자가 직접 정보를 찾는 방식으로 이루어지고 있다. 본 논문에서는 자연어처리를 사용한 교육행정의 질의응답시스템을 제안한다. 사용자 질의의 의도를 분석하여 기본사전과 매칭한 후에 추출된 사용자 질의정보를 통해 자동으로 정답 데이터뷰를 생성하여 사용자 의도에 알맞는 정확한 정답을 제공하도록 하였다. 또한 동적인 FAQ 관리기능인 히스토리를 통해서 한번 질의한 정답을 신속히 제공하도록 하였다. 제안한 시스템의 효용성을 검증하기 위해 교육행정정보를 제공하는 간단한 질의응답시스템을 구현하여 적용해본 결과 일반 키워드 검색에서보다 정확하게 정답을 제공해 주는 것을 확인할 수 있었다.

  • PDF

A Design of Learner-oriented Item Bank System Considering Type of Content (문제 유형을 고려한 학습자 중심의 문제은행 시스템 설계)

  • Oh, Won-Wook;Kim, Yong-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.558-561
    • /
    • 2009
  • 본 논문에서는 웹기반 문제은행의 발전된 모형으로 문제 유형에 따른 학습자의 맞춤형 문제를 제공하는 시스템을 설계하였다. 본 시스템의 최종 목표는 능동적, 자기 주도적 학습을 실현할 수 있는 맞춤형 이러닝을 통해 학습자의 학업 성취도 향상에 있다. 교수자 및 개발자 중심의 이러닝 서비스가 아닌 학습자의 학습 결과에 능동적으로 반영하고 유연한 서비스를 제공하기 위해 문제 유형에 따른 적합한 다음 단계의 문제를 제공함으로써 이러닝의 효율을 극대화 한다. 기존의 고정 출제 또는 무작위 출제 방식에서 탈피하여 개별 학습자의 오답과 문제 유형을 고려하여 문제의 키워드, 선택된 보기의 키워드, 유동적 난이도에 따른 문제 추출 방식을 설계하였다. 이 모델은 보조 학습의 수단으로 문제은행 시스템을 학습자 중심에 근접하여, 융통적이고 효과적으로 개인화된 서비스를 제공한다.

Technology Development Strategy of Piggyback Transportation System Using Topic Modeling Based on LDA Algorithm

  • Jun, Sung-Chan;Han, Seong-Ho;Kim, Sang-Baek
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.12
    • /
    • pp.261-270
    • /
    • 2020
  • In this study, we identify promising technologies for Piggyback transportation system by analyzing the relevant patent information. In order for this, we first develop the patent database by extracting relevant technology keywords from the pioneering research papers for the Piggyback flactcar system. We then employed textmining to identify the frequently referred words from the patent database, and using these words, we applied the LDA (Latent Dirichlet Allocation) algorithm in order to identify "topics" that are corresponding to "key" technologies for the Piggyback system. Finally, we employ the ARIMA model to forecast the trends of these "key" technologies for technology forecasting, and identify the promising technologies for the Piggyback system. with keyword search method the patent analysis. The results show that data-driven integrated management system, operation planning system and special cargo (especially fluid and gas) handling/storage technologies are identified to be the "key" promising technolgies for the future of the Piggyback system, and data reception/analysis techniques must be developed in order to improve the system performance. The proposed procedure and analysis method provides useful insights to develop the R&D strategy and the technology roadmap for the Piggyback system.

Emotion Prediction of Paragraph using Big Data Analysis (빅데이터 분석을 이용한 문단 내의 감정 예측)

  • Kim, Jin-su
    • Journal of Digital Convergence
    • /
    • v.14 no.11
    • /
    • pp.267-273
    • /
    • 2016
  • Creation and Sharing of information which is structured data as well as various unstructured data. makes progress actively through the spread of mobile. Recently, Big Data extracts the semantic information from SNS and data mining is one of the big data technique. Especially, the general emotion analysis that expresses the collective intelligence of the masses is utilized using large and a variety of materials. In this paper, we propose the emotion prediction system architecture which extracts the significant keywords from social network paragraphs using n-gram and Korean morphological analyzer, and predicts the emotion using SVM and these extracted emotion features. The proposed system showed 82.25% more improved recall rate in average than previous systems and it will help extract the semantic keyword using morphological analysis.

A Study on Keywords Extraction from Entertainment News using Bigdata Processing (빅데이터 처리를 통한 연예 뉴스에서의 키워드 추출에 관한 연구)

  • Yoo, Sang-Hyun;Lee, Sang-Jun
    • Jounal of The Korea Society of Information Technology Policy & Management
    • /
    • v.11 no.6
    • /
    • pp.1503-1507
    • /
    • 2019
  • With the softness of online entertainment news articles and the increasing number of quick-reporting articles in the entertainment sector, many people have access to entertainment front-page articles and are now able to make reviews of celebrities. It is not easy to systematically analyze which news articles are about which celebrities in a real-time environment, although their reputation is a key factor in the entertainment agency's business strategy, which should make the most of its affiliated celebrity resources. Based on the amount of celebrity references mentioned in entertainment news data, this paper proposes an entertainment news keyword analysis system, which extracts celebrities that are the subject of the article and associates them with the celebrity entertainment agency in question. Through the system proposed in this paper, advertisers or entertainment agencies can judge the value of the celebrity as reference material for the business. In addition, it can lay the groundwork for an investment strategy by predicting the outlook for the entertainment company for brokerages and investors.

Gray scale image histogram using the horizontal edge information search (그레이스케일 히스토그램을 이용한 에지의 수평 정보획득 영상검색)

  • Jung, Il-Hoe;Park, Jong-An
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.05a
    • /
    • pp.151-154
    • /
    • 2008
  • In this paper, this program which is Retrieval System using Image Gray-scale histogram and Edge features is used to reduce the errors incurred by inputting methods which are used in a current Retrieval System. The Retrieval Algorithm is proceeding with several steps which are extracting features of images quality, extracting edge features and refining images, analysing extracted features, retaining important information from analyzed features, retrieving retained information from database, extracting and comparing among images from retrieved database. The proposed Retrieval System is used for a fast retrieval with accuracy and it is confirmed through simulations.

  • PDF