• 제목/요약/키워드: Web Retrieval System

검색결과 395건 처리시간 0.033초

객체지향 설계 유형에 의한 온톨로지 기반 정보검색 및 관리시스템 구현 (Implementation of Information Retrieval and Management System Based on Ontology Using Object Oriented Design Pattern)

  • 이홍로
    • 한국지리정보학회지
    • /
    • 제12권4호
    • /
    • pp.146-157
    • /
    • 2009
  • 본 논문은 온톨로지 정보검색 시스템을 구현하기 위해서 Event Process 모델과 디자인 패턴을 이용하여 효과적으로 요구조건에 대해 분석하는 방법에 대해 연구하였다. 이러한 분석 방법은 시스템의 재사용성을 향상시키는 객체지향 프로세스 모델에 대한 기법과 사용자의 더 많은 정보의 획득을 위한 것이다. 우리는 이러한 온톨로지 데이터의 재사용성에 대한 분석 방법을 제안하고자 한다. 본 논문에서 온톨로지에 기반한 데이터의 검색은 사용자에게 정확한 정보의 획득을 보여준다. 또한 관리모듈을 통한 온톨로지 데이터의 관리를 통해서 온톨로지의 재사용성을 보여주었고, 기존 다른 데이터와의 연동 및 공유를 할 수 있다. 따라서, 객체지향 설계 유형에 의한 온톨로지 기반 정보검색 시스템은 높은 안정성과 신뢰성을 보여주고, 모듈 및 소프트웨어의 재사용과 확장성을 높이며 사용자에게 신뢰도 있는 정보를 보여주는데 기여 할 것이다.

  • PDF

퍼지연상기억장치에 기반한 협력 추천 방법 (A Collaborative Recommendation Method based on Fuzzy Associative Memory)

  • 이동섭;고일주;김계영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1054-1061
    • /
    • 2004
  • 최근 인터넷의 발전으로 정보의 접근이 용이할 뿐 아니라 그 양 또한 기하급수적으로 증가하고 있다. 정보의 홍수 속에서 원하는 정보만을 자동으로 추출할 수 있는 기술은 정보검색에 소요되는 시간과 노력을 절약할 수 있는 매우 중요한 연구이다. 본 논문에서는 관심 범위가 유사한 사용자에게 양질의 정보를 자동으로 추천하기 위하여 협력적 여과방법에 관하여 제안한다. 제안하는 방법의 기본적인 배경은 사용자는 선택항목의 선호도를 입력하고, 여과 장치는 이 선호도에 근거하여 추천집합을 자동으로 생성하는 것이다. 선호도로부터 추천집합을 추론하기 위하여 본 논문에서 퍼지 연상기억장치에 기반한 방법을 제안한다. 제안된 방법은 웹 서버상에서 기술문서 특히, 정보기술문서를 검색하는 분야에 대하여 구현하였으며 그 결과를 보인다.

분산 정보 검색을 위한 신경망 에이전트의 계층적 구성 (Hierarchical Organization of Neural Agents for Distributed Information Retrieval)

  • 최용석
    • 컴퓨터교육학회논문지
    • /
    • 제8권6호
    • /
    • pp.113-121
    • /
    • 2005
  • 웹과 같은 분산 정보 검색 환경에서 문서들은 많은 문서 데이터베이스들에 자연스럽게 분할되어서 존재한다. 그러므로 이러한 문서들의 효율적인 검색을 위해서는 먼저 질의에 관련되는 문서들을 제공할 것으로 판단되는 문서 데이터베이스를 찾아내고 다음으로 그 문서 데이터베이스에 질의를 줌으로써 분산 정보 검색을 수행해야 한다. 본 논문에서는 이러한 분산 정보 검색을 위한 신경망 에이전트를 소개하고, 확장성을 가지게 하기 위하여 신경망 에이전트들이 계층적으로 구성된 다중신경망 에이전트 시스템을 제안한다. 신경망 에이전트들의 계층적 구성은 정보 검색 성능을 저하시키지 않으면서도 각 신경망 에이전트의 학습을 위한 전체 훈련 비용을 허용할 만한 범위 내에서 유지시켜 주므로 대규모 문서 데이터베이스 환경에서의 분산 정보 검색에도 신경망 에이전트를 적용할 수 있게 해준다. 제안된 신경망 에이전트를 단일 에이전트와 계층적 다중 에이전트 시스템으로 실현 환경에서 구현하여 각각의 정보 검색 성능을 기존의 통계적 분산 정보 검색 기법을 사용했을 때와 비교함으로써 신경망 에이전트의 유용성을 예증한다.

  • PDF

새로운 N-ary 관계 디자인 기반의 온톨로지 모델을 이용한 문장의미결정 (A Semantic Similarity Decision Using Ontology Model Base On New N-ary Relation Design)

  • 김수경;안기홍;최호진
    • 정보관리학회지
    • /
    • 제25권4호
    • /
    • pp.43-66
    • /
    • 2008
  • 시맨틱 웹 기술의 제안과 더불어 다양한 분야에 온톨로지의 특징을 적용한 기술 개발 연구가 많이 진행되고 있다. 인간이 소유한 개념을 가장 적절하게 표현하기 위해 현재에도 OWL, RDF와 같은 온톨로지 언어의 표현력을 확장시키기 위해 N-ary 관계나 모델-이론 의미론과 같은 개발이 진행되고있다. 본 연구는 한국어에 있어 문장이 내포하는 의미를 정확하게 결정하기 위해 문장의 구조에 따라 달라지는 단어의 의미를 연관할 수 있도록 N-ary 관계와 디자인 기반이 적용된 온톨로지의 지식 표현 방법을 연구하였다. 특히 다양한 지식 영역을 포함하는 다의어(polysemy)와 동의어(synonym)의 특징을 갖는 단어에 있어 각 지식 영역으로 분류되어 각 지식 영역에 있는 유사한 의미를 가진 단어로 확장되어 유사한 의미를 가진 단어가 포함된 문장의 경우 까지도 확장할 수 있는 표현 방법을 연구하였다. 연구의 검증을 위해 사용자가 입력한 병증 문장을 제안된 방법에 따라 구축된 온톨로지내 지식 관계와 의미 결정을 위한 추론 표현 방법을 이용하여 병증의 의미를 결정하고 그에 따른 진단을 제공하는 실험 시스템을 구현하였고, 한국어가 갖고 있는 문장의 유의성, 모호성, 복합성 의 특징을 보유한 증상문들의 실험 결과 의미 결정과 유사 의미 확장에 있어 우수한 성능을 보여주었다.

온톨로지 기반의 문화·관광지 검색 어플리케이션 구현 (Ontology-based Culture·Tourist Attraction Search Application)

  • 황태원;서정희;박흥복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.772-774
    • /
    • 2017
  • 현재 지역 문화 관광에 대한 개괄적인 단순 검색들은 많이 있으나, 온톨로지 기술을 적용한 체계적인 정보검색은 미약한 수준이다. 기존의 검색방법인 키워드 중심의 검색은 사용자가 원하는 의도와는 다른 검색 결과를 도출한다. 반면에 온톨로지를 이용한 시맨틱 검색은 추출한 웹 데이터들을 온톨로지로 구축하여 단어와 단어 간의 관계를 만들어 검색어와 관련된 정보를 보여준다. 따라서 관광객들이 해당 지역의 문화 관광지에 대해 검색 할 때, 검색결과에 의미 연관성을 포함하는 내용을 제공한다면 온톨로지를 통해 해당 지역의 문화 관광지, 이동수단, 연계된 장소 혹은 관련 행사에 대한 정보 등을 보다 쉽게 파악할 수 있을 것이다. 본 논문에서는 사용자에게 정확하고 신뢰성 있는 정보를 제공하기 위해 기존의 내부 데이터베이스에만 의존하던 검색 시스템을 확장하여 공공기관의 데이터베이스를 활용한 문화 관광지에 특화된 온톨로지 기반의 검색 시스템을 모바일 애플리케이션을 이용하여 제안하고자 한다. 이러한 효율적인 온톨로지의 구성으로 사용자에게 적합한 정보를 빠르고 정확하게 제공할 수 있다.

  • PDF

공업계 고등학교를 위한 전자신문활용교육 학습 모형의 설계 및 구현 (Design and Implementation of an e-NIE Learning Model for Technical High Schools)

  • 강오한;이경환
    • 한국산업정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.18-28
    • /
    • 2006
  • 최근에 새로운 교수 학습 방법의 하나로 대두되고 있는 e-NIE는 학습자 중심의 흥미와 적성, 창의성 개발, 비판적 사고력의 함양을 통한 문제해결능력과 의사결정 능력을 키워 준다. 본 논문에서는 공업계 고등학교 전기과의 '전기 전자 측정' 과목 중에서 'I. 측정 일반' 단원을 중심으로 보충 심화 학습지를 개발하였으며, 이를 활용한 e-NIE 수업 모형을 설계하고 구현하였다. 본 논문에서 제안한 e-NIE 수업 모형의 효과를 검증하기 위하여 통제 집단에게는 전통적 수업을 실시하고 실험 집단에게는 e-NIE 수업을 실시한 후 결과를 분석하였다. 그 결과 e-NIE 수업을 실시한 학습자들이 학습 동기, 학습 태도, 자기 주도적 탐구력 분야에서 긍정적인 효과가 있는 것으로 확인되었다.

  • PDF

WWW상에서의 온라인 정보통신표준 개발 시스템 설계 및 구현 (Design and Implementation of On-line Standards Development System on the World Wide Web)

  • 구경철;김형준;박기식;송기평;조인준;정회경
    • 한국정보통신학회논문지
    • /
    • 제2권4호
    • /
    • pp.559-573
    • /
    • 1998
  • 정보통신 표준화 기구들은 최근 동 분야가 국가 및 시장 경쟁력제고에 있어 전략적 수단으로 부상됨에 따라 더 많은 새롭고 복잡한 표준들을 보다 짧은 시간 내에 개발해야 한다는 문제에 직면하고 있으며, 이러한 문제 의 해결을 위해 이들은 표준개발절차의 많은 부분들을 전자화 시킨 소위 전자적 표준개발시스템 혹은 전자적 문서처리시스템의 구현을 꾀하고 있다. 본 논문에서는 이러한 정보통신분야의 환경변화에 효율적으로 대처하기 위해 국내 표준화 환경 및 표준화 순기(표준(안)연구개발표준(안)제안의견수렴표준화위원회 승인표준(안)확정)에 따른 Workflow기반 표준(안) 개발 환경을 WWW상에서 설계 구현한 표준정보유통망(SICN : Standards Information Cooperation Network) 시스템을 소개한다 구현된 온라인 표준개발 시스템은 기존의 인터라넷(Intranet)기반의 시스템과는 달리 개념적으로 인터넷의 제3물결이라 할 수 있는 엑스트라넷(Extranet) 개념의 Workflow 기반 시스템이라 할 수 있으며, 이는 향후 '가 상 표준 개발망(VSDN : Virtual Standards Development Network)'으로 확장 구현될 예정이다.

  • PDF

과학 기술 문헌 분석을 위한 기계학습 기반 범용 전문용어 인식 시스템 (Terminology Recognition System based on Machine Learning for Scientific Document Analysis)

  • 최윤수;송사광;전홍우;정창후;최성필
    • 정보처리학회논문지D
    • /
    • 제18D권5호
    • /
    • pp.329-338
    • /
    • 2011
  • 문헌에서의 전문용어 인식 연구는 정보검색, 정보추출, 시맨틱 웹, 질의응답 분야 등의 연구를 위한 선행 연구로서, 지금까지 대부분 특정 분야, 특히 생의학 분야에서 집중되어 연구되어 왔다. 그러나 기존 연구들이 특정 도메인 또는 문헌 내부 통계 정보를 활용함으로써 범용적인 전문용어 인식에 한계점을 보여 왔기 때문에, 본 연구에서는 웹 검색 결과와 사전, 후보용어의 문형 특징 등을 활용하는 기계 학습 기반 범용 전문용어 인식 방법을 제안하였다. 제안한 방법을 문헌의 지역 통계 정보를 사용하는 방법(C-value)과 비교 실험하여 80.8%의 F-값으로 6.5%의 성능향상을 보였다. 다양한 응집도 자질들을 접목한 두 번째 실험에서는 Normalized Google Distance 방법과 접목한 방식이 F-값 81.8%의 성능으로 최고의 성능을 나타냈다. 기계 학습 방법으로는 로지스틱 회귀분석, C4.5, SVMs 등을 적용하였는데, 일반적으로 이진 분류에 좋은 성능을 보이는 SVMs과 로지스틱 회귀분석 방법보다 결정 트리 방식의 C4.5가 전반적으로 좋은 성능을 보였다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

페이지랭크 알고리즘 적용을 위한 구현 기술 (Implementation Techniques to Apply the PageRank Algorithm)

  • 김성진;이상호;방지환
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.745-754
    • /
    • 2002
  • 1998년에 등장한 구글 검색 사이트(http://www.google.com)에 처음 소개된 페이지랭크 알고리즘은 웹 문서들의 연결 구조에 기반하여 문서들간의 순위를 부여하는 방법이다. 페이지랭크 알고리즘은 상용 검색 엔진에서 구현되어 사용되고 있으나, 상업상의 이유들로 인하여 구현 기법에 관한 연구 결과는 거의 발표되지 않고 있다. [4,8]에서 소개된 페이지랭크 알고리즘의 구현 기법은 웹 문서들의 페이지랭크 값을 산출하기에 충분하지 않다. 본 논문은 페이지랭크 알고리즘의 구현 기법[4,8]을 설명하고, 이를 적용하는데 필요한 입/출력 자료 구조 및 4가지 주요 구현 기술을 제시한다. 본 논문은 실제 웹 문서의 페이지랭크 값을 산출하는 시스템을 예로 들어 페이지랭크 알고리즘을 적용하는 방법에 대한 이해를 돕도록 하였다.