• Title/Summary/Keyword: 정보검색기법

Search Result 2,281, Processing Time 0.028 seconds

시맨틱 기술을 활용한 RESTful 웹서비스의 검색 기법 개발 (Development of Search Method using Semantic technologies about RESTful Web Services)

  • 차승준;최윤정;이규철
    • 한국공간정보시스템학회 논문지
    • /
    • 제12권1호
    • /
    • pp.100-104
    • /
    • 2010
  • 최근 웹 2.0의 등장과 함께 플랫폼으로의 웹이 강조되면서, SOAP 기반의 웹서비스에 비해 RESTful 웹서비스가 크게 증가하고 있다. 하지만 서비스들은 이미 많이 존재하며 빠르게 증가하기 때문에 키워드를 기반으로 사용자가 원하는 서비스를 정확하게 찾는 것은 어렵다. 본 논문에서는 이러한 문제를 해결하기 위해서 시맨틱을 활용한 RESTful 웹서비스 검색 기법을 개발하였다. 이를 위해 우선 OpenAPI 통합 검색 시스템을 바탕으로 시맨틱을 활용하기 위한 시스템 구조를 구성하고, 시맨틱 검색을 위한 기술 형식을 모델링하였다. 이를 바탕으로 의미 마크업(태깅, 시맨틱 어노테이션)을 수행하여, 추출된 결과인 RDF 문서를 서비스 저장소에 저장하여 이를 바탕으로 검색을 수행한다. 온톨로지를 활용하여 입력받은 키워드를 확장하고, 이를 바탕으로 검색을 수행하여 사용자에게 유사도 기반의 키워드 검색 기법에서의 검색 결과보다 확장 / 정제된 검색 결과를 제공한다.

정보검색(情報檢索)에 있어서 용어(用語)의 통계적(統計的) 관련성(關聯性)을 응용(應用)한 클러스터링기법(技法) (A Study on the Clustering Technique Associated with Statistical Term Relatedness in Information Retrieval)

  • Jeong, Jun-Min
    • 정보관리연구
    • /
    • 제18권4호
    • /
    • pp.98-117
    • /
    • 1985
  • 본(本) 논문(論文)에서는 통계적(統計的) 용어조합(用語組合)과 클러스터링기법(技法)에 관한 문헌(文獻)을 간단히 살펴보았다. 선행연구(先行硏究)들로부터 통계적(統計的) 용어조합(用語組合)은 조합기법(組合技法)의 비효율성(非效率性)때문이 아니라 문헌집단(文獻集團)의 이질성(異質性) 때문에 검색(檢索)과 분류(分類)에 적당치 않다는 사실(事實)을 발견(發見)할 수 있다. 그 결과(結果)로부터 정보검색(情報檢索)의 최적화(最適化)를 위한 조합기법(組合技法)으로서 클러스터링과 통계적(統計的) 색인(索引)의 개념(槪念)을 이용(利用)할 수 있다. 본(本) 논문(論文)의 가설(假說)은 클러스터파일내(內)에서 통계적(統計的) 용어조합(用語組合)을 사용(使用)함으로써 정보검색(情報檢索)시스템의 성능(性能)을 상당히 향상(向上)시킬 수 있다는 것이다. 달리말해서, 파일들을 모으고 의미적(意味的)으로 관련(關聯)있는 모든 문헌(文獻)들을 함께 모아줌으로써, 유사조합(類似組合)(spurious association)의 문제(問題)를 상당히 해결(解決)할 수 있을 것이다. 실제적(實際的)으로, 본(本) 논문(論文)에서는 조합기법(組合技法)의 방법론(方法論)을 어떻게 생성(生成)할 수 있을 것인가를 고려했다. 자동용어(自動用語) 상관성(相關性)을 위하여 스타일(stiles)의 조합인자(組合因子)를 이용(利用)했으며 클러스터링 환경(環境)을 위해 커널기법(技法)(kernel method)을 사용(使用)했다.

  • PDF

단계별 OK 기법 기반 효과적 P2P 검색 알고리즘 (An Effective P2P Searching Algorithm Based on Leveled OK Mechanism)

  • 김분희;이준연
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.69-78
    • /
    • 2005
  • P2P시스템의 연구와 활용이 다양화 되면서 피어들의 자원 검색과정에서 발생되는 트래픽의 네트워크 대역폭에 주는 과도한 영향은 더 이상 간과할 수 있는 일이 아니다. P2P응용 프로그램이 이러한 트래픽 발생의 양을 줄이지 않으면, 다양한 네트워크 응용 프로그램들이 산재해 있는 인터넷 환경에서 원활한 대역폭 사용에 큰 영향을 줄 수 있으며, 많은 네트워크 이용자의 관련 응용프로그램 사용에 불편함을 초래할 수 있다. 본 논문에서는 P2P시스템을 이용하는 피어의 연결과 종료의 시점이 모호한 약결합 환경을 기반으로 하는 P2P시스템에서 효과적인 검색 성공률과 트래픽 양을 발생하는 순수한 P2P모델 기반의 브로드 캐스팅 검색 기법에 대해 제안한다 제안한 검색 기법은 관련 시스템에 내재된 문제점을 개선하는 방향으로 설계 및 구현되었으며 기존의 브로드캐스팅 기반 검색기법과 비교 실험을 통해 제안된 검색 기법의 성능을 평가하였다.

  • PDF

시퀀스 데이타들 간의 관계성에 기반한 유사 검색 기법 (Association Based Similarity Search in Time Series Databases)

  • 강성구;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.52-54
    • /
    • 2005
  • 시퀀스 데이타는 크기를 가지는 일련의 값들로 이루어져 있어 일반적인 상품 데이타와는 달리 서로간의 관계성을 파악하기가 어려운 것으로 알려져 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 관계성을 보이는 시퀀스를 유사 시퀀스로 검색해 내는 기법을 제안한다. 이를 위해 유클리드 거리만으로 유사도가 결정되던 기존의 유사 검색을 변형하여 시퀀스의 상대적 위치와 형태를 고려한 시퀀스의 변화율을 척도로 사용하였으며 고차원이라는 문제를 해결하기 위하여 관계성을 수치로 표현하였다. 또한 본 논문에서는 기존의 하르 웨이블릿을 변형한 기하 웨이블릿을 이용하여 인덱스를 구성하였으며 보정 과정을 통해 기존의 유사 검색 기법으로도 문제가 변형될 수 있음을 보였다.

  • PDF

키워드 마케팅을 위한 연관 키워드 추출 기법 (A Related Keyword Group Extraction Method for Keyword Marketing)

  • 이성진;이수원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.124-126
    • /
    • 2004
  • 인터넷 광고 시장의 급속한 성장과 함께 보다 효율적인 광고기법을 개발하기 위한 노력들이 이루어지고 있는 가운데 최근 들어 검색엔진의 특성을 이용한 키워드 광고가 주목을 받고 있다. 키워드 광고란 사용자가 입력한 검색어와 유사한 범주에 속하는 사이트의 광고를 검색 결과 페이지 상단에 보여주는 것을 말한다. 그러나, 키워드 광고는 키워드를 판매할 수 있는 위치가 한정적이기 때문에 판매 가능성이 있는 키워드에 대한 관리 및 판매 전략이 요구된다. 본 논문에서는 판매 가능성이 있는 키워드에 대한 관리 전략 수립을 위하여 연관 키워드 그룹을 자동으로 추출하는 기법을 제안한다. 연관 키워드 그룹의 생성은 사용자가 입력한 검색어에 의해 노출되는 사이트들을 묶어 그룹으로 형성하고 사이트 그룹의 중요 키워드를 추출한 다음 키워드간의 연관성을 판단하는 과정으로 이루어진다. 본 논문에서는 연관 키워드 그룹 추출의 각 단계를 구체적으로 설명하고 실험 결과를 분석한다. 마지막으로 연구의 결론과 향후 연구 과제에 대하여 기술한다.

  • PDF

비디오스트리밍 서비스를 위한 의미기반 비디오 표현 및 저장 기법 (Semantic-Based Video Representation and Storing Techniques for Video Streaming Services)

  • 이석룡
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.505-509
    • /
    • 2004
  • 본 논문에서는 비디오 스트림 서버에서 의미 기반 검색을 가능하게 하기 위하여 대용량 스트림 데이터를 효과적으로 표현하고 저장하는 기법을 제시한다. 비디오 스트림 내의 각 프레임을 다차원 공간상의 점으로 사상함으로써 비디오 스트림은 다차원 시퀀스(multidimensional sequence)로 표현되고, 이 시퀀스는 다시 비디오 세그먼트로 분할된다. 분할된 세그먼트로부터 정적인 특성과 연속된 프레임의 움직임을 나타내는 트랜드 벡터(trend vector)등의 의미 정보를 추출하여 모델링 함으로서 스트림 데이터를 효과적으로 표현한다. 또한 제안된 기법은 효율적인 검색을 위하여 비디오 세그먼트를 인덱싱하고 저장하는 방법을 제공함으로써 공간 사용의 효율성을 높이고 신속한 검색을 가능하게 한다.

  • PDF

키워드를 이용한 효율적인 웹서비스 및 openAPI 검색 엔진 개발 (Development of Efficient Search Engine for Web services and openAPIs by Keyword)

  • 천동석;차승준;김경옥;이규철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.159-164
    • /
    • 2008
  • 최근 많이 주목을 받고 있는 웹 2.0은 사용자의 참여, 개방, 네트워크 효과에 기반하여 누구나 데이터를 생산하고 공유할 수 있는 사용자 중심의 인터넷 환경이다. openAPI는 웹 2.0의 근본 개념인 데이터의 개방 및 공유를 구현할 수 있는 핵심 기술로 포털은 자신의 서비스를 공개한다. 하지만 기존의 웹서비스와 openAPI 검색은 효율적인 검색 방법을 제공하지 않았다. 본 논문에서는 Lee[1]의 논문에서 제공하는 효율적인 웹서비스 검색 방법을 이용하여 검색 엔진을 개발하였다. 하지만 이 연구는 웹서비스와 유사한 구조를 가지는 openAPI를 수용하지 못한다. 따라서 본 논문에서는 openAPI의 정의 및 사용법이 웹서비스와 유사하다는 점을 활용하여 openAPI의 효과적인 검색을 위한 검색기법을 개발하였다. 이러한 검색기법은 사용자가 키워드를 입력하여 키워드 기반 검색을 통해 원하는 서비스를 찾아주고, 매쉬업 서비스나 다른 openAPI와의 조합(Composition)을 위해 템플릿 기반 검색을 통해 효과적인 검색을 제공해준다.

  • PDF

스키마 기반의 XML문서 관리 시스템 설계 (Design of XML Document Management System based on Schema)

  • 조윤기;김영란
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.85-93
    • /
    • 2001
  • 정보화 사회로의 진행이 가속화됨에 따라 정보 양이 급격히 증가하면서 XML을 이용하여 정보를 효율적으로 저장하고 검색하기 위한 많은 연구들이 진행되고 있다. 그러나 기존의 방법은 특정 엘리먼트의 부모, 자식, 형제에 대한 다양한 구조 검색을 효율적으로 지원하지 못한다. 따라서 이 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위해OETID를 이용한 구조 정보 표현과 색인 기법을 제안한다. 또한 XML 문서의 구조 정보를 저장하기 위한 저장 기법과 검색 결과에 대한 문서통합 과정을 제안한다. 제안한 방법을 이용하여 XML 문서의 구조 정보를 효율적으로 표현할 수 있을 뿐 아니라 간단한 연산으로 특정 엘리먼트에 직접적인 접근과, 다양한 질의 처리가 가능하다. 따라서 보다 효율적이고 빠른 검색을 지원할 수 있다.

  • PDF

데이터마이닝기법을 이용한 검색엔진에 관한 연구 (A Study on search engines using datamining techniques)

  • 이수연;김성희
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.107-112
    • /
    • 2000
  • 본 연구에서는 데이터웨어하우스의 개념에 대해 살려본 뒤, 데이터마이닝 개념 및 구축방법을 살펴하고, 이를 이용한 검색엔진인 northernlight와 google에 대해 기존의 검색엔진과 비교해서 분석하고자 한다.

  • PDF

데이터 결합이 웹 문서 검색성능에 미치는 영향 연구 (A Study on the Effect of Data Fusion on the Retrieval Effectiveness of Web Documents)

  • 박옥화;정영미
    • 정보관리연구
    • /
    • 제38권1호
    • /
    • pp.1-19
    • /
    • 2007
  • 이 연구에서는 최근 검색성능을 향상시키기 위한 전략으로 사용되는 데이터 결합기법을 웹 문서 검색에 적용하고, 실험을 통해 문서표현 방법의 결합이 검색성능에 미치는 영향을 분석하였다. 문서 표현 방법으로는 내용기반 표현, 링크기반 표현,URL 등을 선정하고, 단일 표현 방법에 의한 검색결과와 표현방법의 결합을 통한 검색결과를 비교하였다. 분석결과 다른 문서표현 방법의 결합이 웹 문서의 검색성능을 향상시키지는 못하는 것으로 나타났다.