• Title/Summary/Keyword: 정보검색기법

Search Result 2,278, Processing Time 0.032 seconds

An Experimental Study on Generation of User-focused Summaries (이용자 중심 요약문 생성에 관한 실험적 연구)

  • 김정하;정영미
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2001.08a
    • /
    • pp.185-188
    • /
    • 2001
  • 본 연구에서는 단락검색 기법을 응용하여 이용자의 질의에 적합한 최적의 요약문을 자동 생성하는 방안을 모색하고자 하였다. 이를 위해 먼저 실험문헌집단을 구축한 후, 실험을 통해 이용자 중심 요약문을 생성하는 정적 단락검색 기법과 동적 단락추출 기법의 최적의 모형을 찾고 이들의 성능을 비교하였다.

  • PDF

An Experimental Study on Enhancing the Retrieval Performance for the Web Documents Using Link-Based Clustering Technique (링크기반 클러스터링을 이용한 웹 문서 검색의 성능 향상에 관한 실험적 연구)

  • 김혜진;문성빈
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2002.08a
    • /
    • pp.247-252
    • /
    • 2002
  • 본 연구에서는 하이퍼텍스트나 웹 문서의 검색에서 링크로 연결된 문서들이 주제적으로 서로 관련되어 있다는 것을 기반으로 하여 링크정보를 참조한 웹 문서 클러스터링 기법을 제안하였고 이것을 이용하여 검색된 결과를 질의 근접 순위화함으로써 웹 문서 검색의 성능을 향상시키는 방안을 연구하였다. 본 연구에서 사용된 웹 문서 집단은 웹(WWW)을 통하여 직접 수집하였으며 웹 문서가 다른 웹 문서를 링크하고 있을 때를 OutLink, 다른 웹 문서로부터 링크를 받고 있을 때를 InLink로 구분하였다. 실험결과 OutLink를 참조하여 클러스터링을 수행하는 기법과 InLink를 참조하여 클러스터링을 수행하는 기법 모두 검색 성능을 향상시켰다.

  • PDF

A New Keyword Search Algorithm for RDF/S and OWL Documents (RDF/S 및 OWL 문서에 대한 키워드 검색 알고리즘)

  • Kim, Hak Soo;Son, Jin Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.321-324
    • /
    • 2009
  • XML 또는 RDBMS 에서의 키워드 검색은 기존의 정보 검색처럼 데이터의 구조 또는 질의 언어에 대한 사전 지식 없이 질의 처리를 수행하는 연구 분야 중의 하나이다. 오늘날 키워드 검색을 효율적으로 처리하기 위해 제안된 연구들은 그래프 기반의 질의 처리에 기반한 기법들에 초점을 두고 있다. 이러한 접근들은 XML 또는 RDBMS 안에 존재하는 데이터를 그래프 구조에 기반한 데이터로 변환한 다음에 그래프 탐색을 통해서 모든 질의 키워드를 포함하는 결과들을 찾는다. 그러나 기존의 기법들을 RDF/S 또는 OWL 문서와 같은 복잡한 그래프 구조에 적용하기에는 질의 성능 측면에서 많은 문제점을 가지고 있다. 또한, 온톨로지 언어의 의미적 단위로서의 RDF 트리플을 고려하지 않기 때문에 질의 결과에 대한 신뢰성을 보장할 수 없다. 이러한 관점에서 본 논문은 RDF/S 또는 OWL 저장소에서 효율적이고 의미적인 키워드 검색을 위한 인덱싱 기법 및 알고리즘을 설계한다.

Efficient Searching Technique for Nearest Neighbor Object in High-Dimensional Data (고차원 데이터의 효율적인 최근접 객체 검색 기법)

  • Kim, Jin-Ho;Park, Young-Bae
    • The KIPS Transactions:PartD
    • /
    • v.11D no.2
    • /
    • pp.269-280
    • /
    • 2004
  • The Pyramid-Technique is based on mapping n-dimensional space data into one-dimensional data and expresses it as a B+-tree. By solving the problem of search time complexity the pyramid technique also prevents the effect of "phenomenon of dimensional curse" which is caused by treatment of hypercube range query in n-dimensional data space. The SPY-TEC applies the space division strategy in pyramid method and uses spherical range query suitable for similarity search so that Improves the search performance. However, nearest neighbor query is more efficient than range query because it is difficult to specify range in similarity search. Previously proposed index methods perform well only in the specific distribution of data. In this paper, we propose an efficient searching technique for nearest neighbor object using PdR-Tree suggested to improve the search performance for high dimensional data such as multimedia data. Test results, which uses simulation data with various distribution as well as real data, demonstrate that PdR-Tree surpasses both the Pyramid-Technique and SPY-TEC in views of search performance.rformance.

A Study on Information Retrieval in CD-ROM Database (CD-ROM 데이터베이스의 정보검색(情報檢索) 연구)

  • Lee, Woo-Bum
    • Journal of Information Management
    • /
    • v.25 no.4
    • /
    • pp.1-35
    • /
    • 1994
  • This is a practical study on acquisition and efficiently use of CD-ROM databases of diverse subject areas which in recent has rapidly increased in quantity. This study was concentrated on the proposition of production CD-ROM database and intended to give effective ideas of its design. I analysed and compared several CD-ROM databases in aspects of their menu configuration and information retrieval technics, so that may present a rational norm.

  • PDF

Design of Gene Alignment Program(FastA) Using Carpool and Grouping Schemes (카풀 및 그룹핑 기법을 이용한 유전자 서열 정렬 프로그램(FastA) 설계)

  • 이성준;김재훈;정진원;이원태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.124-126
    • /
    • 2003
  • 생물정보학에서 사용되는 많은 프로그램들은 데이터베이스로 부터 방대한 양의 데이터를 검색하고 처리한다. 이러한 환경에서 사용자의 요청마다 데이터베이스를 검색하는 경우 사용자들의 대기 시간이 길어지고 시스템 용량을 초과한다. 이러한 데이터베이스 액세스의 문제점을 해결하기 위하여 카플 기법과 그룹핑 기법이 제안되었다. 본 논문에서는 카플 기법과 그룹핑 기법을 이용하여 유전자 서열 비교 프로그램인 Fasta를 구현하였고 사용자 응답시간을 측정하여 프로그램의 성능을 높일 수 있음을 확인하였다.

  • PDF

Design and implementation of high-dimensional indexing scheme using filtering method (필터링 기법을 이용한 고차원 색인 기법의 설계 및 구현)

  • 한성근;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.219-221
    • /
    • 1999
  • 현재 멀티미디어 응용분야에서 고차원 데이터에 대한 색인 기법이 아주 중요시 되고 있다. 특히, 인터넷의 보급으로 멀티미디어 정보에 대한 수요가 급증함에 따라 멀티미디어 객체에 대한 효율적인 색인 기술이 절실히 필요하게 되었다. 멀티미디어 객체들은 특징 벡터들로 표현이 되며, 대부분 고차원 특징 벡터를 형성하게 된다. 이러한 고차원 특징 벡터를 색인 및 검색하기 위하여 다양한 방법들이 제시되었다. 그러나, 차원이 증가할수록 검색 성능이 급격히 저하되는 dimensional curse 문제를 완전히 해결하지는 못했다. 본 논문에서는 필터링(filtering) 기법을 사용하여 개선된 고차원 색인 기법을 설계 및 구현한다.

  • PDF

Transformation Method for Publishing DCAT based Metadata in Data Repository on Web (DCAT 기반 메타데이터의 웹 출판을 위한 변환 기법)

  • Park, Jinhyo;Kim, Kihun;Kim, Sung-Hee;Youn, Joosang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.491-493
    • /
    • 2021
  • 최근 데이터 산업 발전과 함께 데이터를 저장, 공유, 거래가 가능한 다양한 데이터 저장소와 거래소가 증가하고 있다. 대부분의 데이터 저장소 및 거래소는 데이터 검색과 공유를 위해 DCAT 기반 메타데이터를 구성하고 있다. 하지만 DCAT 기반 메타데이터는 웹 검색 엔진에서 검색이 잘되지 않는 문제점을 가지고 있다. 이는 웹에서 자원을 출판하기 위한 데이터 모델 기법이 Schema.org 방법을 사용하고 있기 때문이다. 본 논문에서는 이런 문제점을 해결하기 위해 DCAT 기반 메타데이터를 Schema.org 방법으로 변환할 수 있는 새로운 기법을 제안한다. 제안하는 변환 기법은 데이터 저장소와 거래소 내 데이터셋이 웹에서 잘 검색될 수 있는 웹 출판 기능을 지원한다.

Database with Keyword Based on Symmetric-Key Cipher (암호화된 DB에서 대칭키 기반 검색기법 구현)

  • Jeong, Min-Kyoung;Song, Hee-Jeong;Shin, Seung-Soo;Han, Kun-Hee
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.05a
    • /
    • pp.158-161
    • /
    • 2009
  • 최근 개인정보유출사건으로 프라이버시에 대한 관심이 급증하면서, 데이터베이스의 내용을 암호화할 필요성이 요구된다. 초기에는 문서 전체의 복호화를 통해서만 검색이 가능하기 때문에 효율성이 떨어져 암호화기법이 거의 사용되지 않았다. 최근에는 복호화 하지 않고 암호화된 데이터로부터 특정 키워드를 포함하는 정보를 효율적으로 검색하고자 하는 연구가 시작되었다. Song의 연구를 시작으로 점차 효율적인 검색 기법이 제안되어졌다. 본 논문에서는 데이터베이스내의 암호화된 데이터를 검색하는 기법에 대한 설계 및 구현하고, 그에 따른 정확도 및 오류율을 분석한다.

  • PDF

Design and Performance Evaluation of an Efficient Index Mechanism for Real-Time MMDBMS (실시간 MMDBMS 를 위한 효율적인 색인 기법의 설계 및 성능평가)

  • Min, Young-Soo;Shin, Jae-Ryong;Yoo, Jae-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.61-64
    • /
    • 2001
  • 본 논문에서는 실시간 MMDBMS 를 위한 효율적인 색인 기법을 제안한다. 기존의 주기억장치 트리 기반 색인 구조는 범위 검색을 효과적으로 지원할 수 있지만 한 노드에 대한 접근시간과 평균 접근시간의 차이가 클 수 있기 때문에 실시간 특성을 보장하지 못하는 단점이 있다. 또한 해시 기반 색인 구조는 간단한 검색에서 접근 시간이 매우 빠르고 일정하지만 범위 검색을 지원하지 못하는 단점이 있다. 이러한 두 색인 구조의 단점을 해결하기 위해 본 논문에서는 동적 확장이 가능하며 검색 시간이 빠르고 실시간 특성을 지원할 수 있는 ECBH(Extendible Chained Bucket Hashing)와 범위 검색에 더욱 효과적인 $T^{\ast}$-트리를 상호보완적으로 결합하여 Hyper-TH(Hyper Tree-Hash)라는 실시간 MMDBMS 에 적합한 새로운 색인 기법을 제안하고 구현한다. 그리고 성능 평가를 통해 제안하는 색인 기법의 우수성을 증명한다.

  • PDF