• 제목/요약/키워드: 정보검색 시스템

검색결과 5,086건 처리시간 0.038초

글로버스 기반 그리드 환경에서의 분산 웹 크롤러 매니저 설계 및 구현 (Design and Implementation of a Globus-based Distributed Web Crawler Manager on Grid Environment)

  • 김혁호;이승하;박찬호;김양우;이필우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.945-948
    • /
    • 2005
  • 그리드 정보검색 시스템은 일반적인 정보검색 시스템의 문제점과 한계점을 인식하고, 그리드라는 분산처리 환경을 기반으로 정보검색 시스템을 구축함으로써 보다 효율적이고 유연한 확장성을 갖는 정보검색 서비스를 제공한다. 본 논문에서는 그리드 시스템 환경에 맞게 그리드 미들웨어 중에 하나인 글로버스 툴킷(Globus Toolkit)을 이용하여 정보검색을 위한 가상 조직(VO: Virtual Organization)을 구성했다. 그리고 그리드 정보검색을 위한 전단계로 웹상에서 각종 정보를 수집하는 P2P 기반 분산 크롤러들을 관리하는 크롤러 매니저를 그리드 서비스로 설계 및 구현하여 그리드 정보검색 시스템에 존재하는 다른 서비스들과 함께 활용할 수 있도록 하였다.

  • PDF

웹 상의 정보검색을 위한 지능형 검색시스템의 연구 (A Study of Practical Search System for Information Retrieval on the Web)

  • 박병율;임종태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1737-1740
    • /
    • 2002
  • 검색시스템은 분류시스템과 지식탐사 시스템을 결합하여 구성한 복합적인 시스템으로 일반 사용자들에게 자신이 일하는 정보의 데이터를 우선적으로 제공한다. 시스템의 특징으로 겉으로 보기에는 일반 검색엔진과 유사하나, 시스템적으로는 요구하는 각종 기능과 검색 기법, 지식탐사기법이 들어있다. 시스템에서는 문서 분류기법과 문서와 검색어 사이의 연관성을 찾기 위한 방법, 문서간의 연속적인 사건을 통한 검색 패턴 탐사기법을 사용하였다. 이들은 시스템의 검색과 분류 결과를 지금까지보다 더욱 인공지능에 가깝도록 하여 준다.

  • PDF

키팩트 색인텀에 기반한 정보검색 시스템 (An Information Retrieval System Based on Keyfact Index Term)

  • 박의규;나동열;변성찬;정경택;박세영
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.245-251
    • /
    • 2000
  • 지금까지의 정보검색 시스템은 소위 키워드 기반 정보검색 시스템으로서 색인이 단일 단어(single word) 즉 키워드의 집합으로 나타내어 진다. 그러나 이 방법은 문서의 내용을 정확히 표현하는 데 한계가 있다. 따라서 최근에는 단어 이상의 구문 단위인 구(phrase)를 이용하여 색인과 검색을 하도록 하는 시스템을 개발하고자 하는 추세에 있다. 따라서, 본 논문에서는 키워드보다는 의미를 좀더 잘 나타내고 일반적인 구보다는 정형화된 형태의 색인 단위인 키팩트를 색인어로 하는 정보검색시스템을 개발하고 이의 성능을 살펴보았다.

  • PDF

문서 클러스터링에 의한 효율적인 병렬 정보검색 시스템 (An Efficient Parallel Information Retrieval System using Document Clustering)

  • 강유경;류광렬;정상화
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권2호
    • /
    • pp.157-167
    • /
    • 2001
  • 본 논문은 고품질의 정보를 신속하게 제공할 수 있으면서 가격대 성능비가 우수한 병렬 정보 검색 시스템을 제시하고 있다. 본 검색 시스템은 문서 라이브러리를 여러 개의 클러스터로 세분화하고 검색 시 클러스터 단위로 프로세서에 할당함으로써 작업 단위를 적절한 규모로 하였을 뿐만 아니라, 문서의 점수 계산 시 프로세서 간 통신이 전혀 필요치 않게 하였다. 검색은 1차로 클러스터 레벨에서 관련 클러스터들을 찾는 것으로 시작하여 2차로 관련 클러스터 내에서 실제 문서를 찾는 방식으로 이루어진다. 이러한 계층적인 검색 구조로 인하여 1차 검색 후 여과가 가능하므로 전체적인 검색의 부하를 줄일 수 있다. 또한 문서의 클러스터가 가능한 한 유사한 문서군이 되도록 함으로써 불필요한 클러스터가 검색될 가능성을 최소화하여 성능을 높였다. 본 검색 시스템은 분산메모리 MIMD 구조의 다중 트랜스퓨터 시스템에서 구현되었으며, 실험 결과 무작위적으로 클러스터링한 경우에 비해 유사 문서군으로 클러스터링한 접근 방법이 우수함을 확인하였다.

  • PDF

CORBA/Java 기반 분산 서지정보 통합검색시스템(DBIRS) 모델에 관한 연구 (The Study of Distributed Bibliographic Information Retrieval System(DBIRS) Model based on CORBA and Java)

  • 서현석;박우창
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.87-89
    • /
    • 1998
  • 정보 기술의 발달로 문헌정보의 양이 증가하고 있지만 정확하고 빠른 정보를 지역적으로 분산된 서지정보 데이터베이스에서 찾기에 이미 개발된 방식으로는 시간이 많이 걸린다. 현재 사용중인 텔넷(telnet)을 통한 방식이나. 웹/CGI 기술을 이용한 방식은 문헌정보가 존재하는 각각의 서버를 사용자가 한번에 하나씩 접속하여 검색을 해야 하므로 검색시간이 많이 걸릴 뿐 아니라, 사용자는 각 서버마다 상이한 검색방법을 익혀야 한다. 최근에 이러한 단점들을 개선하기 위해 한곳에서 종합적인 서지 및 본문정보검색을 하는 통합 검색시스템이 중앙 집중형 시스템을 모델로 하여 구축되고 있으나 이 방식 역시, 자료의 불일치성, 시스템 공장과 과부하등 여러 문제점들을 내포하고 있다. 따라서 본 논문에서는 이러한 문제들의 해결책으로 분산 서지정보 통합검색시스템 DBIRS를 제안하고 구현한다. DBIRS는 웹 환경하에서 CORBA 기술과 Java언어를 이용함으로서, 단일 사용자 인터페이스로 병렬 복수질의를 수행하여 동시에 각 도서관에서 자료를 찾을 수 있다. 또한 객체를 기반으로 하는 표준 모델을 사용하여 소프트웨어의 개발과 확장을 가능하게 하고, 향후 멀티미디어 데이터나 웹과 같은 비 정형 데이터 시스템과의 통합을 쉽게 해준다.

주제분류 기반의 개인화 검색시스템에 관한 연구 (A Study on Personalized Search System Based on Subject Classification)

  • 김광영;곽승진
    • 한국문헌정보학회지
    • /
    • 제45권4호
    • /
    • pp.77-102
    • /
    • 2011
  • 본 연구의 목적은 이용자의 자신의 성향 정보에 맞는 정확한 검색결과를 제공하기위한 개인화 검색시스템을 설계, 구현, 평가하는 것이다. 이를 위해서 주제 분류와 하이브리드기반의 이용자 프로파일을 구성하였다. 제안한 개인화 검색시스템의 성능 평가를 위해서 전문가들이 직접 국내과학기술 DB의 논문의 적합성을 판별하기위해서 MRR, MAP과 사용성 평가를 측정하였다. 그 결과 전문가가 직접 "컴퓨터공학"과 "문헌정보학" 분야에서 평가한 국내과학기술논문 결과에서도 제안한 개인화 검색시스템이 일반 검색시스템보다 정확도가 더 높았다. 특히 중의성을 가진 키워드 부분에서 더 높은 정확도를 보였다. 질적 평가인 심층면담을 통한 평가에서도 개인화 검색시스템이 이용자가 선호하는 문서들을 우선적으로 제공함으로써 정보검색 시간 및 정보 획득에 용이하다고 응답하였다. 또한 다양한 추천 시스템을 제공함으로써 새로운 정보 탐색에 도움이 된다하였으며, 개인화 검색시스템이 일반 검색시스템보다 이용자의 만족도가 높음을 알 수 있었다. 따라서 본 연구에서 전문가 직접 평가 결과 모두 제안한 개인화 검색시스템이 일반 검색시스템보다 더 높은 효율성을 제공하는 것을 입증하였다.

분산된 생물정보 데이터베이스의 통합검색 시스템연구 (Integrated Information Retrieval System from Distributed Biological Database)

  • 윤홍원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.311-314
    • /
    • 2000
  • 분자 생물학의 발전염기서열, 단백질 서열, 지놈 서열 등의 서열데이터베이스와 단백질 3차구조를 제공하는 구조 데이터베이스등이 구축되어서 웹을 통해 많은 정보를 제공하고 있다. 전세계적으로 분산되어 있는 다양한 생물정보 데이터베이스의 효율적인 검색을 위해서 통합 검색 시스템의 개발이 필요하다. 이 논문에서는 전세계의 생물정보 데이터베이스의 개발 현황을 보이고 분산되어 있는 생물정보데이터베이스로부터 통합검색을 위한 생물정보 통합검색시스템(GenPlus)를 제안하였다. 제안한 GenPlus 에서는 염기 서열, 단백질서열, 그리고 키워드를 이용한 서열정보, 구조정보,완전한 지놈 정보, 그리고 문헌정보의 통합 검색을 제공한다.

  • PDF

정보 검색 과제별 동적 검색 랭킹 모델 구현 및 검증: 사용자 중심 적합성 판단 모형 평가를 중심으로 (Implementation and Verification of Dynamic Search Ranking Model for Information Search Tasks: The Evaluation of Users' Relevance Judgement Model)

  • 박정아;손영우
    • 감성과학
    • /
    • 제15권3호
    • /
    • pp.367-380
    • /
    • 2012
  • 본 연구는 정보 검색 과제별 주요 적합성 판단 기준을 실제 정보 검색 시스템으로 구현해 보고 사용자 평가를 통해 그 효과를 검증해 보고자 하였다. 이를 위해, 사용자 적합성 판단 기준들을 정보 검색 시스템에서 적합성을 결정하는 검색 랭킹 모델의 랭킹 요소들로 적용하였다. 그리고 정보 검색 과제별 차이가 있는 동적 검색 랭킹 모델과 차이가 없는 정적 검색 랭킹 모델을 시스템으로 구현하였고, 이에 대한 사용자 평가를 진행하여 비교해 보았다. 총 45명의 참가자가 실험에 참여하였고, 정보 검색 과제별 차이가 있는 동적 검색 랭킹 모델과 차이가 없는 정적 검색 랭킹 모델이 적용된 각각의 검색 시스템에서 3개의 검색 과제를 수행하였다. 3개의 정보 검색 과제로는 사실 검색 과제, 문제 해결 검색 과제, 의사 결정 검색 과제가 사용되었다. 각 참가자는 검색 결과 첫 페이지 상위 5 개의 검색 결과에 대해 적합성 정도를 7 점 척도로 평가하였다. 그 결과, 사용자는 전반적으로 모든 검색어에 동일하게 반응하는 정적 검색 랭킹 모델을 적용한 시스템보다 정보 검색 과제별로 사용자 적합성 판단기준의 변화에 따라 랭킹 요소 가중치를 달리한 동적 검색 랭킹 모델을 더 높이 평가하는 것을 확인할 수 있었다. 본 연구는 이를 통해, 정보 검색 과제를 고려한 정보 검색 시스템 디자인의 필요성과 함께, 사용자 중심 적합성 판단 모형 연구 결과를 실제 정보 검색 시스템으로 구현하여 평가함으로써 사용자 중심 적합성 연구 결과의 타당성을 검증하였다는 점, 그리고 사용자 연구 접목을 통한 시스템 개선의 중요성을 강조하였다는 점에서 의의를 가진다.

  • PDF

CORBA기능을 이용한 정보검색시스템 통합에 관한 연구 (A Study on Information Retrieval Systems Integration Using Common Object Request Broker Architecture)

  • 최한석;김상미;남태우;손덕주
    • 정보관리학회지
    • /
    • 제13권2호
    • /
    • pp.223-242
    • /
    • 1996
  • 본 논문에서는 정보검색을 원하는 이용자들에게 시스템 및 DBMS의 이형성, 서로 다른 검색시스템 사용에 관계없이 단일 사용자 인터페이스를 통해 일관성 있는 질의 및 검색결과를 제공할 수 있는 CORBA기반의 정보검색시스템(DDIR/ORB) 통합모델을 제안한다. 본 논문에서 제안한 DDIR/ORB는 질의를 요구한느 클라이언트와 검색을 실행하는 응용서버 사이에 미들웨어베이스와 CD-ROM 텍스트 데이터베이스에 대한 접근 투명성을 보장하고 정보검색 결과에 대한 자유로운 데이터 교환 및 변환을 제공하며, 기존의 정보검색시스템의 재사용을 보장한다. DDIR/ORB 시스템 설계 및 구현에서 OMG IDL을 사용함으로써 인터페이스 복잡도가 감소되었고 구성요소들의 구현 비용을 최소화하였다.

  • PDF

형태 전역특징과 히스토그램을 이용한 내용 기반 영상 검색 시스템 (Content based Image Retrieval System by Shape Global Feature and Histogram)

  • 정성호;이상열;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.323-329
    • /
    • 2002
  • 멀티미디어 정보검색 중 내용 기반 영상검색은 색상, 질감, 형태 등의 영상 내용 특징들을 이용하여 검색하는 방법으로, 색상과 질감 특징을 이용한 검색 시스템이 일반적으로 널리 소개되고 있다. 그러나 형태가 서로 다른 영상에서는 색상과 질감 특징에 의한 검색 방법은 유사 영상검색에서 오류를 수반할 수 있다. 그래서 본 논문에서는 영상의 윤곽선 에 의한 전역 형태 특징으로 허용 가능한 범주 이내로 유사도 영상을 필터링한 후 형태정보의 히스토그램을 이용하여 유사도 검색을 함으로써 정확도를 놀일 수 있는 시스템을 개발한다.

  • PDF