• 제목/요약/키워드: 확률검색모형

검색결과 13건 처리시간 0.02초

불논리검색, 퍼지검색, 확률검색의 효율 비교연구 (A Comparative Study on Effectiveness of Boole logic retrieval, Fuzzy retrieval and Probabilistic retrieval)

  • 이젬마;사공철
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.15-18
    • /
    • 1994
  • 본 연구에서는 불논리검색의 단점을 보완하기 위한 가장 강력한 검색 모형인 퍼지검색과 확률검색의 효율을 불논리검색과 상호비교하였다. 실험데이터로 정보학 분야의 한국어 test collection인 KT Test Set을 이용하였고 색인어와 색인어의 문헌내 출현빈도를 바탕으로 퍼지시소러스를 생성하여 시소러스의 NT, BT로 탐색식을 확장한 다음 각각에 대해 3가지 검색을 행하고 검색효율을 평균재현율과 평균정확률로 측정하였다. 실험결과 검색효율은 재현율에서는 확률검색, 불논리검색, 퍼지검색 순으로. 정확률에서는 퍼지검색, 확률검색, 불논리검색 순으로 나타났다.

  • PDF

2-포아송 모형의 전문검색시스템 응용에 관한 연구 (Application of the 2-Poisson Model to Full-Text Information Retrieval System)

  • 문성빈
    • 정보관리학회지
    • /
    • 제16권3호
    • /
    • pp.49-63
    • /
    • 1999
  • 본 연구는 질문용어의 분포가 초록/표제 및 전문으로 표현된 문헌 내에서 2-포아송 분포를 따르고 있는지를 조사하였으며 질문용어의 2-포아송 분포여부가 확률이론에 기반을 둔 이진독립모형과 2-포아송 독립모형에서 초록/표제 및 전문의 검색효율성에 미치는 영향을 비교 분석하였다.

  • PDF

용어간 종속성을 이용한 문서 순위 매기기에 의한 확률적 정보 검색 (A probabilistic information retrieval model by document ranking using term dependencies)

  • 유현조;이정진
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.763-782
    • /
    • 2019
  • 텍스트 문서 집합에 대한 정보검색에서는 주어진 질의에 부합하는 각 문서의 적합도 확률을 계산하고 이 확률이 높은 것부터 낮은 순으로 문서 순위를 정하여 사용자에게 제공한다, 각 문서의 적합도 확률 계산에 많이 사용되는 모형은 단어들이 확률적으로 독립이라는 가정 하에 확률을 추정한다. 이 모형은 단어들의 결합 확률을 계산하는 것이 현실적으로 어렵다는 점에서 많이 이용되고 있지만 질의에 사용되는 단어들이 대개 서로 관련성을 가지고 있다는 사실을 고려하고 있지 않다. 본 논문에서는 단어 자질들의 의존 구조를 고려하여 문서의 적합도 확률을 계산하기 위하여 단어들의 결합 패턴의 확률을 다항분포 모형으로 가정하고, 최대 엔트로피 방법으로 확률을 추정하여 문서 순위를 매기는 정보검색 모형을 제안한다. 여러 가지 다항분포 상황에서 시뮬레이션 실험을 한 결과 변수들의 독립을 가정한 모형보다 더 우수한 추정 결과를 보여 준다. 실제 LETOR OHSUMED 데이터 이용한 문서 순위 매기기 실험의 결과도 더 나은 검색 결과를 보여 준다.

확률적 이진 검색 트리 성능 추정 (Estimation of performance for random binary search trees)

  • 김숙영
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.203-210
    • /
    • 2001
  • 이진 트리 검색에 관한 관계 모형들을 추정하고 이론 가설들을 검정하기 위하여 중복되지 않는 자연수들을 자료로 하는 3개 이상 7개 이하의 노드를 가진 모든 가능한 이진 검색 트리 들을 생성하였다. 노드 개수 별로 높이 및 균형도 에 따른 이진 검색 트리 생성 확률들을 추정하였으며 노드 개수와 트리의 높이, 검색에 필요한 비교 횟수의 관계를 나타내는 회귀 모형이 구축되었고 이진 검색 트리의 O(1g(n)) 이론이 적합도 검정 절차에 의하여 실험적으로 채택되었다. 이진 검색 트리의 균형에 따른 검색 성능의 유의적 차이들을 통계적으로 증명하기 위하여 균형도에 따라 확률적으로 생성된 이진 검색 트리들을 세 그룹으로 그룹화하고 그룹간의 검색 비교 횟수를 분산 분석 모형에 의하여 비교 분석하였다.

  • PDF

논리적 패턴을 이용한 확률화 정보검색 시스템의 연구 (A Study of Probabilistic Information Retrieval System Using Logical Pattern)

  • 이윤오;이정진
    • 응용통계연구
    • /
    • 제13권1호
    • /
    • pp.1-10
    • /
    • 2000
  • 정보화사회에서 효율적인 정보검색(information retrieval)은 각종 의사결정에 매우 중요하다. 주어진 정보검색 문제가 있을 때 과거에 검색되었던 자료는 그 적절성 여부에 대한 평가를 데이터베이스에 첨가하여 지식베이스(knowledge base)화 할 수 있다. 본 연구는 이 지식베이스에 대한 논리적 패턴을 분석하여 새로운 정보의 '적정성(relevance)' 여부를 판별하는 확률화 정보검색 모형을 만들고 이에 대한 실험을 하였다.

  • PDF

적합성피이드백을 이용한 전문검색시스템의 검색효율성 증진을 위한 연구 (Enhancing performance of full-text retrieval systems using relevance feedback)

  • 문성빈
    • 정보관리학회지
    • /
    • 제10권2호
    • /
    • pp.43-67
    • /
    • 1993
  • 본 연구의 주목적은 전문검색시스템의 문제점인 낮은 정확율을 향상시키는 검색기법을 제시하는 것이다. 높은 재현율을 유지하면서 정확율을 증진시키기 위하여 확률검색모형 (이진독립형과 투포이슨독립모형)에 기초를 둔 적합성피이드백을 이용하였고, 이것이 전문검색시스템의 검색효율성에 미치는 영향을 조사하였다.

  • PDF

수량적 접근 방법에 의한 이진 검색 트리 불균형도에 따른 검색 성능 비교 분석 (Quantitative approach to analyze searching efficiencies varying degrees of imbalance in a binary search tree)

  • 김숙영
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권2호
    • /
    • pp.235-242
    • /
    • 2002
  • 트리 재균형 과정을 최소화하기 위하여 이진 검색 트리의 불균형도에 따른 검색 성능에 관한 수량적 정보를 얻기 위한 실험이 행하여졌다. 트리를 구성하는 노드들의 좌, 우 서브트리 높이 차 인 균형 인수에 의하여 불균형도를 수량화 한 결과 불균형도가 심해질수록 검색성능이 저하됨이 실험 자료들에 의하여 확률적으로 증명되었고 (p<0.01), 노드 개수와 평균 검색 횟수 관계를 설명하기 위한 모형으로는 로그 모형 보다 선형 모형이 적합한 경향을 보였다. 그러나 균형 인수 크기가 3 미만인 노드들만으로 구성된 이진 검색 트리의 성능은 높이 균형이진 트리에 비하여 저하되지 않는 것으로 평가된다. 본 연구 결과들은 이진 트리를 자료 구조를 사용하는 소프트웨어 관리에 적용될 수 있을 것이다.

  • PDF

전문 포털사이트 구축에 관한 연구 (A Study on the Design of Portal Site)

  • 곽승진
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.113-116
    • /
    • 1999
  • 인터넷 이용 경험이 적은 초보자뿐만 아니라 경험자도 인터넷에서 자신에게 필요한 정보를 찾기는 쉽지 않다. 인터넷 정보자원은 급증하는 반면 인터넷 검색엔진이 원하는 정보를 찾아주는 확률은 오히려 줄어들고 있는데 이는 체계적으로 정리되어 있지 않기 때문이다. 본 연구는 인터넷의 잔문 즉 웹브라우저를 실행한 후 처음 접속하는 사이트인 포털사이트(Portal site)를 전문화하여 궁극적으로 포털을 정보이용의 최종 목적지가 될 수 있는 모형을 설계하였다. 이 모형은 도서관이 보유하고 있는 학술정보 뿐만 아니라 인터넷의 정보자원을 체계적으로 정리하고 부가서비스를 제공하여 이용자의 정보이용 편의성을 높이는데 있다.

  • PDF

데이터 생성의미를 활용한 정보공유구조의 효과성 비교 연구 (An Evaluation of an Information Sharing Workflow Using Data Provenance Semantics)

  • 이춘열
    • 디지털융복합연구
    • /
    • 제11권6호
    • /
    • pp.175-185
    • /
    • 2013
  • 본 연구는 효과적인 정보공유를 위한 방안으로서 생성의미종속성을 소개하고, 데이터의 생성의미에 대한 이해가 정보공유에 미치는 영향을 측정하는 정보공유비용모형을 제시한다. 정보공유비용모형은 복수의 사용자집단 또는 부서들 사이에서 데이터의 생성의미 차이로 인한 정보공유 오류비용을 측정한다. 정보공유 오류비용은 정보공유오류의 발생확률과 비용에 의하여 결정되는데, 오류 발생확률은 사용자집단들 사이의 생성의미 차이를 나타내는 정보공유 거리로 측정된다. 본 연구는 대표적인 정보공유아키텍처인 부서별 데이터관리구조, 허브형 구조, 계층형 구조, 독립형 구조를 대상으로 정보공유비용을 측정함으로써 정보공유구조가 정보공유에 미치는 영향을 분석하였다. 정보공유비용의 관점에서 허브형이 가장 우수한 것으로 분석되었다. 그러나 데이터의 생성의미에 대한 표준화가 이루어지지 않을 경우, 허브형 정보공유구조는 부서별 데이터관리구조와 같은 특성을 보였다. 그리고 모든 정보공유구조가 독립형 구조보다 낮은 정보공유비용을 보임으로써 비록 표준화가 이루어지지 않아도 데이터를 공유하는 것이 공유하지 않는 경우보다 우수한 것으로 분석되었다.

사용자 잠재선호특성을 고려한 스마트 주차서비스 설계요건 연구 (A Study on Design Requirements for Smart Parking Services Considering User'S Stated Preferences)

  • 장정아;이현미;이원우;김현미;김태형
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1279-1286
    • /
    • 2021
  • 본 연구는 주차장 검색 및 사전예약서비스가 가능한 스마트 주차서비스에 대한 것으로, 요금(예약요금, 위약금) 등과 관련된 사용자의 선호선택 모형에 관한 연구이다. 스마트 주차서비스에 대한 응답설문을 구성하여 로짓 모형형태의 사용자 선호도 모형을 두 가지를 구축하였다. 첫 번째는 스마트주차장을 선택하는 모형으로 이용요금과 비용과의 관계에서 일반 주차장보다 선택확률이 높아지는 상황을 제시하였다. 두 번째는 주차권 예약할인 선택모형으로 예약금액과 위약금과의 관계 모형을 통하여 스마트주차서비스 선택확률을 분석하였다. 사용자의 선호도를 고려한 정교하고 다양한 형태의 스마트 주차서비스가 가능한 설계 요구사항으로 활용이 가능할 것으로 판단된다.