• Title/Summary/Keyword: 정보 검색 비용

Search Result 519, Processing Time 0.028 seconds

Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System (음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가)

  • 김태수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

Construction of Korean symptom articulation data using rule-based data augmentation technique (규칙기반 데이터 증강기법을 활용한 한국어 증상발화 데이터 구축)

  • Seong-Won Jeon;Dong-Jun Lee;Dong-Ho Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.360-362
    • /
    • 2023
  • 건강정보 검색 요구가 증가하면서 다양한 건강정보 검색 서비스가 제공되고 있다. 하지만 최근의 건강정보 검색 서비스는 정형화 된 전문적인 의료정보와 그 해석을 제공하기 때문에 사용자는 이러한 정보를 스스로 이해하여 원하는 건강정보를 검색해야 한다. 사용자의 검색 피로를 줄이고 원하는 정보를 정확하게 얻을 수 있는 건강정보 검색 시스템 개발을 위하여 사용자의 비의료적 표현인 한국어 증상발화 데이터 구축이 선행되어야 한다. 이러한 데이터 구축은 많은 시간과 비용이 필요하기 때문에 이를 줄이기 위한 규칙기반 데이터 증강기법을 제시하고, 이를 활용하여 한국어 증상발화 데이터를 증강하였다. 증강된 데이터의 유효성을 보이기 위하여 KoBERT 기반의 증상분류 실험을 진행하였으며, 증강된 데이터가 그 전의 데이터보다 F1 스코어가 더 높음을 확인할 수 있었다.

Design and Implementation of Storage Structure in XML using Extended Path Expression (확장된 경로 표현을 이용한 XML 문서의 저장 구조 설계 및 구현)

  • 백주현;최윤철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.463-466
    • /
    • 2001
  • 최근 인터넷상에서 정보 교환의 표준으로 XML이 자리잡고 있다. XML은 웹 문서뿐만 아니라 전자 도서관, 전자 상거래, EC/EDI를 포함한 다양한 분야에서 사용하기 위하여 폭 넓은 연구를 진행하고 있다. 따라서 이들 문서에 대한 저장 및 검색에 대한 연구가 활발히 진행되고 있다. 그러나 이들 기법들은 주로 관계형 데이터베이스 시스템만 지원하거나, 주로 검색만 다루어 문서 정보 갱신이 발생할 경우 인덱스 변환에 따른 비용이 증가하는 문제점이 있다. 본 연구에서는 기존의 기법과 달리 객체 관계 및 관계형 데이터베이스 환경 둘 다 지원할 수 있도록 하였으며, 검색 정보 표현과 정보 갱신에 따른 인덱스 갱신 비용을 최소화하기 위해 화장 경로 표현 기법을 제안하였다. 그리고 제안된 기법을 Window 2000에서 PHP와 SQL Server 2000 데이터베이스 시스템을 이용해서 구현하였다.

  • PDF

Efficient Inverted List Search Technique using Bitmap Filters (비트맵 필터를 이용한 효율적인 역 리스트 탐색 기법)

  • Kwon, In-Teak;Kim, Jong-Ik
    • The KIPS Transactions:PartD
    • /
    • v.18D no.6
    • /
    • pp.415-422
    • /
    • 2011
  • Finding similar strings is an important operation because textual data can have errors, duplications, and inconsistencies by nature. Many algorithms have been developed for string approximate searches and most of them make use of inverted lists to find similar strings. These algorithms basically perform merge operations on inverted lists. In this paper, we develop a bitmap representation of an inverted list and propose an efficient search algorithm that can skip unnecessary inverted lists without searching using bitmap filters. Experimental results show that the proposed technique consistently improve the performance of the search.

The automatic acquisition system design of the user's searching intention using Game With A Purpose(GWAP) (목적을 가진 게임을 이용한 사용자의 검색 의도 자동 획득 시스템 설계)

  • Yang, Yeong-Wook;Lim, Heui-Seok
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.12a
    • /
    • pp.810-812
    • /
    • 2009
  • 정보의 양이 기하급수적으로 증가함에 따라, 그 정보들을 효과적으로 제공하기 위해 검색 기술들이 개발 되었다. 현대 검색 기술은 단순 텍스트 매칭 기반으로 사용자의 의도와는 상관없는 정보까지 검색하는 경우가 많아서, 실제로 원하는 정보를 찾는데 많은 시간과 노력을 요구한다. 이런 단점들을 극복하고자 사용자의 검색 의도를 고려한 검색 기술들이 개발되었다. 검색 의도를 획득하는 방법에는 자동적인 방법과 수동적인 방법, 그리고 반자동적인 방법이 있다. 자동적인 방법은 사람이 아닌 컴퓨터를 통해서 획득이 이루어지기 때문에 사용자의 의도를 완벽히 반영하는 것이 어렵다. 수동적인 방법은 사람이 직접 참여하여 작성하기 때문에 사용자의 의도를 반영할 수 있지만, 시간과 비용이 많이 드는 단점이 있다. 반자동적인 방법은 위의 두 가지 단점을 보완할 수 있다. 본 논문에서는 반자동적인 방법인 목적을 가진 게임을 이용한 사용자의 검색 의도 획득 시스템을 사용한다. 이 후에 시스템에서 도입한 Game With A Purpose(GWAP)의 개념과 시스템의 구성, 그리고 발전방향 및 결론을 논의한다.

  • PDF

시맨틱 웹 기반의 협업적 교육을 위한 문제은행 시스템

  • O Gyeong-Jin;Kim Heung-Nam;Bae In-Gyeong;Jo Geun-Sik
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2006.06a
    • /
    • pp.270-276
    • /
    • 2006
  • 문제은행 시스템은 학습 평가를 위한 문제를 DB로 구성한 다음, 추후에 인터넷으로 검색하여 재 사용하게 하는 시스템이므로 교사 업무의 효율성 및 비용이 절감되며, 사용자에게 제공할 문제 정보들을 체계적으로 관리, 저장, 검색할 수 있는 환경을 제공한다. 하지만 기존에 구축되어 있는 문제 은행 시스템들의 데이터들은 컴퓨터가 그 의미를 처리할 수 없기 때문에 동의어, 유의어들에 대한 정확한 검색이 어렵고, 단순한 키워드 검색으로 인하여 학생들과 교사들은 수많은 불필요한 검색 결과 속에서 원하는 정보를 다시 재 검색해야 하는 시간 낭비를 초래하고 있다. 이러한 문제를 극복하기 위해 본 논문에서는 시맨틱 웹 기반 기술인 OWL을 사용해서 문제은행 시스템의 온톨로지를 구성하고 개념 정의, 구조 및 관계를 명시한다. 그리고 온톨로지 기반위에 OWL 개체를 생성하고, SWRL에 정의된 규칙과 함께 추론 통해 시맨틱 검색을 가능하도록 하였다. 그 결과 데이터의 관계 및 의미 분석을 통한 향상된 검색 결과와 학습자와 교사가 다양하게 문제를 공유하고 재 사용함으로써 협업적 학습에 대한 효과를 기대할 수 있다.

  • PDF

Clustering and Association Rule Mining of Transactions using Large Items (주요 항목 집합을 이용한 문서 클러스터링 및 연관 탐사 기법)

  • 서성보;김선철;이준욱;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.169-171
    • /
    • 2000
  • 현재 광범위한 웹 문서를 검색하기 위해서 많은 사용자들이 여러 종류의 검색엔진을 사용하고 있다. 하지만 대부분의 사용자는 검색엔진에 의해 검색된 문서의 순서화가 된 긴 리스트의 검색 문서들과 이들이 갖는 낮은 신뢰도에 대해 검색된 문서 중에 자신이 원하는 타당한 문서를 검색하는 불편함이 있어 왔다. 정보 검색에서 문서의 클러스터링은 검색된 결과를 재구성하는 효율적이고 선택적인 방법이다. 이 연구에서는 문서를 트랜잭션 관점에서 해석하여 하나의 클러스터에 대해 유사성을 측정하기 이해 주요항목과 비 주요항목으로 구분하여 각 트랜잭션의 최소 비용 계산을 통해 자동화된 문서 클러스터링 기법을 제안한다. 또한 클러스터링 단계에서 주요 항목간의 연관 규칙을 생성하기 위하여 문서 클러스터링을 위한 디스크 엑세스 동안 키워드간의 연관성을 찾을 수 있는 효율적인 검색 기법을 제시한다.

  • PDF

An Efficient Index Transfer Method for Reducing Index Organization Cost In Distributed Database Systems (분산 데이터베이스 시스템에서의 색인 구성비용 절감을 위한 효율적인 색인 전송기법)

  • 박상근;김호석;이재동;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.223-225
    • /
    • 2003
  • 분산 데이터베이스 시스템 환경에서는 특정 노드로 집중되는 부하의 분산이나 가용성 및 안정성 제공을 위해 데이터 분할기법 (fragmentation)과 복제기법(replication)을 사용한다. 이때 전송된 데이터에 대한 기존의 색인 재활용 기법과 벌크 로딩(bulk loading) 기법은 효율적인 색인 구성을 위해 논리적인 페이지 포인터를 물리적 주소로 변환하는 물리적 사상구조를 필요로 하거나, 색인 구성시간과 검색성능 모두를 향상시키지 못하는 문제점을 지닌다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 색인 전송기법을 제안한다. 본 기법은 색인 재활용을 위해 물리적 사상구조를 추가로 유지하거나, 검색 성능을 향상시키기 위해 전체 데이터 집합을 정렬하는 것이 아니라, 데이터가 전송될 사이트에 색인구조물 저장하기 위한 물리적 공간은 예약하고 예약된 공간에 색인구조를 전송, 기록함으로써 색인 구성비용을 줄이게 된다. 또한 예약된 공간을 연속적인 페이지구조로 구성함으로써 색인 구성 시 자식노드에 대한 위치정보를 예상하여 부모노드가 지니는 자식노드에 대한 위치정보 기록 비용을 줄일 수 있다.

  • PDF

Allocation Algorithm for Distributed Database Systems (분산 데이터베이스에서 할당 알고리즘의 설계)

  • Lee, Soon-Mi
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1647-1650
    • /
    • 2003
  • 분산 데이터베이스 시스템에서 데이터의 할당이란 릴레이션이 분할되어 생성된 프래그먼트들을 여러 사이트에 분산시키는 것을 의미한다. 최적의 데이터 할당이란 할당에 소요되는 비용을 최소화시키는 할당 해를 찾는 것이라고 할 수 있는데, 본 논문에서는 저장, 질의 처리 및 전송 비용을 고려한 데이터 할당 함수를 정의하였다. 본 논문에서 정의한 할당 함수에서는 전송비용을 갱신 전송 비용과 검색 전송 비용으로 나누어서 산출하도록 정의하였다.

  • PDF