• 제목/요약/키워드: 질의수정

검색결과 165건 처리시간 0.029초

온라인 이용자 피드백을 사용한 정보필터링 시스템의 수정질의 최적화에 관한 연구 (A Study on Query Refinement by Online Relevance Feedback in an Information Filtering System)

  • 최광;정영미
    • 정보관리학회지
    • /
    • 제20권4호통권50호
    • /
    • pp.23-48
    • /
    • 2003
  • 이 연구의 목적은 대량의 최신정보를 제공하는 정보필터링 시스템에서 이용자 피드백에 의해 수정질의를 자동생성하여 재검색을 수행함으로써 검색 성능을 최적화할 수 있는 방안을 찾는 데 있다. 이용자가 입력한 초기질의를 사용하여 정보필터링 시스템이 검색한 문헌에 대해 이용자가 적합성 여부를 온라인으로 입력하도록 하고, 이 피드백 결과를 토대로 '중복제거법'과 ‘저빈도제거법' 두 가지 방법에 의해각각 17개의 수정질의를 생성하여 재검색한 결과를 초기 검색결과와 비교 분석하였다. 수정질의는 각각의 방법마다 17개 패턴의 불논리 질의형태를 미리 만든 다음 초기질의에 디스크립터와 분류기호를 결합하여 생성하였으며, 재검색 결과에 대한 적합성 평가를 통해 최적의 수정질의식을 도출하였다.

질의어 자동수정을 이용한 메타시소러스 검색 방법 (The Method of Searching Metathesaurus, Using Automatic Modified a Query)

  • 김종광;하원식;김태용;류중경;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.454-456
    • /
    • 2003
  • UMLS(2003AA edition 기준)의 메타시소러스는 다국어를 지원하며 875.233개의 개 (concept)과 2,146,897개의 개념명(concept name)을 포함한다. 현재 UMLS 메타시소러스 검색을 제공하는 PubMed나 NLM에서는 UMLS에서는 개념명에 존재하지 않는 잘못된 질의나, 잘못된 구문 또는 개념명의 일부를 이용한 검색이 불가능하다. 이는 사용자가 UMLS에서 정보를 얻기 위해서는 정확한 의학용어를 숙지해야 되며. UMLS 메타시소러스의 데이터가 잘못 되었을 경우 정보를 얻을 수 없다. 본 연구에서는 이러한 문제점을 보완하기 위해서 자연어처리에서 연구되고 있는 문자열 간의 유사도 측정방식을 적용하여 잘못된 질의어에 대한 자동수정 기능을 이용한 메타시소러스 검색방법을 제안한다. 제안한 방법에서는 질의어를 자동수정하기 위하여 철자사전을 자동으로 추출하고 문자열 비교알고리즘을 도입하여 질의어와 철자사전간의 용어의 유사도를 측정한다. 유사도에 의하여 얻어진 용어를 메타시소러스의 형식에 맞게 변환하여 질의에 대한 최적의 결과를 얻을 수 있도록 한다. 제안된 방법의 성능을 평가하기 위해서 최근(2003년 8월) bi-gram 방식을 도입한 NLM에서의 시스템과 비교 평가한다.

  • PDF

클러스터링을 이용한 R-Trees 구축방법 (R-Trees construction using clustering)

  • 차정숙;이기준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.171-173
    • /
    • 1999
  • 공간 데이터베이스에서 사용되는 데이터는 그 양이 방대하고 복잡하여 이를 효율적으로 저장, 관리하는 색인이 필요하다. 여러 공간 색인 방법들 중에서 R-tree는 삽입과 삭제가 빈번히 발생하는 동적인 환경에서 효율적인 질의 성능을 보이는 것으로 알려져 있다. R-tree는 삽입되는 데이터의 순서에 따라 트리의 구조가 달라질 수 있는데, 주어진 데이터가 수정이 자주 발생하지 않는다며 데이터 입력 순서를 결정하여 질의 성능이 가장 좋은 트리를 구성할 수 있다. 본 논문에서는 데이터가 자주 수정되지 않는 환경에서 노드간의 중첩을 가장 최소화 할 수 있는 데이터 입력 순서를 결정하기 위해 클러스터링을 이용한 새로운 방법인 CSR-tree를 제안하고자 한다. CSR-tree는 일반 R-tree와 hilbert packed R-tree 방법보다 향상된 질의 성능을 보인다.

  • PDF

클라이언트/서버 공간 데이터베이스에서 실체화된 뷰를 이용한 공간질의 처리 (Spatial Query Processing using Materialized Views in Client/Server Spatial Databases)

  • 문상호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.593-596
    • /
    • 2002
  • 일반적으로 공간질의 처리는 복잡한 대용량 공간데이타를 대상으로 수행하기 때문에 많은 비용과 시간이 필요하다. 특히, 클라이언트/서버 공간 데이터베이스 환경에서는 클라이언트가 자주 이용하는 질의를 반복하여 처리하는 경우에 서버의 부하가 증가되며 질의 응답시간도 길어지게 된다. 따라서 클라이언트/서버 공간 데이타베이스에서 클라이언트측의 공간질의를 효율적으로 처리하기 위해서는 데이터 캐싱 등의 기법이 필요하다. 이를 위하여 본 논문에서는 클라이언트에서 자주 이용되는 공간질의를 뷰로 정의하고 클라이언트에서 실체화하는 방법을 이용하여 데이터 캐싱을 처리한다. 그리고 클라이언트에 실체화된 뷰를 최대한으로 이용하기 위하여 질의 수정 기법을 적용한 공간질의 처리 방법을 제시한다.

  • PDF

효율적인 XML 검색을 위한 재질의 시스템 설계 (Design of Query Reformulation System for Efficient Retrieval of XML Documents)

  • 정유나;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.238-240
    • /
    • 2001
  • XML이 확산되면서 이를 저장하고 검색하는 XML DB와 검색 앤진들이 만들어졌다. 그러나, 이들 대부분의 시스템에서 초기 질의만으로 문서를 검색하고, 그 대상도 질의 조건에 완전히 정합되는 문서로만 제한하고 있다. 그러나, 사용자가 데이터에 대한 정확한 정보가 없는 경우에는 자신의 요구를 제대로 표현하기가 힘들고 또, 한번의 질의로 사용자 요구에 정확하게 부합되는 문서를 검색하기도 매우 어렵다. 따라서, 본 논문에서는 질의 조건에 부분적으로 정합되는 문서도 검색하고, 사용자 피드백을 받아서 조기 질의를 사용자 요구에 좀 더 근접만 문서들을 검색할 수 있도록 수정하여 재질의를 하는 시스템을 설계하였다.

  • PDF

OQL 질의 처리기를 위한 중첩 질의 구조 제어용 전위 모듈의 설계와 구현 (Design and Implementation of an Unnesting Front-End for an OQL Query Optimizer)

  • 정승진;정진완;김형주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.36-38
    • /
    • 1998
  • 객체지향 데이터베이스 시스템의 표준 질의어로 사용되는 OQL은 SQL과 달리 select-from-where절 어디서나 중첩 질의를 자유롭게 허용하며, 이러한 중첩 질의는 질의어 수행 성능에 중요한 영향을 미치므로, OQL을 처리하는 질의 처리기에서는 이를 반드시 고려해 주어야 한다. 본 논문은 모노이드 컴프리핸션 해석(monoid comprehension calculus)을 이용하여, OQL 질의 처리기에서 중첩 질의의 중첩 구조를 제거할 수 있도록 해주고, 나아가 기존 질의 처리기에서 중첩질의 처리 기능을 추가하는데 있어, 이미 구현되어 있는 질의 최적화 모듈과 질의 수행 모듈의 수정을 최소화할 수 있는 중첩 질의 구조 제거용 전위 모듈(unnesting front-end)을 설계하고 구현하였다.

다변량 데이터 스트림을 위한 아파치 스톰 기반 질의 필터링 시스템 (Apache Storm based Query Filtering System for Multivariate Data Streams)

  • 김영국;손시운;문양세
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.561-564
    • /
    • 2018
  • 최근 빠르게 발생하는 빅데이터 스트림이 다양한 분야에서 활용되고 있다. 이러한 빅데이터 전체를 수집하고 처리하는 것은 매우 비경제적이므로, 데이터 스트림 중 필요한 데이터를 걸러내는 필터링 과정이 필요하다. 본 논문에서는 아파치 스톰(Apache Storm)을 사용하여 데이터 스트림의 질의 필터링 시스템을 구축한다. 스톰은 대용량 데이터 스트림을 처리하기 위한 실시간 분산 병렬 처리 프레임워크이다. 하지만, 스톰은 입력 데이터 구조나 알고리즘 변경 시, 코드의 수정과 재배포, 재시작 등이 필요하다. 따라서, 본 논문에서는 이 같은 문제를 해결하기 위해 아파치 카프카(Apache Kafka)를 사용하여 데이터 수집 모듈과 스톰의 처리 모듈을 분리함으로써 시스템의 가용성을 크게 높인다. 또한, 시스템을 웹 기반 클라이언트-서버 모델로 구현하여 사용자가 언제 어디에서든 질의 필터링 시스템을 사용할 수 있게 하며, 웹 클라이언트를 통해 입력한 질의를 자동적 분석하는 쿼리 파서를 구현하여 별도의 프로그램의 수정 없이 질의 필터링을 적용할 수 있다.

내용 기반 영상 검색을 위한 개선된 질의 방법 (Improved Query Method for Contents-Based Image Retrieval)

  • 임미영;김형준;김경수;김희정;하명환;정병희;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1665-1668
    • /
    • 2003
  • 디지털 컨텐츠의 증가에 따라 이들의 효율적인 검색과 관리를 위하여 내용 기반 영상 검색에 관한 많은 연구가 이루어지고 있다. 이러한 내용기반 영상 검색의 질의 방법으로는 유사한 영상을 질의로 사용하는 QBE와 영상을 사용자가 직접 스케치하여 질의에 사용하는 QBS 가 대표적이다. 본 논문에서는 질의로 사용할 정확한 영상을 가지고 있어야 하는 QBE 방법의 제약과 질의할 영상의 전체를 스케치해야 하는 QBS 의 문제점을 보완하는 개선된 질의 방법을 제안한다 제안하는 방법은 입력 영상의 단순화를 통해 스케치에 사용할 밑그림을 제공하고 사용자가 간단한 수정을 거쳐 질의 영상을 얻을 수 있도록 하는 방법으로 기존의 질의 방법을 개선하여 사용자의 편리성을 향상시킨다.

  • PDF

QALT지원을 위한 LTSA기반의 교육 시스템 구현 (Instruction System Implementation based on Learning Technology Standard Architecture for Question Answer Learning Tool)

  • 김정수;신호준;한은주;김행곤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.709-711
    • /
    • 2002
  • 웹 기반의 교육의 활성화로 이를 학습에 응용하기 위한 노력으로 GVA(Global Virtual Academy) 등과 같은 학습 보조 도구가 많이 발표하고 있는 설정이다. 대부분의 학습 보조 도구들은 각각의 특성들만 제시할 뿐 통합된 표준호가 되어 있지 않다. 최근 가상교육에서 학습기술이 상호운용성에 기반한 표준화의 일반적인 필요성을 인식하게 됨에 다라 가상교육의 국제표준을 소개하고 체계적으로 AICC(Aviation Industry CBT Committee), IMS Global Learning Consortium, ADL(Advanced Distributed Learning)을 중심으로 진행되어 오고 있다. 웹 기반의 교육을 통한 질의 응답의 학습방법을 고려한 도구가 없으므로 질의 응답 학습 도구(QALT)지원을 위한 표준화된 LTSA(Learning Technology Standard Architecture) 기반 시스템을 학습 객체에 대한 질의 응답과 개방형 단순 질의 응답 측면으로 구현한다. 그러므로 개방형 단순 질의 응답 측면을 구현하기 위해 학습 기술의 표준화로 제시되어 있는 LOM(Learning Object Metadata)을 통해 설계 자체를 체계화하고 전체적으로 명세 작업을 가능하게 하여 일관성을 유지하는 정련화된 문서로 질의 응답할 수 있도록 한다. 또한, Web 상에서의 Network delivery와 DTD(Document Type Definition)와 Stylesheet를 사용자가 쉽게 수정 가능하며 다양한 Linking Type을 제공하므로 단순 질의 응답 문서의 형식을 XML로 한다

  • PDF

키워드 패턴을 이용한 질의유형 분류 시스템 구현 (Implementation of a Question Type Classification System using Keyword Patterns)

  • 안혁주;김민경;김학수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.813-815
    • /
    • 2015
  • 질의응답 시스템에서 정답선택의 정확률을 향상시키기 위해 본 논문은 패턴과 휴리스틱을 기반으로 하는 질의유형 추출 시스템을 구현하는 방법을 제안한다. 질의유형은 DBPedia에서 사용하는 클래스타입을 기반으로 추출되며 질의유형에 포함하는 키워드패턴들을 수집하여 키워드패턴 데이터를 생성한다. 그 후 한국어 질의에서 많이 발생하는 유형을 분석하여 휴리스틱을 이용해 사용자가 의도한 질의 유형을 출력한다. 제안시스템은 기존 연구에 비해 구축과 수정이 쉽다는 장점이 있다.