• 제목/요약/키워드: 질의 축약

검색결과 22건 처리시간 0.026초

경로 정보 축약 레이블링 기법을 이용한 효율적인 XML 분기 질의 처리 (Efficient XML Twig Query Processing based on Path-summarized Labeling Schemes)

  • 서세훈;배진욱;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.178-180
    • /
    • 2005
  • 지금까지 제안된 XML 문서상의 분기 질의(twig query) 처리 기법들의 중요한 흐름 중 하나는 지역 인코딩 기법을 이용하는 것이다. 하지만 이 기법에 기반한 분기 질의 처리는 분기 질의상의 단말 노드와 분기 노드의 엘리먼트를 반드시 읽어야 하는 단점이 있다. 그러나 지역 인코딩 기법과는 달리 경로 정보를 축약하는 방식의 레이블링 기법(예: 듀이 인코딩)은 지역 인코딩에 의한 레이블에 비해 더 많은 정보를 담고 있어서, 이 기법과 구조 인덱스를 이용하여 XML 문서를 인덱싱하면 질의상의 단말 태그의 엘리먼트만을 읽어도 분기 질의를 처리할 수 있다. 이를 이용하여, 본 논문에서는 경로 정보 축약 레이블링 기법과 구조 인덱스를 이용한 분기 질의 처리 기법을 제안한다. 제안된 알고리즘은 디스크 입출력을 줄일 수 있으며 불필요한 중간 결과도 생성하지 않는다.

  • PDF

화학반응 메커니즘에 따른 대기질 모델링 결과 비교 (Comparison of Air Quality Modeling Results from Different Chemical Reaction Mechanisms)

  • 이시혜;김영성;김진영;김용표
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2002년도 춘계학술대회 논문집
    • /
    • pp.103-104
    • /
    • 2002
  • 가스상 물질만을 대상으로 하여도 대기 중에서 일어나는 화학반응은 20,000개를 넘고 관여하는 물질도 수천을 넘는다. 대기화학 반응이 대기질 모델링에 포함되기 시작한 이래 지난 20-30년간 이들 반응들의 특성을 보전하면서 모델링에서 취급이 가능한 형태로 축약하기 위한 노력이 계속되고 있다. 그러나 축약 자체가 불완전을 감수하면서 전체적인 효율을 추구하는 과정이기 때문에 관점에 따라 방법이 다를 수밖에 없고, 또한 실측 자료로써 메커니즘의 개발과 검증에 주로 이용되는 스모그 챔버 실험도 결국은 실제 대기 현상의 일부분을 대표한 것이기 때문에 메커니즘들은 각각 다른 특성을 지니게 되고 일정 부분 불완전함을 내포하고 있다. (중략)

  • PDF

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2004년도 춘계학술대회
    • /
    • pp.139-142
    • /
    • 2004
  • 자연어 질의 문장을 입력하는 방법은 정보 검색 시스템 사용자에게 아주 이상적인 인터페이스이다. 검색을 위해 색인어를 입력하거나 불리언 질의식을 사용하는 것에 비해 훨씬 친밀하지만, 동일한 의도의 검색 요구에 대해서도 개인의 성향에 따라서 다양한 형태나 구조의 자연어 질의문장으로 입력될 수 있는 본질적인 특성이 있다. 본 논문은 자연어 질의문장을 입력으로 하는 검색 시스템을 위해 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중 검색 기법을 제안한다. 질의 문장에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고 이형 표기 용어와 축약 표기 용어들을 확장하여 다중 검색함으로써 재현율과 정확도를 높일 수 있다.

  • PDF

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색 (Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion)

  • 윤성희;장혜진
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.235-248
    • /
    • 2004
  • 웹 문서 정색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

무결성 유지 기능을 지원하는 공간 데이터베이스시스템의 설계 및 구현 (A Design and Implementation of Spatial Database System Supporting Integrity maintenance Facility)

  • 이영걸;배해영
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2224-2232
    • /
    • 1998
  • 본 논문은 공간데이터와 비공간 데이터를 연계 처리하는 공간 데이터베이스 시스템에서 데이터의 의미적 무결성을 보장하는 확장된 공간 질의 처리 시스템의 구현에 대해 기술한다. 다양한 실세계의 지형 및 공간 정보를 모델링해야하는 지리정보 시스템은 공간 데이터베이스 시스템을 기반으로 구현되고 있다. 이러한 공간 데이터베이스 시스템에서 다루는 데이터는 단순 객체가 아닌 추상화된 복합 객체로 다양한 유도 데이터에 대한 의미적 무결성을 데이터베이스 시스템 내부에서 효율적으로 유지해야 하며 공간 데이터의 의미적 특성을 제약 조건의 형태로 표현할 수 있어야 한다. 본 논문에서는 공간 질의 처리기를 확장하기 위해 공간 데이터에 대한 무결성 정보를 술어 논리 형태로 표현할 수 있는 공간 제약 언어를 제안한다. 제안된 공간 제약 언어는 축약된 질의 트리 형태로 메타-데이터베이스에 저장하며 저장된 공간 제약 언어는 사용자의 질의에 대해 공간 데이터베이스의 일치성을 보장하는 정보로 사용된다.

  • PDF

특징벡터의 차원축약 기법을 이용한 2단계 내용기반 이미지검색 시스템 (Two-stage Content-based Image Retrieval Using the Dimensionality Condensation of Feature Vector)

  • 조정원;최병욱
    • 한국통신학회논문지
    • /
    • 제28권7C호
    • /
    • pp.719-725
    • /
    • 2003
  • 내용기반 이미지검색 시스템에서는 색인과정으로 색상, 형태 및 질감 등의 특징정보를 추출하여 데이터베이스에 저장한다. 전체 검색 시스템 내에서 탐색이라 함은 특징정보 데이터베이스를 이용하여 질의이미지와 유사한 특징정보를 갖는 이미지를 찾아나가는 부분 과정으로 정의할 수 있다. 본 논문에서는 내용기반 이미지검색 시스템에서의 새로운 2단계 탐색방법을 제안한다. 제안하는 방법은 사용자가 질의를 입력한 후 결과를 얻을 때까지의 반응시간 중 가장 큰 비중을 차지하는 유사도 비교시간인 탐색시간을 최소화하기 위해 Cauchy-Schwartz 부등식의 특성을 이용하여 미리 특징벡터의 차원을 축약하여 저장하고, 이를 사용하여 검색범위를 최소화함으로써 검색속도를 향상시킬 수 있다. 실험결과를 통해 차원축약 기법을 이용하는 2단계 검색방법으로 기존 상세검색 방법과 비교하여, 동일한 검색 적합성을 보장하면서 대용량의 이미지 데이터베이스에서 월등한 탐색속도 향상을 확인하였으며, 특징벡터가 더욱 고차원화 되고 이미지의 수가 더욱 늘어날수록 효과적이었다.

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권4호
    • /
    • pp.303-308
    • /
    • 2004
  • 자연어 질의문장을 입력하는 방법은 정보 검색 시스템 사용자에게 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의문장을 입력하는 검색 시스템을 위해 자연어 처리 기술에 기반 하여 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중검색 기법을 제안한다. 질의 문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고, 이형표기 용어와 축약표기 용어들을 확장하여 다중 검색함으로써 재현율을 11.3%, 정확도를 4.7% 높였다.

  • PDF

접미어 트리 구조를 이용한 효율적인 XML 경로 인덱싱 (A Suffix Tree Approach for Efficient XML Path Indexing)

  • 이덕형;원정임;노관준;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.88-90
    • /
    • 2002
  • 최근 인터넷 상에서 XML 문서의 사용이 급속도로 보편화, 일반화됨 따라 정보 검색을 위한 다양한 XML 질의 언어가 제안되고 있다. XML 질의의 공통 특징으로서 ‘*’ 문자 등을 사용한 정규화 경로식(regular path expression)에 의한 손쉬운 구조정보 검색 기능을 들 수 있다. 본 논문에서는 접미어 트리(suffix tree)를 이용한 새로운 경로 인덱싱 기법을 제안한다. 제안하는 기법에서는 XML 문서상의 각 경로를 축약된 유일한 문자열로 인코딩하며, 인코딩 된 각 문자열의 모든 접미어 정보를 인덱스에 저장한다. 본 기법은 일반 정규화 경로식을 포함하는 구조질의를 매우 효율적으로 처리하며, 또한 경로 정보가 부정확하게 기술된 경우에도 관사 질의 처리를 효과적으로 처리할 수 있다.

  • PDF

XML 질의의 수행성능 향상을 위한 트리 구조 XPath 질의의 축약 기법에 관한 연구 (A Tree-structured XPath Query Reduction Scheme for Enhancing XML Query Processing Performance)

  • 이민수;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.585-596
    • /
    • 2007
  • 일반적으로 XML 데이터는 트리 형태의 계층적인 구조를 가지고 있으며, XML 데이터의 저장 및 검색도 이러한 특성을 반영한다. 따라서 XML 데이터를 데이터베이스화 할 때에 XML 엘리먼트 간의 이러한 계층 관계를 반영하여 XML 데이터를 구조화하여 저장하고, 사용자의 검색을 지원하기 위해서는 질의에 명세 된 엘리먼트 구조 간의 계층 관계를 계산하여 처리하는 방법이 필요하다. 구조적 조인(structural joins) 연산은 이 문제의 한 해결책으로서 노드 번호 매기기 방식(node numbering scheme)에 기반한 XML 데이터베이스에 대하여 효율적인 계층 관계 연산 기법을 제시하고 있다. 하지만 계층 관계가 복잡하게 중첩되어 있는 트리 구조의 XML 질의를 처리하려면 여전히 다수의 구조적 조인을 수행해야 하기 때문에 질의 처리 비용이 많이 드는 또 다른 문제를 갖게 된다. 이에 본 논문에서는 선행 연구에서 제안된 트리 구조의 XML 질의 처리시에 필요한 다수의 중첩된 구조적 조인들의 수행비용을 효과적으로 줄이기 위한 사전 처리 방법으로서 동등 클래스 개념을 적용한 정규 표현식(regular expression)으로 된 경로 질의(path query)의 길이를 단축하는 경로식 단축 알고리즘을 소개하며 특히 분기 노드(branch node)가 포함된 경로식 단축 알고리즘을 제안한다. 제안한 알고리즘이 XML 경로식 질의 처리 시간을 평균적으로 1/3로 단축할 수 있음을 실험을 통해서 확인한다.

한메일넷 질의 자동응답을 위한 이단계 자기구성 지도 (A Two-level Self-Organizing Map for Automatic Response of Hanmail Net Questions)

  • 김현도;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.481-483
    • /
    • 2000
  • 컴퓨터가 널리 보급되고 인터넷이 발전함에 따라 많은 정보가 생산되고, 이러한 정보를 가공하여 사용자에게 효율적으로 제공하는 서비스들도 많아지게 되었다. 그러나, 컴퓨터에 익숙하지 않은 사용자들은 쉽게 이러한 서비스를 이용하지 못하기 때문에 사용자들을 돕는 시스템들이 필요하게 되었다. 한메일넷의 경우 전자 우편을 통한 사용자들의 질문에 대해 관리자가 직접 답을 해주는데, 사용자의 증가로 질의응답 업무의 양이 커지고 있다. 따라서, 본 논문에서는 사용자의 질의에 자동으로 응답하는 시스템을 개발하기 위하여 효율적인 이단계 자기구성 지도(SOM)를 제안한다. 이 방법은 다양한 크기의 질의메일을 정형화된 크기로 만들기 위한 데이터 축약 SOM과 이를 실제 해당 답변 클래스로 분류하는 문서 분류 SOM으로 구성된다. 실제 사용되고 있는 2206개의 데이터에 대한 실험 결과, 95%의 분류 성공률을 보여 그 가능성을 볼 수 있었다.

  • PDF