• 제목/요약/키워드: 질의어 변환

검색결과 69건 처리시간 0.023초

효율적인 부울 질의 연산에 관한 연구 (An Efficient Boolean Query Processing in Information Retrieval)

  • 채승기;남영광;박현주
    • 정보관리학회지
    • /
    • 제13권1호
    • /
    • pp.173-185
    • /
    • 1996
  • 본 논문에서는 부울검색시스템에서 사용자로부터 입력되는 부울 질의를 효율적으로 연산하기 위한 부울 질의 최적화 방법 4가지를 기술한다. 첫째, 프로그래밍 언어에서 논리식의 계산에 사용되는 단거리계산 방법을 적용한다. 둘째, AND, NOT과 같은 특정 연산자를 효율적으로 연산하기 위하여 색인어 출현 빈도의 차이를 이용한다. 세째, 분배법칙이 적용된 질의를 원래의 식으로 변환하여 연산의 수를 감소시킨다. 마지막으로 반복되는 식을 포함하는 질의에 대하여 중복 연산을 회피한다. 또한 위의 4가지 방법들을 UNIX환경에서 개발된 KRISTAL-II 시스템에 구현하여, 제시된 방법들이 특정 경우에 검색 속도를 향상시킬 수 있음을 검증하였다.

  • PDF

웹 정보원 통합을 위한 XML 기반의 랩퍼 시스템 (An XML-based Wrapper System for Integrating Web Information Sources)

  • 배종민;박은경;정채영
    • 한국정보통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.2235-2242
    • /
    • 2006
  • 최근 웹 정보원에서 제공하는 정보가 정보서비스의 주류를 이루면서 웹 정보원 랩퍼 개발의 중요성이 크게 부각되었다. 본 논문은 웹 정보원을 통합하기 위한 미들웨어로서의 웹 랩퍼를 설계, 구현한 결과를 제시한다. 특히 HTML 문서로부터 XML 스키마로 변환하는 방법을 제시하고, XQuery 질의어에 대한 파서와 XQJ 기반의 질의처리 과정을 제시한다. 그리고 개발된 랩퍼 API의 사용 예를 통하여 그 유용성을 보인다.

실체뷰 캐쉬 기법을 이용한 XML 질의 처리 시스템의 구현 (Implementation of XML Query Processing System Using the Materialized View Cache-Answerability)

  • 문찬호;박정기;강현철
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.293-304
    • /
    • 2004
  • 데이터베이스 기반의 웹 응용을 위한 캐슁 기법이 최근 많이 연구되고 있다. 자주 제기되는 질의의 결과를 캐쉬 해두면 반복 질의를 위한 재사용은 물론 관련 질의의 처리에 이용될 수 있다. 웹 상에서 데이터 교환의 표준으로 XML이 등장한 이래 현재 웹 응용들은 네트워크 상의 원격 XML소스로부터 데이터 검색을 수행하는 경우가 많아졌는데 이의 효율적인 지원을 위해 검색 결과를 캐쉬 하는 것은 유용하다. 본 논문은 XML 질의를 관련 XML 캐쉬를 이용하여 처리하는 시스템의 구현 및 성능 평가에 관한 것이다. XML 질의로 XQuery, XPath, XQL 등과 같은 모든 XML 질의어의 핵심 요소인 경로 표현식을 대상으로 하였고, XML 캐쉬는 XML 실체뷰를 고려하였고, 캐쉬를 이용한 XML 질의 변환 알고리즘은 [13]에 제시된 것을 대상으로 하였다. [13]의 질의 변환 알고리즘을 지원하는 프로토타입 XML저장 시스템이 관계 DBMS를 이용하여 구현되어 다양한 성능 실험에 이용되었다. 구현의 주요 이슈에 대하여 자세히 기술한다. 성능 실험 결과를 통해 캐쉬를 이용한 XML질의 처리의 효율성을 확인하였고, 기존 연구와의 성능 비교도 기술하였다.

온톨로지 기반의 SBML 변환기 (Ontology based SBML Converter)

  • 임정곤;김태경;정태성;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.259-261
    • /
    • 2004
  • 최근 이슈가 되고 있는 시스템 생물학(Systems Biology)은 생물학적인 이론과 컴퓨터의 계산적인 모델링 그리고 실험의 상호 의존적인 통합으로써 특징 지워진다. 그 중 컴퓨터의 계산적인 모델링에 대한 연구가 무엇보다 중요한 비중을 차지하고 있다. 하지만 계산적인 모델링에서 여러 자원을 통합하기 위한 공통의 기반 구조나 표준에 대한 연구는 미흡한 실정이다. 이러한 문제점을 해결하기 위해 KML 기반의 형식을 갖춘 SBML(Systems Biology Markup Language)이 시스템 생물학의 표준으로 개발되어 연구 중에 있다. 현재 시스템 생물학 분야에서 개발중인 시뮬레이션과 데이터 분석을 위한 다양한 응용 어플리케이션이 이미 SBML 문서를 지원하고 있다. 본 연구에서는 시스템 생물학 분야에서 SBML 표준에 대한 중요성을 인식하여, 객체지향 바이오 데이터베이스로부터 질의 결과를 SBML 문서로 변환하고, 반대로 외부의 SBML 문서를 객체지향 데이터베이스에 저장하는 변환기를 제안하며, 데이터를 검색하고 저장하는데 발생하는 중복이나 동의어 관계의 모호성을 줄이고 정확성을 높이기 위한 방안으로 온톨로지 기법을 적용한다.

  • PDF

이질의 생물 정보원 통합을 위한 랩퍼 시스템에서의 XML 질의 처리 시스템 (An XML Query System in a Wrapper System for Integrating Heterogeneous Biological Databases)

  • 박은경;강동완;정채영;김현주;배종민
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.553-568
    • /
    • 2005
  • 분산된 생물 정보원을 물리적으로 혹은 가상적으로 통합하기 위해서는 정보원들의 이질성을 해결해야 하며, 사용자의 다양한 요구를 수용할 수 있도록 범용성과 적응력이 뛰어나야 한다 본 논문에서는 데이터는 물론 응용 프로그램의 통합을 위한 미들웨어를 설계함에 있어서 랩퍼 시스템에서의 융통성 있는 범용 XML 질의 처리 엔진을 제시한다. 제시된 질의 처리 엔진은 사용자 정의 XML 뷰를 지원함으로서 융통성 있는 통합 질의 구성을 가능하게 한다. 질의 처리 과정은 뷰 합성, 지역 정보원에 대한 질의 변환, 그리고 결과 문서 생성과정을 동반하는데, 이를 위해 XML 뷰와 XML 질의어를 뷰 트리로 표현하는 XML 뷰 트리 기반의 질의 처리 모델을 제시한다. 그리고 제시된 질의 처리 모델의 범용성을 확인하기 위해 관계형 데이터베이스와 웹 정보원, 그리고 응용 프로그램에 대하여 정보원의 질의 결과 형이 관계형 튜플과 XML 문서인 경우에 대한 질의 처리 방법을 제시한다.

맥락적 어휘 지식 그래프 추출 알고리즘의 설계 (Design of a Contextual Lexical Knowledge Graph Extraction Algorithm)

  • 남상하;최규현;함영균;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.147-151
    • /
    • 2016
  • 본 논문에서는 Reified 트리플 추출을 위한 한국어 개방형 정보추출 방법을 제시한다. 시맨틱웹 분야에서 지식은 흔히 RDF 트리플 형태로 표현되지만, 자연언어문장은 복수개의 서술어와 논항간의 관계로 구성되어 있다. 이러한 이유로, 시맨틱웹의 대표적인 지식표현법인 트리플을 따름과 동시에 문장의 의존구조를 반영하여 복수개의 술어와 논항간의 관계를 지식화하는 새로운 개방형 정보추출 시스템이 필요하다. 본 논문에서는 문장 구조에 대한 일관성있는 변환을 고려한 새로운 개방형 정보추출 방법을 제안하며, 개체중심의 지식과 사건중심의 지식을 함께 표현할 수 있는 Reified 트리플 추출방법을 제안한다. 본 논문에서 제안한 방법의 우수성과 실효성을 입증하기 위해 한국어 위키피디아 알찬글 본문을 대상으로 추출된 지식의 양과 정확도 측정 실험을 수행하였고, 본 논문에서 제안한 방식을 응용한 의사 SPARQL 질의 생성 모듈에 대해 소개한다.

  • PDF

관계형 데이터베이스 환경에서의 XQuery Processor 설계 및 구현 (Design and Implementation of XQuery processor using Relational Technologies)

  • 정민경;홍동권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.23-26
    • /
    • 2005
  • XML이 발표되면서 대용량의 XML을 효과적으로 관리하는 여러 가지 방법들이 연구되고 있다. 특히 지금까지 상업적, 기술적으로 성공적이고 안정된 데이터 모델인 관계형 데이터베이스를 활용하는 여러 가지 방법들이 연구되고 있다. 본 논문은 관계형 DBMS를 사용하여 XML 질의어인 XQuery를 SQL로 변환하여 처리하는 효율적인 방법을 제안한다. 우선 본 논문에서 제안하는 방식은 XML문서를 분할하여 관계형 테이블에 저장하는 분할방식을 사용하며, 분할된 관계형 테이블을 이용하여 XPath를 포함한 XQuery의 기능을 실행하는 SQL을 생성하여 관계형 DBMS에서 SQL을 실행하는 방식을 사용한다. 제안한 XQuery 처리방식은 먼저 XQuery의 구문 분석을 통하여 AST(Abstract Syntax Tree)를 생성하고, AST를 순회하면서 SQL문장을 생성한다. 생성된 SQL문장은 XML 문서의 경로를 사용함으로써 XQuery 연산의 조인 횟수를 감소시키며, 각 노드마다 부여된 순서 정보를 효과적으로 사용하여 문서의 원래 순서에 맞는 XML 부분을 생성하는 방법을 제시한다. 그리고 실제 제안된 시스템을 개발하여 그 성능을 평가한다.

  • PDF

토픽 모델을 이용한 수학식 검색 결과 재랭킹 (Reranking Search Results for Mathematical Equation Retrieval Using Topic Models)

  • 양선;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.77-81
    • /
    • 2013
  • 본 논문은 두 가지 주제에 대해 연구한다. 첫 번째는 수학식 검색에 대한 것이다. 웹에는 양질의 수학식 데이터가 마크업 언어 형태로 저장되어 있으며 이를 활용하기 위한 연구들이 활발히 진행되고 있다. 본 연구에서는 MathML (Mathematical Markup Language)로 저장된 수학식 데이터를 일반 질의어를 이용하여 검색한다. 두 번째 주제는 토픽 모델(topic model)로 검색 성능을 향상시키는 방법에 대한 것이다. 먼저 수학식 데이터를 일반 자연어 문장으로 변환한 후 Indri 시스템을 이용하여 검색을 수행하고, 토픽 모델을 이용하여 미리 산출된 스코어를 적용하여 검색 순위를 재랭킹한 결과, MRR 기준 평균 5%의 성능을 향상시킬 수 있었다.

  • PDF

맥락적 어휘 지식 그래프 추출 알고리즘의 설계 (Design of a Contextual Lexical Knowledge Graph Extraction Algorithm)

  • 남상하;최규현;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.147-151
    • /
    • 2016
  • 본 논문에서는 Reified 트리플 추출을 위한 한국어 개방형 정보추출 방법을 제시한다. 시맨틱웹 분야에서 지식은 흔히 RDF 트리플 형태로 표현되지만, 자연언어문장은 복수개의 서술어와 논항간의 관계로 구성되어 있다. 이러한 이유로, 시맨틱웹의 대표적인 지식표현법인 트리플을 따름과 동시에 문장의 의존구조를 반영하여 복수개의 술어와 논항간의 관계를 지식화하는 새로운 개방형 정보추출 시스템이 필요하다. 본 논문에서는 문장 구조에 대한 일관성있는 변환을 고려한 새로운 개방형 정보추출 방법을 제안하며, 개체 중심의 지식과 사건중심의 지식을 함께 표현할 수 있는 Reified 트리플 추출방법을 제안한다. 본 논문에서 제안한 방법의 우수성과 실효성을 입증하기 위해 한국어 위키피디아 알찬글 본문을 대상으로 추출된 지식의 양과 정확도 측정 실험을 수행하였고, 본 논문에서 제안한 방식을 응용한 의사 SPARQL 질의 생성 모듈에 대해 소개한다.

  • PDF

User Interface 기반 스크립트 설계를 통한 대화형 에이전트의 지식 표현 (Knowledge Representation of Conversational Agent using Script Design based on User Interface)

  • 김경민;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.427-729
    • /
    • 2003
  • 인터넷의 사용이 보편화됨에 따라 빠르게 변화하는 사용자의 요구를 만족시킴과 동시에 편리하고 유용한 서비스를 제공하기 위하여 사용자와 자연스럽게 의사소통할 수 있는 대화형 에이전트의 연구가 활발히 진행되고 있다. 그러나 현재 상용되고 있는 대부분의 대화형 에이전트들은 도메인 제한적 정보만을 제공하는 경향이 있어 도메인 변경의 경우 스크립트에서부터 새롭게 설계해야 하는 이중 부담을 겪고 있다. 본 논문에서는 스크립트 설계자가 특별한 사전 지식 없이도 간단한 입력 절차만 거쳐 자동으로 스크립트를 재구성할 수 있는 스크립트 인터페이스 구현에 초점을 맞춘다. 이 때 자연어로 입력되는 사용자 질의의 다양한 어휘들을 자동으로 대표 언어로 변환시킬 수 있도록 온톨로지 개념을 도입하여 동의어 사전을 구축함으로써 시스템의 효율성을 극대화한다. 또한 질의에 대한 다양한 답변 생성을 가능하게 하며, 실제 의류 사이트를 안내하는 대화형 에이전트를 구현하여 적용해 봄으로써 그 가능성을 알아본다.

  • PDF