• 제목/요약/키워드: 질의 생성

검색결과 2,127건 처리시간 0.042초

정보검색 기법을 이용한 산업/직업 코드 분류 도구 (An automatic Industrial/Occupational Code Classification Tool Using Information Retrieval Technique)

  • 임희석;박두순
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.75-78
    • /
    • 2001
  • 본 논문은 통계청에서 실시하는 인구주택 총조사로부터 획득된 각 개인의 직업 및 직종을 기술하고 있는 자연어를 입력받아 입력된 자연어가 의미하는 한국 표준 산업/구업 분류 코드의 후보들을 생성하는 산업/직업 코드 분류 도구를 제안한다. 코드 분류는 분류할 코드를 문서 범주로 간주하면 문서 분류와 동일한 문제로 생각할 수 있다. 하지만 본 산업/직업 코드 분류 문제는 입력되는 자연어의 길이가 한 두 문장 정도로 매우 짧아 문서 분류에 사용될 자질들이 개수가 주어 기존의 문서 분류 기법을 적용하기 어렵다. 이에 본 논문은 표준 코드를 기술하고 있는 내용을 미리 색인하고 입력된 자연어로부터 질의어를 생성하여 벡터공간모델로 질의어를 검색후 질의어와 일치율이 가장 높은 코드들을 분류될 후보 코드로 계시하는 정보검색 기법을 이용한 산업/직업 코드 분류 도구를 개발하였다.

  • PDF

웹 정보 통합 및 검색을 위한 XML기반 미디에이터 시스템의 개발 (Development of an XML-based Mediator System for Web Information Integration and Retrieval)

  • 양정욱;홍동완;이덕형;윤지희
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.281-294
    • /
    • 2001
  • HMS(Hallym Mediator System)는 XML을 기본 데이터 모델로 하여 인터넷에 산재하여 있는 분산이질 정보에 대한 통합, 검색기능을 제공하는 미디에이터 시스템이다. 분산이질 정보의 공통 스키마 구조로서 XML DTD를 사용하며, 각종 정보에 대한 가상의 통합 뷰(view) 생성기능을 제공하여 웹 상의 통합된 가상정보 구조를 표현한다. 웹 상의 일반 사용자는 이와 같이 생성된 뷰 DTD를 근거로 분산이질 정보에 대한 구조적, 내용적 질의를 수행할 수 있다. HMS는 가상접근 기법(virtual approach) 기반의 정보검색 시스템으로서, 사용자 질의는 XML 형태의 소스 매핑정보를 이용하여 각 소스에 대한 부질의로 변환되며, 각 소스로부터의 검색결과는 시스템에 의하여 통합되어 XML 문서 형태로 돌아오게 된다. HMS에서 는 DTD 구동형의 비쥬얼 사용자 인터페이스를 제공하여, 관리자와 일반 사용자에게 직관적이고 간편한 가상정보 구축 및 질의검색 환경을 제공한다.

  • PDF

시멘틱 환경에서의 개인화 검색 (Personalized Search Service in Semantic Web)

  • 김제민;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.649-651
    • /
    • 2005
  • 웹에 분산된 모든 웹 페이지는 구조가 서로 다르다. 시멘틱 웹 환경은 이형적인 구조를 갖는 웹 페이지들의 메타데이터를 바탕으로 시멘틱 검색이 가능하다. 그러나 일반적으로 사용자의 요구에 따른 시멘틱 검색은 상황에 따라 엄청난 수의 검색 결과를 내놓는다. 따라서 검색 결과에 대해 각 사용자에 맞는 검색 결과 순위를 적용할 필요가 있다. Culture Finder는 시멘틱 웹 검색 에이전트들이 개인화된 문화 정보를 검색할 수 있도록 도움을 준다. Culture Finder는 웹에 존재하는 각 웹 페이지에 대한 메타 데이터를 작성하고, 시멘틱 검색을 이행하며, 사용자 프로파일을 기반으로 삼아 검색 결과일 대한 순위 점수를 계산한다. Culture Finder에는 개인화된 시멘틱 검색을 효율적으로 실행하기 위해 중요한 5가지 기법이 적용되었다. 사용자의 검색 행위로부터 사용자 프로파일을 생성하기위한 기계 학습기법, 시멘틱 웹 검색 에이전트를 위한 효율적인 시맨틱 검색 기법, 사용자 질의의 효과일인 파악을 위한 질의 분석 기법, 각 사용자에게 적합한 검색 결과를 제공하기 위한 순위 적용 기술, 메타데이터를 생성화기 위한 상위 온톤로지 표현 기법. 본 논문에서는 Culture Finder의 구조를 통해서 시멘틱 개인화 검색에 적용되는 여러 가지 방법을 제안한다.

  • PDF

XML 데이터의 갱신을 지원하는 확장된 SQL (An Extended SQL for Updating XML data)

  • 조영주;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.82-84
    • /
    • 2002
  • XML은 자기 서술적인 표현 언어라는 중요한 장점을 가지고 있기 때문에 인터넷 관련 응용들에서 정보의 표현 및 문서 교환의 표준으로 빠른 속도로 자리잡아 가고 있다. 본 논문에서는 SQL에 XPath 표현 중 일부를 추가하여 SQL을 확장함으로써 XML 문서에 대한 질의를 가능하게 하였고, 또한 SQL의 CRUD(Create, Read. Update, Delete) 기능을 그대로 사용함으로써 XML 문서의 변경이 가능한 XML 질의를 위한 새롭게 확장된 SQL을 제안하였다. 그리고 폭 넓게 사용되고 있는 ORDBMS 환경에서 XML 색인 정보를 자동 생성 관리하는 XML 저장 관리기 및 확장된 SQL 처리기를 설계하고 구현하였다. 본 논문에서 제안하는 확장된 SQL 처리기는 XML 원문 자체의 보관을 원칙으로 하여 완벽한 문서 복구 등에 따르는 부담을 제거하였고, XML 저장 문서에 대한 원본성 및 무결성을 쉽게 유지할 수 있도록 하였으며, 색인 정보를 자동 생성 관리함으로써 파일 처리 시간과 XML 트리 운행 시간 및 XPath 파싱 처리 시간을 줄였다. 또한, “path”라는 키워드를 추가로 관리함으로써 ORDBMS 환경에서 XML 질의를 위한 SQL 변환 과정에서 PATH의 깊이 만큼 조인이 중첩되는 문제를 배제하여 조인이 발생할 가능성을 줄이는 방법을 제시하였다.

  • PDF

연속적인 질의에서 사용자의 이동 경로를 보호하기 위한 연구 (A Study to Protect the User's Trajectory in Continuous Queries)

  • 송두희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.209-211
    • /
    • 2021
  • 위치를 이용한 애플리케이션이 증가함에 따라 사용자의 위치를 보호하기 위한 다양한 연구들이 진행되고 있다. 특히, 애플리케이션을 이용하기 위해서는 사용자가 서비스 제공자(서버)에게 자신의 위치 정보를 제공해야 하는 상황이다. 이러한 문제를 개선하기 위하여 보호영역(cloaking;클로킹)을 생성하거나 자신의 주변에 가상의 사용자(dummy;더미)를 생성하는 연구 등이 존재한다. 기존 연구들은 사용자의 현재 위치를 보호하는 장점은 있지만 연속적인 질의를 요청할 경우 서버에게 사용자의 이동 경로가 예측될 수 있다. 따라서 본 논문에서는 사용자가 연속적인 질의를 요청하더라도 이동 경로를 보호할 수 있는 기법을 제안한다. 실험 결과를 통하여 제안 기법의 우수성을 증명했다.

자연어 인터페이스를 위한 관계에 대한 자연어 표현 자동 수집 방법 (Automatic Collecting of Natural Language Expressions of Relations for Natural Language Interface)

  • 한용진;박세영;박성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.221-224
    • /
    • 2011
  • 관계에 대한 다양한 자연어 표현을 다루는 것은 구조 정보에 대한 자연어 질의 인터페이스 연구의 중요한 문제 중에 하나이다. 이러한 문제를 해결하기 위한 기존의 연구들은 자연어 질의 인터페이스를 대상 분야에 적합하게 구축하기 위한 수작업에 의존하였다. 이러한 접근은 소규모 구조 정보에 대한 자연어 질의 인터페이스 구축 시 효율적으로 적용될 수 있다. 하지만 최근에는 RDF와 OWL과 같은 그래프 구조 정보가 다양한 분야에서 대량으로 생성되고 있다. 수작업에 의존하는 접근을 통해 이러한 대량의 그래프 구조 정보에 대한 자연어 인터페이스를 구축하기에는 어려움이 있다. 본 논문은 자연어 인터페이스에 대한 자연어 표현의 다양성 문제를 해결하기 위해 자동으로 관계에 대한 자연어 표현을 수집하는 방법을 제안한다. 그래프 구조 정보에서 관계는 두 객체를 연결하는 유일한 에지(edge)로 표현된다. 제안한 방법은 주어진 에지로 연결되는 서로 다른 객체 쌍을 말뭉치(corpus)에서 검색하고 검색된 객체 쌍 주변에서 빈번하게 등장하는 자연어 표현을 수집한다. 자동으로 수집한 자연어 질의 표현을 자연어 인터페이스에 적용한 결과 수작업에 의존하는 기존 연구들과 비교할 만한 실험 결과를 보였다.

이벤트 탐색을 사용하는 일정 영역 질의 응답 시스템의 구현 (A Domain-Dependent Question-Answering System)

  • 장두성;오종훈;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.414-421
    • /
    • 2001
  • 본 논문에서는 한정된 영역을 대상으로 하는 질의응답 시스템에서 사용자의 질의를 해석하고 적당한 대답을 생성하기 위해 백과사전이나 일반사전 등과 같은 지식원에서 추출된 구조화된 지식을 사용하는 과정을 기술한다. 질의응답을 위하여 지식원은 그 단락의 의미에 따라 구조화되고 각 단락은 논리형식으로 변환되었으며, 논리형식 내 각 개체들은 사전 정의문에 따라 확장되었다. 이 구조화된 지식은 입력된 자연언어 질의문에서 질의의 의도를 추출하고, 질의에 포함되어 있는 지식에 의미속성을 부착하기 위해 사용된다. 지식원의 논리형식 변환을 위해 한국어의 논리형식이 도입되었으며, 사용된 지식원은 우리말 큰사전과 계몽백과사전의 30여개 질병정의문이다.

  • PDF

개념 기반 질의-응답 시스템에서의 정답 추출 (Answer Extraction of Concept based Question-Answering System)

  • 안영민;오수현;강유환;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2005년도 춘계 종합학술대회 논문집
    • /
    • pp.448-451
    • /
    • 2005
  • 본 논문에서는 개념 기반 질의-응답 시스템에서의 정답 추출 방법에 대하여 기술한다. 개념 기반 질의-응답 시스템은 개념 정보를 이용하여 해답을 추출하는 시스템을 말하며, 질의분석을 통해 분류되고 추출된 개념 그에 따른 정답 추출 규칙을 이용하여 정답을 추출하는 방법과 시스템에 대하여 연구하였다. 질의에 대한 정답이 들어 있는 문서들을 분석하여 정답 추출 규칙을 작성한다. 규칙은 개념과 구문정보를 포함하고 있으며 작성된 규칙을 통하여 문서로부터 정답후보를 생성하고 정답을 선택한다.

  • PDF

XML 뷰를 지원하는 랩퍼에서 트리 기반의 XML 뷰 합성 모델 (A Tree-Based View Composition Model in Storage Wrapper Supporting XML Views)

  • 강동완;배종민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1481-1484
    • /
    • 2003
  • XML 뷰 기반의 랩퍼 시스템은 지역 데이터베이스에 대한 XML 뷰 정의를 지원하고, 사용자는 XML 질의어를 이용하여 XML 뷰에 대한 질의를 할 수 있다. 이 때, XML 뷰와 질의간의 합성이 필수적인데, 본 논문에서는 XML 뷰와 사용자 질의를 높은 수준에서 추상화하여 모두 트리로 표현하고, 이것을 이용하여 질의에 나타난 뷰의 경로식에 대한 항해를 통해 합성을 수행하는 모델을 제시한다. 뷰 트리는 가상의 XML 문서의 구조를 그대로 반영하기 때문에 경로식의 항해를 쉽게 하며, XML 뷰의 스키마를 생성하고, 질의 결과 문서를 구성하는 템플릿으로 활용된다. 또한, XML 뷰와 질의의 추상화된 개념적 통일은 다단계 XML 뷰 정의와 합성을 지원하고, 구현을 용이하게 한다.

  • PDF

키워드 패턴을 이용한 질의유형 분류 시스템 구현 (Implementation of a Question Type Classification System using Keyword Patterns)

  • 안혁주;김민경;김학수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.813-815
    • /
    • 2015
  • 질의응답 시스템에서 정답선택의 정확률을 향상시키기 위해 본 논문은 패턴과 휴리스틱을 기반으로 하는 질의유형 추출 시스템을 구현하는 방법을 제안한다. 질의유형은 DBPedia에서 사용하는 클래스타입을 기반으로 추출되며 질의유형에 포함하는 키워드패턴들을 수집하여 키워드패턴 데이터를 생성한다. 그 후 한국어 질의에서 많이 발생하는 유형을 분석하여 휴리스틱을 이용해 사용자가 의도한 질의 유형을 출력한다. 제안시스템은 기존 연구에 비해 구축과 수정이 쉽다는 장점이 있다.