• 제목/요약/키워드: 키워드 질의

검색결과 278건 처리시간 0.024초

국가R&D정보를 활용한 기업 대표 키워드 DB 구축 방법 (Enterprise Representative Keyword Database Construction from National R&D Information Collection)

  • 한희준;김병정;최희석;김재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.279-280
    • /
    • 2014
  • 기업이 원하는 R&D정보를 추출하기 위해서는 R&D정보 검색에 활용할 질의어가 있어야 한다. 먼저 구축되어야 한다. 기업마다 관심있는 제품과 기술 키워드가 각각 다르다. 기업에 적합한 R&D정보를 생성하기 위해 질어어로 사용될 기업을 대표하는 키워드 군을 생성하고자 한다. 본 논문에서는 2002년부터 기업이 수행한 국가 R&D과제정보와 과제에서 도출된 논문, 특허, 연구보고서 등 성과정보로 부터 기업을 대표하는 키워드를 추출하고 이를 웹에서 크롤링한 기업정보와 비교하여 기업 대표 키워드 데이터베이스를 구축하는 방안에 대해 논한다.

  • PDF

문서 말뭉치 기반 질의응답 시스템 (Text Corpus-based Question Answering System)

  • 김한준;김민경;장재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권3호
    • /
    • pp.375-383
    • /
    • 2010
  • 질의응답시스템을 구축하는데 있어서 사용자 질의로 입력된 자연어 문장을 문법적 또는 의미적으로 완벽하게 분석하는 작업과 그 질의에 대한 정확한 답변을 찾아내는 작업은 쉬운 일이 아니다. 본 논문에서는 질의응답시스템 구축의 난제를 극복하기 위해, 문서 말뭉치에 기반하여 질의문을 자동 생성, 저장하여 이를 키워드로 검색하는 새로운 방식의 시스템을 제안한다. 질의문 생성을 위한 기본 아이디어는 수집 문서의 주요 문장에 대해 고유명사인식 기술을 활용하여 사람, 사물, 장소, 시간 등의 고유명사를 인식한 후, 각 고유명사에 해당하는 자연어 질의문을 생성하는 것이다. 질의문은 두가지 유형인 단순형 및 문장구조유지형 질의문으로 구분한다. 시스템은 이렇게 준비된 질의문 데이터베이스를 가지고 입력된 검색 키워드에 대하여 관련 질의문과 답변을 쉽게 얻을 수 있다. 본 연구의 관건은 생성된 질의문이 명확한 해답을 도출할 수 있는 의미있는 질의문을 생성하는 것이다. 이를 위해 본 연구에서는 질의문의 원천이 되는 평서문장을 선별하는 원칙과 선별된 평서문으로부터 의미있는 질의문을 생성하는 방법론을 제시한다.

XML DOM을 이용한 웹문서 검색 알고리즘 (Retrieval algorithm for Web Document using XML DOM)

  • 김노환;정충교
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권6호
    • /
    • pp.775-782
    • /
    • 2001
  • 현재까지 웹 검색엔진은 각 문서가 어떤 키워드를 얼마나 갖고 있는지, 키워드의 빈도수에 따라서, 문서에 키워드를 많이 포함하는 문서가 가까운 문서라는 가정에 의거 문서 순위를 사용자에게 보여주는 형태였다. 이런 형태의 검색은 HTML 웹 데이터처럼 구조적인 정보를 포함하지 않은 일반 문서형태의 경우 키워드의 발생빈도를 고려하는 형태에서는 별 문제가 없지만 구조적인 정보를 갖고 있는 XML로 표현된 웹 데이터일 경우에는 그래프 형태의 모델표현이 가능하기 때문에 단순히 키워드의 빈도만을 고려하는 형태로서는 바른 검색결과를 얻을 수 없다. 따라서 XML 문서의 구조적인 특성을 최대한 활용하여 SQL과 유사한 형태의 질의를 통하여 원하는 데이터만을 추출한다면 단순히 키워드에 의존하는 형태의 질의를 탈피하며 보다 분명한 검색결과를 획득할 수 있다고 생각한다. 본 논문에서는 XML DOM을 이용하여 XML 데이터의 정보검색 시스템을 모델링하고, 이와 관련된 알고리즘을 제안하고자 한다.

  • PDF

사용자 질의 의미 해석을 위한 온톨로지 지식 기반 검색 (Ontology Knowledge based Information Retrieval for User Query Interpretation)

  • 김난주;표혜진;정훈;최의인
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.245-252
    • /
    • 2014
  • 시맨틱 검색은 논리적으로 표현된 지식 베이스를 사용하여 현재의 키워드 기반 검색보다 더 정확한 결과를 제공할 수 있다. 그러나 일반 사용자는 지식 기반의 복잡하고 정형화된 질의어와 스키마를 잘 알지 못한다. 그래서 검색 시스템은 사용자 키워드의 의미를 해석할 수 있어야 한다. 본 논문에서는 멀티미디어 콘텐츠의 시맨틱 검색을 위한 사용자 질의 의미 해석 시스템을 설명한다. 제안한 시스템은 도메인 온톨로지 기반으로 구축된 지식 베이스의 정형화된 구조에 의미 해석 과정이 통합된 온톨로지 지식 베이스 기반 검색 시스템이다.

MPEG-7 표준에 따른 내용기반 비디오 검색 시스템 (Content-based Video Indexing and Retrieval System using MPEG-7 Standard)

  • 김형준;김회율
    • 방송공학회논문지
    • /
    • 제9권2호
    • /
    • pp.151-163
    • /
    • 2004
  • 본 논문에서는 비디오의 효율적인 검색과 관리를 위해 MPEG-7 표준에 따른 내용기반 비디오 검색 시스템을 제안한다. 제안된 시스템은 비디오 DB 구축을 위한 인덱싱 모듈과 웹을 통한 비디오 검색 모듈로 구성되며 검색 모듈에서는 다양한 질의 방법을 지원한다. 비디오 인덱싱 모듈은 관리자가 입력한 키워드, 인덱싱 모듈이 자동으로 추출한 등장 인물 정보와 MPEG-7 비주얼 서술자와 같은 메타데이터를 서버에 저장한다. 일반 사용자는 웹을 통해 검색 모듈에 접근하며 키워드, 얼굴 예제 및 스케치 질의와 같은 다양한 질의 방법을 통해 원하는 비디오를 검색할 수 있다. 이러한 비디오 검색 시스템을 구성하기 위해서 본 논문에서는 효율적인 비디오 인덱싱을 위한 장면 전환 검출 방법으로 ATC(Adaptive Twin Comparison)와 사용자 편의성을 위한 개선된 내용기반 질의 방법으로 QBME(Query By Modified Example)를 제안한다. 실험에서 제안된 장면 전환 검출 방법이 기존의 방법보다 우수함을 보였고, 제안된 질의 방법을 통해 기존의 질의 방법인 QBE(Query By Example)나 QBS(Query By Sketch) 보다 사용자에게 검색의 편의성을 제공할 수 있음을 보였다.

추론엔진을 이용한 DAML-S 검색 시스템 (DAML-S Search System with Inference Engine)

  • 강민구;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.25-27
    • /
    • 2003
  • 현재 웹이 가지고 있는 문제점들을 해결하기 위해서 연구하고 있는 차세대 웹을 시멘틱 웹이라고 한다. 시멘틱 웹에서 다루고 있는 기술들은 다양하지만 요즈음 가장 부각되고 있는 기술이 DAML-S이다. DAML-S는 DAML+OIL기술을 기반으로 확장된 레이어를 제공하여 웹 서비스의 모호성(unambiguous)을 제거하고, 상호 운용성을 증가시키는 역할을 하고 있다. 본 논문에서는 DAML-S로 정의된 웹 서비스를 FOL 추론방법을 이용해서 검색하는 시스템을 제안한다. 이를 위해서 DAML-S를 PSO TRIPLE 형태로 변환하는 전처리 방법과 FOL 질의 방법을 제안한다. 본 시스템을 이용하면 기존의 키워드 기반의 검색 방법에서는 불가능하였던 질의 작성이 가능해 지며, 추론을 이용한 정확한 서비스 검색이 가능해 진다.

  • PDF

비디오 데이터를 위한 색상 히스토그램 기술 (Color Histogram Mechanism for Video Data)

  • 이종희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.299-301
    • /
    • 2010
  • 본 논문에서는 사용자의 키워드 학습과 비교 영역 학습을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화된 비디오 검색 시스템을 제안한다. 사용자의 기본적인 질의와 질의에 의해 추출된 키 프레임의 이미지를 선택함으로써 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 질의 이미지가 되어 색상 히스토그램 비교기법과 제안하는 비교 영역 학습 기법을 통해 가장 유사한 키 프레임을 검색한다.

  • PDF

순서를 고려하는 k-키워드 근접도 문제를 위한 빠른 알고리즘 (A Fast Algorithm for the k-Keyword Ordered Proximity Problem)

  • 김진욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권3호
    • /
    • pp.281-288
    • /
    • 2010
  • 웹 검색 엔진들은 질의에 대한 문서의 적합성을 판단하기 위한 방법의 하나로 근접도를 사용한다. 근접도는 키워드의 순서를 고려하지 않는 방식과 순서를 고려하는 방식이 모두 연구되어왔다. 본 논문에서는 k개 키워드의 순서를 모두 고려하는 근접도 문제를 위한 O(n) 시간 알고리즘을 제시한다. 이때, n은 k개의 키워드가 문서에 나타난 전체 횟수이다. 또한 실험을 통해 이전 연구 결과보다 k=2인 경우는 약 1.2배의 속도 향상을, k=5인 경우는 3배 이상의 속도 향상이 있음을 보인다.

온톨로지 기술과 스피어만 상관계수를 적용한 시맨틱 정보 검색 향상 (Improvement of the Semantic Information Retrieval using Ontology and Spearman Correlation Coefficients)

  • 이병욱
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.351-357
    • /
    • 2013
  • 질의 키워드의 정보 검색은 키워드의 의미가 다양하여 검색된 문서들이 사용자의 요구에 부합되지 않는 문제점을 가지며, 사용자의 상황과 특성이 사용자 마다 달라 정보가 매우 적고 연관성을 찾기 어렵다. 또한, 일반 상관 계수의 사용은 정보에 대한 연관성을 나타내지 못하는 문제가 있다. 본 연구에서는 시맨틱 웹 기술을 기반으로 인선에 필요한 다양한 개념들과 지식으로 구성된 인선 온톨로지와 인선 규칙들을 구축하고 규칙들을 지원하는 인선 절차와 인선 결과의 적합성을 확인할 수 있는 지식검색 시스템을 제안한다. 제안된 시스템에서는 스피어만 상관계수를 이용하여 사용자의 상황과 특성에 적합한 정보를 제공하여 제한적인 정보 추천의 단점을 해결하였다. 키워드 기반 검색과 시맨틱 기반 검색 실험 결과 시맨틱 기반 검색이 키워드 검색에 비하여 정확도는 90.3%, 재현율은 71.8%의 성능을 보였다.

키워드 질의를 이용한 순위화된 웹 서비스 검색 기법 (Ranked Web Service Retrieval by Keyword Search)

  • 이경하;이규철;김경옥
    • 한국전자거래학회지
    • /
    • 제13권2호
    • /
    • pp.213-223
    • /
    • 2008
  • 오늘날 XML 웹 서비스의 보급에 따라 많은 양의 서비스로부터 적합한 서비스들을 발견해 내는 문제는 중요한 문제로 부각되고 있다[7, 24]. 본 논문에서는 의미론적인 서비스 발견을 행하는 기존 연구와 다르게 구문적인 방법으로 서비스 발견 문제에 접근한다. 우리는 웹서비스 발견의 문제를 레지스트리에 저장된 웹 서비스 설명 정보들에 대한 정보 검색의 문제로 인식하고, 웹 서비스와 질의의 모델링과 유사도 측정을 통한 검색 기법을 고안하였다. 이 서비스 설명정보는 특정 구조를 가지는 XML 문서이며, 본 논문에서는 이를 대상으로 한 키워드 질의를 통해 서비스 발견을 수행한다. 본 논문의 특징은 다음과 같다. 사용자는 키워드 질의를 통해 순위화된 서비스 검색 결과를 제공받을 수 있다. 서비스 검색에 있어 기존 기법들과 달리 UDDI 레지스트리에 저장된 서비스 설명 정보와 WSDL 서비스 정의 모두를 활용한다. 또한 시스템은 기존 관계형 DBMS의 기능을 이용하여 구현됨으로써 의미적인 서비스 발견에 비해 구현이 용이하고, DBMS의 여러 장점을 취할 수 있다.

  • PDF