• Title/Summary/Keyword: Semantic retrieval

검색결과 397건 처리시간 0.022초

백과사전 질의응답 시스템을 위한 의미적 단락 생성 및 검색 기법 (Method of Semantic Passage Generation and Retrieval for Encyclopedia QA system)

  • 이충희;오효정;김현진;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.159-166
    • /
    • 2004
  • 본 논문에서는 질의응답 시스템에서 질문의 주제와 개념적으로 일치하는 단락으로부터 정보를 추출할 경우에 보다 정확한 정답을 추출할 수 있다는 가정 하에 문장 주제를 활용한 의미적 단락 생성 및 검색 기법을 제안한다. 문장주제란 백과사전 문서 집합에서 공통으로 기술하는 내용이나 자주 언급하고 있는 사건 혹은 개념들의 집합을 의미하는 것으로, 주제별로 응집된 문장들로 재구성된 단락을 의미적 단락이라고 정의한다. 제안된 방법의 성능을 평가하기 위해 의미적 단락의 신뢰도를 파악하고, 백과사전 본문을 3문장 단위로 잘라서 고정길이 단락을 만든 후 의미적 단락의 검색결과와 비교하였다. 평가척도로는 TREC의 역순위평균(MRR : Mean Reciprocal Rank)과 상위 5개 단락 안에 정답유무를 측정하는 사용자 정답만족도를 사용하였다. ETRI 평가셋을 대상으로 한 실험 결과, 주제를 이용한 의미적 단락 검색 성능이 고정길이 단락 검색보다 우수함을 알 수 있었다.

  • PDF

다국어 질의응답을 위한 한국어 해석 시스템 설계 및 구현 (Design and Implementation of a Korean Analysis System for Multi-lingual Query Answering)

  • 강원석;황도삼
    • 컴퓨터교육학회논문지
    • /
    • 제7권4호
    • /
    • pp.43-50
    • /
    • 2004
  • 다국어 질의 응답 시스템은 여러 언어의 질의에 대한 응답을 하는 시스템이다. LASSO 시스템은 다국어 질의응답 시스템 중의 하나이다. 본 논문은 LASSO 시스템을 위한 한국어 해석 시스템의 설계 및 구현에 관한 것이다. 질의 응답을 위한 한국어 해석 시스템은 한국어 질의를 처리할 수 있는 대화체 처리 기술이 필요하다. 그리고 다양한 분야의 질의에 대한 응답을 할 수 있는 범용의 시스템이어야 한다. 본 논문의 한국어 해석 시스템은 이와 같은 사항을 만족하기 위하여 심도 깊은 대화체 처리 기술보다 실용성이 높은 휴리스틱 규칙을 활용하였다. 이 시스템은 다국어 질의 응답 시스템의 한국어 인터페이스 역할을 하는 것으로 질의 응답 시스템의 목적에 맞게 설계, 구현되었다. 본 해석 시스템에 적용된 기술은 정보검색 분야와 한국어 해석 분야에 응용할 수 있다.

  • PDF

정보검색시스템의 확률 및 벡터모델에 대한 질의 확장 검색 성능 평가 (Extended Query Search Performance Evaluations for Vector Model and Probabilistic Model of Information System)

  • 전유정;변동률;박순철
    • 한국산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.36-42
    • /
    • 2004
  • 본 논문은 벡터모델과 확률모델의 성능 비교에 관한 연구이다. 벡터모델로써는 잠재적 의미를 적용한 검색 결과를 찾기 위해 사용되는 LSI 모델을 이용하였다. 확률모델로써는 현재 상용화 단계에 있는 콘도르 정보검색 시스템을 적용하였다. 각 모델 시스템의 검색 성능 비교를 위한 실험은 사용자가 입력한 원래 질의어에 관한 검색 결과를 바탕으로 성능을 비교한 후에, 사전적 의미를 적용한 확장 질의어에 대한 검색 결과를 추가하여 비교하였다. 본 연구에서는 입력된 질의어와 관련된 용어를 추가하여 검색하였을 경우, 확률모델에 비해 벡터모델에서 성능이 대부분의 질의어에 대해서 향상됨을 보인다.

  • PDF

분산 시각미디어 검색 프레임워크를 위한 모니터링 시스템 (The Monitoring System for Semantic Web based Visual Media Retrieval Framework)

  • 심준용;김세창;원재훈;김정선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.178-180
    • /
    • 2006
  • 기존의 Ontology를 이용한 이미지 검색 시스템이나. 간단한 구조를 가진 메타데이터 기반의 분산 이미지 검색 시스템들의 단정들을 극복하기 위해 다양한 이미지 제공자들의 자율성을 보장하면서, 시맨틱 기반의 이미지 검색을 지원하는 분산 시각미디어 검색 프레임워크가 제안되었다. 하지만 제안된 프레임워크에서는 Visual Media Data를 제공하는 Provider와 클라이언트의 Query를 처리해서 Provider에게 전달하는 Broker 사이의 연결 상태에 대한 신뢰성이 보장되지 않았고, 다수의 클라이언트 접속에 의해 발생하는 Broker 내부 컴포넌트들의 Overhead 문제를 효과적으로 해결할 수 없었다. 본 논문에서는 기존의 프레임워크에 Monitoring 시스템을 도입하여 Broker 내부 컴포넌트들의 수행시간을 측정하여 저장함으로써, 다수의 클라이언트 요구에 의해서 Overhead가 발생하는 컴포넌트들을 Monitoring 할 수 있고, Provider의 연결 상태를 정기적으로 확인하여 Broker 내부에 등록되어 있는 Provider의 도메인 리스트를 서버 상태가 확인된 리스트로 업데이트 시켜줌으로써 연결 상태에 대한 신뢰성을 제공할 수 있도록 하기 위한 Monitoring 시스템을 제안한다.

  • PDF

사용자 어휘지능망을 이용한 의미적 정보검색 (Semantic Information Retrieval using User-Word Intelligent Network)

  • 김창환;임지희;최호섭;윤화묵;옥철영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.157-160
    • /
    • 2006
  • 웹 자원이 방대함에 따라, 사용자가 원하는 정보를 얼마나 정확하게 제시하느냐가 정보검색시스템 성능을 판단하는 기준이 된다. 그러나 동형이의어만을 질의어로 이용한 검색 결과는 동형이의어 각 의미에 관련된 문서가 혼재되어 있거나, 특정 의미에 관련된 문서가 집중적으로 나타나는 현상을 볼 수 있다. 이에 본 논문에서는 한국어 사용자 어휘지능망(U-WIN)의 관계정보를 이용하여 질의어의 모호성을 해결하고 의미적 정보검색의 기반을 마련하고자 한다. 우선, 전문분야에 주로 사용되는 동형이의어와 보편적으로 사용하는 동형의어를 구번하여 질의어로 선정하고, '질의어+상위어' 형태의 확장 질의어에 대해 두 개의 포탈사이트(Google, Naver)를 대상으로 웹 문서를 검색하여 정확률이 각각 81.5%(Naver), 65.5%(Google)로 나타났다.

  • PDF

색인어 말뭉치 처리를 기반으로 한 웹 정보검색 시스템의 설계 (Design of WWW IR System Based on Keyword Clustering Architecture)

  • 송점동;이정현;최준혁
    • 정보학연구
    • /
    • 제1권1호
    • /
    • pp.13-26
    • /
    • 1998
  • 대부분의 정보검색시스템들은 부적절한 색인어들에 의해 가끔 사용자의 의도에 맞지 않는 전혀 다른 검색 결과가 나타난다. 그것은 시스템이 색인어들을 검색하기 위해 그 의미가 아닌, 단지 용어로서만 고려하기 때문이다. 검색 정확도의 증진을 위해 색인어는 연관된 용어 사용 빈도와 역 빈도 사용으로 검색되고 동시 발생어는 원시 문서로부터 추출된다. 결과적으로 색인어는 계산된 상호 정보들을 사용함으로써 그들의 세맨틱에 의해 클러스팅된다. 이 논문은 재현율의 감소없이 클라이언트 사용자 모듈로부터 피드백에 따라 세분된 세맨틱 정보를 사용하여 부적절한 검색 결과를 거절함으로써 검색 효율을 높일 수 있도록 설계하였다.

  • PDF

An Image Retrieving Scheme Using Salient Features and Annotation Watermarking

  • Wang, Jenq-Haur;Liu, Chuan-Ming;Syu, Jhih-Siang;Chen, Yen-Lin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권1호
    • /
    • pp.213-231
    • /
    • 2014
  • Existing image search systems allow users to search images by keywords, or by example images through content-based image retrieval (CBIR). On the other hand, users might learn more relevant textual information about an image from its text captions or surrounding contexts within documents or Web pages. Without such contexts, it's difficult to extract semantic description directly from the image content. In this paper, we propose an annotation watermarking system for users to embed text descriptions, and retrieve more relevant textual information from similar images. First, tags associated with an image are converted by two-dimensional code and embedded into the image by discrete wavelet transform (DWT). Next, for images without annotations, similar images can be obtained by CBIR techniques and embedded annotations can be extracted. Specifically, we use global features such as color ratios and dominant sub-image colors for preliminary filtering. Then, local features such as Scale-Invariant Feature Transform (SIFT) descriptors are extracted for similarity matching. This design can achieve good effectiveness with reasonable processing time in practical systems. Our experimental results showed good accuracy in retrieving similar images and extracting relevant tags from similar images.

정보 검색에서의 잠재 의미 분석 방법을 이용한 응집 계층 군집화 기법 연구 (Agglomerative Hierarchical Clustering Using Latent Semantic Analysis in Information Retrieval)

  • ;강대현;박한샘;권경락;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.952-955
    • /
    • 2014
  • 본 논문에서는 정보 검색 분야에서 잘 알려진 잠재 의미 분석 방법과 계층적 군집화 방법의 단점을 상호 보완하여 보다 효율적인 정보 검색을 위한 혼합형 군집화 방법을 제안한다. 먼저, 잠재 의미 분석 방법은 벡터 연산을 통하여 자동적으로 문서 내에 있는 잠재적인 의미를 찾는 정보 검색분야에서 많이 사용되는 고전적인 방법이다. 그러나 이 방법은 언어의 유의성이나 다의성으로 인하여 발생되는 백-오브-워드(bag-of-word) 문제를 가지고 있다. 두 번째 방법인 문서 군집화를 위하여 범용적으로 사용되고 있는 계층적 군집화 방법이다. 이 방법은 이를 통하여 분석된 군집의 질적 측면에서 볼 때, 여전히 단층적 군집들이 많이 형성되어 세부적인 분석을 통한 추가적인 군집화가 필요함을 알 수 있다. 따라서, 본 논문에서는 앞서 언급한 문제점을 해결하기 위하여 혼합적인 방법으로 잠재 의미 분석 방법을 이용한 응집 계층 군집화 방법을 제안한다. 제안한 방법을 이용하여 잘 알려진 두 개의 데이터에 적용하고 기존의 방법과 그 결과를 비교함으로써 군집의 질적 측면에서의 우수함을 보인다.

Towards Improving Causality Mining using BERT with Multi-level Feature Networks

  • Ali, Wajid;Zuo, Wanli;Ali, Rahman;Rahman, Gohar;Zuo, Xianglin;Ullah, Inam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권10호
    • /
    • pp.3230-3255
    • /
    • 2022
  • Causality mining in NLP is a significant area of interest, which benefits in many daily life applications, including decision making, business risk management, question answering, future event prediction, scenario generation, and information retrieval. Mining those causalities was a challenging and open problem for the prior non-statistical and statistical techniques using web sources that required hand-crafted linguistics patterns for feature engineering, which were subject to domain knowledge and required much human effort. Those studies overlooked implicit, ambiguous, and heterogeneous causality and focused on explicit causality mining. In contrast to statistical and non-statistical approaches, we present Bidirectional Encoder Representations from Transformers (BERT) integrated with Multi-level Feature Networks (MFN) for causality recognition, called BERT+MFN for causality recognition in noisy and informal web datasets without human-designed features. In our model, MFN consists of a three-column knowledge-oriented network (TC-KN), bi-LSTM, and Relation Network (RN) that mine causality information at the segment level. BERT captures semantic features at the word level. We perform experiments on Alternative Lexicalization (AltLexes) datasets. The experimental outcomes show that our model outperforms baseline causality and text mining techniques.

Eye-Tracking Method를 이용한 메뉴구조 설계 및 평가 (Information Architecture Design Using Eye-tracking Method)

  • 박종순;명노해
    • 한국HCI학회논문지
    • /
    • 제2권1호
    • /
    • pp.33-39
    • /
    • 2007
  • 디지털 컨버전스 제품은 복잡한 정보 구조로 인한 인지적 과부하로 메뉴로 부터 효과적인 정보 인출의 방해를 초래하고 있다. 이러한 인지적 과부하를 완화하기 위해서 현재까지 크게 두 가지 방법(메뉴의 폭과 깊이에 관련된 물리적 방법과 메뉴 타이틀에 관련된 어의적 방법)을 사용하여 효과적인 메뉴구조를 만들기 위하여 노력하여 왔다. 본 연구는 visual search에 수반되는 Fixation과 Fixation Duration을 사용한 또 다른 어의적 방법론을 제안하여 메뉴구조 설계 방법으로서의 효능을 입증하고자 한다. 특히, Fixation은 인간의 인지 모델에 따라 자동적으로 이루어지기 때문에 Fixation을 통해 정보 구조와 인지 모델간의 일치 여부를 파악할 수 있으므로 인지적으로 잘 설계된 메뉴 구조는 Fixation 수와 Duration이 잘못 설계된 메뉴구조보다 적다는 가설이 성립된다. 이러한 가설의 검정을 위하여 본 연구에서는 Eye-Tracking 장비를 사용하여 메뉴 수정 전 후의 Fixation 수와 Duration을 측정하여 비교하였다. 그 결과 수정 후의 Fixation 수와 Duration이 유의하게 감소됨으로서 수정 후의 메뉴구조가 수정 전보다 효과적인 메뉴구조임을 알 수 있다. 다시 말해서 본 연구에서 제안한 visual search에 수반되는 Fixation과 Fixation Duration을 사용한 메뉴구조 설계 방법론이 효과적인 방법이라는 것이 증명되었다.

  • PDF