• Title/Summary/Keyword: 질의 언어

검색결과 806건 처리시간 0.028초

의미 기반의 질의 분석 및 확장 (Question Analysis and Expansion based on Semantics)

  • 신승은;박희근;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.50-59
    • /
    • 2007
  • 본 논문에서는 효율적인 정보검색을 위한 의미 기반의 질의 분석 및 확장을 제안한다. 기존의 정보검색 시스템들은 사용자 질의로 자연언어 질의를 허용하고 있지만 단순히 명사 단어의 색인어를 사용자 질의로부터 추출하여 정보검색에 활용하기 때문에 사용자의 질의 의도를 반영한 정보검색을 하지 못한다. 이러한 문제점을 해결하기 위해서 의미 기반 질의 분석 및 확장은 사용자의 질의를 의미적으로 분석하여, 질의유형을 결정하고 의미 자질들을 추출한다. 추출된 의미 자질들과 정답을 표현하기 위해 사용되는 구문구조를 이용하여 사용자 질의를 확장한다. 또한 확장된 질의를 이용하여 정답을 포함하는 관련문서들을 정보검색 결과의 상위에 랭크시킬 수 있는 방법을 제시한다. 비교적 짧지만 사용자의 질의 의도를 충분히 표현하고 있는 자연언어 질의에 대한 의미 기반의 질의 분석 및 확장을 통해 정보검색의 정확률을 향상시킬 수 있음을 보였다.

감각 언어를 이용한 칼라패턴 선택에 관한 연구 (A Study on the Color Patten Selection Using Linguistic Image Words)

  • 엄진섭;유원영;이준환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 추계학술대회 학술발표 논문집
    • /
    • pp.424-428
    • /
    • 1997
  • 본 논문에서는 사용자가 원하는 분위기의 칼라패턴을 추천하여 주는 칼라패턴 데이터 베이스 시스템을 제안하였다. 사용자가 원하는 분위기는 감각언어로 나타낼 수 있는데, 이 감각 언어를 이용한 9가지 심리적 척도의 감성 질의의 형태로 시스템에 입력되며 시스템은 입력된 질의와 칼라패턴의 감성 속성을 비교하여 사용자가 원하는 분위기의 칼라패턴을 추천한다. 이를 위하여 감각 언어의 9가지 실리적 척도에 대한 칼라패텬의 9가지으 감성 속성을 신경회로망을 이용하여 추출하였다. 칼라패턴 데이터 베이스 시스템은 패션 및 상품 디자인, 화랑의 회화 등의 데이터 베이스에서 소비자들의 요구에 좀 더 빠르게 접근하는 해결책을 제공해 줄 수 있을 것이다.

  • PDF

평균 상호정보량에 기반한 동음이의어 중의성 해소 (Homonym Disambiguation based on Average Mutual Information)

  • 허정;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.159-166
    • /
    • 2005
  • 자연언어처리의 목적은 컴퓨터가 자연어를 이해할 수 있도록 하여, 인간에게 다양한 정보를 정확하고 빠르게 전달할 수 있도록 하고자 하는 것이다. 이를 위해서는 언어의 의미를 정확히 파악하여야 하는데, 어휘 의미 중의성 해소가 필수적인 기술이다. 본 연구에서는 평균 상호정보량에 기반한 동음이의어 의미 중의성 해소 기술을 소개한다. 사전 뜻풀이를 이용하는 기존 연구들은 어휘들간의 정확한 매칭에 의존하기 때문에 자료부족 현상이 심각하였다. 그러나, 본 연구에서는 어휘들간의 연관계수인 상호정보량을 이용함으로써 이 문제를 완화시켰다. 또한, 상호정보량을 가지는 어휘 쌍의 비율, 의미 별 빈도 정보와 뜻풀이의 길이를 가중치로 반영하였다. 본 시스템의 평가를 위해 질의응답 평가셋의 500여 개의 질의와 정답단락을 대상으로 동음이의어 의미 중의성 해소 평가셋을 구축하였다. 평가셋에 기반하여 두 가지 유형의 실험을 수행하였다. 실험 결과는 평균 상호정보량만을 이용하였을 때 62.04%의 정확률을 보였고, 가중치를 활용하였을 때 83.42%의 정확률을 보였다.

  • PDF

SQL3 확장에 의한 멀티데이터베이스 시스템의 스키마 통합 (Schema Integration in Multidatabase System Using the Extension of SQL3)

  • 김미연;송주원;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.175-177
    • /
    • 2000
  • 이기종 DB에 분산 저장되어 있는 데이터를 통합하여 사용자가 단일한 환경 내에서 각종 데이터를 접근, 관리할 수 있는 기술로써 멀티데이터베이TM 시스템(Multidatabase System:MDBS)이 연구되어 왔다. 그러나, 기존의 MDBS 는 사용하는 통합 모델에 따라 데이터 정의 언어나 데이터 처리 언어를 새로 정의하여 사용하였기 때문에, 지역 데이터베이스 시스템의 사용자는 새로운 데이터 모델과 데이터베이스 언어를 습득해야 하는 문제가 발생한다. 그러므로, 이를 해결하기 위해 현재 표준으로 진행되고 SQL3를 기반으로 한 MDBS의 개발이 요구된다. 본 논문에서는 SQL3를 확장한 멀티 데이터베이스 질의 언어(Multidatabase Query Language: MQL)를 제시하고 MQL을 이용한 3단계 스키마 통합 방안을 제안하고자 한다.

  • PDF

봄밭: 한글 프로그래밍 언어 '새싹'을 지원하는 클라우드 IDE (Bombat: A Cloud IDE for 'Saesark,' a Korean Programming Language)

  • 안형준;송지원;류샤오;우균
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.49-50
    • /
    • 2016
  • 소프트웨어 산업의 중요성이 높아짐에 따라 소프트웨어 교육의 중요성 또한 높아지고 있다. 한글 프로그래밍 언어 새싹은 소프트웨어 교육의 질을 높이기 위해 개발된 언어다. 한편, 소프트웨어 교육에서 코딩은 중요한 요소 중 하나이다. 때문에, 코딩 환경을 개선하는 것 역시 소프트웨어 교육의 질을 높이는 것이다. 본 논문에서는 한글 프로그래밍 언어 새싹을 지원하는 클라우드 IDE 봄밭을 제시한다. 봄밭은 웹상에서 새싹 프로젝트 관리, 코드 제작 및 수정, 컴파일 및 실행 등의 기능을 지원한다.

  • PDF

확률적 정보 검색 모델에서의 유사 적합성 피드백 실험 (Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model)

  • 조봉현;이창기;안주희;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

구문 관계 정보를 이용한 한국어 질의-응답 시스템 (Korean Question-Answering System using Syntactic-Relation Information)

  • 신승은;이대연;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제4권2호
    • /
    • pp.36-42
    • /
    • 2004
  • 본 논문은 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위한 동사의 구문 관계 정보를 이용한 한국어 질의-응답 시스템에 대해 기술한다. 구문 관계 정보는 동사의 원형, 사용 패턴, 각 문장 성분들의 의미 속성, 유의 동사 등의 정보를 담고 있다. 문장 및 구에 대한 구문분석은 구문관계 정보에 나타난 동사에 의존적인 문장 성분들의 의미속성과 동사의 일반적인 사용 패턴을 활용한다. 또한 정답후보 문장들의 구문분석을 위해 구문 관계 정보를 사용하고, 질의문의 격 슬롯(case slot)으로부터 정답을 찾기 위해 구문관계 정보를 사용한다. 실험에서 동사의 구문 관계 정보의 이용이 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위해 한국어 질의-응답 시스템에 효율적으로 활용될 수 있음을 보였다.

  • PDF

단어 의미 표현과 질병 중심 의학 문서 클러스터 기반 의학 문서 검색 기법 (Method of Document Retrieval Using Word Embeddings and Disease-Centered Document Clusters)

  • 조승현;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.51-55
    • /
    • 2016
  • 본 논문에서는 임상 의사 결정 지원을 위한 UMLS와 위키피디아를 이용하여 지식 정보를 추출하고 질병 중심 문서 클러스터와 단어 의미 표현을 이용하여 질의 확장 및 문서를 재순위화하는 방법을 제안한다. 질의로는 해당 환자가 겪고 있는 증상들이 주어진다. UMLS와 위키피디아를 사용하여 병명과 병과 관련된 증상, 검사 방법, 치료 방법 정보를 추출하고 의학 인과 관계를 구축한다. 또한, 위키피디아에 나타나는 의학 용어들에 대하여 단어의 효율적인 의미 추정 기법을 이용하여 질병 어휘의 의미 표현 벡터를 구축하고 임상 인과 관계를 이용하여 질병 중심 문서 클러스터를 구축한다. 추출한 의학 정보를 이용하여 질의와 관련된 병명을 추출한다. 이후 질의와 관련된 병명과 단어 의미 표현을 이용하여 확장 질의를 선택한다. 또한, 질병 중심 문서 클러스터를 이용하여 문서 재순위화를 진행한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS) 2014, 2015 테스트 컬렉션에 대해 비교 평가한다.

  • PDF

Answer set 자동 구축을 위한 문서 필터링 (Document filtering for automatic construct ion of Answer Set)

  • 정용교;신승은;오효정;장명길;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-258
    • /
    • 2002
  • 본 논문은 의미기반 정보검색 소프트웨어 기술에서 정답 문서 자동 구축을 위한 문서 필터링기법을 제안한다. 문서 필터링은 1차 질의어와 문서간의 유사도와 2차 질의어와 문서간의 유사도를 이용하여 이루어지며, 1차 질의어와 문서간의 유사도를 구하기 위하여 개념 망과 백과사전 정보를 이용한 1차 질의어 확장 과정을 수행하고, 화장된 질의어와 문서와의 유사도를 계산한다. 1차 확장 질의어를 이용해 얻어진 결과 중 유사도가 상위 10%에 속하는 문서를 이용하여 2차 질의어 확장을 한다. 2차 질의어 확장은 상위 10% 문서에 출현하는 명사중 문서 출현 빈도가 임계치 이상인 명사를 선택하여 이루어지고, 그것을 이용하여 문서의 유사도를 계산한다. 이렇게 얻어진 두 가지의 유사도를 결합하여 문서들을 순위화하고 Accept Point를 이용하여 문서를 필터링한다.

  • PDF

연역 객체 지향 데이터베이스 언어 구현을 통한 XML 데이터 처리에 관한 연구 (On XML Data Processing through Implementing A Deductive and Object-oriented Database Language)

  • 김성규
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.991-998
    • /
    • 2002
  • 본 논문에서는 XML 데이터와 같은 비구조적인 데이터 처리와 추론을 필요로 하는 의미 웹(semantic web) 구축에 유리한 연역 객체 지향 데이터베이스(Deductive and Object-oriented Database) 언어구현을 통해 XML 데이터 처리에 대해 알아본다. 대량 문서 관리와 데이터 교환에 가장 유용한 마크업 언어로 알려진 XML을 이용하여 XML 데이터 모델을 연역객체지향 데이터베이스 모델로 바꾸는 방법에 대해 알아본 다음 이 연역객체 지향 데이터베이스를 다시 Connection Graph로 바꾸고 Connection Graph Resolution을 이용하여 어떻게 질의에 답할 수 있는지를 기술한다. 또한 데이터베이스 내의 계층 지식을 이용하여 효율적이면서도 같은 답을 주는 질의로 바꾸는 방법을 제시하고 이 방법이 효율적이며 논리적으로 타당하다는 점을 증명한다.