• 제목/요약/키워드: 의미 기반

검색결과 5,220건 처리시간 0.031초

의미적 연결 관계에 기반한 전자 카탈로그에서의 확장된 어휘 인덱스 구축 및 이를 이용한 검색 성능 향상 기법 (Construct ion of Keyword Index and Improved Search Methods for e-Catalogs Eased on Semantic Relationship)

  • 이동주;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.67-69
    • /
    • 2005
  • 본 논문에서는 기 구축된 전자 카탈로그를 의미적 연결 관계에 기초한 확장된 전자 카탈로그로 변환하는 방법을 제안한다. 이를 통해 구축된 확장된 전자 카탈로그에서 의미적 태깅에 의한 확장된 어휘 인덱스 구축 방안과, 이를 이용한 검색 성능 향상 기법을 제안한다. 기존의 전자 카탈로그는 상품 정보가 분류별로 생성된 테이블에 저장되고 저장된 테이블로부터 생성된 키워드 인덱스로부터 검색이 이루어 졌다. 이러한 검색은 상품이 가지는 정보를 데이터베이스에 구축된 테이블에만 한정하게 되어 전자 카탈로그에 포함된 상품이나 분류간의 의미적 연결 관계들을 충분히 이용하지 못하였다 전자 카탈로그에 내재된 의미적 요소를 충분히 활용하기 위해서는 전자 카탈로그를 의미적 연결 관계에 기초한 모델로 구성할 필요가 있다. 본 논문에서는 의미적 모델 기반 전자 카탈로그 시스템으로의 전환 과정을 XML형태의 명세를 이용해 반자동적으로 전환할 수 있는 툴을 구현하며, 단순 키워드 어휘 인덱스 구축이 아닌, 어휘 인덱스의 의미적 확장을 제안하고, 이를 위한 태그 요소로써 어휘에 대한 형태소 분석 결과, 수치 환산 및 확장 요소, 속성간의 도메인 정보 등을 제시하였다. 이를 기반으로 최적의 검색 결과를 얻어 내도록 하는 인접도 평가 함수에 적용하는 방법을 제시한다.

  • PDF

의미범주 및 거리 가중치를 고려한 통계기반 동형이의어 분별 시스템 (A Homonym Disambiguation System Based on Statistical Model Using Sense Category and Distance Weights)

  • 김준수;김창환;이왕우;이수동;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.487-493
    • /
    • 2001
  • 본 논문에서는 Bayes 정리를 적용한 통계기반 동형이의어 분별 시스템에 대한 외부실험 결과를 분석하여, 정확률 향상을 위한 의미범주 가중치 및 인접 어절에 대한 거리 가중치 모델을 제시한다. 의미 분별된 사전 뜻풀이말 코퍼스(120만 어절)에서 구축된 의미정보를 이용한 통계기반 동형이의어 분별 시스템을 사전 뜻풀이말 문장에 출현하는 동형이의어 의미 분별에 적용한 결과 상위 고빈도 200개의 동형이의어에 대해 평균 98.32% 정확률을 보였다. 내부 실험에 사용된 200개의 동형이의어 중 49개(체언 31개, 용언 18개)를 선별하여 이들 동형이의어를 포함하고 있는 50,703개의 문장을 세종계획 품사 부착 코퍼스(350만 어절)에서 추출하여 외부 실험을 하였다. 분별하고자 하는 동형이의어의 앞/뒤 5어절에 대해 의미범주 및 거리 가중치를 부여한 실험 결과 기존 통계기반 분별 모델 보다 2.93% 정확률이 향상되었다.

  • PDF

지능형 전자상거래를 위한 온톨로지의 효율적인 생성

  • 김태석;양진혁;이지홍;손종수;정인정
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.273-279
    • /
    • 2005
  • 월드와이드웹 (WWW) 기반의 전자상거래는 주로 데이터베이스를 기반으로 서비스를 제공하고 있다. 그러나 월드와이드웹 기반의 전자상거래는 단순 키워드 검색에만 의존하고 있다. 이러한 검색은 데이터베이스 자체로는 의미적인 정보를 효과적으로 처리하기에는 많은 문제점이 있다. 1999년 말에 의미적인 정보를 효과적으로 처리하기 할 수 있는 시맨틱 웹 이 제안되었다. 시맨틱 웹은 의미적인 정보를 담고 있는 지식베이스(Knowledge Bases)인 온톨로지를 기반으로 하고 있다. 그러나 온툴로지의 생성은 많은 부분을 휴리스틱에 의존하고 있기 때문에 많은 시간과 비용이 소비된다. 따라서 우리는 이와 같은 문제를 해결하기 위하여 데이터베이스에서 온톨로지를 생성하는 방법을 제안한다. 데이터베이스는 도메인을 잘 나타내고 있는 정보의 저장소이므로 데이터베이스로부터의 온톨로지 생성은 분석, 설계 등의 사전 작업이 필요하지 않아 시간과 비용의 소비를 줄 일 수 있는 장점이 있다. 우리는 데이터베이스에서 스키마를 추출, 뼈대그래프$^{1}$ 를 생성하고 개념그래프로 확장하여 도메인을 잘 나타낼 수 있는 온톨로지를 생성하는 알고리즘을 제안하고 제안된 알고리즘을 통하여 온톨로지를 생성을 함으로서 제안된 생성 방법을 검증한다. 제안한 방법으로 생성된 온톨로지는 단순 키워드 검색에서 의미적인 검색을 할 수 있는 시맨틱 웹 서비스의 기반이 되므로 의미적 검색이 가능한 전자상거래 서비스를 구축하는데 시간과 비용의 소비를 줄임으로 차세대 전자상거래의 초석이 된다.

  • PDF

포커스 - 중국 원유선물시장 개설의 의미와 전망

  • 서병기
    • 석유와에너지
    • /
    • 통권308호
    • /
    • pp.40-43
    • /
    • 2018
  • 올해 3월 26일, 전문가들과 관계자들의 우려와 기대 속에 중국은 위안화 기반의 원유선물거래를 개시했다. 이는 미국을 제치고 세계 최대 원유수입국으로 등극한 중국이 수요자 중심의 시장을 열었다는 것 외에도 여러 가지 의미를 가진다. 특히 달러화 표시가 아닌 위안화를 기반으로 선물거래를 개시했다는 점, 중국이 상품 선물로는 최초로 외국인 투자자의 거래를 허용했다는 점 등은 단지 동북아 원유 벤치마크만을 위한 포석으로 설명하기는 힘들다는 것이 대부분 전문가들의 의견이다. 중국이 위안화 기반 국제 원유선물시장을 개장했다는 것에 대한 의미와 전망을 살펴보자.

  • PDF

카네비게이션 시스템을 위한 의미베이스의 활용 (Application of Meaning Base for Car Navigation System)

  • 장문수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.17-20
    • /
    • 2003
  • 언어는 인간의 지적 활동의 가장 근본적인 도구이다. 컴퓨팅에 있어서도 특히, 인간의 지적 활동을 모방하는 경우에 언어를 통한 컴퓨팅이 효과적일 수 있다. 의미베이스는 시스템 기능문법(SFLT)을 기반으로 한 인간 사고의 모델링으로 언어기반 컴퓨팅의 도구로 이용될 수 있다 본 논문에서는 카네비게이션 시스템을 예로 들어 언어를 매개로 한 지적 컴퓨팅에 관한 아이디어를 제시한다. 의미베이스의 계층은 컨텍스트, 의미, 어휘문법으로 나뉘고, 각 계층은 시스템, 서브시스템, 인스턴스로 세분된다 본 논문에서는 카네비게이션의 컨텍스트를 정의하고, 이것을 바탕으로 의미층에서 의미를 생성함을 보인다 그리고, 제시한 의미베이스 안에서 대화를 분석 및 생성하는 과정을 통해 컴퓨팅이 이루어질 수 있음을 예를 통하여 보인다.

  • PDF

멀티데이터베이스 시스템에서 정보공유를 위한 개념-기반 의미망의 구축 (A Concept-based Semantic Network for Information Sharing in Multidatabase Systems)

  • 이정욱;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.188-203
    • /
    • 2001
  • 멀티데이터베이스 시스템(multidatabase system)에서 여러 요소 데이터베이스(component database)에 대한 통합된 접근을 제공하기 위해서는 의미 이질성(semantic heterogeneity)이 탐색되고 해결되어져야 한다. 즉, 멀티데이터베이스 시스템은 각 요소 데이터베이스가 가지고 있는 정보의 의미를 이해하고 의미적으로 동등한 또는 유사한 정보들을 식별할 수 있어야 한다. 또한, 멀티데이터베이스 시스템은 사용자로 하여금 실세계의 동일한 정보를 가지고 있는 여러 다른 데이터베이스로부터 원하는 정보를 용이하게 획득할 수 있도록 해야 한다. 본 논문에서는, 요소 데이터베이스간의 의미 이질성을 탐색하고 해결하기 위하여 정보가 갖고 있는 개념간 의미관계에 기반한 의미망(semantic network)을 구축한다. 또한 의미질의어(semantic query language)를 제공하여 사용자가 스키마에 대한 사전 지식이 없이도 여로 자율적인 데이터베이스로부터 원하는 정보를 용이하게 획득 할 수 있도록 한다.

  • PDF

뉴럴 전이 기반 한국어 의존 파싱 & 의미역 결정 통합 모델 (Neural transition-based joint models for dependency Parsing and semantic role labeling of Korean)

  • 민진우;나승훈;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.343-346
    • /
    • 2018
  • 기존의 의미역 결정은 먼저 구문 분석을 수행한 후에 해당 구문 분석 결과를 이용해 의미역 결정 테스크에 적용하는 파이프라인 방식으로 진행한다. 이러한 방식의 학습을 두 번 연이어 진행하기 때문에 시간이 오래 걸리고 또한 구문 파싱과 의미 파싱에 대해 서로 영향을 주지 못하는 단점이 존재하였다. 본 논문에서는 의존 파싱과 의미역 파싱을 동시에 진행하도록 전이 액션을 확장한 의존 파싱 & 의미역 결정 통합 모델을 제안하고 실험 결과, Korean Prop Bank 의미역 결정 데이터 셋에서 파이프라인 방식 전이 기반 방식을 사용한 모델보다 논항 인식 및 분류(AIC) 성능에서 F1 기준 0.14% 높은 결과을 보인다.

  • PDF

Semantic parsing 기반 지식 베이스 질의응답 시스템의 어휘-의미 패턴 질의 템플릿을 통한 보완 (Assisting semantic parsing-based QA system with lexico-semantic pattern query template)

  • 심효섭;박선영;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-258
    • /
    • 2014
  • 본 논문에서는 semantic parsing과 사전 정의된 어휘-의미 패턴 질의 템플릿 방법론을 결합하여 자연어 질의로부터 RDF 지식베이스에 질의하기 위한 SPARQL 쿼리를 생성하는 방법을 제안한다. semantic parsing 접근법은 문장의 표현과 분리된 형식적 의미표현만을 포착해내므로, paraphrase 혹은 의미 변화와 무관한 어순의 변화에 강인하지만, 일부 자연어 질의문장에는 단순한 의미 및 구조를 갖는 문장도 적합한 형식적 의미표현을 생성하지 못하는 단점이 있다. 따라서 이 연구에서는 이러한 단순한 문장에 있어서는 사전 정의된 질의 템플릿을 사용하여 적합한 쿼리를 생성하되, 적합한 템플릿을 선택하는데 있어 해당 질의문장의 어휘-의미적 유형을 포착하고 해당 정보를 이용하는 방법을 이용하였으며 이를 통해 주 방법론의 약점을 보완하는 제한적인 효과를 얻을 수 있었다.

  • PDF

캡슐내시경 영상의 진단 보조를 위한 소장 기관 중심 지식 모델링 기법 (Small Intestine-Centric Knowledge Modeling Method for Supporting Diagnosis using Capsule Endoscopy Image)

  • 황규본;박예슬;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.900-903
    • /
    • 2017
  • 캡슐내시경은 일반적인 내시경의 접근이 어려운 소장을 관찰하는 데 특화되어 있다. 보통 캡슐내시경 영상을 판독하기 위해 의사는 해부학적 지식과 병리학적 지식과 같은 도메인 지식을 활용하여 영상에 내재된 정보를 획득한다. 이와 같은 내재된 정보는 도메인 지식을 활용하여 분석될 수 있는 의미적 정보라고 할 수 있다. 본 논문에서는 의미적 정보를 추출하는 과정을 의미 기반 분석이라 정의하고, 의미 기반 분석 과정에서 요구되는 도메인 지식 모델링 기법을 제안하고자 한다. 캡슐내시경의 의미 기반 분석 과정은 크게 이미지 특징 추출, 해부학적 분석, 병리학적 분석으로 구성되며, 이와 같은 분석 과정에 활용될 수 있는 해부학 모델과 병리학 모델을 제안한다. 제안하는 모델은 캡슐내시경 영상의 주요 대상 기관인 소장에 특화된 모델로 효과적인 영상 판독을 보조할 수 있음을 보인다.

동사사전를 이용한 의미 기반 정보 검색 시스템의 설계 (Design of An Information Retrieval System using Verb Dictionary)

  • 이용훈;이상범
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.177-180
    • /
    • 2009
  • 본 논문에서는 문장에서 동사를 파악하여 명사간의 의미를 부여하는 자동학습 온톨로지 기반 정보 검색 시스템을 제안한다. 정보의 양이 무한히 증가하고 있으며 웹의 발전에 따라 적합한 정보를 찾아내야 하는 효율적인 정보 검색 시스템의 필요성이 증대되고 있다. 단순히 키워드의 가중치에 따른 검색의 순위화는 사용자의 의미를 이해하지 못한 검색 결과로서 사용자로 하여금 결과를 다시 한번 직접 검색해야 하는 불편함을 제공하고 있다. 이러한 문제점을 해결하기 위해서 문장에서 동사를 파악하여 명사 간의 의미를 부여하고 문서 내에서 단어 간의 의미를 파악하여 검색의 질을 개선하는 방법을 논의한다. 또한, 문서에서 단어의 관계를 스스로 학습 가능하여 구축되는 자동학습 온톨로지 기반의 정보 검색 시스템을 제안한다.

  • PDF