• 제목/요약/키워드: 의미베이스

검색결과 336건 처리시간 0.024초

한국어 문장으로부터 개념단위의 추출과 지식베이스의 구축 (The Conceptual Unit Extraction and Knowledge Base Construction from Korean Sentence)

  • 한광록;이주근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.247-251
    • /
    • 1989
  • 본 논문은 한국어를 대상으로 하는 자연언어 처리 시스템을 개발하는데 있어서 기초가 되는 지식베이스의 구축에 대하여 논한다. 한국어의 일반문에서 단문을 분리해 내기 위하여 형태소 해석의 결과로부터 도출한 구 단위를 한-일 기계번역 시스템의 구문, 의미 해석기(VCPN) 을 적용하여 절단위로 결합한다. 그리고 이들 단위절에 대하여 대명사의 조응관계, 생략에의 재생을 위한 추론, 부정어, 시제일치 등을 처리하여 논리적 지식베이스를 구성하는 방법을 제안한다. 본 논문은 입력문장에 제한을 두지 않고 단문으로부터 장문에 이르기까지 광범위한 일반문을 대상으로 하여 Horn Clause 이론을 확장한다.

  • PDF

관계형 데이타베이스 시스템을 위한 지능적인 질의처리시스템 (An Intellingnet Query Processing System for Relational Database System)

  • 김대수;김창석
    • 한국지능시스템학회논문지
    • /
    • 제7권4호
    • /
    • pp.1-8
    • /
    • 1997
  • 본 논문에서는 관계형 데이타베이스 시스템을 위한 새로운 지능적인 질의 처리 시스템을 제안하였다. 애매한 질의와 관련된 기존의 연구결과를 분석하여 그 문제점들을 해결할 수 있는 새로운 질의 처리 시스템이 개발되었는데, 지능적 질의 처리기를 비롯한 각 모듈의 역할을 정의하였으며, 구문분석기, 질의변환 모듈, 추진 엔진, 의미 데이타베이스 모듈, 결과합성기 등의 알고리즘을 제시하였다. 또한 제안된 질의처리 시스템의 기반한 실제 작동의 과정을 한 예를 들어 검증한 결과 타당성 있는 결과가 입증되었으며, 사용자의 일반적인 질의뿐만 아니라 애미한 질의에도 지능적으로 대처하여 순서화된 겨로가를 보여주고 있다.

  • PDF

유사어 사전을 이용한 자동범주화 모델 개발 (Automatic Text Categorization Model by Synonym Dictionary)

  • 김규환;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.167-172
    • /
    • 2004
  • 기존의 문서분류는 학습문서에 출현하는 자질에 대해 가중치를 계산하여 그 순위에 따라 상위 자질로 구성된 지식베이스를 사용하였다. 그리고 새로운 문서가 들어왔을 때 자질 지식베이스를 근거로 새 문서를 색인하였다. 결국 자질 지식베이스와 정확히 일치하지 않는 키워드는 색인대상에서 제외되는 문제가 있었다. 본 고에서는 이 문제를 해결하기 위하여 분류될 문서의 특징을 나타내는 범주별 자질과 유사한의미를 가지나 형태가 변형되어 기술된 단어에 대하여 유사어 사전을 구축하였으며 이를 통해 새로운 문서가 범주에 할당될 가능성을 높여 자동 문서 범주화 시스템의 성능을 향상시키고자 한다.

  • PDF

한국어 워드넷의 구축 (Construction of Korean WordNet)

  • 임성신;이은령;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.106-111
    • /
    • 2004
  • 사람의 언어를 이해하는 자연언어처리 시스템을 개발하기 위해서는 의미처리를 위한 지식 베이스(knowledge base)가 필요하다. 지금까지 사람이 가진 지식 베이스를 컴퓨터에 도입하려는 많은 노력을 기울이고 있고 그 결과물로 온톨로지(ontology)와 시소러스(thesaurus)가 만들어지고 있다. 외국에서는 지식 베이스의 중요성을 알고 많은 연구를 수행하고 있으며 그 대표적인 사례들에는 Roget's Thesaurus, WordNet, EDR 개념사전, CYC, Euro WordNet 등이 있다. 이 중에서 가장 대표적이며 많은 활용을 보이는 것이 Princeton 대학의 WordNet이다. WordNet은 인간의 어휘지식에 대한 심리 언어학적인 연구의 결과물로써 심리학자와 언어학자들에 의해 10여 년 동안 구축되고 있는 영어에 대한 어휘데이터베이스이다. 본 논문에서는 WordNet을 기반으로 명사에 대해서 영한사전과 국어사전을 이용하여 구축한 한국어 워드넷을 소개하구 구축시 고려한 기본지침을 소개하도록 하겠다.

  • PDF

전문가 시스템과 데이터 베이스를 이용한 이산 사건 시뮬레이션 모델링 (A Discrete Event Simulation Modeling Using the Expert System and Database)

  • 김형종
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2000년도 춘계학술대회 논문집
    • /
    • pp.95-100
    • /
    • 2000
  • 시뮬레이션 모델과 전문가 시스템의 학제간 연구는 그동안 많은 학자에 의해 진행되어 왔다. 전문가 시스템은 추론 기관과 지식베이스로 구성되며, 지식베이스는 사실과 규칙으로 구성된다. 사실과 규칙은 추론 기관의 추론을 위한 정보로 사용된다. 요즘의 정보 시스템은 데이터베이스를 가지며 데이터베이스의 정보를 기반으로 모든 처리가 진행된다. 이러한 정보 시스템에 삽입되어 사용되는 시뮬레이션 모델의 전문가 시스템도 데이터베이스의 정보를 사용하여 추론을 행한다. 데이터베이스의 정보는 전문가 시스템의 추론을 위한 사실로 사용되고, 추론 결과를 저장하기 위한 저장 장소로 사용된다. 본 연구에서는 전문가 시스템의 사실과 데이터베이스 사이의 사상을 정리하고, 이를 위한 사실 클래스를 제안한다. 이 사실 클래스는 데이터베이스 데이터를 전문가 시스템이 사용할 수 있도록 필링하는 기능과 추론을 위한 의미 분석의 기능을 갖는다. 또한, 데이터베이스에 추론 결과를 저장할 때 생기는 데이터의 일치성과 무결성 문제를 해결한다. 이 사실 클래스를 갖는 전문가 시스템 기능을 갖는 시뮬레이션 모델을 그래이팅 생산 공정의 시뮬레이션에 적용하였다.

  • PDF

한국어 서술어와 지식베이스 프로퍼티 연결 (Linking Korean Predicates to Knowledge Base Properties)

  • 원유성;우종성;김지성;함영균;최기선
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1568-1574
    • /
    • 2015
  • 본 논문은 자연언어 문장을 지식베이스의 지식 골격에 맞추어 지식의 형태로 변환하기 위한 과정 중의 하나인 관계추출(Relation Extraction)을 목표로 한다. 특히, 문장 내에 있는 서술어(Predicate)에 집중하여 서술어와 관련성 높은 지식베이스 프로퍼티(Property or Relation)를 찾아내고, 이를 통해 두 개체(Entity)간의 의미를 파악하는 관계추출에 초점을 둔다. 이에 널리 활용되는 원격지도학습(Distant Supervision) 접근 방식에 따라, 지식베이스와 자연언어 텍스트로부터 원격 학습이 가능한 레이블(Labeled) 데이터를 자동으로 마련하여 지식베이스 프로퍼티에 대한 어휘화 작업을 수행한다. 즉, 두 개체 사이의 관계로 표현되는 서술어와, 온톨로지로 정의할 수 있는 프로퍼티와의 연결을 통해, 텍스트로부터 구조적 정보를 생성할 수 있는 기반을 마련하고 최종적으로 지식베이스 확장의 가능성을 열어준다.

XML 데이타베이스 변경 연산의 즉시 부분 검증 메카니즘 (Immediate and Partial Validation Mechanism for Update Operations in XML Databases)

  • 김상균;이규철
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.540-551
    • /
    • 2003
  • 최근에 데이타베이스에 저장된 XML문서의 변경에 대한 여러 연구들이 수행되었다[1-3]. 이 연구들은 우선 변경 연산들을 정의하고 이 연산들을 수행할 때 발생하는 의미적 문제들을 해결하는 방법을 제안하였다. 이러한 연구들에서는 변경 연산을 수행한 후에 검증을 수행하기 때문에 여러 가지 충돌 문제가 발생한다. 이러한 충돌문제를 해결하기 위해서는 XML데이타베이스 시스템이 변경 연산을 수행하기 전에 이 연산이 DTD에 따르는지 즉시 검증할 수 있어야 한다. 또한 지금까지의 연구들은 변경된 XML문서를 검증할 때 변경된 부분을 검증하지 않고 문서 전체를 검증한다. 따라서 많은 응용프로그램들이 XML문서를 변경한다면 이 연산에 대한 검증 과정 때문에 심각한 성능 저하를 가져올 것이다. 이 연구에서는 이 두 가지 문제점을 해결하기 위한 방법을 제안한다. 우선 DTD정보를 추출하여 데이타베이스에 저장하고 데이타베이스에 저장된 XML문서를 변경할 때 이 저장된 DTD정보를 이용하여 변경 연산의 유효성을 검증함으로써 항상 유효한 XML문서를 데이타베이스에 유지하도록 한다. 이를 위해 유효성 검증을 변경 연산이 수행되기 전에 즉시 수행하고 검증 범위 또한 변경된 부분으로 한정시키는 메카니즘을 고안하였다.

국가전자도서관구축 기본계획

  • 강한배
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.221-238
    • /
    • 1998
  • 전자도서관의 정의와 범위 $\square$ 전자도서관이란 전통적인 도서관의 기능을 근간으로 디지털 형태의 멀티미디어 정보의 수집, 가공, 유통을 컴퓨터와 통신망을 기반으로 하여 이용자로 하여금 공간적, 시간적 제약 없이 양질의 정보를 획득하게 한 수 있게 하는 정보서비스 체계 $\square$ 국가 전자도서관의 완성단계에서는 포괄적 의미의 전자도서관 형태 $\square$ 초기 또는 발전단계에서 국가 전자도서관은 어문저작물 형태를 디지털화하고 이를 시간적, 공간적 제약 없이 필요한 최종 정보를 획득한 수 있는 도서관 시스템을 의미(중략)

  • PDF

인터넷비즈니스의 거래유형별 수익구조의 차이에 관한 연구

  • 최형석;최흥식
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.53-60
    • /
    • 2000
  • 본 연구에서는 인터넷 비즈니스를 통해 획득할 수 있는 수익을 규명하고, 사례조사를 통하여 거래유형별로 나타나는 수익구조의 차이를 제시한다. 거래의 유형에 따라 사례연구를 통해 수익구조를 살펴본 결과는 거래유형에 따라 수익구조가 서로 다르게 나타나고 있음을 보이고 있다. 이는 거래유형별로 수익원이 각기 다름을 의미하며 비즈니스 모델별로 적합한 수익구조를 구성할 수 있음을 의미한다. 그리고 수익구조를 구성하고 있는 수익들간의 관계를 분석함으로써 획득하고자 하는 수익과 그에 선행하여 획득하여야 하는 수익을 연결시켰다. 이와 같은 결과를 통해 인터넷 비즈니스를 전개하고 있는 기업에서는 획득하고자 하는 수익과 그에 필요한 적절한 수익구조를 구성하는데 가이드라인으로 사용될 수 있을 것이다.

  • PDF

구조 및 의미 검색을 지원하는 비디오 데이타의 모델링 (Video Data Modeling for Supporting Structural and Semantic Retrieval)

  • 복경수;유재수;조기형
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.237-251
    • /
    • 2003
  • 이 논문에서는 비디오 데이타의 논리적 구조와 의미적 내용을 효과적으로 검색하기 위한 비디오 검색 시스템을 제안한다. 제안하는 검색 시스템은 비정형화된 비디오 데이타를 원시 데이타 계층, 내용 계층 그리고 키프레임 계층의 세 계층으로 구성하는 계층화된 모델링을 사용한다. 계층화된 모델링에 존재하는 내용 계층은 비디오 데이타에 대한 논리적인 계층 구조와 의미적 내용을 표현한다. 제안하는 검색 시스템은 모델링에 따라 텍스트 기반의 검색은 물론 시각적인 특징 기반의 유사도 검색을 지원한다. 또한 시공간 관계에 기반한 의미적 내용 검색과 유사도 검색을 지원한다.