• Title/Summary/Keyword: 의미적 연관성

Search Result 850, Processing Time 0.031 seconds

The Classification of Korean Adjectives using Case Frame Set (격틀집합을 이용한 한국어 형용사 유형 분류)

  • Jeon, Ji-Eun;Choe, Jae-Woong
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.254-261
    • /
    • 2006
  • 형용사 분류에 격틀이 중요한 역할을 한다는 주장은 여러 연구에서 제기된 바 있다. 본 연구에서는 격틀이 의미 분류에 기여하는 바를 보다 체계적으로 검토하기 위하여 '격틀집합'을 활용한다. 격틀집합은 한 개의 어휘가 취할 수 있는 격틀의 집합을 말한다. 격틀집합에 근거하여 형용사를 분류할 경우, 의미적으로 연관성이 높은 그룹으로 나뉠 수 있다는 가설을 바탕으로 이러한 가설의 타당성을 검증하고 이를 입증하는 것이 본 연구의 목적이다. 아울러 본 연구에서는 그러한 가설을 검증하기 위한 구체적인 방법론을 제시한다. 격틀집합정보는 세종전자사전에 들어있는 어휘별 격틀정보를 추출하여 활용한다. 본 연구 결과 도출된 총 101개의 격틀집합 중에서 한 개의 격틀만을 갖는 유형과 어휘목록이 5개미만인 유형을 제외한 12개의 격틀집합이 주요 분석 대상으로, 본 연구에서는 그 중에서 6개를 자세히 분석한다. 격틀집합별 어휘들을 살펴보면 의미적 연관성이 파악되지 않는 어휘들도 일부 포함되어 있기는 하나, 대부분은 의미적으로 상관관계가 있음을 확인할 수 있었다 이와 같은 방법론을 통해 국어 형용사 전체의 유형, 더 나아가 국어 용언을 분류하는데 본 연구의 가설과 방법론이 활용될 수 있다.

  • PDF

Discovery Of Cyclic Association Rule With Loose Cycle and Error Cycle over Loose Cycle (오차를 허용하는 주기적 연관규칙 탐사를 통한 오차의 경향성에 관한 연구)

  • 배수균;남도원;이동하;이전영
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.11a
    • /
    • pp.317-324
    • /
    • 2000
  • 주기적인 연관규칙은 타겟데이터베이스를 일정 단위시간으로 나누었을 때 연관규칙이 만족하는 구간이 일정한 주기마다 발생하는 패턴을 탐색하는 방법이다. 하지만, 이 방법은 엄격한 주기를 가지도록 하여 실제 데이터에 그대로 적용하기가 어려웠다. 예를 들이 편의점 데이터에서 매일 오전 7시-8시 사이에 주기적으로 발생하는 연관규칙을 발견할 때, 이러한 연관규칙을 주기적인 연관규칙이라고 한다. 하지만, 실제 데이터에서는 날씨와 같이 사람의 행동에 영향을 미치는 다른 요인 때문에 항상 일정한 주기를 가지는 연관규칙을 찾기는 어렵다. 본 논문에서는 주기가 일정하지 않은 연관규칙을 찾기 위해서 연관규칙의 주기성을 허용 오차를 포함하며 재정의하고, 오차를 허용하기 위한 탐색 알고리즘을 보완하였다. 반면에, 오차를 허용함으로써 오차를 허용하지 않는 경우보다 더 많은 주기성을 찾을 수 있을 뿐만 아니라, 동일한 주기를 가지지만 오프셋이 다른 여러 개의 비슷한 주기가지 찾게 되어 사용자가 의미 있는 연관규칙을 찾는데 방해가 된다. 본 논문에서는 이를 해결하기 위해서 오차를 허용하는 주기적 연관규칙의 오차의 정도를 측정하기 위한 단위로 집중도(intensity)와 경향성(tendency)을 제안한다. 주기적 연관규칙이 매 주기마다 정확한 세그먼트에 나타나는 정도를 나타내는 집중도와, 최소 평균오차를 의미하는 경향성을 이용하여 유사한 주기들 중에서 대표주기만을 찾을 수 있도록 한다. 또한, 오차를 허용하는 주기적 연관규칙에서 오차가 주로 발생하는 패턴을 분석함으로써 고객들의 수요 경향성을 더 잘 파악할 수 있다. 예를 들어, 평소에는 매일 오진 7시∼8시에 나타나던 연관성이 지각하는 사람들이 같은 월요일에는 1시간 늦은 8시∼9시에 나타난다는 오타 정보까지 파악할 수 있다. 이러한 월요일마다 1시간 늦게 나타나는 오차의 경향성을 나타내는 오차 주기(error cyc1e)를 이용함으로써 고객들의 수요의 경향성을 좀 더 세밀한 부분까지 파악할 수 있게 해 준다.

  • PDF

분류사와 명사 의미 부류

  • 최민우;강범모
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.395-401
    • /
    • 2000
  • 국어에서는 어떠한 대상의 수량을 표현할 때 수사와 함께 분류사(classifier)를 사용한다. 따라서 분류사는 그 특성상 수량 표현 구문을 형성하는 대상 명사와 의미적으로 밀접한 관련을 지니게되는데, 단순히 명사를 셈하는 것 뿐 아니라 명사의 의미적 특성을 명세(specify)해 준다고 할 수 있다. 본 연구에서는 이러한 명사와 분류사의 연관성에 초점을 맞추어 분류사의 사용에 따른 명사의 범주화 및 계층 구조를 보이고, 컴퓨터 말뭉치 자료를 이용하여 그 관계를 좀더 명확히 밝히는 것을 목적으로 한다. 이러한 연구는 언어를 전산적으로 처리하는데 필수적인 전산어휘부(computational lexicon)의 구축에 필요한 기초 작업이 될 수 있다.

  • PDF

Association-Based Knowledge Model for Supporting Diagnosis of a Capsule Endoscopy (캡슐내시경 검사의 진단 보조를 위한 연관성 기반 지식 모델)

  • Hwang, Gyubon;Park, Ye-Seul;Lee, Jung-Won
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.6 no.10
    • /
    • pp.493-498
    • /
    • 2017
  • Capsule endoscopy is specialized for the observation of small intestine that is difficult to access by general endoscopy. The diagnostic procedure through capsule endoscopy consists of three stages: examination of indicant, endoscopy, and diagnosis. At this time, key information needed for diagnosis includes indicant, lesions, and suspected disease information. In this paper, these information are defined as semantic features and the extracting process is defined as semantic-based analysis. It is performed in whole capsule endoscopy. First, several symptoms of patient are checked before capsule endoscopy to get some information on suspected disease. Next, capsule endoscopy is performed by checking the suspected diseases. Finally, diagnosis is concluded by using supporting information. At this time, some association are used to conclude diagnosis. For example, there are the disease association between the symptom and the disease to identify the expected disease, and the anatomical association between the location of the lesion and supporting information. However, existing knowledge models such as MST and CEST only lists the simple term related to endoscopy and cannot consider such semantic associations. Therefore, in this paper, we propose association-based knowledge model for supporting diagnosis of capsule endoscopy. The proposed model is divided into two; a disease model and anatomical model of small intestine, interesting area(organs) of capsule endoscopy. It can effectively support diagnosis by providing key information for capsule endoscopy.

Context-sensitive Spelling Correction using Measuring Relationship between Words (단어 간 연관성 측정을 통한 문맥 철자오류 교정)

  • Choi, Sung-Ki;Kim, Minho;Kwon, Hyuk-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1362-1365
    • /
    • 2013
  • 한국어 텍스트에 나타나는 오류어의 유형은 크게 단순 철자오류와 문맥 철자오류로 구분할 수 있다. 이중 문맥 철자오류는 문맥의 의미 통사적 관계를 고려해야만 해당 어휘의 오류 여부를 알 수 있는 오류로서 철자오류 중 교정 난도가 가장 높다. 문맥 철자오류의 유형은 발음 유상성에 따른 오류, 오타 오류, 문법 오류, 띄어쓰기 오류로 구분할 수 있다. 본 연구에서는 오타 오류에 의해 발생하는 문맥 철자오류를 어의 중의성 해소와 같은 문제로 보고 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 방법을 제안한다. 미리 생성한 교정 어휘 쌍을 대상으로 교정 어휘 쌍의 각 어휘와 주변 문맥 간 의미적 연관성을 통계적으로 측정하여 문맥 철자오류를 검색하고 교정한다. 제안한 방법을 적용한 결과 3개의 교정 어휘 쌍 모두 90%를 넘는 정확도를 보였다.

Automatic Summarization based on Lexical Chains considering Word Assocication (단어간의 연관성을 고려한 어휘 체인 기반 자동 요약)

  • Song, Young-In;Han, Kyoung-Soo;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.300-305
    • /
    • 2002
  • 자동 문서 요약 분야에서 대상 문서를 컴퓨터가 이해할 수 있는 형태로 어떻게 파악하고 구조화할 것인가는 중요한 이슈가 되어 왔다. 문서에 출현한 단어들은 Bag of Words 가정처럼 서로 독립적으로 존재하는 것이 아니라 문서가 쓰여진 의도에 따라 서로 간의 의미적, 혹은 지시적으로 연관되어 있다. 이러한 단어간의 연관성은 결속성(cohesion)이라고 표현하며, 이를 이용한 자동 방법으로 Barzilay의 어휘 체인(lexical chain)을 사용한 자동 방법이 대표적이다. 본 연구에서는 단어간의 연관성과 영문 시소러스인 워드넷(wordnet)에서 단어의 위치 정보를 사용하여 어휘 체인의 성능을 개선하였고, 대상 문서의 개념을 어휘 체인에 기반해 표현하여 자동의 성능을 개선하는 방안을 제시한다.

  • PDF

Design of Content-Based Image Database and Development of Retrieval System using XML (XML을 이용한 내용기반 이미지 데이터베이스의 설계 및 검색 시스템 구현)

  • Park, Seon-Yeong;Yong, Hwan-Seung
    • Journal of KIISE:Databases
    • /
    • v.27 no.4
    • /
    • pp.572-584
    • /
    • 2000
  • 내용기반 이미지 검색을 하기 위해서는 이미지에 대한 내용정보가 필요하며, 이러한 내용정보간에는 상호 연관성이 존재한다. XML(eXtensible Markup Language)은 내용정보간의 상호연관성을 표현하기에 적절하므로 본 논문에서는 이미지 내용정보를 구조화하기 위한 방법으로 XML을 사용하였다. 또한 이미지는 눈에 보이는 객체의 시각적인 특징과 이미지 전테가 내포하는 시술적인 의미도 가지므로, 이러한 이미지의 특성에 따라 내용정보의 구조도 객체의 시각적 특징 중심의 모델링과 의미 중심의 모델링으로 구분하여 XML 문서 구조를 모델링 하였다. 구조화된 모델들 간의 객체지향 특성을 이용하여 XML 데이터 서버인 eXcelon에 통합하고, 이를 XQL(XML Query Language)에 의하여 질의해 냄으로써 검색 구간에 제약을 가하고 이를 통하여 더욱 효과적인 검색을 지원하도록 한다. 검색되어진 XML 문서 구조는 XSL(extensible StyleSheets Language)의 적용을 통하여 쉬운 형태로 웹 브라우저 상에 출력하도록 한다. 마지막으로 본 논문에서 제안한 모댈링의 효율성을 검증하기 위하여, 웹 상에서 이미지 내용정보의 상호 연관성에 기반 하여 원하는 이미지를 검색할 수 있는 시스템을 구현하였다.

  • PDF

ISO 14001과 ISO 9001의 연관성

  • 대한설비건설협회
    • 월간 기계설비
    • /
    • s.106
    • /
    • pp.74-76
    • /
    • 1999
  • 다음 <표1>과 <표2>는 ISO 14001과 ISO 9001의 연관성과 넓은 의미에서 기술적 일치성, 그 반대의 경우를 비교하였다. 이같은 비교의 목적은 이미 제정된 규격 중의 하나를 운영하고 있으며 앞으로 두 체제를 운영하고자 하는 조직에게 두 체제의 연계 가능성을 증명하기 위함이다. 두 규격의 조항 사이의 직접적인 연계는 두 조항의 요건이 대체로 일치하는 경우에만 수립된다. 여기에서는 나타낼 수 없는 많은 세부적인 요소들이 두 규격 사이에 상호 관련성을 맺고 있다.

  • PDF

An Efficient Terminology Clustering Method Using Datamining Technique (데이타마이닝 기법을 이용한 효율적인 전문 용어 클러스터링)

  • 이정화;남상엽;문현정;우용태
    • Proceedings of the Korea Database Society Conference
    • /
    • 2000.11a
    • /
    • pp.210-215
    • /
    • 2000
  • 최근 대량의 텍스트 문서로부터 의미 있는 패턴이나 연관 규칙을 발견하기 위한 텍스트마이닝 기법에 대한 연구가 활발히 전개되고 있다. 하지만 비정형 텍스트 문서로부터 추출된 용어의 수는 불규칙적이고 일반적인 용어가 많이 추출되는 관계로 일반적인 연관 규칙 탐사 방법을 사용하게 되면 무의미한 연관 규칙이 대량으로 생성되어 지식 정보를 효과적으로 검색하기 어렵다. 본 논문에서는 연관 규칙 탐사 기법을 이용하여 대량의 문서로부터 유용한 지식 정보를 찾기 위하여 의미적으로 연관된 전문 용어들끼리 클러스터링 하기 위한 방법을 제안하였다. 학술 논문을 대상으로 전문 용어를 추출하여 관련된 용어들끼리 클러스터를 구성하는 실험을 통하여 제안된 방법의 효율성을 보였다.

  • PDF

Effective Keyword Search on Semantic RDF Data (시맨틱 RDF 데이터에 대한 효과적인 키워드 검색)

  • Park, Chang-Sup
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.11
    • /
    • pp.209-220
    • /
    • 2017
  • As a semantic data is widely used in various applications such as Knowledge Bases and Semantic Web, needs for effective search over a large amount of RDF data have been increasing. Previous keyword search methods based on distinct root semantics only retrieve a set of answer trees having different root nodes. Thus, they often find answer trees with similar meanings or low query relevance together while those with the same root node cannot be retrieved together even if they have different meanings and high query relevance. We propose a new method to find diverse and relevant answers to the query by permitting duplication of root nodes among them. We present an efficient query processing algorithm using path indexes to find top-k answers given a maximum amount of root duplication a set of answer trees can have. We show by experiments using a real dataset that the proposed approach can produce effective answer trees which are less redundant in their content nodes and more relevant to the query than the previous method.