• 제목/요약/키워드: 범주

검색결과 3,921건 처리시간 0.029초

K-모드 알고리즘과 ROCK 알고리즘의 비교 및 개선방안

  • 김보화;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.163-167
    • /
    • 2001
  • 데이터 마이닝에서 분석의 대상으로 하는 대용량 자료에는 연속형 자료와 범주형 자료가 모두 포함된다. 전통적인 군집분석은 연속형 자료를 대상으로 하는 방법들이다. 본 연구에서는 범주형 자료를 대상으로 하는 군집분석방법인 K-모드 알고리즘과 락(ROCK) 알고리즘을 비교${\cdot}$분석하였다. 그리고 두 알고리즘이 갖는 방법론적인 단점을 보안하여 군집의 효과를 높일 수 있는 개선 방안을 제안하였다.

  • PDF

온톨로지 정보를 이용한 범주 재편성: Roget 시소러스의 경우 (Category Reorganization with Ontology Information: Roget Thesaurus Case)

  • 양재군;배재학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.515-518
    • /
    • 2002
  • 본 논문에서는 Roget 시소러스의 범주를 재편성하여 문장추상화에 사용할 온톨로지를 추측하였다. Roget 시소러스의 표제정보와 참조정보를 이용해서 범주를 재편성한 각 결과를 토대로, OfN(Ontology for Narratives)을 구성하였다. 이렇게 하여 얻어진 OfN을 설화 문장추상화에 적용하여 이 온톨로지가 유의함을 확인하였다.

  • PDF

한국어 격틀 사전과 용언의 하위 범주 정보를 사용한 한국어 의미역 결정 (Korean Semantic Role Labeling using Case Frame and Subcategory of Predicate)

  • 김완수;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.198-201
    • /
    • 2015
  • 의미역 결정은 문장의 서술어와 그 서술어에 속하는 논항들 사이의 의미관계를 결정하는 문제이다. 본 논문에서는 UPropBank 격틀 사전과 UWordMap의 용언의 하위 범주 정보를 이용하여 의미역을 부착하였다. 실험 결과 80.125%의 정확률로 의미역을 부착하는 성능을 보였다.

  • PDF

한국어 구문 분석과 문장 생성을 위한 범주 문법 적용의 몇 가지 원칙 (Some Application Principles of Categorial Grammars for Korean Syntactic Analysis and Sentence Generation)

  • 송도규;차건회;박재득
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-359
    • /
    • 1997
  • 주로 영어, 불어 등의 형상적 언어(configurational languages)의 구문 분석을 위해 개발된 범주 문법은 문장 구성 성분의 문장 내의 위치가 대체적으로 고정적이며 통사 기능이 그 위치로서 할당 되는 형상적 언어의 통사적인 특성에 따라 방향성의 개념을 도입하였다. 그러나 이 방향성 개념은 문장 구성 성분의 문장 내의 위치가 비교적 자유로운 한국어 등의 비형상적 언어(non-configurational languages)에 그대로 적용하기에는 많은 무리가 따른다. 심지어 형상적 언어에 적용하는 경우에도 도치나 외치된 문장 또 격리된 구조(unbounded dependency constructions)가 있는 문장들도 적절히 분석해 내지 못한다. 이런 이유로 본고에서는 범주 문법에 도입되어 있는 방향성을 재고하고 아울러 한국어 구문 분석과 문장 생성을 위한 범주 문법 적용상의 다섯 원칙을 제안한다.

  • PDF

지식 구조에 미치는 요소에 대한 연구 (A Study of Factors for Knowledge Structure)

  • 곽철완
    • 한국비블리아학회지
    • /
    • 제11권2호
    • /
    • pp.65-82
    • /
    • 2000
  • 본 연구는 인간의 지식 구조를 조사하기 위해 인터넷 검색엔진에서 제공하는 디렉토리를 이용하여 인간이 만드는 범주와 비교하며, 지식 구조에 영향을 미치는 요소를 조사하는데 있다. 연구 방법은 질문지를 이용하여 데이터가 수집되었고, 요인분석과다변량분석을 통하여 데이터가 분석되었다. 연구의 결과는 야후! 코리아 검색엔진의 디렉토리 범주와 인간의 개념 범주와는 차이가 있었다. 그리고, 인간의 지식 구조는 다음의 3가지 요소들-시각적인 것과 청각적인 것, 동적인 것과 정적인 것, 그리고 한 개념과 그 개념에 포함된 하위개념과의 관계요소-로 나타났다.

  • PDF

복합 분류기를 이용한 웹 문서 범주화에 관한 실험적 연구 (An Experimental Study on Categorization of Web Documents Using an Ensemble Classifier)

  • 이혜원;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.73-82
    • /
    • 2003
  • 본 연구에서는 웹 문서를 분류하기 위해 문서로부터 다양한 자질을 추출하고, 두 가지의 분류기를 통해 여러 개의 분류 예측치를 구한 다음, 그것들을 하나의 결과물로 통합하는 복합분류기를 사용하였다. 먼저 다양한 자질 집합에 대해 일반적으로 많이 사용되는 kNN(k nearest neighbor) 분류기와 나이브 베이즈(Naive Bayes) 분류기를 사용한 범주화 실험을 수행하고, 실험을 통해 나온 범주 예측치를 통합하는 복합 분류기들의 성능을 비교하였다. 또한 단일 분류기들을 통해 나온 모든 범주 예측치를 통합하는 과정을 수행하여, 단일 분류기만을 사용할 경우와 복합 분류기를 사용할 경우를 비교해 더 좋은 성능을 나타내는 분류기를 밝히고자 한다.

  • PDF

고품질 바이그램을 이용한 문서 범주화 성능 향상 (Improving Text Categorization with High Quality Bigrams)

  • 이찬도;탄체이드멩;왕유안팡
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.415-420
    • /
    • 2002
  • 본 논문은 정보이익을 사용하여 고품질 바이그램을 생성하는 효율적 문서 범주화 알고리즘을 제안한다. 실험 결과 유니그램에 적은 수의 바이그램을 추가해서 나이브 베이즈 분류기에 적용했을 때 문서 범주화 성공률은 상당히 향상되었다. 결과 분석은 제안한 알고리즘이 양의 문서를 분류하는데 더 우수하다는 것을 제시한다.

사물의 범주 위계에 따른 영아의 범주화 수행 (Categorization of Young Children by Object Categorical Hierarchy)

  • 최혜영;이강이
    • 아동학회지
    • /
    • 제33권5호
    • /
    • pp.19-35
    • /
    • 2012
  • The purposes of this study were to investigate how children's categorization differs in object categorical hierarchy and to examine whether these aspects were different according to the children's age of 18 months, 24 months, 30 months. The participants consisted of 120 young children aged 18 months, 24 months, and 30 months from 31 child-care centers located in middle-income regions of Seoul and Kyonggi Province. The major findings were as follows : First, all the children from all three age groups could consistently differentiate the superordinates; however, they could not consistently differentiate basic categories. Second, 24 month appears to be a critical change period in category development. Third, as the children become older, they are able to acquire more knowledge regarding categories. These results suggested that the advent of ordering, in terms of basic categories as well as superordinates which occurred around the age of 24 month, was confirmed in category development.

데이터 불균형 해결을 위한 Under-Sampling 기반 앙상블 SVMs (EUS SVMs: Ensemble of Under-Sampled SVMs for Data Imbalance Problems)

  • 강필성;조성준
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.291-298
    • /
    • 2006
  • 패턴인식 문제에서 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극히 많거나 적으면 데이터 불균형이 발생했다고 한다. Support Vector Machine(SVM)은 다른 기계 학습 알고리즘들과 마찬가지로 학습에 사용되는 데이터의 범주간 비율이 거의 비슷하다는 가정 하에서 학습을 하고 예측 결과를 도출하게 된다. 그러나 실제 문제에서는 데이터의 불균형이 발생하는 경우가 매우 빈번하며, 이러한 경우에는 모델의 성능이 매우 저하되는 문제점이 발생한다. 본 논문에서는 실제로 데이터 불균형이 SVM의 분류 결과에 어떠한 영향을 미치는지를 2차원 인공 데이터를 통하여 알아본다. 그리고 이러한 데이터 불균형을 해소하기 위하여 Under-Sampling 기반 앙상블 SVM을 제안하였다. 제안된 방법을 두 가지 인공 데이터에 적용하여 본 결과, 제안된 방법은 데이터 불균형을 해소하기 위해 사용되는 기존의 방법들에 비하여 소수 범주에 속하는 데이터의 수가 매우 적고 데이터의 불균형이 매우 심한 경우에도 높은 성능과 안정성을 갖는 효과적인 방법이라는 것이 입증되었다.

  • PDF

다차원 범주형 자료에 대한 링차트 (Ring Chart for Categorical Data)

  • 오민권;홍종선;이종철
    • 응용통계연구
    • /
    • 제12권1호
    • /
    • pp.225-239
    • /
    • 1999
  • 범주형 자료에 대하여 탐색적 자료분석을 할 수 있는 기존의 여러 그림들을 변수의 수가 많아지면 시각적인 식별이 어렵다는 단점이 있다. 본 논문에서는 삼차원이상의 다차원 범주형 자료를 이차원 평면성에 표현할 수 있는 링차트(ring chart)를 제안한다. 각 칸의 확률값을 표현하는 링차트는 범주형 자료의 구조 전체를 시각적으로 파악할 수 있으며, 관측값을 표준화한 링차트는 변수들간의 연관성 여부를 시각적으로 판단하는데 유용한 정보를 제공한다. 삼차원이상의 자료에서는 이중 링차트(조건부 링차트)를 개발하여 일차 및 이차교호작용 검정까지도 가능하다. 또한, 관측값과 잔차를 동시에 표현한 잔차 링차트는 설정된 모형의 적합성 여부를 시각적으로 평가할 수 있는 장점이 있다.

  • PDF