• 제목/요약/키워드: 범주의 순서화

검색결과 30건 처리시간 0.022초

모자이크 플롯에서 변수와 범주의 순서화 (Ordering Variables and Categories on the Mosaic Plot)

  • 이문주;허명회
    • 응용통계연구
    • /
    • 제21권5호
    • /
    • pp.875-888
    • /
    • 2008
  • Hartigan과 Kleiner (1981, 1984)에 의해 제안된 모자이크 플롯은 범주형 자료의 탐색에 매우 유용한 시각화 도구이다. 모자이크 플롯은 범주 셀의 빈도를 사각형의 기에 비례하게 나타내므로 이해가 쉽고 데이터에 포함된 정보를 유지하지만 실제 모습은 변수 순서와 변수 내 범주의 순서에 따라 상당히 달라진다. 이에 우리는 본 연구에서 모자이크 플롯에서 크래머(Cramer)의 V 계수를 활용한 변수의 순서화 방법과 감마 계수를 활용한 범주의 순서화 방법을 제안하고 Titanic, Housing, PreSex 등 공개 자료에 적용한 결과를 제시한다.

범주형 자료에서 순서화된 대립가설 검정을 위한 정확검정의 개발 (Developing of Exact Tests for Order-Restrictions in Categorical Data)

  • 남주선;강승호
    • 응용통계연구
    • /
    • 제26권4호
    • /
    • pp.595-610
    • /
    • 2013
  • 범주형 자료에서 순서화된 대립가설을 검정하는 경우는 의학 사회학 경영학 등 다양한 응용분야에서 발생한다. 이러한 검정 방법은 대부분 대표본이론에 근거하여 개발되었다. 하지만 표본크기가 작거나 표본크기가 매우 불균등한 경우 대표본이론에 근거한 검정방법의 제 1종 오류 확률은 목표로 하는 5%와 멀어지는 경우가 많이 발생한다. 본 논문에서는 범주형 자료에서 순서화된 대립가설을 검정하는 경우 표본크기가 작거나 표본크기가 매우 불균등한 경우에 사용될 수 있는 정확검정방법을 소개하고 이에 대한 검정력 및 정확 p-value를 제시할 것이다.

고차원 범주형 데이터를 위한 투영 군집화 기법의 핵심 요소 개발 (Development of Core Components of Projected Clustering for High-Dimensional Categorical Data)

  • 김민호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.181-183
    • /
    • 2006
  • 본 논문은 고차원의 범주형 데이터에 대한 군집화에 대해서 다룬다. 기존의 범주형 데이터 객체를 위한 유사성(상이성) 계측들의 기저에 깔려 있는 한계점은 수치형 데이터에서와 같은 순서화 (ordering)의 부재와 데이터의 고차원성과 희소성에 기인하는데, 이를 효과적으로 극복할 수 있는 기법이 투영 군집화이다. 본 논문에서는 고차원의 범주형 데이터를 효과적으로 처리할 수 있는 투영 군집화를 다루며 핵심 요소인 군집 차원의 정의와 군집 응집도를 제안한다.

  • PDF

트랜잭션을 위한 데이터 우선순위 기반형 시간소인 순서화 기법 (Data Priority-Based Timestamp-Ordering Protocol for Transactions)

  • 윤석환;김평중;박지은;이재영;이동현;궁상환
    • 한국정보처리학회논문지
    • /
    • 제4권5호
    • /
    • pp.1196-1210
    • /
    • 1997
  • 트랜잭션 순서화 기법중 기존의 시간소인 순서화 기법(Timestamp-Ordering Protocol)은 시스템에 진입하는 트랜잭션에 시간소인을 배정하여 이를 기준으로 트랜잭션을 순서화 함으로써 우선순위가 높은 트랜잭션이 나중에 처리되는 우선순위 바뀜 현상이 발생할 수 있다. 이를 방지하기 위하여 트랜잭션들을 그들의 시스템 진입사정에 따라 일정한 시간간격으로 범주화 한 후, 같은 범주내에 있는 트롄잭션들 에 대해서는 그들의 우선순위에 따라 순서화하는 데이터 우선순위 기반형 시간소인 순서화 기법을 제안한다.이 기법의 성능을 평가하기 위하여 실시간 데이터베이스 시스템으로 시물레이션 환경을 구축하여 기존의 기법들과 성능을 비교하였으며,제안 하는 기법이 높은 부하와 높은 데이터 충돌의 조건하에서 기존의 시간소인 순서화 기법보다 성능이 우수함을 확인하였다.

  • PDF

특정 범주에 대한 평가자간 카파 일치도의 퍼뮤테이션 p값 (Permutation p-values for specific-category kappa measure of agreement)

  • 엄용환
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.899-910
    • /
    • 2016
  • 근사검정은 종종 표본이 작은 순서척도의 범주를 갖는 분할표를 분석할 때 그 p값이 과대추정 되거나 과소추정 되기 때문에 적절하지 못한 것으로 여겨진다. 본 논문에서는 순서화된 범주를 갖는 $k{\times}k$ 분할표에서 특정 범주에 대한 가중 일치도에 대해 정확한 p값과 재표본 기법에 의해 p값을 구하는 퍼뮤테이션 방법을 제시한다. 이를 위해 두 명의 평가자가 특정의 범주에서 얼마나 일치된 평가를 하는 지를 측정하기 위해 $Kv{\dot{a}}lseth$가 제안한 특정 범주에 대한 가중 일치도 (weighted specific-category kappa)를 사용한다. 사례 데이터로서 $3{\times}3$ 분할표 형태의 실제 데이터와 가상데이터 그리고 $4{\times}4$ 분할표 형태의 가상데이터를 이용하며, 정확한 퍼뮤테이션 p값과 재표본 퍼뮤테이션 p값 그리고 근사검정의 p값을 계산하여 비교한다.

k-Modes 분할 알고리즘에 의한 군집의 상관정보 기반 빅데이터 분석 (A Big Data Analysis by Between-Cluster Information using k-Modes Clustering Algorithm)

  • 박인규
    • 디지털융복합연구
    • /
    • 제13권11호
    • /
    • pp.157-164
    • /
    • 2015
  • 본 논문은 융복합을 위한 범주형 데이터의 부공간에 의한 군집화에 대해서 다룬다. 범주형 데이터는 수치형 데이터에만 국한되지 않기 때문에 기존의 범주형 데이터들의 평가척도들은 순서화(ordering)의 부재와 데이터의 고차원성과 희소성으로 인하여 한계를 가지기 마련이다. 따라서 각각의 군집에 존재하는 범주형 속성들의 상호 유사도을 보다 근접하게 측정할 수 있는 조건부 엔트로피 척도를 제안한다. 또한 군집의 최적화를 위하여 군집내의 발산을 최소화하고, 군집간의 독립성을 향상시킬 수 있는 새로운 목적함수를 제안한다. 제안된 알고리즘의 성능을 4개의 알고리즘과 비교검증하기 위하여 5가지의 데이터에 대하여 실험을 수행하였다. 비교검증을 위한 평가척도는 정확도, f-척도와 적응된 Rand 색인이다. 실험을 통하여 제안된 방법이 평가척도에 의한 결과에서 기존의 방법들보다 좋은 성능을 보였다.

베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석 (Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake)

  • 이다솜;이은지;조성일;최태련
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.25-46
    • /
    • 2020
  • 본 논문에서는 Bayesian spectral analysis regression (BSAR) 방법론을 이용한 베이지안 순서형 프로빗 준모수 회귀모형에 대해서 고찰한다. 순서형 프로빗 회귀모형은 순서가 있는 범주형 자료를 모형화하는 방법으로, 정규 분포의 분포함수의 역함수인 프로빗 연결함수를 이용해 각 범주의 확률과 설명변수을 연결함으로써 반응변수의 확률을 모형화한다. 베이지안 프로빗 회귀 모형은 정규 분포를 따르는 잠재변수를 도입함으로써 사후 분포 도출을 용이하게 하고, 절단점에 따라 나뉘어지는 잠재변수들의 값에 따라서 반응 변수들이 범주화된다. 본 논문에서는 이러한 잠재 변수 방법을 확장해 BSAR 방법론에 기반하여 단조증가/감소와 같은 형태제약을 반영할 수 있는 베이지안 이항형 및 순서형 프로빗 준모수 회귀모형에 대해 연구한다. 모의실험을 통하여 이항형 프로빗 준모수 회귀모형과 기존의 다른 모형들 간의 적합결과를 비교하고, 형태 제약에 따른 순서형 프로빗 준모수 회귀모형의 적합결과를 비교 분석하도록 한다. 아울러, 국민건강영양조사 제 7기 1차년도 (2016) 자료(Korean National Health and Nutrition Examination Survey (KNHANES), 2016)를 바탕으로, 본 논문에서 고찰한 이항형 및 순서형 프로빗 준모수 회귀모형을 적용하여, 흡연양태와 커피섭취 간의 관계에 대한 실증적 분석을 수행한다.

다계층 퍼셉트론의 온라인 학습에서 학습 순서 제어의 효과 (Effect of Training Sequence Control in On-line Learning for Multilayer Perceptron)

  • 이재영;김황수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권7호
    • /
    • pp.491-502
    • /
    • 2010
  • 인간이 교육을 통해 지식을 습득하고 발전시키는 과정에서, 이전 단계에서의 학습 진행 과정은 향후 학습에 영향을 미친다. 이것은 기계 학습에서도 고려되어야 할 사항으로 실제 기계 학습에서 학습순서의 제어가 어떤 효과가 있는지 살펴볼 필요가 있다. 본 연구에서는 MLP의 학습에서 지도자가 목표값을 알려주는 역할은 물론, 학습 대상의 지식 정도를 고려하여 자료들의 학습 순서를 제어하는 추가적 역할도 수행할 때, 학습 과정에 미치는 효과를 실험한다. 실험 방법은 SOM과 MLP를 이용하여 분류 문제에 적용한다. SOM은 지도자가 학습 순서를 결정하기 위한 학습 자료들의 범주화에 이용되고, MLP는 학습 대상이 된다. 제안하는 방법은 SOM을 학습 자료의 전처리 방법이 아닌, 학습 과정 동안 학습 자료의 선택에 이용하는 점에서 여타 연구들과 차이가 있으며, 실험 결과는 학습에 사용되는 자료의 수와 학습 횟수에서 개선 효과가 있음을 보여준다.

전통의 규범적 의미에 대한 재해석과 범주화 (A Study on Reinterpretation and Categorization of Normative Meaning of Tradition)

  • 윤영돈;심승우;지준호;한성구
    • 한국철학논집
    • /
    • 제50호
    • /
    • pp.333-361
    • /
    • 2016
  • 본 연구는 전통의 규범적 의미에 대한 재해석과 범주화의 탐구를 목적으로 한다. 행위의 규정 근거로서 전통은 규범적 의미를 지니며, 도덕의 중요한 원천이다. 통시적 맥락에서 볼 때, 생태문화적 관점에서 고찰할 때, 전통적 가치는 그 연원이 있고, 시대적 사회적 변화에 따른 변용과 왜곡의 모습을 지니기도 한다. 전통적 가치가 민주시민으로서 미래 사회를 대비하는 데 기여하기 위해서는 재해석과 범주화가 필요하다. 미래 한국사회의 변화 전망 속에 유효한 전통의 규범적 의미는 그 연원으로부터 재해석을 통해 도출될 수 있다. 본고의 논의 순서는 다음과 같다. 먼저 생태문화적 관점에서 전통적 가치의 동적인 변화상을 살펴보고, 한국사회에서 전통적 가치에 대한 사회적 인식을 바탕으로 대표적인 전통적 가치인 충효의 현대적 재해석의 가능성을 탐색하고자 한다. 끝으로 서구적 가치와 한국의 전통적 가치를 포괄하는 한국적 가치의 맥락 속에서 전통적 가치의 범주화와 그 함의를 밝히고자 한다.

시나리오의 스케치를 위한 시간 공간 동기화 표현 모델 (Representaion Model of Spatio-Temporal Synchronization for Sketching Scenario)

  • 하수철;성해경
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1998년도 춘계학술발표 논문집
    • /
    • pp.38-43
    • /
    • 1998
  • 서로 다른 개발 과정에 있거나, 이미 개발된 게임 공간에 새로운 시나라요의 스케치를 포함시키는 경우 시간(temporal)과 공간(spatial)의 개념적인 동기화가 요구된다. 본 논문에서는 게임 시나리오 스케치의 표현 공간에 대한 범주를 나누며, 게임 장면 순서의 시간 관계성과 동적 장면의 공간 개념과의 동기화에 관한 표현법률 확장하는 표현 모델에 대한 논의를 한다.

  • PDF