• 제목/요약/키워드: 잠재범주분석

검색결과 61건 처리시간 0.019초

혼합모드 잠재범주모형을 통한 텍스트 자료의 분석 (Latent class model for mixed variables with applications to text data)

  • 신현수;서병태
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.837-849
    • /
    • 2019
  • 일종의 혼합다항분포 모형이라고 볼 수 있는 잠재범주모형은 범주형 자료에서 직접 관측되지 않은 중요한 정보를 얻어낼 수 있는 유용한 도구이다. 하지만 자료에 범주형 변수 뿐 아니라 연속형 변수 혹은 빈도형 변수가 함께 포함되어 있을 경우 이 모형을 직접적으로 사용할 수 없다. 본 논문에서는 특히 범주형 변수와 빈도형 변수가 함께 포함되어 있는 경우에 잠재범주모형인 혼합모드 잠재범주모형을 사용하여 텍스트 후기와 범주형 응답문항이 모두 포함된 의약품 사용 후기자료를 분석하였다. 이 분석을 통해 범주형 응답만을 사용한 보통의 잠재범주 모형에 비해 텍스트 자료를 함께 사용한 혼합모드 잠재범주모형을 사용했을때 잠재범주에 대한 보다 자세한 정보를 얻을 수 있는 것을 확인하였다.

잠재범주분석을 이용한 원인적 영향력 추론에 관한 연구 (Estimating Average Causal Effect in Latent Class Analysis)

  • 박가영;정환
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1077-1095
    • /
    • 2014
  • 관찰연구를 이용하여 인과관계를 추론할 경우 무작위 통제시험과는 달리 교란변수로 인한 편향을 제어하기 위한 통계적 전략이 필요하다. 최근에는 성향점수(propensity score) 를 이용한 짝짓기나 원인변수의 역확률을 가중치로 사용하는 주변구조모형이 제안되어 사용되고 있다. 이러한 인과관계 추론은 처치(treatment)가 명확히 주어진 경우에 교란변수를 통제하고 그 처치가 결과에 미치는 영향을 평가하는 방법에 초점이 맞추어져 있다. 하지만 기존의 방법의 경우 원인변수인 처치가 직접관측이 가능한 범주형 변수이고 결과변수 또한 직접관측이 가능한 변수인 경우에만 사용할 수 있는 한계를 갖고 있다. 본 연구에서는 원인변수인 처치와 결과변수의 결괏값의 직접적인 관측이 어려운 경우, 측정오차를 고려한 잠재범주모형(latent class analysis)의 변수로 모형화 함으로써 잠재범주 간의 원인적 영향력을 추정하는 방법을 제시하고자 한다. 그리고 미국의 The National Longitudinal Study of Adolescent Health 자료를 이용하여, 약물사용의 잠재범주에 대한 청소년기의 비행(delinquency)이라는 잠재범주의 원인적 영향력을 추정하였다.

잠재범주회귀모형의 성향점수를 이용한 잠재변수의 원인적 영향력 추론 연구 (Latent causal inference using the propensity score from latent class regression model)

  • 이미솔;정환
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.615-632
    • /
    • 2017
  • 무작위 통제시험에서와 달리, 관찰연구에서는 편향되지 않은 인과관계를 추론하기 위한 통계적 전략이 필요하다. 최근 잠재범주분석(latent class analysis; LCA)에서 처치의 평균인과효과(average causal effect; ACE)를 추정하기 위한 새로운 방법들이 제안되었으나 이러한 방법들은 실제 데이터를 분석하는 응용 연구에 초점이 맞춰있다. 따라서 ACE의 참값을 알 수 없어 추정 방법의 성능을 평가하는 데 한계가 있다. 본 연구에서는 Park과 Chung(2014)이 제안한 방법을 개선하여, 다항범주형 처치변수가 잠재변수인 상황에서 다항범주형 결과변수에 미치는 인과효과 추정방법을 제안하고 처치변수와 결과변수가 잠재변수 또는 관측변수를 포함하는 여러 상황에서 본 연구가 제안한 인과효과 추정방법의 성능을 모의실험연구를 통하여 평가하고자 한다. 더불어 'National Longitudinal Study of Adolescents Health'자료를 사용하여 미국 여성 청소년 성장과 약물사용에 대한 인과효과를 추론하고자 한다.

범주형 자료를 포함한 다형질 임계개체모형에서 유전능력 추정 알고리즘 (Computing Algorithm for Genetic Evaluations on Several Linear and Categorical Traits in A Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제46권2호
    • /
    • pp.137-144
    • /
    • 2004
  • 불연속 범주형 자료에 대한 잠재변수가 존재한다는 가정하에 임계값을 추정하고 잠재변수를 생성하며 생성된 잠재변수 및 기타 연속변량에 대한 관측치를 포함하는 다변량 임계개체모형을 설정하고 유전능력을 예측하기 위한 방법을 제시하였다. 각각의 범주형 조사 자료의 특성을 갖는 형질에 있어서 임계점의 추정은 추정 가능한 임계점에 대한 1차 미분값(gradient)과 2차 미분값(Hessian)을 이용한 Newton 방법을 이용하면 추정가능하며 지역모수인 육종가의 추정은 PCG 방법으로 구현 가능하다. 이러한 이론은 Quaas(2001)가 제시한 하나의 이산형 자료와 하나의 연속형 자료의 2변량 동시 분석방법을 확장하여 전개한 것이며 이때 잠재변수 및 임계점의 추정은 기타 형질의 잔차 회귀계수 및 상관을 고려해야 한다. 본 연구를 위한 모의실험은 2개의 연속변량으로 체중과 유량을 고려하였고 또 다른 2개의 불연속 변량인 분만난이도와 출생시 생존유무를 고려하여 4형질 동시 분석을 실시하였다. 임계모형에 의한 육종가 추정치의 정확도는 4개의 구간으로 분류되어 기록된 분만난이도의 경우에 91${\sim}$92%의 정확도를 보였고 이항분포인 분만시 생존유무에 대하여는 87~89%의 정확도를 보였다. 반면에 이들 범주형 자료를 선형으로 간주하고 분석한 선형 동물개체 혼합모형에서는 72${\sim}$84% 및 59${\sim}$70%으로 비교적 낮은 추정의 정확도를 보였다. 따라서 범주형 자료의 유전분석은 선형 혼합모형 보다 임계형 혼합모형이 크게 타당할 것으로 사료되었다.

잠재변수 모형에서의 군집효율을 이용한 변수선택 (Variable selection for latent class analysis using clustering efficiency)

  • 김성경;서병태
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.721-732
    • /
    • 2018
  • 잠재집단 모형은 다변량 범주형 자료 안에 숨겨진 집단을 찾는 매우 중요한 도구종의 하나이다. 하지만 실제 자료분석에서 너무 많은 관찰변수들을 포함시킨 모형은 모형을 복잡하게 만들고 또한 모수추정의 정확도에 영향을 주기 때문에 정보가 손실되지 않는 내에서 유용한 변수를 찾는 것은 중요한 문제이다. Dean과 Raftery (2010)은 잠재집단 모형에서의 변수선택을 위해 BIC를 이용한 Headlong search 알고리즘을 제시하였는데 본 논문에서는 이 방법을 대체할 수 있는 방법으로 적합한 모형으로부터 계산된 잠재집단에 속할 사후확률을 이용하여 변수 선택을 하는 방법을 제안하고자 한다. 이를 위하여 잠재집단 모형의 적합성을 측정할 수 있는 새로운 통계량과 이를 이용한 변수선택 알고리즘을 제시할 것이다. 또한 제안된 방법의 효율성을 모의실험과 실증자료 분석을 통해 살펴보고자 한다.

영 과잉 순서적 프로빗 모형을 이용한 한국인의 음주자료에 대한 베이지안 분석 (Bayesian Analysis of Korean Alcohol Consumption Data Using a Zero-Inflated Ordered Probit Model)

  • 오만숙;오현탁;박세미
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.363-376
    • /
    • 2012
  • 순서적 다항 반응변수의 경우 종종 과도하게 많은 수의 관측치가 0 범주에서 발생하는 영 과잉 특성을 지닌다. 이러한 영 과잉 자료에서 0범주를 발생시키는 요인이 여러 개 존재할 때 일반적인 순서적 프로빗 모형은 자료를 설명함에 있어서 한계를 지닌다. 본 논문에서는 영 과잉 특성을 반영한 이 단계 영 과잉 순서적 프로빗 모형의 베이지안 분석기법을 제시하고 이를 2008년도 통계청에서 조사한 한국인의 음주소비 자료에 적용시킨다. 첫 번째 단계에서는 음주소비가 하나도 없다고 답한 0 범주에 속하는 비음주자들을 신념 또는 영구적 건강상의 문제 등으로 상황에 관계없이 음주를 하지 않는 절대적 비음주자(genuine non-drinker, non-participant)와 현재 소비가 없지만 상황에 따라 음주자가 될 가능성이 있는 잠재적 음주자(zero consumption potential drinker)로 구분하는 프로빗 모형을 적용시켜 분석한다. 두 번째 단계에서는 잠재적 음주자와 1 이상의 범주에 속하는 실제적 음주자를 합하여 음주자 집단으로 보고 이에 대하여 순서적 프로빗 모형을 적용하여 분석한다. 분석결과, 비음주자 중 약 30%가 절대적 비음주자로 음주자료가 일반적 순서적 자료에 비하여 뚜렷한 영 과잉 특성을 가짐을 알 수 있었다. 각 변수의 한계효과를 분석함으로써 같은 설명변수가 절대적 비음주자와 잠재적 음주자에 미치는 영향이 서로 반대로 나타날 수 있음을 발견하였고, 따라서 한국인의 음주자료에 대하여 제안된 영 과잉 순서적 프로빗 모형이 유용함을 보여주었다.

잠재의미색인(LSI) 기법을 이용한 kNN 분류기의 자질 선정에 관한 연구 (Evaluation of the Feature Selection function of Latent Semantic Indexing(LSI) Using a kNN Classifier)

  • 박부영;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.163-166
    • /
    • 2004
  • 텍스트 범주화에 관한 선행연구에서 자주 사용되면서 좋은 성능을 보인 자질 선정 기법은 문헌빈도와 카이제곱 통계량 등이다. 그러나 이들은 단어 자체가 갖고 있는 모호성은 제거하지 못한다는 단점이 있다. 본 연구에서는 kNN 분류기를 이용한 범주화 실험에서 단어간의 상호 관련성이 자동적으로 유도됨으로써 단어 자체 보다는 단어의 개념을 분석하는 잠재의미색인 기법을 자질 선정 방법으로 제안한다.

  • PDF

액화 천연 가스 연료 선박의 연료 공급 장치 폭발 잠재 위험 분석 (Estimation of explosion risk potential in fuel gas supply systems for LNG fuelled ships)

  • 이상익
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제39권9호
    • /
    • pp.918-922
    • /
    • 2015
  • 선박으로부터 배출되는 오염원과 온실가스에 대한 국제적 규제가 점점 더 강화되어 감에 따라, 액화 천연 가스를 선박의 연료로 사용하는데 대한 관심이 높아져 가고 있다. 본 연구는 액화 천연 가스 연료 선박에서 사용되는 두 가지 방식의 연료 가스 공급 장치에 대하여 폭발 잠재 위험 분석을 수행하였다. 8500 TEU 급 컨테이너 선박을 목표 선박으로 선정하여, 액화 천연 가스 저장 탱크를 설계하였고 각 연료 공급 방식의 운전을 위한 압력 조건을 가정하였다. 누출공의 크기를 세 개의 범주로 분류하여, 각 누출공 크기 범주에 대한 누출 빈도를 산출하였고, 대표 누출공의 크기와 누출량을 추산하였다. 방출률의 증가와 누출 빈도는 역비례 관계를 보였으며, 펌프 방식 연료 공급 장치에서는 누출 빈도가 높게 나타났고, 가압 방식 연료 공급 장치에서는 방출률이 높게 나타났다. 전산 유체 역학 시뮬레이션을 통하여 폭발 잠재 위험 분석을 수행하고 각 연료 공급 장치에 대한 결과를 비교하였다.

동작인식형 (Motion-detective) 디지털웨어(Digital Wear)의 의류 상품화 가능성 탐색과 디자인 프로토타입 (Design Prototype)의 제안 (I) (An Explorative Research for Possibility of Digitalwear Based on Motion-detective Input Technology as Apparel Product and a Suggestion of the Design Prototypes (I))

  • 박희주;이주현
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2002년도 춘계학술대회 논문집
    • /
    • pp.366-372
    • /
    • 2002
  • 본 연구는 제 1보와 2보로 구성되었으며, 본 연구의 목적은 1) 동작 인식형 입력기술에 기반한 디지털웨어(이하, DMDI로 약칭함)의 의류상품화 가능성을 탐색하고, 2) 소비자의 잠재적 수요에 기초하여 DMDI의 디자인을 개발하는 것이다. 제 1 보에서는 소비자의 DMDI 에 대한 잠재수요를 고찰하기 위하여, 디자인 에스노 그래피적 견지에 기초하여 개발된 심층면접 방식 및 범주분석 방식을 취하였다 그 분석 결과를 토대로 하여, DMDI를 위한 7가지의 가능성있는 애플리케이션 영역과 DMDI의 6가지 디자인 방향이 제안되었으며, 이를 토대로 디자인 프로토타입 개발을 위한 기본형 디자인을 제시하였다. 제 2보에서는 제 1보의 결과를 토대로 하여 DMDI의 디자인 프로토타입을 개발하였다. 본 학술발표는 제 1보의 내용을 중심으로 하여 DMDI에 대한 소비자 수요의 분석결과와 DMDI를 위한 기본형 디자인을 주요 내용으로 구성하였다.

  • PDF

국내 사회통합범주 음악영재의 내재적 특성 탐색 (Exploring the Inherent Trait of Music Giftedness of the Disadvantaged Gifted in Music)

  • 김성혜
    • 영재교육연구
    • /
    • 제24권6호
    • /
    • pp.1073-1097
    • /
    • 2014
  • 본 연구의 목적은 여러 가지 환경적 제약과 요인으로 인해 개인의 재능이 사장되거나 억제될 가능성이 높은 국내 사회통합범주 음악영재의 내재적 특성 탐색으로, 내재적 특성이란 음악영재성을 구성하는 3가지 구인, 음악성, 창의성, 동기를 의미하는 것이다. 연구를 위해 먼저 2013년 7월 한국예술영재교육연구원에서 주최한 영재발굴캠프 참가자 10명을 목적표집하였다. 그리고 이들과의 개별면담자료와 이들에 대한 전문가 수업관찰평가 결과를 교차 분석함으로써 사회통합범주 음악영재의 내재적 특성을 현상학적 관점에서 살펴보았다. 연구 결과, 사회통합 범주 음악영재들 가운데 음악영재성이 여러 가지 구인들의 상보적 관계에서 개발되는 것을 인지하는 학생들은 대체적으로 이에 적합한 학습전략을 갖고 노력하여 잠재성이 있는 것으로 드러났다. 대체적으로 많은 학생들이 동기 구인에서 잠재성이 높은 것으로 드러났고, 상대적으로 창의성과 음악영재성의 관계를 제대로 인식하지 못해 창의성이 낮은 것으로 드러났다. 그리고 사회통합범주 음악영재 교육을 위한 제언으로 부모교육, 메타인지 및 창의성 신장, 학습동기와 자존감 같은 내적 영역요인 개선을 제안하였다.