• 제목/요약/키워드: 이항반응변수

검색결과 27건 처리시간 0.023초

이변량 효능과 안전성 이항변수의 표본수 결정방법 (Determination of Sample Sizes of Bivariate Efficacy and Safety Outcomes)

  • 이현학;송혜향
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.341-353
    • /
    • 2009
  • 두 군의 처리를 비교하는 임상시험에서 효능(efficacy)과 안전성(safety)이 동일하게 중요한 변수로 취급되는 경우에 이변량(bivariate) 반응변수로서 분석되고 연구계획의 단계에서도 이변량 표본수 결정방법이 사용되어야 한다. Thall과 Cheng (1999)은 효능과 안전성의 반응값이 이변량 이항(bivariate binary) 변수인 경우의 표본수 결정방법을 제시하였으며, 본 연구에서는 목표모수 설정과정은 기존의 연구와 같으나 월콕슨-만-휘트니(Wilcoxon-Mann-Whitney: WMW) 통계량에 근거한 검정법과 표본수 결정방법을 제시한다. Thall과 Cheng (1999)의 검정통계량은 변수 변환시킨 비율의 근사 정규성에 근거하는 반면에, WMW 통계량은 확률에 근거한 비모수적 방법으로 이변량 이항변수 뿐만 아니라 이변량 순위변수로 측정된 반응값에도 적용시킬 수 있다 Thall과 Cheng (1999)에 제시한 항암치료 임상연구의 두 예제에 위의 두 다른 방법으로 계산된 표본수를 비교한 결과, Thall과 Cheng (1999)의 첫째 예제에서는 이변량 WMW 방법에 의한 표본수가 더욱 작았으나 둘째 예제에서는 더욱 큰 것으로 나타났다.

서로 다른 산포를 허용하는 이변량 영과잉 음이항 회귀모형 (Bivariate Zero-Inflated Negative Binomial Regression Model with Heterogeneous Dispersions)

  • 김동석;정슬기;이동희
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.571-579
    • /
    • 2011
  • 본 연구에서는 두 반응 변수에 서로 다른 산포를 허용하는 새로운 이변량 영과잉 음이항 회귀모형을 제안하고, Deb과 Trivedi (1997)에 나타난 헬스케어 자료를 이용하여 두 반응변수가 갖는 서로 다른 산포도를 무시한 Wang (2003)이 제안한 이변량 영과잉 음이항 회귀모형과의 효율성을 로그우도와 AIC의 관점에서 비교 하였다. 모형적합결과, 본 연구에서 제안한 모형이 모형선택기준 관점에서 기존모형에 비하여 월등히 우수한 결과를 보여주었다.

국소선형 준가능도 추정량의 자료 희박성 문제 해결방안 (Sparse Design Problem in Local Linear Quasi-likelihood Estimator)

  • 박동련
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.133-145
    • /
    • 2007
  • 국소선형 추정량은 여러 면에서 바람직한 특성을 많이 갖고 있는 좋은 추정량이다. 그러나 자료가 희박한 부분에서는 매우 불안정한 추정값을 갖게 되는 문제가 있음이 밝혀졌으며, 이 문제를 해결하기 위한 여러 방안이 많이 연구되었다. 그러나 이항반응변수를 위한 국소선형 추정량의 변형이라고 할 수 있는 국소선형 준가능도 추정량에 대해서는 아직 자료의 희박성 문제가 다루어지지 않고 있었다. 이 논문에서는 국소선형 준가능도 추정량이 갖고 있는 자료의 희박성 문제를 인식하고, 몇 가지 해결방안을 제시하였으며, 모의 실험을 통하여 가장 효과적인 방안을 선택하였다.

로지스틱회귀모형에서 로그-밀도비를 이용한 변수의 선택 (Variable Selection with Log-Density in Logistic Regression Model)

  • 강명욱;신은영
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.1-11
    • /
    • 2012
  • 로지스틱회귀모형에서 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 어떤 설명변수가어떻게모형에포함되는지에대한변수선택문제에서유용한정보를제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하다. 여러 가지 모의실험을 수행한 결과를 보면, $x{\mid}y$ = 0과 $x{\mid}y$ = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

한우 거세우 고기 관능평가 데이터의 로지스틱 회귀분석 (Logistic Regressions with Sensory Evaluation Data about Hanwoo Steer Beef)

  • 이혜정;김재희
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.857-870
    • /
    • 2010
  • 국립축산과학원에서는 2006년 부터 2008년 까지 전국 소비자들을 대상으로 한우 거세우 표본 시료에 대한 관능 평가 조사를 실시하여 데이터를 수집하였으며 본 연구에서는 한우 관능 평가 데이터에 대해 사회 인구학적 요인과 한국 소비자들의 맛 평가에 대한 연관성을 탐구하고자 한다. 소비자 거주지역, 연령, 성별, 직업, 월수입과 쇠고기 부위를 설명변수로 맛등급 평가를 반응변수로 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 회귀계수별 유의성 검정과 적합도 검정을 실시한다. 단계별 변수 선택으로 최종 모형을 선택하고 반응변수 범주에 대한 오즈비를 계산하여 맛등급과 설명변수들 간의 관련성을 파악한다. 또한 맛과 관련 있는 연속형 변수를 설명변수로 포함한 경우에 대해서도 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 비교한다. 그 결과 거주 지역, 연령, 월수입과 쇠고기 부위 변수들이 선택되었으며 영남지역에서 맛에 대한 오즈가 큰 편이며 수입이 많고 연령이 높을수록 맛에 대한 오즈가 작은 편이었다. 요리법으로는 탕에 대한 구이의 오즈비가 큰 편이며 쇠고기 부위별로는 우둔에 비해서 등심이 다른 부위들 보다 맛에 대한 차이가 크다고 볼 수 있다. 연속형 변수로는 연도가 맛등급에 큰 영향을 미치는 변수로 나타났다.

로지스틱회귀모형의 변수선택에서 로그-오즈 그래프를 통한 로그-밀도비 연구 (A study on log-density with log-odds graph for variable selection in logistic regression)

  • 강명욱;신은영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.99-111
    • /
    • 2012
  • 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 로지스틱회귀모형에서 어떤 설명변수가 어떻게 모형에 포함되는지에 대한 변수선택문제에서 유용한 정보를 제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하고 이 경우 x항과 log(x)항이 모형에 포함되어야 한다. 로그-오즈 그래프는 변수선택문제를 연구하는데 매우 중요한 도구가 된다. 이러한 그래픽적 연구에 의하면, x|y = 0과 x|y = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

이항 반응 자료에 대한 학습곡선의 모형화 (Statistical Modeling of Learning Curves with Binary Response Data)

  • 이슬지;박만식
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.433-450
    • /
    • 2012
  • 연구자가 같은 작업을 반복적으로 수행할 때, 작업 효율성은 연구에 관련된 지식, 경험, 기술이 축적되면서 향상된다. 결과를 얻기 위해 연구에 투자하는 시간은 같은 작업을 반복함으로써 줄일 수 있다. 이러한 현상을 학습곡선 효과(learning curve effect)라고 일컫는다. 학습곡선(learning curves)은 학습의 변화를 시각적으로 나타낸 것으로 이전의 학습곡선 연구에서는 시간을 일정한 구간으로 나누어 구간별 작업에 대한 숙련도의 평균 차이 여부를 확인하였다. 이러한 방법은 구간을 어떻게 나눌 것인가 하는 기준이 존재하지 않으며, 더욱이 이항 반응 자료로 모형을 적합하기 어려운 문제점을 가지고 있다. 본 연구에서는 이산형 확률변수 중 이항 반응 자료(베르누이자료)에 대한 학습곡선의 통계적 모형에 초점을 맞추고자 한다. 누적확률분포의 특성을 이용하여 모수를 추정하기 위해서 뉴튼-랩슨 방법(Newton-Raphson method)을 사용하였고, 이 연구에서 제안한 모형의 점근적 분포를 구하였다.

제로절단된 이변량 일반화 포아송 분포에서 산포모수의 효과 및 산포의 동일성에 대한 검정 (The Effects of Dispersion Parameters and Test for Equality of Dispersion Parameters in Zero-Truncated Bivariate Generalized Poisson Models)

  • 이동희;정병철
    • 응용통계연구
    • /
    • 제23권3호
    • /
    • pp.585-594
    • /
    • 2010
  • 본 연구에서는 제로절단된 이변량 일반화 포아송 분포에서 두 반응변수간 산포모수의 효과에 대하여 연구하였다. 모의실험 결과 두 반응변수가 서로 다른 산포를 갖는 경우 이를 무시하는 이변량 포아송 분포나 이변량 음이항 분포에 의한 모형적합은 효율성이 떨어지는 것으로 나타났다. 아울러 본 연구에서는 이와 같은 상이한 산포의 존재유무에 대한 가설검정에서 스코어 검정을 유도하고 우도비 검정과 효율성을 비교하였다.

초고차원 다범주분류를 위한 변수선별 방법 비교 연구 (A comparative study of feature screening methods for ultrahigh dimensional multiclass classification)

  • 이경은;김경희;신승준
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.793-808
    • /
    • 2017
  • 본 논문에서는 초고차원 자료의 다항분류를 위한 변수선별 방법에 대해 비교 연구를 진행하였다. 다항분류를 위한 변수선별 방법에는 일대일 혹은 일대다 비교를 통해 이항분류를 위한 방법을 확장시켜 적용하는 방법과 다항 반응 변수에 직접 적용할 수 있는 방법이 있다. 다항분류를 위한 변수선별 성능을 확인하기 위하여 여러가지 상황-설명변수의 꼬리가 두꺼운 경우, 신호변수와 잡음변수가 서로 연관된 경우, 결합분포상으로 연관되어 있지만 주변분포 상으로는 연관되어 있지 않은 경우, 다범주 반응변수의 분포가 불균형인 경우-을 가정하고 모의실험을 진행하였고, 실제 자료에도 적용해 보았다. 그 결과, 모형 가정을 필요로 하지 않는 방법들이 안정적인 성능을 보이는 것을 확인하였다.

베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석 (Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake)

  • 이다솜;이은지;조성일;최태련
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.25-46
    • /
    • 2020
  • 본 논문에서는 Bayesian spectral analysis regression (BSAR) 방법론을 이용한 베이지안 순서형 프로빗 준모수 회귀모형에 대해서 고찰한다. 순서형 프로빗 회귀모형은 순서가 있는 범주형 자료를 모형화하는 방법으로, 정규 분포의 분포함수의 역함수인 프로빗 연결함수를 이용해 각 범주의 확률과 설명변수을 연결함으로써 반응변수의 확률을 모형화한다. 베이지안 프로빗 회귀 모형은 정규 분포를 따르는 잠재변수를 도입함으로써 사후 분포 도출을 용이하게 하고, 절단점에 따라 나뉘어지는 잠재변수들의 값에 따라서 반응 변수들이 범주화된다. 본 논문에서는 이러한 잠재 변수 방법을 확장해 BSAR 방법론에 기반하여 단조증가/감소와 같은 형태제약을 반영할 수 있는 베이지안 이항형 및 순서형 프로빗 준모수 회귀모형에 대해 연구한다. 모의실험을 통하여 이항형 프로빗 준모수 회귀모형과 기존의 다른 모형들 간의 적합결과를 비교하고, 형태 제약에 따른 순서형 프로빗 준모수 회귀모형의 적합결과를 비교 분석하도록 한다. 아울러, 국민건강영양조사 제 7기 1차년도 (2016) 자료(Korean National Health and Nutrition Examination Survey (KNHANES), 2016)를 바탕으로, 본 논문에서 고찰한 이항형 및 순서형 프로빗 준모수 회귀모형을 적용하여, 흡연양태와 커피섭취 간의 관계에 대한 실증적 분석을 수행한다.