성향점수 매칭은 관찰연구에서 처리효과 추정 시 혼란변수에 의한 편의를 줄이기 위해 자주 사용되는 방법이다. 매칭을 위해 처리군에 대응되는 대조군 선정 시 처리군의 일부가 탈락되는 경우가 발생할 수 있는데, 이로 인해 편의가 발생할 수 있다. 최근, Austin (2017)의 연구에서 이중 성향점수 보정(double propensity score adjustment)방법을 사용하는 것이 이에 대한 해결책이 될 수 있음을 제시하였다. 하지만, 처리효과 추정치의 표준오차는 이론적 추정치가 제시되지 않아 추정에 어려움이 있다. 본 연구에서는 이중 성향점수 보정 방법을 이용한 처리효과 추정치의 표준오차 추정을 위하여 두 가지 붓스트랩 방법을 제안한다. 첫 번째는 원 자료에서 성향점수 매칭 후 매칭 된 표본에서 붓스트랩 표본을 얻는 방법(simple 붓스트랩)이고, 두 번째는 원 자료에서 붓스트랩을 먼저 시행하고 각 붓 스트랩 표본에서 성향점수 매칭을 하는 방법(complex 붓스트랩)이다. 두 방법의 성능을 비교하기 위하여 다양한 상황을 가정하여 모의실험을 시행한 결과 complex 붓스트랩 방법이 경험적 표준오차와 더 가까운 값으로 추정함을 알 수 있었다. 95% 신뢰구간의 포함확률도 complex 방법을 사용했을 때 0.95에 훨씬 가까웠다. 실제 자료에 적용하였을 때에도 simple 방법은 complex 방법에 비해 표준오차를 작게 추정하였다.
본 연구는 사회조사에서 무응답으로 인한 편향을 축소하는 방안으로 성향점수를 이용하는 방법과 사례를 설명하기 위해서 성향점수 방법의 이론적인 개념과 배경을 정리하였다. 또한 성향점수 방법을 처음으로 적용한 역학적인 관찰연구에서 성향점수 모형의 정의와 이론적 배경을 살펴보았고 추정에서 편향의 축소방법으로 이용되는 가지 성향점수 방법을 정리하였다. 성향점수로 짝짓기는 통제그룹의 데이터가 상대적으로 많을 경우에 이용되고 부차분류법은 통제그룹의 모든 데이터를 이용할 수 있으며 회귀모형을 이용한 보정은 다중공변량에서도 사용할 수 있을 뿐만 아니라 각 관찰단위에 성향점수 값을 산출하여 사용할 수 있는 특징이 있다. 그리고 사회여론조사에서 항목무응답으로 인한 편향을 축소하는 데 성향점수 가중법을 적용하는 절차를 제안하고 기존의 데이터를 이용하여 실제 적용에 대한 가능성을 검토하였다.
고차원 데이터의 인과 추론에서 고차원 공변량의 차원을 축소하고 적절히 변형하여 처리와 잠재 결과에 영향을 줄 수 있는 교란을 통제하는 것은 중요한 문제이다. 평균 처리 효과(average treatment effect; ATE) 추정에 있어서, 성향점수와 결과 모형 추정을 이용한 확장된 역확률 가중치 방법이 주로 사용된다. 고차원 데이터의 분석시 모든 공변량을 포함한 모수 모형을 이용하여 성향 점수와 결과 모형 추정을 할 경우, ATE 추정량이 일치성을 갖지 않거나 추정량의 분산이 큰 값을 가질 수 있다. 이런 이유로 고차원 데이터에 대한 적절한 차원 축소 방법과 준모수 모형을 이용한 ATE 방법이 주목 받고 있다. 이와 관련된 연구로는 차원 축소부분에 준모수 모형과 희소 충분 차원 축소 방법을 활용한 연구가 있다. 최근에는 성향점수와 결과 모형을 추정하지 않고, 차원 축소 후 매칭을 활용한 ATE 추정 방법도 제시되었다. 고차원 데이터의 ATE 추정 방법연구 중 최근에 제시된 네 가지 연구에 대해 소개하고, 추정치 해석시 유의할 점에 대하여 논하기로 한다.
본 연구에서는 선거여론조사에서 좀더 많은 젊은 유권자를 접촉하기 위해서 인터넷조사의 적용 가능성을 제시하고자 한다. 2007년 대선여론조사에서 수집한 인구통계학 변수와 공변량 변수를 이용하여 성향점수모형을 추정하였다. 인터넷조사에서 투표성향을 전화조사의 것과 같이 보정하기 위해서 추정한 성향점수모형을 사용하였다. 실제로 인터넷조사 데이터에 성향점수 가중치를 적용함으로써 전화조사의 추정치에 근접하게 됨을 보였다. 성향가중모형을 인터넷조사의 데이터에 적용하여 인터넷조사데이터만으로 전화조사와 유사한 추정치를 얻을 수 있음을 예시함으로써 선거여론조사에서 전화조사의 대안적인 조사방법으로 인터넷조사의 활용가능성을 실제 조사데이터로 입증하였다는 데 그 의의가 있다.
표본조사에서 무응답의 적절한 처리는 추정의 정확성을 향상한다. 결측 메카니즘이 MCAR (missing completely at random) 또는 MAR (missing at random)인 경우에서는 이를 적절히 처리할 수 있는 다양한 방법이 연구되었다. 무응답이 발생하였을 때 사용하는 평균 추정량으로 흔히 성향점수보정 추정량이 사용되며 MAR 또는 MCAR 무응답인 경우, 알려진 표본 가중치와 타당한 방법으로 추정된 응답확률을 사용할 수 있으므로 성향점수보정 추정량은 불편추정량이 된다. 그러나 관심변수 값에 영향을 받는 무응답인 MNAR (missing not at random) 무응답에서는 정확한 응답확률을 구하는 것이 어려워 성향점수보정 추정량에 편향이 발생할 수 있다. Chung과 Shin (2017, 2022)은 무정보적 표본설계에서 MNAR 무응답이 발생하였을 때 평균 추정의 정확성을 향상하는 방법으로 단일 사후층화 방법을 제안하였다. 본 연구에서는 정보적 표본설계를 사용하고, MNAR 무응답이 발생한 경우에서 나이브 성향점수보정 추정량의 정확성 향상을 위한 이중 사후층화 방법을 제안하였다. 또한, 모의실험을 통해 제안된 방법의 우수성을 확인하였다.
대부분의 임상시험에서 가장 대표적으로 사용되는 실험설계는 무작위화로, 치료 효과를 정확하게 추정하기 위해 이용된다. 그러나 무작위화가 이루어지지 않은 관찰연구의 경우 치료군과 대조군의 비교로 얻는 치료효과에는 환자 간의 특성 등 여러 조정되지 않은 차이로 인해 편향이 발생한다. 성향 점수 가중치는 이러한 문제점을 해결하기 위해 널리쓰이는 방법으로 치료 효과를 추정하는데에 있어 교란요인을 조정하여 편향을 최소화하도록 하는 방법이다. 성향 점수를 이용한 가중치 방법 중 가장 널리 알려진 역확률 가중치는 관찰된 공변량이 주어졌을 때 특정 치료에 할당될 조건부 확률의 역에 비례하는 가중치를 할당한다. 그러나 이 방법은 극단적인 성향 점수에 의해 종종 방해 받아 편향된 추정치와 과도한 분산을 초래한다는 점이 알려져있어 이러한 문제를 완화하기 위해 절사 역확률 가중치, 중복 가중치, 일치 가중치를 포함한 여러 가지 대안 방법이 제안되었다. 본 논문에서는 제한된 중복, 잘못 지정된 성향 점수 모델 및 예측과 반대되는 치료 등 다양한 문제상황에서 여러 성향 점수 가중치 방법의 성능을 비교하는 시뮬레이션 비교연구를 수행하였다. 비교연구의 결과 중복 가중치와 일치 가중치는 편향, 제곱근평균제곱오차 및 포함 확률 측면에서 역확률 가중치와 절사역확률 가중치에 비에 우월한 성능을 보임을 확인하였다.
생존 자료에서 Hade 등 (2020) 은 시간-의존 교란 변수가 환자의 처치 시점에 영향을 미칠 때, 해당 효과를 보정하여 treatment delay effect를 올바르게 추정하기 위해 성향 점수 매칭 방법을 이용하였다. 이 때, treatment delay effect란 환자가 관심 있는 지연 시점만큼 늦게 처치를 받는 경우 제 때 받는 경우에 비해 사건 발생 위험에 미치는 영향을 의미한다. 본 연구에서는 또 다른 성향 점수 기반 모형인 Cox-MSM 모형 또한 해당 효과를 올바르게 추정할 수 있는지 모의 실험을 통해 확인 및 기존 매칭 모형과 비교하였다. 모의실험 결과, 세 가지 모형 모두 다양한 시나리오 내에서 treatment delay effect를 올바르게 추정함을 확인하였다. 특히 모든 시나리오 내에서 Cox-MSM의 제곱근평균제곱오차의 값이 가장 낮았으며, restricted Cox matching 모형에서 가장 큰 값을 가지는 것으로 나타났다. 결론적으로, 성향 점수에 기반하나 매칭이 아닌 방법 또한 treatment delay effect 적용이 가능하다는 결과를 제공한다. 추후 G-formula과 같이 성향 점수 기반이 아닌 모형에서도 적용이 가능한지에 대한 상세 연구가 필요하다고 사료된다.
본 논문은 우리나라에서 직업능력 향상을 위한 교육훈련이 개인의 임금에 어떤 영향을 미치는지를 "경제활동인구조사" 자료를 통해 분석한다. 교육훈련의 내생성을 통제하기 위하여 실증분석 방법으로 (1) 고정효과 추정법과 (2) 성향점수 매칭법을 적용한다. 고정효과 추정법(매칭법)의 결과에 따르면, 지난 1년 동안에 이수한 교육훈련으로 인하여 개인의 월평균 임금수준은 평균 2.6~4.7%(7.5~9.8%) 정도 상승한다. 상이한 두 가지 추정방법의 분석 결과를 종합하면, 우리나라에서 직업능력 향상을 위한 교육훈련의 임금 상승효과는 평균 2.6~9.8% 수준인 것으로 추정된다.
Journal of the Korean Data and Information Science Society
/
제28권1호
/
pp.109-117
/
2017
본 연구의 목적은 국가표본조사자료인 제6기 국민건강영양조사자료를 활용하여 성향점수를 기반으로 운동강도가 고혈압에 미치는 영향을 알아보고, 고혈압을 예방 또는 치료하기 위한 가장 효율적인 운동강도의 근거를 마련하고자 하는 것이다. 연구대상자는 만 18세 이상 65세인 미만의 대한민국 성인 중에서 운동능력에 제한이 있을 것으로 예상되는 장애인과 활동제한이 있는 사람을 제외하고 나트륨 섭취량을 비롯한 고혈압에 영향을 줄 수 있는 교란요인들이 결측인 대상자를 제외한 3,486명을 선정하였다. 성별, 나이, 흡연, 음주 등과 같은 교란요인을 기반으로 운동강도에 대한 성향점수를 추정하고, 복합표본설계를 고려한 로지스틱회귀모형에 추정된 성향점수를 보정변수로 활용하여 운동강도에 따른 고혈압 유병여부의 관련성을 파악하였다. 본 연구결과는 운동강도와 고혈압 유병의 관련성이 통계적으로 유의한 것으로 나타나지는 않았지만, 운동을 하지 않거나 무리한 운동을 하기 보다는 중강도의 적절한 운동을 하는 것이 고혈압 예방 및 치료에 더욱 효과적일 수 있다는 향후 연구들의 기초자료로 활용 될 수 있으리라 기대한다.
무작위 통제시험에서와 달리, 관찰연구에서는 편향되지 않은 인과관계를 추론하기 위한 통계적 전략이 필요하다. 최근 잠재범주분석(latent class analysis; LCA)에서 처치의 평균인과효과(average causal effect; ACE)를 추정하기 위한 새로운 방법들이 제안되었으나 이러한 방법들은 실제 데이터를 분석하는 응용 연구에 초점이 맞춰있다. 따라서 ACE의 참값을 알 수 없어 추정 방법의 성능을 평가하는 데 한계가 있다. 본 연구에서는 Park과 Chung(2014)이 제안한 방법을 개선하여, 다항범주형 처치변수가 잠재변수인 상황에서 다항범주형 결과변수에 미치는 인과효과 추정방법을 제안하고 처치변수와 결과변수가 잠재변수 또는 관측변수를 포함하는 여러 상황에서 본 연구가 제안한 인과효과 추정방법의 성능을 모의실험연구를 통하여 평가하고자 한다. 더불어 'National Longitudinal Study of Adolescents Health'자료를 사용하여 미국 여성 청소년 성장과 약물사용에 대한 인과효과를 추론하고자 한다.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.