• 제목/요약/키워드: 로그-밀도비

검색결과 15건 처리시간 0.031초

로지스틱 회귀모형에서 이변량 정규분포에 근거한 로그-밀도비 (Log-density Ratio with Two Predictors in a Logistic Regression Model)

  • 강명욱;윤재은
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.141-149
    • /
    • 2013
  • 로지스틱회귀모형에서 두 설명변수의 조건부 분포가 모두 이변량 정규분포라고 할 수 있다면 설명변수들의 함수로 표현되는 로그-밀도비를 통해 모형에 포함시켜야하는 항을 알 수 있다. 두개의 이변량 정규분포에서 분산-공분산행렬이 같은 경우에는 이차항과 교차항 없이 일차항만으로 충분하다. 상관계수가 모두 0이면 교차항은 설명변수의 분산과 관계없이 필요하지 않다. 또한 로지스틱회귀모형에서 로그-밀도비를 통해 이차항과 교차항이 필요하지 않게 되는 다른 조건들도 알아본다.

로지스틱회귀모형의 변수선택에서 로그-오즈 그래프를 통한 로그-밀도비 연구 (A study on log-density with log-odds graph for variable selection in logistic regression)

  • 강명욱;신은영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.99-111
    • /
    • 2012
  • 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 로지스틱회귀모형에서 어떤 설명변수가 어떻게 모형에 포함되는지에 대한 변수선택문제에서 유용한 정보를 제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하고 이 경우 x항과 log(x)항이 모형에 포함되어야 한다. 로그-오즈 그래프는 변수선택문제를 연구하는데 매우 중요한 도구가 된다. 이러한 그래픽적 연구에 의하면, x|y = 0과 x|y = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

로지스틱회귀모형에서 로그-밀도비를 이용한 변수의 선택 (Variable Selection with Log-Density in Logistic Regression Model)

  • 강명욱;신은영
    • Communications for Statistical Applications and Methods
    • /
    • 제19권1호
    • /
    • pp.1-11
    • /
    • 2012
  • 로지스틱회귀모형에서 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 어떤 설명변수가어떻게모형에포함되는지에대한변수선택문제에서유용한정보를제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하다. 여러 가지 모의실험을 수행한 결과를 보면, $x{\mid}y$ = 0과 $x{\mid}y$ = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

로지스틱회귀모형의 평가를 위한 그래픽적 방법 (Various Graphical Methods for Assessing a Logistic Regression Model)

  • 김경진;강명욱
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1191-1208
    • /
    • 2015
  • 대부분의 통계분석방법은 요약통계량에 의존하지만 그래픽적 방법을 이용하면 자료의 특성을 파악하기 쉽고 통계량만으로는 알아낼 수 없는 부분까지도 접근이 가능하다. 그래프를 통한 로지스틱회귀모형의 평가 방법으로 로그-밀도비를 통한 검토, 차원 검토, 주변모형산점도, 카이잔차산점도, CERES 그림을 알아보고 모의자료들을 통해 다양한 상황에서 그래픽적 방법들 어떠한 결과를 나타내지를 비교 검토한다.

비점착성 유사의 입도 분포 모형에 관한 Framework (A Framework for Size Distribution of Noncohesive Sediment)

  • 변지선;손민우;박병은;문혜진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.282-282
    • /
    • 2017
  • 모래, 실트 및 자갈과 같은 비점착성 유사는 하천에서의 이동 형태에 따라 소류사와 부유사로 구분된다. 부유사는 난류로 인해 흐름 내에서 부유 상태로 이동하는 유사로, 대부분의 자연 하천에서 유사는 부유사 형태로 이송된다. 유수동역학적 조건 하에서 이동하는 부유사의 입도 분포는 유사 입자의 부유와 퇴적에 따라 불규칙적으로 변화하기 때문에 여러 연구에서 주요한 문제로 다뤄지고 있다. 부유사의 입도 분포는 흐름 유속, 부유사의 부유 높이, 하상 재료의 특성 등에 따라 변화하며, 로그 정규분포를 따르는 것으로 알려져 있다. 이에 본 연구에서는 여러 다양한 하천 흐름 조건에서 부유사의 입도 분포를 모의할 수 있는 입도 분포 모형에 관한 개념적 틀(Framework)을 제안한다. 유사 입자의 입도 분포 모의는 추계학적 방법의 적용을 통해 얻어진다. 본래 점착성 유사의 입도 분포를 모의하기 위한 추계학적 입도 분포 모형으로부터 제안된 개념적 틀로, 다양한 흐름 조건 하에서 특정 확률 분포형을 띠는 입도 분포를 모의할 수 있다. 점착성 유사의 이동 모형에서는 점착성을 띠는 유사 입자들의 응집 현상에 따른 크기 변화를 모의하기 위한 응집 모형이 필수적이다. 시간에 따른 크기 변화를 모의하는 응집 모형에서, 흐름 내 여러 특성들에 의해 결정되는 응집 인자와 달리 파괴 인자의 경우 불규칙적 난류 운동으로 인해 무작위한 특성을 띤다. 모형에서 요구되는 파괴 인자를 특정 확률 분포형을 띠는 난수로 고려함으로써 점착성 유사의 입도 분포 모형이 개발되었다. 이 때, 점착성 유사는 프랙탈 구조를 가지는 것으로 가정하기 때문에 크기에 따라 밀도와 침강 속도가 변화한다. 반면 비점착성 유사는 크기에 따른 밀도 변화가 일어나지 않으므로, 고정된 밀도와 프랙탈 차원을 적용하여 점착성 유사의 입도 분포모형으로부터 비점착성 유사의 입도 분포 모의가 가능할 것으로 판단된다. 이러한 추계학적 방법의 적용을 통해, 하나의 경계 조건으로 대변되는 하상 특성에 따른 단점 또한 보완될 것으로 예측된다. 예를 들어 로그 정규 분포를 띤다고 가정할 때 보정을 통해 결정해야하는 변수는 평균과 분산으로 두 개가 요구된다. 유사의 평균 크기로부터 확률분포형의 평균값이 결정되면, 하상에 존재하는 유사의 특성에 따른 입도 분포의 분산은 난수의 분산을 결정함으로써 모의할 수 있다.

  • PDF

몬테 카를로 시뮬레이션을 이용한 소나무 탄소배출계수의 불확도 평가 (Uncertainty Assessment of Emission Factors for Pinus densiflora using Monte Carlo Simulation Technique)

  • 표정기;손영모;장광민;이영진
    • 한국산림과학회지
    • /
    • 제102권4호
    • /
    • pp.477-483
    • /
    • 2013
  • 본 연구의 목적은 몬테 카를로 시뮬레이션을 이용하여 소나무 탄소배출계수 자료의 확률밀도를 추정하고 불확도를 제시하는데 있다. 이용된 탄소배출계수는 목재기본밀도, 바이오매스확장계수, 뿌리함량비이고 4개의 확률밀도 함수(정규분포, 로그정규분포, 감마분포, 와이불 분포)를 고려하였다. 2-표본 콜모그로프-스미르노프 검정통계량과 누적밀도그림을 비교하여 최적의 확률밀도함수를 선정하고 상한과 하한의 불확도를 제시하였다. 본 연구의 결과에 의하면, 각 탄소배출계수에서 추정된 확률밀도함수는 강원지방소나무에서 목재기본밀도는 감마분포, 바이오매스확장계수는 로그정규분포, 뿌리함량비는 정규분포이고 중부지방소나무에서 목재기본밀도는 정규분포, 바이오매스확장계수는 감마분포, 뿌리함량비는 감마분포를 나타내었다. 강원지방소나무 탄소배출계수의 불확도는 상한에서 62.1%, 하한에서 -52.6%이고 중부지방소나무는 상한에서 43.9%, 하한에서 -34.5%를 나타내었다.

현장 조사 자료를 이용한 GIS 기반 주제도 작성을 위한 단변량 크리깅 기법의 비교 (Comparison of Univariate Kriging Algorithms for GIS-based Thematic Mapping with Ground Survey Data)

  • 박노욱
    • 대한원격탐사학회지
    • /
    • 제25권4호
    • /
    • pp.321-338
    • /
    • 2009
  • 이 연구의 목적은 비대칭 분포를 가지는 현장 조사 자료로부터 GIS 기반 주제도를 생성하기 위한 공간 내삽 방법으로 단변량 크리깅 기법을 비교하는데 있다. 기존 정규 크리깅과 비선형 자료 변환에 기반을 둔 로그 정규 크리깅, 다중 가우시안 크리깅과 지시자 크리깅을 지화학 원소 비소와 납에 대해 사례 연구를 통해 비교하였다. 예측 능력의 비교 분석을 위해 leave-one-out 기반 교차 검증을 통한 오차 분석을 수행하였으며, 샘플링 밀도의 차이에 따른 오차의 변화 양상도 분석하였다. 비교 분석 결과, 지시자 크리깅이 전반적으로 가장 높은 예측 능력을 나타내었으며, 작은 값과 높은 값의 예측 능력도 우수한 것으로 나타났다. 정규 크리깅에 비해 비선형 자료 변환 기반 크리깅 기법들이 우수한 예측 능력을 나타내었지만, 기존에 많이 적용된 로그 정규 크리깅은 샘플링 밀도와 상관없이 편향 정도가 가장 크게 나타내었다. 이 연구를 통해 얻어지는 정량적 검증 결과는 비대칭 분포를 가지는 현장 조사 자료의 내삽을 위한 크기깅 기법의 선정에 유용하게 이용될 수 있을 것으로 기대된다.

3차원 잔차산점도를 이용한 로지스틱회귀모형에서 교호작용의 탐색 (Exploring interaction using 3-D residual plots in logistic regression model)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권1호
    • /
    • pp.177-185
    • /
    • 2014
  • 로지스틱회귀모형에서 설명변수만으로는 충분히 설명이 되지 못하고 설명변수의 변환된 형태인 이차항 또는 교호작용항이 필요한 경우가 있다. 설명변수가 두 개이고 조건부 분포가 이변량 정규분포를 따르는 경우 로지스틱회귀모형에서는 기본적으로 이차항과 교호작용항이 모형에 포함되어야 한다. 하지만 조건부 분포의 분산과 상관계수에 따라 이차항과 교호작용항이 필요하지 않게 되는 경우도 있다. 분산이나 상관계수에 대한 정보는 산점도를 보고 대체적인 판단이 가능하지만 교호작용항의 필요성을 판단하기가 쉽지 않다. 본 논문에서는 3차원 잔차산점도를 이용한 교호작용의 탐색방법을 제시하고 이 방법을 실제 자료에 적용시켜본다.

라돈 농도 분포도 작성을 위한 단변량 크리깅 기법의 정량적 비교 (Quantitative Comparison of Univariate Kriging Algorithms for Radon Concentration Mapping)

  • 곽근호;김용재;장병욱;박노욱
    • 한국지리정보학회지
    • /
    • 제20권1호
    • /
    • pp.71-84
    • /
    • 2017
  • 토양, 암석, 지하수로부터 실내에 유입되는 라돈은 인간에게 큰 위해를 끼치는 방사능 가스이다. 라돈 가스의 위해성을 확인하기 위해 실내 라돈 농도를 측정해 오고 있는데, 추가적인 분석 수행을 위해서는 신뢰성 높은 분포도 작성이 매우 중요하다. 본 연구에서는 비대칭 분포를 나타내는 라돈 농도의 공간 분포도 작성을 위해 단변량 크리깅 기법들의 비교를 목적으로 정규 크리깅, 비선형 자료 변환 기반의 로그 정규 크리깅, 다중 가우시안 크리깅과 지시자 크리깅의 예측 능력을 비교하였다. 예측 능력을 비교 분석하기 위해 잭나이프 방법을 이용하여 검증을 수행하였으며, 자료 구간별 오차와 샘플링 밀도의 차이에 따른 오차도 추가적으로 분석하였다. 남한 지역을 대상으로 한 사례 연구 결과에서 전반적으로 정규 크리깅에 비해 비선형 자료 변환 기반 크리깅 기법들이 좋은 예측 능력을 보였으며, 비선형 자료 변환 기반 크리깅은 로그 정규 크리깅, 다중 가우시안 크리깅 순으로 좋게 나타났다. 그러나 공간 패턴과 높은 값의 재생산을 고려할 때, 높은 값의 예측 능력은 정규 크리깅이 가장 우수하였다. 본 연구의 결과는 비대칭 분포 자료의 공간 예측을 위한 크리깅 기법의 선정에 유용하게 사용될 것으로 기대된다.

자산변동 좌표 클러스터링 기반 게임봇 탐지 (Game-bot detection based on Clustering of asset-varied location coordinates)

  • 송현민;김휘강
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1131-1141
    • /
    • 2015
  • 본 논문에서는 MMORPG에서 각 캐릭터의 소지금 증가/감소 이벤트 로그 데이터를 위주로 플레이어의 액션 로그 데이터를 조사하여 게임봇을 탐지하는 기계 학습 기반의 새로운 접근 방법을 제안한다. 게임봇 계정과 일반 계정을 구분하는 주요 피쳐를 추출하기 위해 밀도 기반 군집화 알고리즘의 하나인 DBSCAN (Density Based Spatial Clustering of Application with Noise)를 이용하였다. DBSCAN 알고리즘을 통해 각 플레이어의 소지금 증가/감소 위치 좌표를 클러스터링하고, 그 결과 생성된 클러스터의 수, 코어 포인트의 비율, 멤버 포인트의 비율, 노이즈 포인트의 비율과 같은 공간적 특성을 나타내는 값들을 추출하였다. 해당 피쳐들을 사용하면 게임봇 개발자들이 게임봇 탐지 시스템의 원리를 알더라도 넓은 지역을 돌아다니며 사냥을 하도록 게임봇 프로그램을 제작하는 것은 매우 비효율적이기 때문에 탐지 시스템을 우회하기 어렵게 된다. 결과적으로, 게임봇은 소지금 변동 좌표 데이터로부터 추출한 공간적 특성에서 일반유저와 명확한 차이를 보였다. 예를 들면, DBSCAN 클러스터링 결과 중 노이즈 포인트의 비율에서 게임봇은 5% 이하의 낮은 값을 가지는 반면에 일반 유저들은 대부분 높은 값을 갖는다. 실제 MMORPG의 액션 로그 데이터를 이용한 게임봇 탐지에서, 본 논문에서 제안된 시스템은 높은 탐지율의 우수한 성능을 보였다.