• 제목/요약/키워드: 선형 혼합효과 회귀모델

검색결과 4건 처리시간 0.019초

비선형 혼합효과모형에서의 로버스트 능형회귀 방법과 정량적 고속 대량 스크리닝 자료에의 응용 (Robust ridge regression for nonlinear mixed effects models with applications to quantitative high throughput screening assay data)

  • 유지선;임창원
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.123-137
    • /
    • 2018
  • 비선형 혼합효과 모형은 다양한 분야에서 반복 측정 자료를 분석할 때 주로 사용된다. 비선형 혼합효과 모형은 개체 내 변동(intra-individual variation)에 대해 고려하는 제 1단계 개별수준모델(individual-level model)과 개체간 변동(inter-individual variation)에 대해 고려하는 제 2단계 개체군모델(population model)의 두 단계로 구성되어 있다. 비선형 혼합효과 모형의 첫 번째 단계인 개별수준모델은 비선형 회귀모형의 모수를 추정하는 것으로 일반적인 비선형 회귀모형과 같고, 주로 보통최소제곱추정 방법을 사용하여 모수를 추정한다. 그러나 최소제곱추정방법은 가정된 비선형 함수가 자료에 의해 명시적으로 드러나지 않는 경우 모수의 추정값과 그 표준오차가 극단적으로 커지는 문제가 발생할 수 있다. 본 논문에서는 최근에 비선형 회귀모형에서 제안된 능형회귀(ridge regression) 방법을 비선형 혼합효과 모형의 제 1단계 개별수준모델에 도입함으로써 이러한 문제를 해결할 수 있는 새로운 추정방법을 제안하였다. 제안된 추정량은 모의실험 연구를 통하여 기존의 표준적인 추정량과 그 성능을 비교하였다. 또한 미국의 National Toxicology Program으로부터 얻어진 정량적 대량고속 스크리닝(quantitative high throughput screening) 실제 자료를 사용하여 추정 방법들을 비교하였다.

The Ability of L2 LSTM Language Models to Learn the Filler-Gap Dependency

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권11호
    • /
    • pp.27-40
    • /
    • 2020
  • 본 논문은 장단기기억신경망(LSTM)이 영어를 배우면서 학습한 암묵적 통사 관계인 필러-갭 의존 관계를 조사하여 영어 문장 학습량과 한국인 영어 학습자(L2ers)의 문장 처리 패턴 간의 상관관계를 규명한다. 이를 위해, 먼저 장단기기억신경망 언어모델(LSTM LM)을 구축하였다. 이 모델은 L2ers가 영어 학습 과정에서 잠재적으로 배울 수 있는 L2 코퍼스의 영어 문장들로 심층학습을 하였다. 다음으로, 이 언어 모델을 이용하여 필러-갭 의존 관계 구조를 위반한 영어 문장을 대상으로 의문사 상호작용 효과(wh-licensing interaction effect) 즉, 정보 이론의 정보량인 놀라움(surprisal)의 정도를 계산하여 문장 처리 양상을 조사하였다. 또한 L2ers 언어모델과 상응하는 원어민 언어모델을 비교 분석함으로써, 두 언어모델이 문장 처리에서 필러-갭 의존 관계에 내재된 추상적 구문 구조를 추적할 수 있음을 보여주었을 뿐만 아니라, 또한 선형 혼합효과 회귀모델을 사용하여 본 논문의 중심 연구 주제인 의존 관계 처리에 있어서 원어민 언어모델과 L2ers 언어모델간 통계적으로 유의미한 차이가 존재함을 규명하였다.

The Unsupervised Learning-based Language Modeling of Word Comprehension in Korean

  • Kim, Euhee
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.41-49
    • /
    • 2019
  • 본 연구는 비지도 기계학습 기술과 코퍼스의 각 단어를 이용하여 한국어 단어를 형태소 분석하는 언어 모델을 구축하는데 목적을 둔다. 그리고 이 언어 모델의 단어 형태소 분석의 결과와 언어 심리 실험결과에서 얻은 한국어 언어사용자의 단어 이해/판단 시간이 상관관계을 갖는지를 규명하고자 한다. 논문에서는 한국어 세종코퍼스를 언어 모델로 학습하여 형태소 분리 규칙을 통해 한국어 단어를 자동 분리하는데 발생하는 단어 정보량(즉, surprisal(놀라움) 정도)을 측정하여 실제 단어를 읽는데 걸리는 반응 시간과 상관이 있는지 분석하였다. 이를 위해 코퍼스에서 단어에 대한 형태 구조 정보를 파악하기 위해 Morfessor 알고리즘을 적용하여 단어의 하위 단위 분리와 관련한 문법/패턴을 추출하고 형태소를 분석하는 언어 모델이 예측하는 정보량과 반응 시간 사이의 상관관계를 알아보기 위하여 선형 혼합 회귀(linear mixed regression) 모형을 설계하였다. 제안된 비지도 기계학습의 언어 모델은 파생단어를 d-형태소로 분석해서 파생단어의 음절의 형태로 처리를 하였다. 파생단어를 처리하는 데 필요한 사람의 인지 노력의 양 즉, 판독 시간 효과가 실제로 형태소 분류하는 기계학습 모델에 의한 단어 처리/이해로부터 초래될 수 있는 놀라움과 상관함을 보여 주었다. 본 연구는 놀라움의 가설 즉, 놀라움 효과는 단어 읽기 또는 처리 인지 노력과 관련이 있다는 가설을 뒷받침함을 확인하였다.

한국인의 정상 폐활량 예측치 (Normal Predictive Values of Spirometry in Korean Population)

  • 최정근;백도명;이정오
    • Tuberculosis and Respiratory Diseases
    • /
    • 제58권3호
    • /
    • pp.230-242
    • /
    • 2005
  • 연구배경 : 우리나라 국민을 대상으로 실시한 폐활량검사의 판정과 해석은 우리나라 국민을 대상으로 구한 폐활량 예측식이 사용되어야 한다. 그 동안 외국인을 대상으로 구한 폐활량 예측치가 사용되어 오류가 있었다. 본 연구에서는 전 국민을 대상으로 대표성 있고 신뢰할 수 있는 노력성 폐활량과 일초간 노력성 폐활량, 6초간 노력성 폐활량, 일초율에 대한 정상 예측식을 개발 하고자 하였다. 연구방법 : 전 국민을 대상으로 층화표본 추출법을 사용하여 조사대상을 선정하였으며, 폐활량검사기와 검사방법, 검사과정, 결과의 선택을 미국흉부학회에서 권고하는 기준에 따라 체계적인 정도관리와 질관리를 실시하였다. 폐활량 검사를 실시한 대상자 4,816명 중에서 비흡연자이면서 폐활량에 영향을 미칠 수 있는 호흡기 질환 및 증상이 없고, 흉부방사선학적 검사에서 심폐 이상 소견이 없으면서, 폐활량에 영향을 미치는 유해인자에의 노출력이 없는 대상자는 1,212명으로 남자 206명, 여자 1,006명이었다. 이들은 지역과 연령별로 우리나라 국민을 대표할 수 있었다. 통계분석에서 혼합효과모델을 적용하여 AIC 값이 가장 작은 모델로서 남자와 여자에 공통적으로 포함된 변수들을 일반선형회귀분석에 적용하여 폐활량 예측식을 구하였다. 결 과 : 노력성 폐활량의 예측식은 남자 -4.8434 - 0.00008633*연령$^2$(년) + 0.05292*신장(cm) + 0.01095*체중(kg)이었으며, 여자 -3.0006 - 0.0001273 *연령$^2$(년) + 0.03951*신장(cm) + 0.006892*체중(kg)이었다. 일초간 노력성 폐활량의 예측식은 남자 -3.4132 -0.0002484*연령$^2$(년) + 0.04578*신장(cm)이었으며, 여자 -2.4114 - 0.0001920*연령$^2$(년) + 0.03558*신장(cm)이었다. 6초간 노력성 폐활량의 예측식은 남자 -4.4244 -0.0001367*연령$^2$(년) + 0.05156*신장(cm) + 0.008246*체중(kg)이었으며, 여자 -3.1433 - 0.0001442*연령$^2$(년) + 0.04018*신장(cm) + 0.007077*체중(kg)이었다. 일초율의 예측식은 남자 119.9004 - 0.3902*연령(년) - 0.1268*신장(cm)이었으며, 여자 97.8567 - 0.2800*연령(년) - 0.01564*신장(cm)이었다. 결 론 : 본 예측식은 미국흉부학회에서 제시하고 있는 연령과 신장 변수에 체중이 포함되어 차이가 있었다. 이러한 이유는 연령효과와 젊은 연령에서 신장과 체중이 급격하게 변화하는 체격효과가 복합적으로 작용하기 때문이라고 해석된다. 본 예측식과 다른 국내 및 국외 예측식을 비교할 때 본 예측식이 노력성 폐활량과 일초간 노력성 폐활량, 일초율의 예측치를 높게 추정하였으나 대부분 그 차이가 10% 이내로 비슷하였다. 코카시안인 백인을 대상으로 구한 외국의 예측식보다 본 연구의 정상 예측치가 낮지 않았다. 이러한 이유로는 우리나라 젊은 사람들의 체격조건의 변화와 함께 엄격한 정상인의 선정기준, 검사방법과 검사결과의 정도관리 및 질관리에 기인하는 것으로 판단되었다.