• 제목/요약/키워드: 부분최소자승회귀법

검색결과 23건 처리시간 0.028초

근적외선분광광도계(NIRS)를 이용한 국내산 콩과 수입콩의 판별분석 (Discrimination of Korean Domestic and Foreign Soybeans using Near Infrared Reflectance Spectroscopy)

  • 안형균;김용호
    • 한국작물학회지
    • /
    • 제57권3호
    • /
    • pp.296-300
    • /
    • 2012
  • 국내산 콩과 수입콩의 판별에 NIRS를 도입함으로써 보다 빠르고 정확한 식별분석을 하고자 실험을 수행하였다. NIRS를 사용하여 400~2,500 nm 범위에서 콩 분말의 파장을 측정하였으며, 측정된 spectrum은 WINISI II program 을 이용하여 수처리와 회귀분석을 하였다. 검량식 작성을 위한 수처리는 spectrum을 1차미분 및 4 nm gap으로 조정한 것이 가장 적합하였으며, 회귀식은 변형부분최소자승회귀법(Modified partial least squares regression)이 우수하였다. MPLS 회귀분석시 원산지 판별을 위해 loading value를 국내산 콩은 '100', 수입콩은 '1'로 처리하여 검량식을 작성하고 그 적합성을 검증한 결과 factor가 10일 때 도출된 calibration equation의 상관값이 0.98, 교차검증의 상관값이 0.94를 나타내어 상관도가 높음을 알 수 있었다. 따라서 NIRS를 이용한 국내산 콩과 수입콩의 판별분석이 가능할 것으로 판단되었다.

그룹 구조를 갖는 고차원 유전체 자료 분석을 위한 네트워크 기반의 규제화 방법 (Network-based regularization for analysis of high-dimensional genomic data with group structure)

  • 김기풍;최지윤;선호근
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1117-1128
    • /
    • 2016
  • 고차원 유전체 자료를 사용하는 유전체 연관 분석에서는 벌점 우도함수 기반의 회귀계수 규제화 방법이 질병 및 표현형질에 영향을 주는 유전자를 발견하는데 많이 이용된다. 특히, 네트워크 기반의 규제화 방법은 유전체 연관성 연구에서의 유전체 경로나 신호 전달 경로와 같은 생물학적 네트워크 정보를 사용할 수 있으므로, Lasso나 Elastic-net과 같은 다른 규제화 방법들과 비교했을 경우 네트워크 기반의 규제화 방법이 보다 더 정확하게 관련 유전자들을 찾아낼 수 있다는 장점을 가지고 있다. 그러나 네트워크 기반의 규제화 방법은 그룹 구조를 갖고 있는 고차원 유전체 자료에는 적용시킬 수 없다는 문제점을 가지고 있다. 실제 SNP 데이터와 DNA 메틸화 데이터처럼 대다수의 고차원 유전체 자료는 그룹 구조를 가지고 있으므로 본 논문에서는 이러한 그룹 구조를 가지고 있는 고차원 유전체 자료를 분석하고자 네트워크 기반의 규제화 방법에 주성분 분석(principal component analysis; PCA)과 부분 최소 자승법(partial least square; PLS)과 같은 차원 축소 방법을 결합시키는 새로운 분석 방법을 제안하고자 한다. 새롭게 제안한 분석 방법은 몇 가지의 모의실험을 통해 변수 선택의 우수성을 입증하였으며, 또한 152명의 정상인들과 123명의 난소암 환자들로 구성된 고차원 DNA 메틸화 자료 분석에도 사용하였다. DNA 메틸화 자료는 대략 20,000여개의 CpG sites가 12,770개의 유전자에 포함되어 있는 그룹 구조를 가지고 있으며 Illumina Innium uman Methylation27 BeadChip으로부터 생성되었다. 분석 결과 우리는 실제로 암에 연관된 몇 가지의 유전자를 발견할 수 있었다.

PCBs 독성 예측을 위한 주요 분자표현자 선택 기법 및 계산독성학 기반 QSAR 모델 개발 (Development of QSAR Model Based on the Key Molecular Descriptors Selection and Computational Toxicology for Prediction of Toxicity of PCBs)

  • 김동우;이승철;김민정;이은지;유창규
    • Korean Chemical Engineering Research
    • /
    • 제54권5호
    • /
    • pp.621-629
    • /
    • 2016
  • EU의 REACH 제도 도입에 따라 각종 화학물질에 대한 독성 및 활성 정보 확보를 위해 화학물질의 분자구조 정보를 기반으로 화학물질의 독성 및 활성을 예측하는 정량적구조활성관계(QSAR)에 대한 연구가 최근 활발히 진행되고 있다. QSAR 모델에 사용되는 분자표현자는 매우 다양하기 때문에 화학물질의 물성 및 활성을 잘 표현할 수 있는 주요한 분자표현자를 선택하는 과정은 QSAR 모델 개발에 있어 중요한 부분이다. 본 연구에서는 화학물질의 분자구조 정보를 나타내는 주요 분자표현자의 통계적 선택 방법과 부분최소자승법(Partial least square: PLS) 기반의 새로운 QSAR 모델을 제안하였다. 제안된 QSAR 모델은 130종의 폴리염화바이페닐(Polychlorinated biphenyl: PCB)에 대한 분배계수(log P)와 14종의 PCBs에 대한 반수 치사 농도(Lethal concentration 50%: $LC_{50}$) 예측에 사용되고, 제안된 QSAR 모델 예측 정확도는 기존의 OECD QSAR Toolbox에서 제공하는 QSAR 모델과 비교하였다. 관심 화학물질의 분자표현자와 활성정보 간의 높은 상관관계를 갖는 주요 분자표현자를 선별하기 위해서, 상관계수(r)와 variable importance on projections (VIP)기법을 적용하였으며, 화학물질의 독성 및 활성정보를 예측하기 위해 선별된 분자표현자와 활성정보를 이용해 부분최소자승법(PLS)를 사용하였다. 회귀계수($R^2$)와 prediction residual error sum of square (PRESS)을 이용한 성능평가결과, 제안된 QSAR 모델은 OECD QSAR Toolbox의 QSAR 모델보다 PCBs의 log P와 $LC_{50}$에 대하여 각각 26%, 91% 향상된 예측력을 나타내었다. 본 연구에서 제안된 계산독성학 기반의 QSAR 모델은 화학물질의 독성 및 활성정보에 대한 예측력을 향상시킬 수 있고 이러한 방법은 유독 화학물질의 인체 및 환경 위해성 평가에 기여할 것으로 판단된다.

가시광선-근적외선 분광법을 이용한 유성분 측정 기술 개발 (Development of Measuring Technique for Milk Composition by Using Visible-Near Infrared Spectroscopy)

  • 최창현;윤현웅;김용주
    • 한국식품저장유통학회지
    • /
    • 제19권1호
    • /
    • pp.95-103
    • /
    • 2012
  • 본 연구는 원유의 실시간 휴대용품질측정 시스템 개발을 위한 기초 연구로서 원유 시료의 온도에 따른 가시광선-근적외선 스펙트럼을 측정하였으며, 다양한 수학적 전처리방법을 적용하여 유성분 예측모델을 개발하였다. 스펙트럼 측정은 원유 시료 180개에 대해 스펙트럼의 수학적 전처리 방법으로 평활화, 정규화, MSC, 1차 및 2차 미분을 사용하였고 예측모델은 부분최소자승법을 이용하였다. 유성분을 분석한 결과 함량 범위와 평균은 지방이 각각 2.44~6.42%, 4.05%, 단백질은 각각 2.44~4.28%, 3.35%, 무지고형분은 각각 7.85~9.57%, 8.76%로 나타났다. 또한 유당의 함량 범위와 평균은 각각 3.93~5.24%, 4.74%였으며 요소태질소의 경우에는 각각 4.6~15.1 mg/dl, 10.27 mg/dl로 대부분 권장 기준을 만족하였다. 원유 시료의 온도에 따른 스펙트럼은 1,400~2,500 nm에서 큰 차이를 보였으며 온도가 상승함에 따라 흡광도가 높아지는 것을 알 수 있었다. 원유 시료의 온도에 따른 유성분 예측모델을 400~2,500 nm의 영역에서 개발하였으며 예측성능은 지방과 무지고형분의 경우 온도변화와 무관하였다. 단백질과 유당, 요소태질소의 예측성능은 온도가 낮을수록 급격히 감소하여 스펙트럼 측정 시 원유 시료의 온도를 $40^{\circ}C$로 유지하는 것이 필요함을 알 수 있다. $40^{\circ}C$의 원유 스펙트럼에 대해 수학적 전처리를 수행한 결과 평활화를 수행하여 측정 장치 자체의 노이즈를 감소시킬 수 있었고 정규화를 수행하여 기준선을 일치시킬 수 있었다. 또한 MSC를 수행하여 빛의 산란에 의한 영향을 제거하여 스펙트럼간의 차이를 감소시킬 수 있었고 1차 및 2차 미분을 수행한 결과 기준선 일치와 기존 스펙트럼에서 나타나지 않았던 파장영역에 대한 분석이 가능함을 알수 있다. 다중회귀분석의 stepwise 방법을 이용하여 최적 파장영역을 선정하고 유성분 예측모델을 개발한 결과 요소태질소를 제외하고 대부분 근적외선 영역에서 우수한 상관관계를 보여주었다. 지방과 단백질은 원시 스펙트럼의 검증부 결정계수가 각각 0.93, 0.92에서 정규화를 수행한 결과 각각 0.98, 0.92로 원시 스펙트럼의 결과가 우수하여 큰 개선이 없었으나 RPD는 각각 4.10, 3.41에서 5.47, 3.73으로 높아져 정밀도가 향상됨을 알 수 있다. 무지고형분과 유당의 예측모델은 원시 스펙트럼의 경우 각각 0.82, 0.75로 예측모델로 사용하기에는 어려웠으나 각각 평활화와 MSC를 수행하였을 때 검증부 결정계수가 0.90, 0.80으로 크게 개선되어 유성분 예측모델의 신뢰성 향상에 기여할 수 있을 것으로 판단된다. 요소태질소의 경우 가시광선 영역에서 가장 우수한 상관관계를 보여주었으나 검증부 결정계수, 오차, RPD가 각각 0.61, 1.56%, 1.58로 다른 성분에 비해 매우 낮게 나타났다. 이를 개선하기 위해 수학적 전처리를 수행하였으나 크게 개선되지 않았으므로 요소태질소의 신뢰성 있는 모델을 개발하기 위해서는 부분최소자승법 외에 다양한 알고리즘의 적용이 필요할 것으로 판단된다.

근적외선분광법을 이용한 옥수수 사일리지의 소화율 및 에너지 평가 (Prediction of the Digestibility and Energy Value of Corn Silage by Near Infrared Reflectance Spectroscopy)

  • 박형수;이종경;이효원;김수곤;하종규
    • 한국초지조사료학회지
    • /
    • 제26권1호
    • /
    • pp.45-52
    • /
    • 2006
  • 본 시험의 목적은 옥수수 사일리지의 소화율 및 에너지가치를 신속하고 정확하게 평가하는 방법으로서 근적외선분광법(NIRS)의 이용성을 확대하고 동시에 더욱 정확한 검량식을 유도하기 위하여 수행되었다. 112점의 옥수수 사일리지 시료를 이용하여 근적외선분광기를 이용하여 스펙트럼을 수집하였다. 검량기법은 변형부분 최소자승회귀법(MPLS), 산란보정법은 SNV-D 또한 1,4,4,1 수처리 방법을 이용하여 검량식을 작성하였다. 옥수수 사일리지의 소화율 측정방법에 따른 근적외선분광법의 예측 능력은 IVDMD, IVTD 및 CDMD 함량에서 각각 $SEP=1.57% (R^2v=0.70),\;SEP=1.13%(R^2v=0.73)$$SECV=1.74%\;(R^2v=0.77)$로 나타났으며 에너지 가치를 예측하기 위한 검량식 작성 및 검증 결과는 TDN, NEL 및 ME 함량에서 각각 SECV=0.69% $(R^2v=0.85)$, SECV=0.02% (R2v=0.88) 및 SECV=0.02% $(R^2v=0.88)$로 비교적 양호한 결과를 나타냈다.

근적외선분광법을 이용한 이탈리안 라이그라스, 페레니얼 라이그라스,톨 페스큐 종자의 초종 판별 (Discrimination of Pasture Spices for Italian Ryegrass, Perennial Ryegrass and Tall Fescue Using Near Infrared Spectroscopy)

  • 박형수;최기춘;김지혜;소민정;이기원;이상훈
    • 한국초지조사료학회지
    • /
    • 제35권2호
    • /
    • pp.125-130
    • /
    • 2015
  • 본 연구는 근적외선분광법을 이용하여 우리나라에서 재배되고 있는 목초류 중 외형적 특성이 유사한 이탈리안 라이그라스, 페레니얼 라이그라스와 톨 페스큐 종자의 초종판별 가능성을 검토하고자 수행되었다. 근적외선분광기를 이용하여 목초류 종자를 가시파장 대역대(680~1,099 nm), NIRS 파장 대역대(1,100-2,500 nm) 및 NIRS 전체 파장 대역대(680-2,500 nm)로 구분하여 스펙트라를 얻은 후 1차 미분과 8 nm gap으로 수 처리를 수행하였으며 부분최소자승(PLS) 회귀분석법을 통해 초종판별 검량식을 개발하고 판별 정확성을 검증하였다. 목초류의 초종판별 정확성은 가시파장대역에서 SECV 1.732, $R^2cv$ 0.96으로 가장 판별 정확성이 낮았으며 NIRS 전체 파장대역에서 SECV 1.182, $R^2cv$ 0.98로 가장 높은 판별 정확성을 나타내었다. 파장대역별 예측 정확성은 NIR 파장대역(1,100-2,500 nm)에서 교차검증오차(SECV) 1.319에서 예측 오차(SEP) 1.288로 낮아졌으며 가시영역대(680~1,099)는 SECV 1.732에서 SEP 1.749로 약간 높아졌다. Discrimination equation 분석법에 의한 NIRS 전체 파장대역별 목초류 초종의 판별 결과는 초종간에 판별 정확성의 차이가 크게 나타났으며 이탈리안 라이그라스의 'Hits'는 68%로 가장 낮았으며 페레니얼 라이그라스가 78%의 정확성으로 가장 높게 나타났다. 따라서 NIRS를 이용한 목초류 초종의 판별분석이 가능할 것으로 판단되었다.

근적외선분광법을 이용한 수수×수단그라스 교잡종 종자의 품종 판별 (Variey Discrimination of Sorghum-Sudangrass Hybrids Seed Using near Infrared Spectroscopy)

  • 이기원;송요욱;김지혜;라하만 아티쿨;오미래;박형수
    • 한국초지조사료학회지
    • /
    • 제40권4호
    • /
    • pp.259-264
    • /
    • 2020
  • 본 연구는 근적외선분광법을 이용하여 국내에서 재배중인 수수×수단그라스 교잡종 품 판별 가능성을 검토하고자 수행되었다. 근적외선분광기를 이용하여 수수×수단그라스 교잡종 종자를 가시파장 대역대 (680 - 1,099 nm), NIRS 파장 대역대 (1,100 - 2,500 nm) 및 NIRS 전체 파장 대역대 (680 - 2,500 nm)로 구분하여 스펙트라를 얻은 후 1차 미분과 8 nm gap으로 수 처리를 수행하였으며 부분최소자승 (PLS) 회귀분석법을 통해 품종판별 검량식을 개발하고 판별 정확성을 검증하였다. 수수×수단그라스 교잡종품종 판별의 정확성은 NIR파장대역에서 SECV 8.44 그리고 R2CV 0.89로 가장 판별 정확성이 낮았으며 NIRS 전체 파장대역에서 SECV 7.88 그리고 R2CV 0.90로 가장 높은 판별 정확성을 나타내었다. 파장대역별 예측 정확성은 NIR 파장대역 (1,100 - 2,500 nm)이 가장 우수하였으며, 교차검증오차 (SECV) 8.44에서 예측오차 (SEP) 12.03로 높아졌으며 가시영역대 (680 - 1,099)는 SECV 8.23에서 SEP 12.51로 높아졌다. Discrimination equation 분석법에 의한 NIRS 전체 파장대역별 수수×수단그라스 교잡종 종자의 판별 결과는 품종간에 판별 정확성의 차이가 크게 나타났으며 1, 2, 4 그리고 8번 품종 (G-7, BMR Gold II, Honey chew and SX-17)에서는 100 %의 정확성으로 가장 높게 나타났다. 따라서 NIRS를 이용한 수수×수단그라스 교잡종 종자의 판별분석이 가능할 것으로 판단되었다.

휴대용 분광분석기를 이용한 알코올 중에 함유되어 있는 물의 측정 (Determination of water content in alcohol by portable near infrared (NIR) system)

  • 안지원;우영아;김효진
    • 분석과학
    • /
    • 제16권2호
    • /
    • pp.95-101
    • /
    • 2003
  • 본 연구에서는 근적외선 분광분석법 (NIR)을 이용하여 메탄올과 에탄올 혼합액 중의 물의 함량을 비파괴적으로 측정하였다. Photo-diode array 방식의 휴대용 NIR system과 scanning 방식의 NIR spectrometer를 이용하여 두 기기 사이의 calibration 결과를 비교하였다. 알코올 혼합액 중의 물의 함량을 정량분석 하기 위해 부분최소자승회귀분석법 (PLSR : partial least squares regression)을 사용하였다. 그 결과 SEP (standard error of prediction)가 photo-diode array 방식을 사용하였을 때는 0.10%, scanning 방식을 사용하였을 때는 0.12%였다. Calibration 모델의 안정성을 확인하기 위하여 6일 동안 2%의 메탄올을 함유하고 있는 에탄올 용액 중의 물의 함량이 3%, 5% 및 7% 되도록 시료를 조제하여 측정하였다. 두 가지 방식의 NIR 모두 3%이내의 변동계수 (CV : coefficient of variation)로 좋은 결과를 나타내었다. 이번 연구를 통해서 메탄올과 에탄올 혼합액 중의 물의 함량 측정이 근적외선 분광분석법을 이용하여 성공적으로 수행되었고 photo-diode array 방식의 휴대용 NIR 시스템을 이용해서 scanning 방식의 NIR spectrometer를 이용한 결과와 유사한 결과를 얻을 수 있었다.

불소고분자내 유기용매의 비-픽 확산 (Non-Fickian Diffusion of Organic Solvents in Fluoropolymeys)

  • 이상화
    • 폴리머
    • /
    • 제28권1호
    • /
    • pp.24-34
    • /
    • 2004
  • 여러 종류의 불소고분자내로 다양한 유기용매들의 동적 흡수 평형 (혹은 팽윤) 실험을 진행하였다. 불소로 포화된 고분자는 이상적 흡수 거동을 나타내었으나 부분적으로 치환된 불소고분자는 최종 흡수단계에서 가속화되는 비이상적 흡수 거동을 나타내었다. 회귀분석에 의해 픽-확산 거동으로부터 벗어나는 정도를 최소자승법 (즉, ∑ [측정값-예측값]$^2$)으로 구한 결과 -퍼플루오로알콕시 공중합체, 폴리(에틸렌 테트라플루오로에틸렌) 공중합체, 폴리(비닐리덴 플루오라이드), 폴리(에틸렌 클로로트리플루오로에틸렌) 공중합체에 대해 각각 3.0${\times}$$10^{-4}$, 1.75${\times}$$10^{-3}$, 8.68${\times}$$10^{-3}$, 1.75${\times}$$10^{-2}$의 수치를 나타내었다. 응력-변형 실험 결과 비-픽 확산 거동은 팽윤된 불소고분자의 기계적 성질 (탄성률과 인장 강도) 변화와 상관관계가 있음을 알 수 있었다. 비이상적 흡수 거동의 주요 원인은 치환된 수소 혹은 염소와 불소원자 간의 전기음성도 차이에 기인한 사슬 간극성 결합 구조가 침투성분의 가소화 효과에 의해 비선형적 이완이 진행되면서 비-픽 확산이 진행되기 때문이다. 따라서 부분적으로 치환된 불소고분자를 차단성 혹은 선택적 투과기능이 요구되는 분야에 적용할 때 가소화 성분에 대한 용해 및 확산 거동에 대한 신중한 고찰이 필요하다.

타 성분 영향을 고려한 요당과 요단백의 흡수분광학 진단 (Measurement of Glucose and Protein in Urine Using Absorption Spectroscopy Under the Influence of Other Substances)

  • 윤길원;김혜정
    • 한국광학회지
    • /
    • 제20권6호
    • /
    • pp.346-353
    • /
    • 2009
  • 요당과 요단백은 소변검사의 중요한 항목으로 스트립을 사용하는 화학적 방법에 의하여 측정되어왔다. 본 연구에서는 중적외선 분광학을 이용하여 이 두 성분의 농도를 측정하였다. 샘플은 상용 합성뇨를 사용하였으며 여기에 추가적으로 글루코즈와 알부민, 그리고 가장 큰 영향의 간섭물질인 적혈구의 세 성분의 농도를 서로 상관관계 없이 조절하여 만들었다. 부분최소자승회귀법을 바탕으로 각 성분의 농도 예측을 위한 최적 파장대역을 구하였다 (글루코즈 980 - 1150/cm, 알부민 1400 - 1570/cm). 다른 성분에의한 간섭은 예측오차를 증가시켰으며, 특히 알부민의 경우에는 글루코즈와 적혈구에 의한 영향이 크게 나타났다. 타 성분의 유무에 따라서 글루코즈 농도가 0 ${\sim}$ 1000 mg/dl인 범위에서의 예측오차는 29.85 ${\sim}$ 45.19 mg/dl 이며 알부민 경우에는 0 ${\sim}$ 500 mg/dl 범위에서 예측오차는 14.0 ${\sim}$ 93.11 mg/dl 이였다. 본 연구는 몇 단계의 범위만을 제시하는 스트립을 이용한 기존의 요검사 보다 더욱 정량적 평가가 가능한 대안으로 사료되었다.