• 제목/요약/키워드: 나무구조모형

검색결과 33건 처리시간 0.023초

악성간암환자의 유전체자료 심볼릭 나무구조 모형연구 (Symbolic tree based model for HCC using SNP data)

  • 이태림
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권5호
    • /
    • pp.1095-1106
    • /
    • 2014
  • 본 연구에서는 악성간암환자의 생존기간에 영향을 주는 인자를 찾기 위하여 반응변수를 악성간암 환자의 생존을 임상변수의 정보와 SNP유전인자를 통합한 자료를 대상으로 이해하기 쉬운 나무구조 생존모형과 심볼릭자료분석을 실시하여 영향을 주는 유의한 인자 뿐 아니라 그 임계치를 구하여 임상적으로 유용한 결과를 찾아 임상에 적용하는 것이 목적이다. 악성간암환자의 임상자료를 계량화하여 통계적 예후진단 모형을 구함으로써 임상변수 간 숨겨진 변수간의 관계를 규명하고 생존기간 군에 따른 예측 분류모형을 구하여 현시적으로 진단후 예후에 영향을 주는 중요 임상변수와 유전체변수 그 임계치를 구하여 임상에서의 치료계획에 중요한 근거를 제시했다. 심볼릭데이터 분석 결과 정상, 만성 간염, 간염, 악성간염 등의 4개 군으로 구성된 1840명의 대상자를 분석 5 유전체의 20개 SNP가 밝혀진 바 있다. 즉 IL10-ht2가 악성간암의 발병에 매위 강한 관련이 있고 TGFB L10P-Prosms가 만성 간염 환자 중 악성간암 발생 위험을 줄여주는 유전체로 밝혀졌다. SNP변수와 질병군의 컴셉트 변수에 따라 상관정도를 원의 반지름 길이로 상대적으로 나타내 줌으로써 가장 판별력 있는 심볼릭변수를 상대적으로 비교할 수 있었다. 임상자료와 유전체자료를 통합하여 심볼릭 나무구조 생존모형을 구하여 생존기간을 군으로 한 나무구조모형을 유의한 변수와 기준치와 함께 구할 수 있었다.

나무구조의 분류분석에서 변수 중요도에 대한 고찰 (Comparison of Variable Importance Measures in Tree-based Classification)

  • 김나영;이은경
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.717-729
    • /
    • 2014
  • 본 연구에서는 나무구조의 분류분석에서 자료의 크기가 방대해짐에 따라 중요한 문제로 대두되고 있는 변수의 중요도에 대하여 사영추적분류나무를 중심으로 고찰하였다. 사영추적분류나무(projection pursuit classification tree)는 각 마디에서 사영추적을 이용하여 그룹을 잘 분리하는 변수들의 선형결합을 이용하는 방법으로 이때 사용되는 사영계수들은 각 마디에서의 분류에 대한 정보를 가지고 있다. 이를 종합하여 각 변수의 분류에 대한 중요도를 계산할 수 있다. 먼저 사영추적분류나무의 분류과정에서 계산되는 사영추적계수를 이용하여 분류를 위한 변수선택의 중요도를 계산하고 이들의 특성을 살펴보고 이를 같은 형태의 나무모형방법인 CART와 랜덤 포레스트의 결과와 비교 분석하여 사영추적분류나무의 특성을 살펴보고 비교, 분석하였다. 대부분의 자료에서 사영추적분류나무가 훨씬 좋은 성능을 보이고 있었으며 특히 상관계수가 높은 변수들이 포함되어 있는 경우에는 상대적으로 적은 수의 변수로도 잘 분류를 할 수 있음을 확인하였다. 랜덤 포레스트에서 제공하는 변수 중요도는 변수들 간의 상관관계가 높은 경우에는 사영추적분류나무의 변수중요도와 매우 다르게 나타나며 사영추적분류나무의 변수 중요도가 조금 더 나은 성능을 보이고 있음을 알 수 있다.

울릉도 섬잣나무-솔송나무림의 구조 및 하층식생의 종 다양성 (Structure and Understory Species Diversity of Pinus parviflora - Tsuga sieboldii Forest in Ulleung Island)

  • 조용찬;홍진기;조현제;배관호;김준수
    • 한국산림과학회지
    • /
    • 제100권1호
    • /
    • pp.34-41
    • /
    • 2011
  • 본 연구에서는 울릉도 태하령의 섬잣나무-솔송나무림에서 10개의 영구방형구($10m{\times}10m$) 및 30개의 소방 형구($1m{\times}3m$)를 설치하여 임분구조, 식생조성 및 종다양성을 밝히며 종다양성 모형을 수립하였다. 섬잣나무-솔송나무 임분의 광량은 평균 $3.7mol{\cdot}m^{-2}{\cdot}day^{-1}$, 수관 열림도는 평균 8.6 %로 분석되었다. Mantel 검정 결과, 임분 상층의 구조가 장기적으로 지속되기 어려울 것으로 나타났다. 하층식생의 조성은 지상부의 구조 및 토양 나출도와 유의한 상관을 나타내었다. 중회귀분석을 통한 종다양성 모형에서 섬잣나무의 양적 요인(단면적 및 밀도) 및 숲 바닥 조건이 유의한 예측변수로 분석되었다. 섬잣나무-솔송나무림의 유지에는 비교적 큰 규모의 교란이 필요할 것으로 생각되며, 종다양성을 유지하기 위해서는 여우꼬리사초 및 큰두루미꽃과 같은 단일 군반을 형성하는 교란지 종의 확장을 제어하는 것이 필요하다.

배경자료를 이용한 나무구조의 군집분석 (Tree Based Cluster Analysis Using Reference Data)

  • 최대우;구자용;최용석
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.535-545
    • /
    • 2004
  • 이 논문에서 제안하는 군집분석방법은 분석자료와 동일한 구조의 배경자료를 생성하고 이를 나무모형의 분류기법을 이용하여 분리해 냄으로써 변수들의 규칙으로 정의되는 군집을 형성한다. 배경자료는 reverse-arcing 알고리즘을 통하여 분석자료와 공간상에서 대비되도록 생성되며 군집이 효과적으로 식별되도록 돕는다. 이 방법은 분석자료에 이산형 변수가 혼합된 경우에도 적용할 수 있으며 모의실험자료와 실제 자료를 이용하여 제안된 알고리즘의 성능을 규명하였다.

ANFIS 기반 분류모형의 설계 및 성능평가 (Design and Evaluation of ANFIS-based Classification Model)

  • 송희석;김재경
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.151-165
    • /
    • 2009
  • 퍼지신경망 모형은 인공신경망의 네트워크 구조 표현방법 및 학습알고리듬과 퍼지시스템의 추론방법을 통합한 모형으로 제어 및 예측분야에 성공적으로 적용되고 있다. 본 연구에서는 퍼지신경망 모형 중 우수한 예측정확도로 인해 최근 각광받고 있는ANFIS (Adaptive Network-based Fuzzy Inference System)모형을 기반으로 하는 분류모형을 설계하고 기존의 분류기법(C5.0 의사결정나무)과 비교하여 분류 정확성 관점에서 평가한다. ANFIS 추론의 경우, 최종 결과값이 계급값이 아닌 연속형 변수값을 취하게 되므로 산출된 결과값을 이용하여 적절한 계급값을 할당하는 과정이 필요하다. 본 연구에서는 의사결정나무기법을 이용하여 계급값을 할당하는 방식과 군집분석을 이용하여 계급값을 할당하는 두 가지 방식을 제안하고 두 가지 데이터 세트에 적용하여 ANFIS를 기반으로 한 분류모형의 정확도를 평가하였다.

  • PDF

의사결정나무의 분기법 변화가 예측력에 미치는 영향 (The impact of the change in the splitting method of decision trees on the prediction power)

  • 장영재
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.517-525
    • /
    • 2022
  • 빅데이터 시대에 이르러 다양한 데이터 마이닝 기법이 주요 분석 방법론으로 제안되었다. 복잡 다양한 데이터가 양산되면서 데이터 마이닝 기법은 데이터 과학의 토대를 이루는 방법으로 부각되었다. 본고에서는 해석의 유용성과 예측력 향상의 측면 모두에 초점을 맞추어 다양한 실험 연구를 시행하였다. 구체적인 모형으로는 의사결정나무를 선택하였는데, 이는 실무적 사용 빈도가 높은 방법으로서 활용 폭이 넓을 뿐만 아니라 이해가 쉽고 성능평가가 용이한 방법론이기 때문이다. 의사결정나무모형을 대상으로 이 모형의 구조를 크게 변형시키지 않으면서도 예측력 향상의 목적을 이룰 수 있는 방법을 살펴보았으며 분기변수의 선택 방법이 모형의 성능에 미치는 영향을 분석하였다. 이 효과를 측정하기 위해서 다양한 모의실험 모델을 생성하고 분기법의 변화에 따른 예측력을 비교하였다. 비선형성을 지니면서 단일 분할을 통해서 하위 집합으로 명확하게 구분하기 어려운 복잡한 데이터의 경우에는 선형결합 분기방법이 예측력 제고에 도움을 주는 것으로 나타났다.

의사결정나무모형을 이용한 유역내 구조적 홍수방어 대안 도출 (Flood Mitigation Planing for a Basin Using a Decision Tree Model)

  • 변성호;강현직;한정우;김태웅
    • 대한토목학회논문집
    • /
    • 제28권1B호
    • /
    • pp.33-40
    • /
    • 2008
  • 우리나라는 6월부터 9월까지의 우기에 강우가 집중 발생하는 기상특성으로 인해 자연재해의 95% 이상이 집중호우와 태풍에 의한 풍수해로 집계되고 있을 만큼 홍수피해에 취약하며, 오래전부터 홍수방어에 대한 구조적 대책이 시행되어왔다. 본 연구의 목적은 의사결정기법중의 하나인 의사결정나무를 이용하여 유역내 홍수방어를 위한 기본적인 후보대안을 제시하는데 있다. 이러한 후보대안은 유역이 가지고 있는 치수적 기능을 최대한 살리고 상 하류의 유기적인 홍수방어기능을 효율적으로 증대시키는 다수의 조합으로 제시되었다. 또한 본 연구에서는 유역종합치수계획 수립시 적용가능한 홍수방어 대안 조합 지침을 제시하였다.

난대 기후대의 상록활엽수림 복원 모형(IV) - 사례지의 식생구조 - (Restoration Model of Evergreen Broad-leaved Forests in Warm Temperate Region(IV) - Vegetation Structure of the Case Study Areas -)

  • 오구균;김용식
    • 한국환경생태학회지
    • /
    • 제11권3호
    • /
    • pp.334-351
    • /
    • 1997
  • 난대 상록활엽수림 복원 모형 연구의 사례지인 완도의 식생구조를 조사하였다. 완도의 사록활엽수림은 붉가시나무가 우점종이었으며, 수령 30여년 미만의 맹아림이 대부분이었다. 중복부와 산록부에는 조림식생과 낙엽활엽수림이, 능선부와 고지대에는 졸참나무, 개서어나무, 소사나무 등의 낙엽활엽수림이 발달하고 있었으며, 임상층에서 상록활엽수종이 활착하고 있었다. 47개 조사구에서 60% 이상의 상재도를 나타낸 상록활엽수종은 광나무, 마삭줄, 붉가시나무, 사스레피나무이었다. 본 조사지역 내에 출현한 관속식물상은 101과 321속 426종 56변종, 5품종 및 1교잡종 등 촌 488종류로 파악되었으며 이 중에서 상록성 수목은 23속 30종 2변종 등 32종류이었다. 12개 조사지역에서 100%의 상재도를 나타낸 종은 맥문동과 칡이었으며, 50% 이상인 종은 덜꿩나무, 마삭줄 등 40종류이었다. 한편 상재도가 8% 이하인 식물종은 가래나무, 말채나무, 병아리꽃나무 등 209종류이었다. 식물종 다양성은 장기간 인간간섭으로 조사지역간 특이한 사항은 보이지 않았으나, 곰솔림이 155종으로 가장 높은 값을 보인 반면에 생달나무-마삭줄군락은 23종으로 가장 낮은 값을 나타내었다.

  • PDF

난대 기후대의 상록활엽수림 복원 모형(II) - 식생구조 - (Restoration Model of Evergreen Broad-leaved Forests in Warm Temperate Region(II) - Vegetational Structure -)

  • 오구균;김용식
    • 한국환경생태학회지
    • /
    • 제10권1호
    • /
    • pp.87-102
    • /
    • 1996
  • 한반도 난대기후대의 식생구조를 연구하기 위하여 남해안 도서지방의 상록활엽수림 지역에 52개 조사구를 설치하였다. 난대상록활엽수림은 지리적 격리와 인위적 교란에 의해 지역간 식생구조가 매우 상이하였다. 조사지의 식생들은 대체적으로 자연적 식생천이가 이루어진 상록활엽수림 집단, 장기간 훼손되었거나 관리되어온 상록활엽수림 집단, 그리고 상록활엽수종으로 천이되고 있는 조림식생 집단으로 구분되었다. 52개 조사구에서 80% 이상의 상재도를 보인 수종은 후박나무, 사스레피나무, 마삭줄, 생달나무, 광나무 등이었다. 난대기후대의 극상군락이라고 추정되는 육박나무군락은 주도와 애도에 잔존하고 있었다. 과거 교란이 있었던 해안지역에서는 구실잣밤나무로 이차천이가 예상된다.

  • PDF

외환거래에서 의사결정나무와 그래디언트 부스팅을 이용한 수익 모형 연구 (The study of foreign exchange trading revenue model using decision tree and gradient boosting)

  • 정지현;민대기
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.161-170
    • /
    • 2013
  • 외환차액거래는 국제외환 시장에서 외국의 통화를 거래하는 것으로 현물시장에서 이뤄지는 장외 통화선물 거래를 의미한다. 외환차액거래 데이터를 이용하여 의사결정나무와 그래디언트 부스팅 방법을 이용한 수익모델을 비교하였다. 금융시장의 예측을 위해 사용되고 있는 시계열분석과 같은 방법들은 장기간의 예측 모형을 설명하기에 장점이 있지만, 파동이많고 짧은 시간에 가격이 급변하는 외환시장을 예측하기에는 한계가 있다. 따라서 본 논문에서는 단기간 즉 1, 3, 5분에서 외환시장의 수익구조를 의사결정나무와 앙상블기법의 하나인 그래디언트 부스팅으로 비교하여 매수, 매도거래 시 수익을 만들기 위한 규칙을 연구하였다.