• 제목/요약/키워드: CART 방법

검색결과 113건 처리시간 0.028초

운율 경계강도 예측을 위한 OC1의 적용 및 CART와의 비교 (The Comparison of OC1 and CART for Prosodic Boundary Index Prediction)

  • 임동식;김진영;김선미
    • 한국음향학회지
    • /
    • 제18권4호
    • /
    • pp.60-64
    • /
    • 1999
  • 본 논문은 연속음 인식과 합성을 위한 운율 경계강도 예측모델을 위해 최근에 널리 사용되고 있는 방법으로 분류·회귀트리라 불리우는 CART(Classification And Regression Tree) 와 OC1(Oblique Classifier1)을 적용한다. 운율 경계강도 수준을 4로 하고 문법적인 특징으로는 트리구조 방법으로 결정된 오른쪽 가지의 수식의 깊이(Rd)와 link grammar 방법으로 결정된 연결거리(To_Right)를 tri_gram모형과 결합하여 CART와 OC1에 적용해 각각 운율 경계강도를 예측, 비교한다. 실험을 통하여 OC1 방법이 CART 방법에 비해 더 적은 터미널 노드에 더 향상된 예측율을 보임을 확인할 수 있다.

  • PDF

CART를 활용한 결측값 대체방법 : 인구주택총조사 혼인상태 항목을 중심으로 (Missing Value Imputation Method Using CART : For Marital Status in the Population and Housing Census)

  • 김영원;이주원
    • 한국조사연구학회지:조사연구
    • /
    • 제4권2호
    • /
    • pp.1-21
    • /
    • 2003
  • 본 연구예서는 일반적인 사회조사에서 사용될 수 있는 효과적인 결측값 대체방법을 검토하기 위해 인구주택총조사 조사항목 중 혼인상태의 결측값을 대체할 수 있는 두 가지 방법을 제안하고 있다. 첫 번째 방법은 CART(Classification and Regression Tree)모형에서 얻어진 최대 예측확률을 기준으로 결측값을 대체하는 일종의 모형기반 접근법이고, 두 번째 방법은 CART 모형에서 얻어진 결과를 근거로 대체층을 구성하여 핫덱(hot-deck) 방법을 적용하는 대체방법이다. 효율성 비교를 위해 2000년 인구주택총조사를 위한 시험조사에서 얻어진 제조사 결과를 이용하여 오분류율을 검토해 본 결과 두 방법 중 CART 모형을 기반으로 핫덱 방법을 적용하는 것이 효율적이라는 결론을 얻을 수 있었다. 아울러 전국에 대해 동일한 모형을 설정한 경우와 거주지 특성에 따라 광역시$.$도의 동지역, 도의 읍$.$면지역으로 구분하여 대체방법을 적용하는 경우를 비교해 본 결과 지역 구분을 통한 효율성 향상 효과는 미흡한 것으로 파악되었다.

  • PDF

카트-폴 균형 문제를 위한 실시간 강화 학습 (On-line Reinforcement Learning for Cart-pole Balancing Problem)

  • 김병천;이창훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.157-162
    • /
    • 2010
  • Cart-pole 균형 문제는 유전자 알고리즘, 인공신경망, 강화학습 등을 이용한 제어 전략 분야의 표준 문제이다. 본 논문에서는 cart-pole 균형문제를 해결하기 위해 실시간 강화 학습을 이용한 접근 방법을 제안하였다. 본 논문의 목적은 cart-pole 균형 문제에서 OREL 학습 시스템의 학습 방법을 분석하는데 있다. 실험을 통해, 본 논문에서 제안한 OREL 학습 방법은 Q-학습보다 최적 값 함수에 더 빠르게 접근함을 알 수 있었다.

CART 알고리즘을 활용한 확장된 다중인자 차원축소방법의 검정력 평가 (Power of Expanded Multifactor Dimensionality Reduction with CART Algorithm)

  • 이제영;이종형;이호근
    • Communications for Statistical Applications and Methods
    • /
    • 제17권5호
    • /
    • pp.667-678
    • /
    • 2010
  • 인간의 유전자 상호작용을 분석하기 위해 제시된 다중인자 차원축소방법은 연속형자료에는 적용할 수 없다. 그래서 이를 보완한 CART 알고리즘을 활용한 확장된 다중인자 차원축소방법이 제안되었다. 하지만 CART 알고리즘을 활용한 확장된 다중인자 차원축소방법의 검정력이 밝혀지지 않았다. 따라서 본 연구에서는 모의실험을 통하여 CART 알고리즘을 활용한 확장된 다중인자 차원축소방법의 우수한 검정력을 평가하고, 확인된 검정력을 바탕으로 실제 한우 데이터에 적용하여 한우의 경제형질에 영향을 주는 우수 유전자조합을 규명하였다.

CART 알고리즘 기반의 의사결정트리 기법을 이용한 규칙기반 전문가 시스템 구축 방법론 (The Construction Methodology of a Rule-based Expert System using CART-based Decision Tree Method)

  • 고윤석
    • 한국전자통신학회논문지
    • /
    • 제6권6호
    • /
    • pp.849-854
    • /
    • 2011
  • 시스템 이벤트들로부터 그 파급효과를 최소화하기 위해서는 실시간 조건에 기반한 규칙기반 전문가 시스템이 매우 효과적인데, 그 이벤트가 다양하고 부하조건이 매우 가변적이기 때문에 규칙 기반 전문가 시스템을 구축하기가 쉽지 않다. 따라서 본 연구에서는 CART 알고리즘 기반의 의사결정 트리 기법을 적용하여 상정사고 사례들로부터 규칙기반 전문가 시스템을 구축하는 방법론에 대해서 연구하고자 한다.

데이터마이닝을 활용한 이직의도와 조직몰입의 결정요인에 대한 연구 (A Study of The Determinants of Turnover Intention and Organizational Commitment by Data Mining)

  • 최영준;심원술;백승현
    • 한국시뮬레이션학회논문지
    • /
    • 제23권1호
    • /
    • pp.21-31
    • /
    • 2014
  • 본 논문에서는 조직관련 변수들의 연구를 위해 이직의도와 조직몰입을 목표(종속)변수로서 데이터마이닝 시뮬레이션을 실시하여 접근 방법을 찾고 분석결과 도출을 목적으로 하였다. 데이터마이닝 분석방법 중 CART 앙상블 기법을 활용하였다. 자료는 한국직업능력개발원의 인적자본기업패널조사 1차~3차(2005~2009)데이터를 사용하였다. 조직몰입 변수는 다항목 측정 사항에 대해 신뢰성, 단일차원성 검토를 실행 후 합산척도 변수를 생성하여 분석하였다. 본 연구 결과는 다음과 같다. 첫째, 이직의도에 대한 주요 결정요인은 신뢰, 커뮤니케이션, 인재 중시 풍조 아이템으로 나타났다. 둘째, 조직몰입에 대한 주요 결정요인은 신뢰, 근속기간, 혁신, 커뮤니케이션 아이템으로 나타났다. 데이터마이닝 방법의 CART 앙상블 방법으로 Bagging과 Arcing 알고리즘을 적용한 결과 Arc-x4 방법이 매우 높은 결정계수를 나타낸 시나리오를 추출했다. 본 연구에서는 데이터마이닝 방법 중 하나인 CART 앙상블 시뮬레이션을 통해 최대치의 결정계수, 최소치의 오류를 산출한 시나리오 모델을 도출하고 실무적 시사점을 제시하였으며 한계점 및 향후 연구에 대해 논의되었다.

의사결정나무에서 순서형 분리변수 선택에 관한 연구 (Ordinal Variable Selection in Decision Trees)

  • 김현중
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.149-161
    • /
    • 2006
  • CART로 대표되는 의사결정나무의 알고리즘에서 가장 중요한 요소는 분리변수의 선택방법이다. 대부분의 알고리즘은 변수의 형태가 연속형인지, 혹은 명목형(nominal)인지에 따라 별개의 변수선택방법을 적용한다. 하지만 변수의 형태가 순서형(ordinal)인 경우에는 그 변수를 연속형으로 취급하여 연속형 변수선택방법을 적용하는 것이 대부분이다. 이것은 CART와 같은 Greedy탐색을 이용하는 방법에는 문제점이 발생하지 않는다. 하지만 Greedy탐색의 약점을 보완하기 위해 통계이론을 이용하여 개발된 최근의 방법들에는 최선의 대처방법이 아니다. 따라서 본 연구에서는 의사결정 나무에서 분리변수를 선택하는데 있어서 비모수적 접근 방법인 Clamor-von Mises 검정을 이용한 방법을 순서형 변수에 사용하는 것을 제안하고, CART, C4.5, QUEST, CRUISE등 기존 알고리즘과 본 연구에서 제안하는 방법의 순서형 변수 선택력을 비교하였다. 모의실험의 결과, Clamor-von Mises 검정을 이용한 변수선택방법은 순서형 변수의 분류력을 기존 방법들에 비해 더 정확히 예측하는 좋은 성과를 보여주었다.

CART 방법론을 사용한 클라우드 컴퓨팅 도입 의사 결정 모델링 (Cloud Computing Adoption Decision-Making Modeling Using CART)

  • 백승현;장병윤
    • 한국시뮬레이션학회논문지
    • /
    • 제23권4호
    • /
    • pp.189-195
    • /
    • 2014
  • 본 논문에서는 장소와 시간의 제약을 받지 않는 클라우드 컴퓨팅 도입 의사 결정 모델링에 대한 연구를 진행하였다. 연구에서는 65명의 응답자에게 수집 된 패널데이터와 데이터마이닝 방법 중 하나인 CART(회귀분류나무)를 사용하여 의사결정 모델을 구축하였다. 모델링에는 2단계로 진행되는데 첫 번째 단계에서는 패널데이터를 사용하여 도입 의사를 결정하는데 영향을 미치는 문항들을 선택하고 2 번째 단계에서는 선택된 문항을 사용하여 도입 의사 결정 모델을 구축하였다. 문항 선택을 통하여 설문지 수집 문항수를 25개에서 5개로 줄일 수 있어 응답자에게 빠른 답변을 얻을 수 있고 데이터의 사이즈가 작기 때문에 모델 구축 시간을 줄일 수 있는 장점을 보여주었다.

CART의 예측 성능:은행 및 보험 회사 데이터 사용 (The Prediction Performance of the CART Using Bank and Insurance Company Data)

  • 박정선
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1468-1472
    • /
    • 1996
  • 본 연구에서는 CART(Classification and Regression Tree)가 예측을 함에 있어 통계적인 기법인 discriminant analysis와 비교된다. 은행 데이터를 사용하는 경우 discriminant analysis가 더 나은 성능을 보여줬으며, 보험 회사 데이터를 사용한 경 우 CART가 더 나은 성능을 보여줬다. 이러한 모순된 결과가 데이터의 성격을 분석함 으로 해석된다. 본 연구에서는 두가지 모델 모두 사용된 매개변수들인 사전 확률, 데 이터, 타입 I/II오류 코스트, 검증 방법에 의해 성능의 차이를 보여줬다.

  • PDF