• 제목/요약/키워드: 오분류 오차율

검색결과 3건 처리시간 0.019초

불완비 데이터에서 분류 나무의 구축

  • 우주성;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.105-108
    • /
    • 2001
  • 본 논문에서는 결측치가 있는 불완비 데이터에서 분류나루를 구축하는 방법을 고찰하였다. 기존의 결측치 처리 방법인 대리 분리 방법의 대안으로 대체 방법으로 결측치를 처리한 후 분류나무를 구축하는 방법을 제안하였다.

  • PDF

오브젝트-파라미터기반 건축마감공사비 개산견적 모델 (Object & Parameter based Schematic Estimation Model for Predicting Cost of Building Interior finishings)

  • 구교진;박성호;박성철;송종관
    • 한국건설관리학회논문집
    • /
    • 제9권6호
    • /
    • pp.175-184
    • /
    • 2008
  • 건설 프로젝트의 수익성 및 타당성을 판단하기 위한 기준으로 설계초기단계에 활용되는 개산견적은 설계의사결정 업무와 밀접한 연계성을 가지고 수행되어야 할 뿐만 아니라, 정확하고 신뢰성 있는 견적결과를 도출해야 한다. 설계초기단계에서 설계자의 의사결정 지원과 설계변경에 대한 즉각적인 대처를 위해 프로토타입기반 개산견적 시스템이 개발되었지만, 파라미터에 의해 산정되는 공사항목 및 사용자에 의한 추가공사에 대한 공사비 고려가 미흡하였다. 따라서 본 연구에서는 견적의 정확도를 향상시키기 위해 실제 고층 오피스 빌딩 프로젝트의 실적자료 분석을 통해 기본설계단계에서 오브젝트-파라미터기반 건축마감공사비 산정 모델(Object & Parameter based Schematic Estimation Model, OPSEM)을 개발하였다. 모델 개발을 위해 공사비 내역서, 도면으로부터 얻은 작업항목에 대한 정보를 분석 및 분류하고, 각 작업항목 속성에 맞는 공사비 산정 방식을 제안하였다. 본 연구의 실무 효용성 검증을 위해 유사 사례 프로젝트를 바탕으로 기존의 견적방식과 제시된 모델을 활용한 견적방식의 오차율을 분석하여 정확도 비교를 실시하였다.

에어비앤비(Airbnb) 웹 로그 데이터를 이용한 고객 행동 예측 (Consumer behavior prediction using Airbnb web log data)

  • 안효인;최유리;오래은;송종우
    • 응용통계연구
    • /
    • 제32권3호
    • /
    • pp.391-404
    • /
    • 2019
  • 그동안의 고객 행동에 대한 예측은 주로 고객이 가지는 고정적인 특성을 이용해왔다. 최근에는 점차 고객들의 활동이 오프라인에서 온라인으로 이동하면서 각 고객의 웹 로그를 추적하는 일이 가능해졌다. 그러나 방대한 양의 웹 로그 데이터를 수집할 수 있게 된 반면, 이에 대한 연구는 로그 데이터를 정리하거나 기술적인 특성만을 설명하는 것에 그쳤다. 본 연구에서는 웹사이트 Kaggle에서 제공하는 Airbnb 고객들의 성별, 연령 등의 기본 정보 및 웹 로그가 포함된 데이터셋을 이용하여 첫 숙소 예약까지 걸리는 개인의 의사 결정 시간을 예측하였다. Lasso, SVM, Random Forest, XGBoost 등 다양한 방법론을 활용하여 최적의 모형을 찾고, 웹 로그 데이터의 유무에 따른 예측 오차를 비교하여 웹 로그의 효용성을 확인하였다. 결과적으로 오분류율이 약 20%로 낮은 랜덤 포레스트 분류모형을 최적모형으로 선택하였다. 또한, 웹 로그 데이터를 이용하여 고객 개개인의 행동을 예측한 결과 사용하지 않은 경우와 비교해 예측의 정확도가 최대 두 배 더 높아진 것을 확인할 수 있었다.