• 제목/요약/키워드: 로그 회귀분석

검색결과 92건 처리시간 0.023초

상대오차예측을 이용한 자동차 보험의 손해액 예측: 패널자료를 이용한 연구 (Predicting claim size in the auto insurance with relative error: a panel data approach)

  • 박흥선
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.697-710
    • /
    • 2021
  • 상대오차를 이용한 예측법은 상대오차(혹은 퍼센트오차)가 중요시되는 분야, 특히 계량경제학이나 소프트웨어 엔지니어링, 또는 정부기관 공식통계 부분에서 기존 예측방법 외에 선호되는 예측방법이다. 그 동안 상대오차를 이용한 예측법은 선형 혹은 비선형 회귀분석 뿐 아니라, 커널회귀를 이용한 비모수 회귀모형, 그리고 정상시계열분석에 이르기까지 그 범위가 확장되어 왔다. 그러나, 지금까지의 분석은 고정효과(fixed effect)만을 고려한 것이어서 임의효과(random effect)에 관한 상대오차 예측법에 대한 확장이 필요하였다. 본 논문의 목적은 상대오차예측법을 일반화선형혼합모형(GLMM)에 속한 감마회귀(gamma regression), 로그정규회귀(lognormal regression), 그리고 역가우스회귀(inverse gaussian regression)의 패널자료(panel data)에 적용시키는데 있다. 이를 위해 실제 자동차 보험회사의 손해액 자료를 사용하였고, 최량예측량과 최량상대오차예측량을 각각 적용-비교해 보았다.

공공도서관의 진단적 평가와 대안모색 - 대구광역시를 중심으로 - (Diagnostic Evaluation and Alternative Plans of Public Libraries in Taegu Metropolitan City)

  • 윤희윤
    • 한국문헌정보학회지
    • /
    • 제34권2호
    • /
    • pp.47-67
    • /
    • 2000
  • 본 연구는 대구광역시 공공도서관을 대상으로 로그-회귀분석에 의한 경영성과를 평가하고 대안을 모색하였다. 투입예산에 대한 산출효과(생산성)를 분석한 결과, 기울기(b)의 누적값(${\Sigma}b_n$)은 약 3.732이므로 지역주민에 대한 정보봉사력은 매우 낮은 것으로 밝혀졌다. 이에 대한 대안으로 도서관 정체성의 재정립, 최적의 입지선정과 증설, 예산배정 및 장서구성의 개선, 적정 인력의 확보와 조직개편, 웹환경의 최적화, 이용자봉사의 강화를 제시하였다.

  • PDF

신경 망의 지도 학습을 위한 로그 간격의 학습 자료 구성 방식과 손실 함수의 성능 평가 (Performance Evaluation of Loss Functions and Composition Methods of Log-scale Train Data for Supervised Learning of Neural Network)

  • 송동규;고세헌;이효민
    • Korean Chemical Engineering Research
    • /
    • 제61권3호
    • /
    • pp.388-393
    • /
    • 2023
  • 지도 학습 기반의 신경 망을 활용한 공학적 자료의 분석은 화학공학 공정 최적화, 미세 먼지 농도 추정, 열역학적 상평형 예측, 이동 현상 계의 물성 예측 등 다양한 분야에서 활용되고 있다. 신경 망의 지도 학습은 학습 자료를 요구하며, 주어진 학습 자료의 구성에 따라 학습 성능이 영향을 받는다. 빈번히 관찰되는 공학적 자료 중에는 DNA의 길이, 분석 물질의 농도 등과 같이 로그 간격으로 주어지는 자료들이 존재한다. 본 연구에서는 넓은 범위에 분포된 로그 간격의 학습 자료를 기계 학습으로 처리하는 경우, 사용 가능한 손실 함수들의 학습 성능을 정량적으로 평가하였으며, 적합한 학습 자료 구성 방식을 연구하였다. 이를 수행하고자, 100×100의 가상 이미지를 활용하여 기계 학습의 회귀 과업을 구성하였다. 4개의 손실 함수들에 대하여 (i) 오차 행렬, (ii) 최대 상대 오차, (iii) 평균 상대 오차로 정량적 평가하여, mape 혹은 msle가 본 연구에서 다룬 과업에 대해 최적의 손실 함수가 됨을 알아내었다. 또한, 학습 자료의 값이 넓은 범위에 걸쳐 분포하는 경우, 학습 자료의 구성을 로그 간격 등을 고려하여 균등 선별하는 방식이 높은 학습 성능을 보임을 밝혀내었다. 본 연구에서 다룬 회귀 과업은 DNA의 길이 예측, 생체 유래 분자 분석, 콜로이드 용액의 농도 추정 등의 공학적 과업에 적용 가능하며, 본 결과를 활용하여 기계 학습의 성능과 학습 효율의 증대를 기대할 수 있을 것이다.

양식장 어류 생육 데이터 분석 및 마이닝 (Data Analysis and Mining for Fish Growth Data in Fish-Farms)

  • 예성빈;박정선;한순희;정희택
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.127-142
    • /
    • 2023
  • 양식장에서 양식어의 생육 정보인 크기 및 무게의 관리는 가장 기본적인 목표이다. 본 연구에서는 육상 양식장에서 입식 또는 분조 시점부터 출하 시점까지를 epoch로 정의하고, 총 3 epoch에 대하여 생육데이터를 시계열 관점에서 분석하고자 한다. 양식장에서 시간 흐름에 따라 발생하는 양식어의 크기 및 무게 등의 생육 정보를 수질 환경 정보, 급이 정보와 비교 분석하고, 분석 결과를 이용하여 모델을 제시한다. 본 연구에서는 현장에서 획득된 데이터를 이용하여 크기 및 무게에 대하여 Box-Jenkins 방법을 이용하여 선형, 지수, 로그 회귀분석 모델을 제시한다.

수도권 도시 환경 요인에 따른 범죄 발생 건수 예측 (Prediction of the Number of Crimes according to Urban Environmental Factors in the Metropolitan Area)

  • 장예원;김예림;박시현;이재영;문유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.321-322
    • /
    • 2023
  • 본 논문에서는 Scikit-learn 패키지의 LinearRegression 모델과 Keras 딥러닝 모델을 활용하여 수도권 도시 환경 요인에 따른 범죄 발생 건수를 예측 모델을 제안한다. 연구 방법으로 범죄 발생과 유의미한 관계가 있다고 파악되는 수도권의 각 자치구 별 데이터셋을 분석하여, CCTV, 파출소, 가로등의 수가 범죄 발생에 유의미한 영향을 끼치는 것을 확인하였다. 독립 변수들 간에 Scale을 줄이고자 정규화를 진행했고, 종속변수의 정규성 확보를 위해 로그변환을 취했다. 손실 함수는 회귀문제에서 사용되는 'relu'함수를 사용했고 모델의 성능을 확인할 수 있는 지표로 MSE(Mean Squared Error)를 사용해 모델을 구성하였다. 본 논문에서 설계한 이 프로그램은 범죄 발생율이 높은 지역구에 경찰 인력의 추가적 배치, 안전 시설 확충 등 실무적 조치를 취함에 있어 근거를 제공할 수 있을 것으로 사료된다.

  • PDF

음주교통사고 영향요인과 심각도 분석을 위한 모형설정 (Modeling Traffic Accident Characteristics and Severity Related to Drinking-Driving)

  • 장태연;박현천
    • 대한토목학회논문집
    • /
    • 제30권6D호
    • /
    • pp.577-585
    • /
    • 2010
  • 교통사고는 사람과 자동차, 도로환경 등의 여러 요인들이 결합되어 발생됨으로 요인들에 대한 과학적, 심층적인 조사와 분석을 통해 사고요인을 사전에 제거하여 유사한 형태로 반복되는 사고를 예방하는 것이 중요하다. 특히, 인적요인은 교통사고에 있어 큰 부분을 차지하고 있어 인적요인에 의한 음주교통사고는 경각심을 갖고 해결해야 할 중요한 사회적 문제이다. 연구는 교통사고자료를 활용하여 사고 빈도와 사고 심각성에 영향을 주는 요인에 대해 분석한다. 교통사고를 음주 및 비음주 사고로 분류하고, 비음주 사고에 대한 음주 사고 발생 가능성에 대해 로그선형모형을 이용하여 변수간의 관계성을 분석한다. 음주교통사고 영향요인으로는 여성보다는 남성이, 비승용차 운전자보다는 승용차 운전자가 음주관련 사고 발생가능성이 높은 것으로 나타났다. 연령의 증가, 커브구간, 단일로, 노면 불량상태 등에서도 발생가능성이 높은 것으로 분석되었다. 또한, 음주교통사고의 경중을 고려한 심각성 분석을 위해 순위회귀모형의 적용 가능성을 탐색하였다. 종속변수가 이산적 특성과 함께 순위적 특징을 보일 경우 순위회귀모형이 적용되어야 하는데, 종속변수가 정성적 표현이 아닌 단지 순위를 반영하는데 유익한 모형이다. 사고의 심각성 분석에서 교통사고 발생시간대, 기후, 도로형태, 사고유형, 성별, 차량종류 등에 의해 심각성이 가중됨을 알 수 있었다. 계절적으로는 봄과 겨울이 사고의 심각성이 증대되며 반면에 여름과 가을은 감소될 가능성이 높았다.

방화 발생에 영향을 미치는 요인에 관한 연구 (A Study on the Factors Affecting the Arson)

  • 김영철;박우성;이수경
    • 한국화재소방학회논문지
    • /
    • 제28권2호
    • /
    • pp.69-75
    • /
    • 2014
  • 본 연구에서는 방화발생에 영향을 미치는 요인을 도출하기 위하여 발생건수를 종속변수로 하고 경제 인구 사회적 요인을 독립변수로 하는 다중회귀분석을 실시하였다. 다중회귀분석은 선형함수, 준로그함수, 역준로그함수, 이중로그함수 4가지 함수형태에 대해 적용하였으며, 각 단계별로 변수의 선택과 제외를 고려하는 단계적선택 방식을 적용하였다. 다중공선성 문제와 자기상관 문제를 해결하기 위하여 분산확대지수(VIF)와 Durbin-Watson 계수 이용하였으며, 4가지 함수모형에 대하여 수정된 R 제곱(설명력) 값이 0.935 (93.5%)로 가장 값이 높고 통계적으로 유의한 선형함수모형을 최적의 모형으로 결정하고 모형에 대한 해석을 진행하였다. 선형함수모형 결과 방화발생에 영향을 미치는 요인은 범죄발생건수(0.829), 일반이혼율(0.151), 재정자주도(0.149), 소비자물가상승률(0.099) 순으로 도출되었다.

부산지역 오피스텔 가격 결정요인 분석 (A Study on the Factors Determining Officetel Price in Busan)

  • 최열;김형준;여정훈
    • 대한토목학회논문집
    • /
    • 제35권3호
    • /
    • pp.725-735
    • /
    • 2015
  • 본 연구는 부산지역 오피스텔의 가격을 결정하는데 있어서 영향을 주는 요인들이 어떤 것들이 있는지에 대해 실증적 분석을 하여 오피스텔 시장을 구체적으로 이해하는데 목적이 있다. 시세가를 통해 오피스텔 가격 결정요인을 분석하는 것은 오피스텔 공급자로 하여금 적절한 규모와 입지선택에 도움을 줄 수 있고, 수요자들에게는 목적에 따른 오피스텔 선택에 도움이 되리라 판단하여 본 연구를 실시하였다. 부산지역 오피스텔의 실거래가를 종속변수로 하고 물리적 특성과 입지적 특성, 그리고 지역적 특성을 나타내는 요인들을 독립변수로 하여 OLS선형회귀분석(Ordinary Least Square)과 준로그모형분석(Semi-log model), 그리고 로버스트회귀분석(Robust regression)을 이용하여 오피스텔의 가격결정요인을 분석하였다.

콕스 비례위험 모형을 이용한 중소기업의 업종별 생존율 및 생존요인 분석 (Survival analysis on the business types of small business using Cox's proportional hazard regression model)

  • 박진경;오광호;김민수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.257-269
    • /
    • 2012
  • 최근 글로벌 금융위기와 중소기업들의 연이은 도산으로 인해 국내 중소기업들의 구조조정에 대한 논의가 활발히 진행되고 있다. 이에 본 논문에서는 신용보증기금에 등록된 중소기업 자료에 대하여 업종별 생존율 동향을 비교분석하였다. 이때 생존율의 차이는 로그순위 검정과 윌콕슨의 검정통계량을 사용하여 분석하였다. 또한 재무변수들을 이용하여 중소기업의 업종별 콕스 회귀분석을 실시하였다. 그 결과, 도소매업과 서비스업이 경공업과 중공업, 건설업에 비하여 생존율이 높았으며, 건설업의 경우 생존율이 가장 낮음을 알 수 있었다. 또한, 업종별로 유의한 재무변수를 살펴보면, 건설업은 자기자본비율, 유동비율이 커질수록 부도율이 감소하는 반면에 차입금의존도가 커질수록 부도율이 증가하였다. 경공업은 자기자본비율, 총자산 순이익률이 커질수록, 도소매업은 자기자본비율, 유동비율이 커질수록 부도율이 감소하였다. 중공업은 자기자본비율, 총자산 순이익률, 유동비율이 커질수록 부도율이 감소하였지만 결합지표가 커질수록 부도율이 증가하였다. 마지막으로, 서비스업은 유동비율이 커질수록 부도율이 감소하였다.

바젤2 자산상관계수 계산공식의 현실성 검토: 중소기업 대출 포트폴리오를 대상으로

  • 권태고;정재만;조태근
    • 한국산학경영학회:학술대회논문집
    • /
    • 한국산학경영학회 2004년도 추계학술연구발표회
    • /
    • pp.73-100
    • /
    • 2004
  • 본 연구는 기업은행은 1999년${\sim}$2003년 중소기업 대출 자료로 바젤2 자산상관계수 계산공식의 현실성을 검토하였다. 실증분석 결과에 따르면, 자산상관계수는 매출규모와는 양(+)의 관계를, 신용등급과는 음(-)의 관계를 갖는 것으로 나타나 바젤2 계산공식이 상정하고 있는 자산상관계수 패턴이 국내에서도 현실성이 있었다. 이는 자산상관계수가 매출규모와 음(-)의 관계를 보이는 것으로 보고한 Kim-Park(2004)과 상반되는 결과이다. 또한, 바젤2에서는 60억원 이하의 매출규모에 대해서는 60억원으로 간주하고 있지만, 매출규모 60억원 이하에서도 자산상관계수가 매출규모와 양(+)의 관계를 갖는 것으로 나타났다. 바젤2 계산공식에 의해 산출된 자산상관계수는 자료로 추정한 자산상관계수가 비해 1.3배${\sim}$19.2배 높으며, 이러한 차이는 통계적으로 유의할 뿐 만 아니라 경제적으로도 유의하다. 회귀분석 결과에 의하면, 바젤2 자산상관계수의 상향편의는 주로 계산공식에서 절편을 과도하게 높게 설정하였기 때문에 발생한 것으로 나타났으며, 바젤2에서는 매출규모와 자산상관계수간의 관계를 선형으로 설정하였지만, 로그선형이 실제 자료를 더 잘 적합시키는 것으로 나타났다. 이상의 결과로 보건대, 바젤2의 자산상관계수 계산공식은 비교적 현실적으로 고아된어져 있지만, 국내의 실정에 맞게 조정하기 위해서 보다 광범위한 실증분석이 필요한 것으로 판단된다.

  • PDF