• 제목/요약/키워드: K means clustering

검색결과 1,107건 처리시간 0.031초

불확실성을 고려한 기후변화 시나리오의 선정 (Selecting Climate Change Scenarios Reflecting Uncertainties)

  • 이재경;김영오
    • 대기
    • /
    • 제22권2호
    • /
    • pp.149-161
    • /
    • 2012
  • Going by the research results of the past, of all the uncertainties resulting from the research on climate change, the uncertainty caused by the climate change scenario has the highest degree of uncertainty. Therefore, depending upon what kind of climate change scenario one adopts, the projection of the water resources in the future will differ significantly. As a matter of principle, it is highly recommended to utilize all the GCM scenarios offered by the IPCC. However, this could be considered to be an impractical alternative if a decision has to be made at an action officer's level. Hence, as an alternative, it is deemed necessary to select several scenarios so as to express the possible number of cases to the maximum extent possible. The objective standards in selecting the climate change scenarios have not been properly established and the scenarios have been selected, either at random or subject to the researcher's discretion. In this research, a new scenario selection process, in which it is possible to have the effect of having utilized all the possible scenarios, with using only a few principal scenarios and maintaining some of the uncertainties, has been suggested. In this research, the use of cluster analysis and the selection of a representative scenario in each cluster have efficiently reduced the number of climate change scenarios. In the cluster analysis method, the K-means clustering method, which takes advantage of the statistical features of scenarios has been employed; in the selection of a representative scenario in each cluster, the selection method was analyzed and reviewed and the PDF method was used to select the best scenarios with the closest simulation accuracy and the principal scenarios that is suggested by this research. In the selection of the best scenarios, it has been shown that the GCM scenario which demonstrated high level of simulation accuracy in the past need not necessarily demonstrate the similarly high level of simulation accuracy in the future and various GCM scenarios were selected for the principal scenarios. Secondly, the "Maximum entropy" which can quantify the uncertainties of the climate change scenario has been used to both quantify and compare the uncertainties associated with all the scenarios, best scenarios and the principal scenarios. Comparison has shown that the principal scenarios do maintain and are able to better explain the uncertainties of all the scenarios than the best scenarios. Therefore, through the scenario selection process, it has been proven that the principal scenarios have the effect of having utilized all the scenarios and retaining the uncertainties associated with the climate change to the maximum extent possible, while reducing the number of scenarios at the same time. Lastly, the climate change scenario most suitable for the climate on the Korean peninsula has been suggested. Through the scenario selection process, of all the scenarios found in the 4th IPCC report, principal climate change scenarios, which are suitable for the Korean peninsula and maintain most of the uncertainties, have been suggested. Therefore, it is assessed that the use of the scenario most suitable for the future projection of water resources on the Korean peninsula will be able to provide the projection of the water resources management that maintains more than 70~80% level of uncertainties of all the scenarios.

한국주식시장에서 사이드카의 역할과 재설계: 차익거래와 비차익거래에 미치는 효과를 중심으로 (The Effects of Sidecar on Index Arbitrage Trading and Non-index Arbitrage Trading:Evidence from the Korean Stock Market)

  • 박종원;엄윤성;장욱
    • 재무관리연구
    • /
    • 제24권3호
    • /
    • pp.91-131
    • /
    • 2007
  • 본 연구는 한국유가증권시장에서 사이드카가 차익거래와 비차익거래 종목의 주가, 변동성, 그리고 유동성에 미치는 영향을 분석하였다. 선물시장의 급등락으로부터 현물시장을 보호하려는 목적을 갖는 사이드카는 현재 모든 프로그램매매를 대상으로 하고 있으나, 현재의 제도가 바람직한지에 대해서는 논란의 여지가 있다. 사이드카가 프로그램매매 유형별로 차별적인 효과를 갖는지를 검증하기 위해 프로그램매매를 지수차익거래와 비차익거래로 나누어 사이드카가 주가, 변동성, 그리고 유동성에 미치는 영향을 분석한 결과는 사이드카가 지수차익거래와 비차익거래에 미치는 영향에 뚜렷한 차이가 없음을 보인다. 보다 구체적인 분석을 위해 가상사이드카 표본을 구성하고 실제사이드카와 가상사이드카가 차익거래와 비차익거래에 미치는 효과를 분석하였다. 가상사이드카를 이용한 분석결과는 앞서의 결과가 사이드카 발동이라는 특별한 상황의 발생전후에 시장의 주문이 한 방향으로 몰리는 일시적인 현상에 의해 부분적으로 설명될 수 있음을 보여주며, 사이드카 발동은 비차익거래에 비해 차익거래에 상대적으로 큰 영향을 미치고 비차익거래는 큰 영향을 받지 않음을 보여준다. 이는 비차익거래까지를 포함하는 모든 프로그램매매를 적용대상으로 하는 한국유가증권시장의 사이드카 제도에 대한 재검토가 필요함을 말해주는 것이다.

  • PDF

딥러닝을 이용한 판류형 간판의 인식 (Recognition of Flat Type Signboard using Deep Learning)

  • 권상일;김의명
    • 한국측량학회지
    • /
    • 제37권4호
    • /
    • pp.219-231
    • /
    • 2019
  • 간판은 유형마다 간판의 규격이 정해져 있으나 실제 설치된 간판은 형태와 크기가 일정하지 않다. 또한, 간판은 간판 내부의 색상에 대한 규정이 정해져 있지 않기 때문에 다양한 색상을 갖고 있다. 간판을 인식하기 위한 방법은 도로표지판과 차량번호판을 인식하는 유사한 방법으로 생각할 수 있으나 간판의 특성으로 인해 도로표지판과 차량번호판과 유사한 방법으로 간판을 인식할 수 없는 한계점이 있다. 이에 본 연구에서는 딥러닝 기반의 Faster R-CNN 알고리즘을 이용하여 불법 및 노후 간판의 주요 대상이 되는 판류형 간판을 인식하고 간판의 영역을 자동으로 추출하는 방법론을 제안하였다. 스마트폰 카메라를 이용하여 촬영한 간판 영상을 통해 판류형 간판을 인식하는 과정은 2가지의 순서로 나뉜다. 먼저, 다양한 유형의 간판 영상에서 판류형 간판을 인식하기 위해 딥러닝을 이용하여 간판의 유형을 인식하였으며 그 결과는 약 71%의 정확도로 나타났다. 다음으로 판류형 간판의 경계영역을 인식하기 위해 간판 영역 인식 알고리즘을 적용하였을 때 85%의 정확도로 판류형 간판의 경계영역을 인식하였다.

유사도를 활용한 맞춤형 보험 추천 시스템 (Personalized insurance product based on similarity)

  • 김준성;조아라;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1599-1607
    • /
    • 2022
  • 저출산과 노령화로 보험 수요가 지속해서 감소하고 있다. 나아가 언택트 소비가 주류가 되면서 기존의 대면 서비스를 중심으로 한 보험상품 마케팅은 실효성이 크게 떨어지고 있다. 그러므로 보험업계는 비대면 서비스를 기반으로 한 새로운 마케팅이 절실한 시점이다. 확보된 내 외부 및 공공데이터를 바탕으로 보험 트렌드를 반영한 맞춤형 전략을 통해 기존 고객의 로열티를 강화하고 신규 고객을 확보할 수 있는 개인 맞춤형 보험 상품 추천시스템을 제안하고자 한다. 보험회사 데이터베이스에 등록된 고객을 대상으로 공공 데이터(시군구별 총인구수, 건강생활 실천율, 고령 인구 비율, 출생률, 노인여가복지 수, 연령대별 경제활동참가율 등), 고객 개인정보 및 기 계약 정보를 사용하여 인구통계학 기반과 모델 기반 추천시스템을 설계하였다. 인구통계학 기반 추천시스템은 군집화된 고객 내 코사인 유사도를 계산하여 유사도가 높은 고객들이 많이 가입한 보험상품을 추천하였다. K-means를 이용한 군집화 방식과 고객의 지역, 성별 및 연령대 기준의 Segmentation 방식으로 각각 수행하였다. 모델 기반 추천시스템은 Decision Tree, Random Forest Classifier를 사용하여 각각 추천시스템을 설계하였다. 본 연구 결과 군집 된 고객 간 코사인 유사도를 활용한 인구통계학 기반 추천시스템의 성능이 가장 우수하였다. 이는 개인의 특성(성별, 나이 등) 및 환경적인(경제력, 직업 거주지역 등) 요소에 따라 보험 상품을 선택하기 때문에 고객 간 유사도가 보험 추천시스템의 성능에 주요 요소인 것을 보여준다.

직원경험 요인 파악 및 직무 만족도에 끼치는 영향력 분석 (Identification of Employee Experience Factors and Their Influence on Job Satisfaction)

  • 이주현;이소현;김희웅
    • 경영정보학연구
    • /
    • 제25권2호
    • /
    • pp.181-203
    • /
    • 2023
  • 기존에 우수한 인재를 유치하기 위한 기업들의 경쟁이 심화됨에 따라, 직원들의 직무 만족도 관리가 중요해지고 있다. 이에 많은 기업의 관리자들은 직원들의 일상적인 경험과 고충을 파악하여 직무만족도를 개선하기 위해 투자하고 있다. 그러나 직원 경험에 대한 충분한 이해의 부족으로 관리자들의 투자는 효과를 보지 못하고 있다. 본 논문은 전 세계적으로 가장 큰 직장인 커뮤니티인 글래스도어의 직원 리뷰와 기업 평점을 활용하여 직원 경험의 세부 요인들과 직무 만족도 간 관계를 조사한다. 이때 K-평균 군집화, Sentiment LDA Topic Modeling 등 텍스트 마이닝 기법을 활용하여 직급에 따른 주요 경험을 추출하고, DistilBERT 감성 분석을 통해 각 직원경험 요인의 감성점수를 측정한다. 이후 도출된 직원 경험 요인과 감성 점수를 계량적으로 분석하여 각 직원 경험 요인과 직무 만족도 간의 관계를 파악한다. 그 결과, 조직 관리자와 일반 직원의 직장 내 경험에는 상당한 차이가 있는 것으로 발견되었다. 또한 고객관계, 자율성 등은 관리자의 만족도에 영향을 미치지 않는 등, 직무 만족도에 영향을 미치는 직원경험 역시 직급 간 상이했다. 본 연구는 직업적응이론을 기반으로 텍스트 마이닝과 계량 모델링 방법을 이용하여 직원경험의 주요 요인을 확인하고 이를 검증함으로써 관련 연구분야의 문헌을 확장한다. 더불어, 본 연구결과는 직원들의 직무 만족도 개선을 위한 인사관리 전략에 활용될 수 있으며, 궁극적으로는 기업의 생산성을 개선할 것으로 기대한다.

입원환자의 급식서비스 인식에 따른 고객 군집화 및 군집별 급식서비스 질 평가, 재이용 의도 분석: S병원을 대상으로 (Clustering according to Inpatients' Opinion on Hospital Foodservice and Analyzing Inpatient Response to Foodservice Qualify and Revisit Intention by the Cluster: In Case of S Hospital)

  • 이해영;장승희
    • 한국식품영양과학회지
    • /
    • 제35권10호
    • /
    • pp.1491-1497
    • /
    • 2006
  • 본 연구에서는 병원급식에 대한 입원환자들의 견해를 조사하고 그 자료를 근거로 군집화를 실시한 후 급식서비스의 질, 만족도, 재방문 의사에 대한 집단별 차이 분석을 실시함으로써 병원 급식서비스에 대한 환자의 인식과 만족도 재방문 의사의 관련성을 분석하였다. 병원급식에 대한 고객의 견해를 조사한 결과, 전체 의료서비스 중 급식서비스의 중요성은 4.25점, 제공받은 급식서비스의 전반적인 질 3.57점, 지불한 식대에 대한 급식서비스의 질 3.08점이었다. 급식 서비스의 만족도를 표현하는 항목으로는 급식서비스가 질병 치료에 도움이 되는 정도, 식사가 고객에게 행복을 주는 정도, 전반적인 급식서비스 만족도가 각각 3.48점, 3.18점, 3.66점이었으며, 입원 전 기대에 대한 만족도는 3.53점, 병원 명성에 맞는 급식서비스 제공은 3.40점으로 조사되었다. 만약 향후 다시 병원에 입원할 기회가 생긴다면 S병원을 다시 찾겠다는 재이용 의사에 대한 질문에 대해서는 전반적인 치료서비스를 고려할 때와 급식서비스 수준을 고려할 때로 분리해서 분석 한 결과, 각각 4.04점, 3.84점으로 재입원 의사는 높은 것으로 나타났다. 급식서비스의 중요성, 질, 가치, 만족에 대한 고객의 견해 8문항을 독립변수로 하여 군집분석을 실시한 결과, 2개의 군집으로 분류되었고 각 군집의 의미에 따라 군집 1을 '긍정적 평가군', 군집 2를 '부정적 평가관'이라고 명명하였다. 군집별 급식서비스 요인에 대한 기대, 인식 및 만족도 차이를 분석한 결과, 두 군집간 기대도에는 유의적 차이가 없었으나, 인식도에서는 식사의 질(p<0.001), 고객 응대(p<0.001), 정확한 서비스(p<0.001), 배선원의 태도(p<0.01)의 4개요인 모두에서 긍정적 평가군이 부정적 평가군에 비해 유의적으로 수행수준을 높게 인식하고 있었다. 만족도의 경우 긍정적 평가군에서는 만족을, 부정적 평가군에서는 배선원의 태도를 제외한 3가지 요인에서 불만족을 보였으며 4개요인 모두에서 두 군간 유의적인 차이를 보였다. 의료서비스를 고려하거나 혹은 급식서비스를 고려하거나 간에 모두 긍정적 평가군이 부정적 평가군에 비해 유의적(p<0.001)으로 선택가능성이 높게 나타났다.

일개 종합병원의 민간 건강검진 수검자의 검진이용 특성, 건강행태 및 건강관리 수준 분석 (Analysis of Utilization Characteristics, Health Behaviors and Health Management Level of Participants in Private Health Examination in a General Hospital)

  • 김유미;박종호;김원중
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.301-311
    • /
    • 2013
  • 본 연구의 목적은 2차 종합병원급 건강검진센터를 이용한 민간 종합검진 환자의 검진 이용특성과 이들의 건강행태 및 건강관리 수준을 분석하는 것이다. 이를 위해 대전지역 일개 2차 종합병원급 건강검진센터의 2011년 20,696명의 민간 건강검진 수검자를 대상으로 이들의 2001년에서 2011년까지 11년간의 수검자료 150,501건을 분석하였다. 민간 종합검진 수검자의 검진군 분류를 위한 군집분석은 K-means기법의 z-score표준화 방법을 이용하여 분류하였으며, 정기/비정기 검진 분류모형 개발을 위해 로지스틱회귀분석, 의사결정나무, 신경망 분석을 이용하였다. 개발된 비정기 검진군 분류 모형에 따라 신규 검진군 중 비정기 검진군이 될 확률이 높은 1,000명을 추출하여 고객관리사업 대상자로 하였다. 분석결과, 수검자는 신규 검진군, 정기 검진군, 비정기 검진군으로 분류하였다. 신규 검진군은 30대가 많고, 신장질환 의심자의 비율이 높았다. 정기 검진군은 남자, 이상지혈증 의심 비율이 높았다. 비정기 검진군은 흡연율과 운동부족 비율이 높았고, 빈혈 및 당뇨의심 비율이 높았다. 의사결정나무 분석결과 비정기 검진환자의 특성에 영향을 미치는 변수로는 성별, 연령, 거주지, 운동, 빈혈, 이상지혈증, 당뇨, 비만, 간질환 등이었다. 특히 여자 수검자로서 빈혈 검사는 정상, 운동을 하지 않는 군이면서 비만이 의심되는 수검자의 비정기적 수검율은 71.4%에 달하였다. 이러한 연구결과 토대로 맞춤형 고객관리 사업을 진행한다면 건강검진센터 효율적인 운영에 기여할 수 있을 것이다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

만족도를 이용한 자영업에 관한 연구 (A Study on the Satisfaction of Self-Employed)

  • 오유진
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.281-296
    • /
    • 2009
  • 우리나라에서는 외환위기 직후 자영업이 취업자에서 차지하는 비중이 현격히 증가하였으며, 이에 자영업에 대한 연구가 대두되기 시작하였다. 본 연구에서는 외환위기와 카드대란 두 차례의 위기를 지나면서 우리나라의 자영업 구성이 어떻게 변화되었는가를 한국노동패널의 만족도 개념을 이용하여 살펴보았다. 만족도는 생산성뿐만 아니라, 가정 및 사회생활에서도 매우 중요한 역할을 하는 것으로 알려져 있다. 실증분석으로는 군집분석을 통해서 자영업주들을 만족도 유형별로 구분하였으며, 각 그룹에 대한 비교분석을 시도하였다. 또한, 회귀분석으로 각 만족도에 영향을 미치는 결정적인 요인이 무엇인지를 살펴보았다. 군집분석 결과, 두 시점 모두 만족도 상, 중, 하의 3개 집단으로 구분 될 수 있었으나, 내용면 에서는 상당한 차이를 보였다. 카드대란 직후에는 외환위기 직후에 비해 만족도 하위그룹이 현격히 축소된 반면, 만족도 중위그룹은 확대되었으며, 중위그룹의 만족도와 소득수준은 1998년보다 2004년에 급격히 상승하였다. 이는 자영업의 자발적 선택과 자영업에서의 소득기회가 증가했기 때문인 것으로 판단된다. 만족도 상위그룹은 상대적으로 고용주 비율, 교육수준, 소득이 높았으며, 연령, 서울진주비율, 근무일수는 작았다. 회귀분석 결과 직무만족은 여성의 경우 더 만족도가 높으며, 미래에 희망을 포함한 변수들이 유의한 것으로 나타났으며, 생활만족에는 소득금액보다는 실질적인 소득의 존재가 매우 중요한 변수로 나타났다. 이 둘을 아우르는 전반적 삶의 만족에는 연령, 현직장에의 만족정도, 교육수준, 현재건강상태가 유의하였다. 교육수준의 경우는 외국의 경우와 상반되게 국내 연구들에서만 유의한 것으로 나타난 특징을 가지고 있으며, 현재건강상태는 기존 연구에서 많이 다루어지지 않은 변수로 만족도 결정에 매우 유의한 것으로 나타났다.

L 및 LH-모멘트법과 지역빈도분석에 의한 가뭄우량의 추정 (II)- LH-모멘트법을 중심으로 - (Estimation of Drought Rainfall by Regional Frequency Analysis Using L and LH-Moments (II) - On the method of LH-moments -)

  • 이순혁;윤성수;맹승진;류경식;주호길;박진선
    • 한국농공학회논문집
    • /
    • 제46권5호
    • /
    • pp.27-39
    • /
    • 2004
  • In the first part of this study, five homogeneous regions in view of topographical and geographically homogeneous aspects except Jeju and Ulreung islands in Korea were accomplished by K-means clustering method. A total of 57 rain gauges were used for the regional frequency analysis with minimum rainfall series for the consecutive durations. Generalized Extreme Value distribution was confirmed as an optimal one among applied distributions. Drought rainfalls following the return periods were estimated by at-site and regional frequency analysis using L-moments method. It was confirmed that the design drought rainfalls estimated by the regional frequency analysis were shown to be more appropriate than those by the at-site frequency analysis. In the second part of this study, LH-moment ratio diagram and the Kolmogorov-Smirnov test on the Gumbel (GUM), Generalized Extreme Value (GEV), Generalized Logistic (GLO) and Generalized Pareto (GPA) distributions were accomplished to get optimal probability distribution. Design drought rainfalls were estimated by both at-site and regional frequency analysis using LH-moments and GEV distribution, which was confirmed as an optimal one among applied distributions. Design rainfalls were estimated by at-site and regional frequency analysis using LH-moments, the observed and simulated data resulted from Monte Carlotechniques. Design drought rainfalls derived by regional frequency analysis using L1, L2, L3 and L4-moments (LH-moments) method have shown higher reliability than those of at-site frequency analysis in view of RRMSE (Relative Root-Mean-Square Error), RBIAS (Relative Bias) and RR (Relative Reduction) for the estimated design drought rainfalls. Relative efficiency were calculated for the judgment of relative merits and demerits for the design drought rainfalls derived by regional frequency analysis using L-moments and L1, L2, L3 and L4-moments applied in the first report and second report of this study, respectively. Consequently, design drought rainfalls derived by regional frequency analysis using L-moments were shown as more reliable than those using LH-moments. Finally, design drought rainfalls for the classified five homogeneous regions following the various consecutive durations were derived by regional frequency analysis using L-moments, which was confirmed as a more reliable method through this study. Maps for the design drought rainfalls for the classified five homogeneous regions following the various consecutive durations were accomplished by the method of inverse distance weight and Arc-View, which is one of GIS techniques.