• 제목/요약/키워드: k-Means Clustering

검색결과 1,111건 처리시간 0.026초

일개 종합병원의 민간 건강검진 수검자의 검진이용 특성, 건강행태 및 건강관리 수준 분석 (Analysis of Utilization Characteristics, Health Behaviors and Health Management Level of Participants in Private Health Examination in a General Hospital)

  • 김유미;박종호;김원중
    • 한국산학기술학회논문지
    • /
    • 제14권1호
    • /
    • pp.301-311
    • /
    • 2013
  • 본 연구의 목적은 2차 종합병원급 건강검진센터를 이용한 민간 종합검진 환자의 검진 이용특성과 이들의 건강행태 및 건강관리 수준을 분석하는 것이다. 이를 위해 대전지역 일개 2차 종합병원급 건강검진센터의 2011년 20,696명의 민간 건강검진 수검자를 대상으로 이들의 2001년에서 2011년까지 11년간의 수검자료 150,501건을 분석하였다. 민간 종합검진 수검자의 검진군 분류를 위한 군집분석은 K-means기법의 z-score표준화 방법을 이용하여 분류하였으며, 정기/비정기 검진 분류모형 개발을 위해 로지스틱회귀분석, 의사결정나무, 신경망 분석을 이용하였다. 개발된 비정기 검진군 분류 모형에 따라 신규 검진군 중 비정기 검진군이 될 확률이 높은 1,000명을 추출하여 고객관리사업 대상자로 하였다. 분석결과, 수검자는 신규 검진군, 정기 검진군, 비정기 검진군으로 분류하였다. 신규 검진군은 30대가 많고, 신장질환 의심자의 비율이 높았다. 정기 검진군은 남자, 이상지혈증 의심 비율이 높았다. 비정기 검진군은 흡연율과 운동부족 비율이 높았고, 빈혈 및 당뇨의심 비율이 높았다. 의사결정나무 분석결과 비정기 검진환자의 특성에 영향을 미치는 변수로는 성별, 연령, 거주지, 운동, 빈혈, 이상지혈증, 당뇨, 비만, 간질환 등이었다. 특히 여자 수검자로서 빈혈 검사는 정상, 운동을 하지 않는 군이면서 비만이 의심되는 수검자의 비정기적 수검율은 71.4%에 달하였다. 이러한 연구결과 토대로 맞춤형 고객관리 사업을 진행한다면 건강검진센터 효율적인 운영에 기여할 수 있을 것이다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

만족도를 이용한 자영업에 관한 연구 (A Study on the Satisfaction of Self-Employed)

  • 오유진
    • 응용통계연구
    • /
    • 제22권2호
    • /
    • pp.281-296
    • /
    • 2009
  • 우리나라에서는 외환위기 직후 자영업이 취업자에서 차지하는 비중이 현격히 증가하였으며, 이에 자영업에 대한 연구가 대두되기 시작하였다. 본 연구에서는 외환위기와 카드대란 두 차례의 위기를 지나면서 우리나라의 자영업 구성이 어떻게 변화되었는가를 한국노동패널의 만족도 개념을 이용하여 살펴보았다. 만족도는 생산성뿐만 아니라, 가정 및 사회생활에서도 매우 중요한 역할을 하는 것으로 알려져 있다. 실증분석으로는 군집분석을 통해서 자영업주들을 만족도 유형별로 구분하였으며, 각 그룹에 대한 비교분석을 시도하였다. 또한, 회귀분석으로 각 만족도에 영향을 미치는 결정적인 요인이 무엇인지를 살펴보았다. 군집분석 결과, 두 시점 모두 만족도 상, 중, 하의 3개 집단으로 구분 될 수 있었으나, 내용면 에서는 상당한 차이를 보였다. 카드대란 직후에는 외환위기 직후에 비해 만족도 하위그룹이 현격히 축소된 반면, 만족도 중위그룹은 확대되었으며, 중위그룹의 만족도와 소득수준은 1998년보다 2004년에 급격히 상승하였다. 이는 자영업의 자발적 선택과 자영업에서의 소득기회가 증가했기 때문인 것으로 판단된다. 만족도 상위그룹은 상대적으로 고용주 비율, 교육수준, 소득이 높았으며, 연령, 서울진주비율, 근무일수는 작았다. 회귀분석 결과 직무만족은 여성의 경우 더 만족도가 높으며, 미래에 희망을 포함한 변수들이 유의한 것으로 나타났으며, 생활만족에는 소득금액보다는 실질적인 소득의 존재가 매우 중요한 변수로 나타났다. 이 둘을 아우르는 전반적 삶의 만족에는 연령, 현직장에의 만족정도, 교육수준, 현재건강상태가 유의하였다. 교육수준의 경우는 외국의 경우와 상반되게 국내 연구들에서만 유의한 것으로 나타난 특징을 가지고 있으며, 현재건강상태는 기존 연구에서 많이 다루어지지 않은 변수로 만족도 결정에 매우 유의한 것으로 나타났다.

L 및 LH-모멘트법과 지역빈도분석에 의한 가뭄우량의 추정 (II)- LH-모멘트법을 중심으로 - (Estimation of Drought Rainfall by Regional Frequency Analysis Using L and LH-Moments (II) - On the method of LH-moments -)

  • 이순혁;윤성수;맹승진;류경식;주호길;박진선
    • 한국농공학회논문집
    • /
    • 제46권5호
    • /
    • pp.27-39
    • /
    • 2004
  • In the first part of this study, five homogeneous regions in view of topographical and geographically homogeneous aspects except Jeju and Ulreung islands in Korea were accomplished by K-means clustering method. A total of 57 rain gauges were used for the regional frequency analysis with minimum rainfall series for the consecutive durations. Generalized Extreme Value distribution was confirmed as an optimal one among applied distributions. Drought rainfalls following the return periods were estimated by at-site and regional frequency analysis using L-moments method. It was confirmed that the design drought rainfalls estimated by the regional frequency analysis were shown to be more appropriate than those by the at-site frequency analysis. In the second part of this study, LH-moment ratio diagram and the Kolmogorov-Smirnov test on the Gumbel (GUM), Generalized Extreme Value (GEV), Generalized Logistic (GLO) and Generalized Pareto (GPA) distributions were accomplished to get optimal probability distribution. Design drought rainfalls were estimated by both at-site and regional frequency analysis using LH-moments and GEV distribution, which was confirmed as an optimal one among applied distributions. Design rainfalls were estimated by at-site and regional frequency analysis using LH-moments, the observed and simulated data resulted from Monte Carlotechniques. Design drought rainfalls derived by regional frequency analysis using L1, L2, L3 and L4-moments (LH-moments) method have shown higher reliability than those of at-site frequency analysis in view of RRMSE (Relative Root-Mean-Square Error), RBIAS (Relative Bias) and RR (Relative Reduction) for the estimated design drought rainfalls. Relative efficiency were calculated for the judgment of relative merits and demerits for the design drought rainfalls derived by regional frequency analysis using L-moments and L1, L2, L3 and L4-moments applied in the first report and second report of this study, respectively. Consequently, design drought rainfalls derived by regional frequency analysis using L-moments were shown as more reliable than those using LH-moments. Finally, design drought rainfalls for the classified five homogeneous regions following the various consecutive durations were derived by regional frequency analysis using L-moments, which was confirmed as a more reliable method through this study. Maps for the design drought rainfalls for the classified five homogeneous regions following the various consecutive durations were accomplished by the method of inverse distance weight and Arc-View, which is one of GIS techniques.

문헌정보학과 학생의 직장으로서의 도서관·정보센터 이미지 분석 (Study about Library and Information Center's Image of Library and Information Science Students as Workplace)

  • 조재인;이지원
    • 한국문헌정보학회지
    • /
    • 제50권3호
    • /
    • pp.113-132
    • /
    • 2016
  • 소비자에게 형성된 심상 분석을 통해 마케팅 전략을 수립하는데 주로 활용되고 있는 포지셔닝(Positioning) 기법은 공공시설, 기업, 대학이 공중에게 주는 이미지 분석을 비롯해 다양한 영역에서 활용되고 있다. 본 연구는 문헌정보학과 학생이 직장으로서 도서관 정보센터에 대하여 가지고 있는 이미지를 포지셔닝 기법을 통하여 분석하였다. 분석 결과, 학생들은 공공, 대학, 학교, 국가도서관을 유사한 이미지의 직장으로 인식하는 반면, 포털과 전문도서관은 이들과는 이질적인 진출처로 인식하고 있었으며, 직무에 있어서는 이용자봉사업무와 기술업무, 문화프로그램 업무를 각각 상이한 직무 군집으로 인식하고 있는 것으로 나타났다. 한편, 만족스러운 업무와 고용안정성이라는 이미지는 국가도서관과 공공도서관이 가장 크게 나타났으며, 보수가 가장 높을 것으로 기대되는 곳은 포털 업체, 성장가능성이 가장 높을 것으로 기대되는 곳은 전문도서관으로 포지셔닝되었다. 한편, 학생들이 가장 중요하게 생각하는 직장선택준거는 고용안정성으로 나타났으며, 가장 선호하는 직장으로는 공공도서관이 선택되었는데, 이러한 공공도서관 선호 집중 현상은 수도권대학보다는 지방대학 학생들에게 더욱 강하게 나타났다.

MRI 영상 유도 수술 로봇을 위한 개선된 군집 분석 방법을 이용한 뇌종양 영역 검출 개발 (Development of Brain Tumor Detection using Improved Clustering Method on MRI-compatible Robotic Assisted Surgery)

  • 김대관;차경래;승성민;정세미;최종균;노지형;박충환;송태하
    • 대한의용생체공학회:의공학회지
    • /
    • 제40권3호
    • /
    • pp.105-115
    • /
    • 2019
  • Brain tumor surgery may be difficult, but it is also incredibly important. The technological improvements for traditional brain tumor surgeries have always been a focus to improve the precision of surgery and release the potential of the technology in this important area of the body. The need for precision during brain tumor surgery has led to an increase in Robotic-assisted surgeries (RAS). One of the challenges to the widespread acceptance of RAS in the neurosurgery is to recognize invisible tumor accurately. Therefore, it is important to detect brain tumor size and location because surgeon tries to remove as much tumor as possible. In this paper, we proposed brain tumor detection procedures for MRI (Magnetic Resonance Imaging) system. A method of automatic brain tumor detection is needed to accurately target the location of the lesion during brain tumor surgery and to report the location and size of the lesion. In the qualitative assessment, the proposed method showed better results than those obtained with other brain tumor detection methods. Comparisons among all assessment criteria indicated that the proposed method was significantly superior to the threshold method with respect to all assessment criteria. The proposed method was effective for detecting brain tumor.

Tumor Habitat Analysis Using Longitudinal Physiological MRI to Predict Tumor Recurrence After Stereotactic Radiosurgery for Brain Metastasis

  • Da Hyun Lee;Ji Eun Park;NakYoung Kim;Seo Young Park;Young-Hoon Kim;Young Hyun Cho;Jeong Hoon Kim;Ho Sung Kim
    • Korean Journal of Radiology
    • /
    • 제24권3호
    • /
    • pp.235-246
    • /
    • 2023
  • Objective: It is difficult to predict the treatment response of tissue after stereotactic radiosurgery (SRS) because radiation necrosis (RN) and tumor recurrence can coexist. Our study aimed to predict tumor recurrence, including the recurrence site, after SRS of brain metastasis by performing a longitudinal tumor habitat analysis. Materials and Methods: Two consecutive multiparametric MRI examinations were performed for 83 adults (mean age, 59.0 years; range, 27-82 years; 44 male and 39 female) with 103 SRS-treated brain metastases. Tumor habitats based on contrast-enhanced T1- and T2-weighted images (structural habitats) and those based on the apparent diffusion coefficient (ADC) and cerebral blood volume (CBV) images (physiological habitats) were defined using k-means voxel-wise clustering. The reference standard was based on the pathology or Response Assessment in Neuro-Oncologycriteria for brain metastases (RANO-BM). The association between parameters of single-time or longitudinal tumor habitat and the time to recurrence and the site of recurrence were evaluated using the Cox proportional hazards regression analysis and Dice similarity coefficient, respectively. Results: The mean interval between the two MRI examinations was 99 days. The longitudinal analysis showed that an increase in the hypovascular cellular habitat (low ADC and low CBV) was associated with the risk of recurrence (hazard ratio [HR], 2.68; 95% confidence interval [CI], 1.46-4.91; P = 0.001). During the single-time analysis, a solid low-enhancing habitat (low T2 and low contrast-enhanced T1 signal) was associated with the risk of recurrence (HR, 1.54; 95% CI, 1.01-2.35; P = 0.045). A hypovascular cellular habitat was indicative of the future recurrence site (Dice similarity coefficient = 0.423). Conclusion: After SRS of brain metastases, an increased hypovascular cellular habitat observed using a longitudinal MRI analysis was associated with the risk of recurrence (i.e., treatment resistance) and was indicative of recurrence site. A tumor habitat analysis may help guide future treatments for patients with brain metastases.

Association between High Diffusion-Weighted Imaging-Derived Functional Tumor Burden of Peritoneal Carcinomatosis and Overall Survival in Patients with Advanced Ovarian Carcinoma

  • He An;Jose AU Perucho;Keith WH Chiu;Edward S Hui;Mandy MY Chu;Siew Fei Ngu;Hextan YS Ngan;Elaine YP Lee
    • Korean Journal of Radiology
    • /
    • 제23권5호
    • /
    • pp.539-547
    • /
    • 2022
  • Objective: To investigate the association between functional tumor burden of peritoneal carcinomatosis (PC) derived from diffusion-weighted imaging (DWI) and overall survival in patients with advanced ovarian carcinoma (OC). Materials and Methods: This prospective study was approved by the local research ethics committee, and informed consent was obtained. Fifty patients (mean age ± standard deviation, 57 ± 12 years) with stage III-IV OC scheduled for primary or interval debulking surgery (IDS) were recruited between June 2016 and December 2021. DWI (b values: 0, 400, and 800 s/mm2) was acquired with a 16-channel phased-array torso coil. The functional PC burden on DWI was derived based on K-means clustering to discard fat, air, and normal tissue. A score similar to the surgical peritoneal cancer index was assigned to each abdominopelvic region, with additional scores assigned to the involvement of critical sites, denoted as the functional peritoneal cancer index (fPCI). The apparent diffusion coefficient (ADC) of the largest lesion was calculated. Patients were dichotomized by immediate surgical outcome into high- and low-risk groups (with and without residual disease, respectively) with subsequent survival analysis using the Kaplan-Meier curve and log-rank test. Multivariable Cox proportional hazards regression was used to evaluate the association between DWI-derived results and overall survival. Results: Fifteen (30.0%) patients underwent primary debulking surgery, and 35 (70.0%) patients received neoadjuvant chemotherapy followed by IDS. Complete tumor debulking was achieved in 32 patients. Patients with residual disease after debulking surgery had reduced overall survival (p = 0.043). The fPCI/ADC was negatively associated with overall survival when accounted for clinicopathological information with a hazard ratio of 1.254 for high fPCI/ADC (95% confidence interval, 1.007-1.560; p = 0.043). Conclusion: A high DWI-derived functional tumor burden was associated with decreased overall survival in patients with advanced OC.

의미간의 유사도 연구의 패러다임 변화의 필요성-인지 의미론적 관점에서의 고찰 (The Need for Paradigm Shift in Semantic Similarity and Semantic Relatedness : From Cognitive Semantics Perspective)

  • 최영석;박진수
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.111-123
    • /
    • 2013
  • 개념간의 의미적 유사도 및 관계도(Semantic Similarity/Relatedness)를 구하는 연구는 고전적인 연구에서는 데이터 베이스 통합이나 시스템 통합, 그리고 현대의 연구에 있어서는 태그 및 키워드 추출, 연관 단어 추천 등에 걸쳐 다양한 분야에서 활용되어 온 연구이다. 그 연구는 역사가 오래되었을 뿐만 아니라, 경영정보와 컴퓨터 공학, 계산 언어학에 걸쳐 여러 분야에서도 많은 관심을 가져왔던 연구 분야라고 할 수 있다. 그러나, 지금까지의 개념간의 관계도 계산 방식은 미리 만들어진 사전이나 참조할 수 있는 다른 시맨틱 네트워크(Semantic Network)를 이용하여 계산하는 방법이 주를 이루었다. 이러한 접근 방법의 경우, 개념간의 의미적 관계가 변화에 대한 가능성을 고려하지 않는 것이 일반적이다. 하지만, 정보 기술의 발달과 빠른 사회변화는 개념간의 의미관계 등에 변화를 가져오고 있는 것이 현실이다. 사회적으로 일어나는 사건이나, 문화적 변화 등이 개념간의 의미관계를 변화시키는 것을 물론이며, 이러한 변화가 정보 통신 기술의 도움으로 빠르게 공유되고 있다. 이렇게 개념간의 의미 관계가 시간이나 맥락에 따라 빠르게 변화할 수 있는 가능성이 있음에도 불구하고, 기존의 개념간 의미적 유사도 및 관계도에 대한 연구들은 이러한 '의미관계의 변화'에 대한 새로운 문제에 대해 해답을 제시하지 못한 것이 사실이다. 따라서, 본 연구에서는 개념간의 유사도 연구에 있어 지금까지 있어왔던 '정적인 의미간 관계도 패러다임'에서 '동적인 의미간 관계도 패러다임'으로의 전환의 필요성과 그 당위성을 인지 의미론적(Cognitive Semantics)의 관점에서 역설하고자 한다. 인간이 인지하는 개념간의 의미관계가 변화할 수 있는 이론적 근거를 인지 의미론에서 찾아봄으로써, 패러다임 변화의 방향을 구체적으로 제시하였다. 또한 이러한 패러다임의 변화에 맞추어 개념간의 의미적 유사도 및 관계도에 대한 연구가 어떠한 방향으로 나아가야 할지 구체적인 연구 방향을 제시함으로써 관련 연구자들에게 새로운 연구의 가이드라인을 제시하였다.

서울시 토지피복에 따른 계절별 미세먼지 농도 차이 분석 - 산림과 시가화지역을 중심으로 - (Analysis of the Seasonal Concentration Differences of Particulate Matter According to Land Cover of Seoul - Focusing on Forest and Urbanized Area -)

  • 최태영;문호경;강다인;차재규
    • 환경영향평가
    • /
    • 제27권6호
    • /
    • pp.635-646
    • /
    • 2018
  • 본 연구는 도시의 미세먼지 배출과 저감에 관련된 토지피복 유형인 산림과 시가화지역의 영향에 의한 계절별 미세먼지 농도 특성을 파악하고자 하였다. 서울시 23개 도시대기 측정소의 2016년 PM10, PM2.5 농도자료를 수집하였고, 측정소 주변 반경 3km 내 시가화지역과 산림 비율을 기준으로 3개 그룹으로 측정소를 구분하여 그룹간의 미세먼지 농도 차이를 계절별로 분석하였다. 그룹별 시가화지역과 산림의 중심값은 Group A에서 각각 53.4%, 34.6%, Group B는 61.8%, 16.5%, Group C는 76.3%, 6.7%이었다. 계절별 PM10과 PM2.5의 그룹별 농도는 산림 비율이 높은 Group A의 농도가 모든 계절에서 가장 낮았고, 시가화지역 비율이 높은 Group C의 농도는 봄부터 가을까지 가장 높았다. 이상의 그룹간 차이는 통계적으로 유의하였다. Group C 농도는 겨울철에만 Group B보다 낮아졌는데, 겨울철 Group B-C간의 차이는 통계적으로 유의하지 않았다. 계절별 고농도 그룹의 농도 대비 Group A의 농도는 PM10에서 봄, 여름, 가을, 겨울 각각 8.5%, 11.2%, 8.0%, 6.8%, PM2.5에서 3.5%, 10.0%, 4.1%, 3.3% 낮은 수치이었다. PM10과 PM2.5 모두 그룹간 농도 격차가 여름에 가장 크고, 겨울로 가면서 작아졌는데, 이는 산림의 미세먼지 저감기능이 여름에 크고, 겨울에 작기 때문인 것으로 판단되었다. 산림과 비교해 시가화지역이 미세먼지 농도에 끼치는 영향은 작았다. 본 연구를 통해 산림 비율이 높은 지역에서 미세먼지 농도가 낮은 효과가 입증되었으며, 도시의 미세먼지 관리를 위해 녹지의 기능을 규명하는 지속적인 연구가 필요하였다.