• 제목/요약/키워드: K-평균 군집

검색결과 652건 처리시간 0.031초

정준상관 행렬도와 군집분석을 응용한 KLPGA 선수의 기술과 경기성적요인에 대한 연관성 분석 (A Study on the Relationship between Skill and Competition Score Factors of KLPGA Players Using Canonical Correlation Biplot and Cluster Analysis)

  • 최태훈;최용석
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.429-439
    • /
    • 2008
  • 정준상관 행렬도(canonical correlation biplot)는 정준상관분석에서 두 변수 집단에 의해서 측정된 다변량 자료에서 변수 집단 간의 관계와 개체들의 관계를 탐색하기 위한 2차원 그림이다. 이는 일반적으로 최용석 (2006, 1장)의 한 변수 집단에 의한 행렬자료에 대한 일반적인 행렬도를 두 변수 집단에 의한 행렬자료로 확장한 것으로 볼 수 있다. 최근에 Choi와 Kim (2008)은 개체들이 많은 대용량 자료에서 행렬도의 해석상 힘든 문제점을 지적하고 이를 극복하는 데 군집분석을 활용하는 방법을 제시하고 있다. 일반적인 행렬도에서 발생하는 대용량 자료에 대한문제는 정준상관 행렬도에서도 동일하게 발생하곤 한다. 본 연구에서는 2006년도 KLPGA 선수 중 상금 순위 상위 50명을 대상으로 정준상관 행렬도를 통해 기술요인변수군(평균 퍼팅수. 그린 적중율, 파 세이브율, 파 브레이크율)과 경기성적요인변수군(상금, 평균 타수)간의 관련성을 살펴보고 군집분석을 활용하여 각 선수들의 군집을 시도하려한다.

K-평균 군집분석을 활용한 중학생의 군집화 및 특성 분석 (Analysis of Characteristics of Clusters of Middle School Students Using K-Means Cluster Analysis)

  • 이재봉
    • 한국과학교육학회지
    • /
    • 제42권6호
    • /
    • pp.611-619
    • /
    • 2022
  • 최근 교육에서 교육 데이터마이닝에 관한 관심이 높아지고 있는 시점에 과학교육에서 평가 결과를 활용하여 학생들에게 적합한 피드백을 제공하기 위해 빅데이터 분석의 적용 가능성을 탐색해 보고자 하였다. 연구에서는 국가수준 학업성취도 평가의 24문항에 응시한 2,576명의 평가 자료를 활용하여 비지도 기계학습의 한 가지 방법인 K-평균 군집분석을 이용하여 학생들을 군집화하였다. 학업성취도 평가 자료를 활용한 군집화 결과, 학생들을 6개의 군집으로 나누어 볼수 있었다. 상위권이나 하위권에 비해 중위권 학생들이 다양하게 다른 군집으로 구분됨을 알 수 있다. 군집분석의 결과를 보면, 군집화에서 가장 중요하게 영향을 주는 요인은 학업 성취였으며, 군집별로는 교육과정의 내용 영역별, 교과 역량별, 정의적 특성 면에서 서로 다른 특성을 보이고 있었다. 하위 군집에서는 정의적 영역 중에서 학습의욕이 중요하게 영향을 주고, 교과 역량 면에서는 과학적 탐구 및 문제 해결력과 과학적 의사소통 능력이 중요하게 영향을 주고 있었다. 내용 영역 면에서는 운동과 에너지와 물질 영역에 대한 성취가 군집의 특성을 구분하는 중요한 요인으로 작용하고 있었다. 따라서 평가 자료를 활용해 학생을 군집화한 후, 이러한 군집별 특성을 바탕으로 학생들에게 학습을 위한 맞춤형 피드백을 제공할 수 있을 것으로 판단된다. 본 연구에서는 이러한 연구 결과를 바탕으로 군집분석 연구 결과 활용의 가능성, 내용 영역별 균형 있는 학습, 교과 역량 증진, 과학적 태도의 향상 등 과학교육의 시사점을 제안하였다.

군집화 분석을 활용한 선박투자패턴 분석: 그리스와 한국 사례 중심으로 (Analysis of Ship Investment Patterns Using Clustering between Greece and Korea)

  • 임상섭;김석훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.707-708
    • /
    • 2021
  • 선박은 해운시장에서 가장 중요한 자산이다. 이러한 선박투자에는 대규모 자본조달이 필요하며 시황 및 경기분석을 통해 고점투자를 방지하고 조달비용을 절감하는 것이 중요하며 이러한 결정이 투자 성패를 좌우한다. 본 논문은 K평균 군집화분석을 이용하여 그리스 선주와 한국 선주의 선박투자행태를 분류하고자 한다. 분석의 결과로 선박투자의 주요 요인들을 식별하여 기업차원의 선박투자의 벤티마크 투자전략을 수립하는데 기여하고자 하며 정책적 차원에서 선박투자에 필요한 전략에 대한 시사점을 도출하고자 한다.

  • PDF

의무기록 전공 대학생의 회복탄력성 군집에 따른 학업소진, 진로준비행동 등의 융합적 차이 (Convergence differences of academic burnout, career preparation behavior etc. by resilience clusters of students majoring in Medical records)

  • 이현주
    • 한국융합학회논문지
    • /
    • 제8권4호
    • /
    • pp.67-77
    • /
    • 2017
  • 이 연구는 의무기록 전공 대학생 대상 회복탄력성의 군집별로 학업소진, 진로준비행동 및 일반적 특성의 융합적 차이를 파악하고 특성에 따른 개선방안을 도출하기 위한 것이다. 의무기록 전공 대학생을 대상으로 자기기 입식 설문을 실시하여 최종 168건에 대해 분석을 실시하였다. 연구결과, 회복탄력성의 3가지 세부 영역에 따라 군집분석한 결과 2개의 군집으로 분류되었다. 군집1은 세 영역 모두 한국인 평균 이상인 보통수준의 집단이었고, 군집2는 세 영역 모두 한국인 평균보다 낮은 군이었다. 군집1은 진로준비행동, 취미 유, 주관적 건강상태가 좋은 편, 외향적 성격, 성적 상, 대학생활 만족, 전공 만족한 비율이 군집2보다 높았고, 학업소진은 더 낮아 군집 간 차이를 보였다. 따라서 군집2에 속하는 집단에 초점을 맞춘 긍정성 강화 교육을 통해 전체 회복탄력성을 높일 수 있을 것이다.

단어 군집 기반 모바일 애플리케이션 범주화 (Word Cluster-based Mobile Application Categorization)

  • 허정만;박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 단어 군집 정보를 활용하여 모바일 애플리케이션의 범주를 분류하는 방법을 제안한다. 제안하는 방법은 모바일 애플리케이션 설명이 짧을 수 있다는 점을 고려하여, 모바일 애플리케이션 설명에 포함된 단어 정보 뿐만 아니라 각 단어의 단어 군집 대표 정보를 범주화 자질로 활용한다. 그리고, 모바일 애플리케이션의 카테고리가 세분화되어 있으므로, 제안하는 방법은 범주별 단어 발생 빈도를 K 평균 군집화 알고리즘에 적용하여 단어 군집을 생성한다. 모바일 애플리케이션 설명이 설치사양과 같이 범주와 관련없는 내용이 있을 수 있다는 점을 반영하여, 제안하는 방법은 단어 군집 중에서 범주화에 유용한 일부 단어 군집만을 선별하여 활용한다. 실험결과 제안하는 방법은 단어 군집 정보를 활용하여 모바일 애플리케이션 범주화 재현율을 5.65% 개선시켰다.

움직임 벡터의 계층적 군집화를 통한 HEVC 고속 부호화 연구 (Study on Fast HEVC Encoding with Hierarchical Motion Vector Clustering)

  • 임정윤;안용조;심동규
    • 방송공학회논문지
    • /
    • 제21권4호
    • /
    • pp.578-591
    • /
    • 2016
  • 본 논문에서는 HEVC 부호화기의 속도를 향상시키기 위하여, 움직임 벡터의 군집화를 통한 코딩 블록의 최대 분할 깊이를 결정하는 방법을 제안한다. 현재 HEVC (High Efficiency Video Coding)의 참조 소프트웨어 HM은 최적의 코딩 블록 구조를 찾기 위해 다양한 코딩 블록의 깊이들에 대한 율-왜곡 최적화 (RDO: Rate-Distortion Optimization)를 수행한다. 하지만 이는 부호화기의 높은 복잡도를 차지하는 요소 중 하나로 보고된다. 본 논문에서는 최적의 코딩 블록 구조를 움직임 벡터의 군집화 된 결과에 따라 결정함으로써, 부호화 과정에서 코딩 블록 구조를 찾기 위한 RDO의 복잡도를 줄임으로써 부호화기의 속도를 향상시키는 방법을 제안한다. 제안하는 방법은 전처리 과정으로부터 원본 영상에 대한 움직임 벡터 계산, 이를 통한 계층적 군집화를 수행하여, 군집화된 경향을 기반으로 코딩 블록의 최대 깊이를 결정한다. 본 논문의 제안하는 방법은 HEVC 참조 소프트웨어 대비 평균 1.45% BD-rate 손실이 있었으며 평균 16%의 부호화 속도 향상을 보였다. 또한, 기존의 고속화 방법과 함께 적용한 경우 1.84% BD-rate 손실과 45.13%의 평균 부호화 속도 향상을 나타냈다.

mRMR과 수정된 입자군집화 방법을 이용한 다범주 분류를 위한 최적유전자집단 구성 (A hybrid method to compose an optimal gene set for multi-class classification using mRMR and modified particle swarm optimization)

  • 이선호
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.683-696
    • /
    • 2020
  • 표본의 다범주 표현형을 예측하는데 사용되는 최적의 유전자집단이란 적은 수의 유전자로 표현형을 정확히 예측할 수 있는 유전자들의 모임이다. 특이발현유전자를 검색하는 통계량은 이미 여러 가지가 있고, K-평균 군집화를 곁들여 중복성이 적은 특이발현유전자들을 선택 가능하다. 이들을 바탕으로 적은 수로 정확하게 다범주 분류가 가능한 유전자집단을 구성할 수 있도록 수정한 입자최적화 방법을 제안한다. 널리 알려진 ALL 248례와 SRBCT 83례를 이용하여 제안된 방법으로 최적유전자집단을 찾을 수 있음을 보였다.

신용카드업에서 데이터마이닝의 활용 -고객행동기반의 고객세분화-

  • 진서훈;안상욱
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.171-174
    • /
    • 2004
  • 기업들이 심화된 경쟁체제 속에서 고객에 대한 보다 심층적인 이해를 필요로 하고 정보기술의 발달로 각 요소활동내용의 데이터화가 가능해짐에 따라 CRM으로 대변되는 고객 정보의 전략적 활용이 매우 중요하게 되었다. 이를 위해 기업은 고객에 대한 이해를 바탕으로 고객관리 및 마케팅을 수행하기 위한 필수적인 도구인 고객세분화를 수행하고 있다. 본 연구에서는 신용카드고객의 카드사용행태에 근거하여 서로 유사한 사용행태를 보이는 고객군으로 세분화하는 과정을 소개한다. 고객이 실제로 카드를 사용하면서 발생시킨 거래정보에만 의존하여 고객세분화를 수행하였으며 이는 마케팅의 관점에서 상당히 의미 있는 내용이라 볼 수 있다. 고객세분화를 위하여 데이터마이닝기법인 k-평균군집방법과 최장연결법에 의한 계보적 군집방법을 활용하였다

  • PDF

인공지능을 활용한 합류부에서 수질의 공간혼합 특성 분석 (Analysis of spatial mixing characteristics of water quality at the confluence using artificial intelligence)

  • 이서경;김동수;김경동;김영도;류시완
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.482-482
    • /
    • 2022
  • 하천의 합류부에서는 수질이 다른 유체가 혼합하여 합류 전과 다른 특성을 보인다. 하천의 합류부에서 수질을 효율적으로 관리하기 위해서는 수질의 공간적인 혼합 특성을 규명하는 것이 중요하다. 합류부에서 수질의 공간적인 혼합 특성을 분석하기 위해 본 연구에서는 토폴로지 데이터 분석(topological data analysis, TDA), 자기 조직화 지도(Self-Organizing Map, SOM), k-평균 알고리즘(K-means clustering algorithm) 세 가지 기법을 이용하였다. 세 가지 기법을 비교하여 어떤 알고리즘이 합류부의 수질 변화 특성을 더 뚜렷하게 나타내는지 분석하였다. 수질 변화 비교 인자들은 pH, chlorophyll, DO, Turbidity 등이 있고, 수질 인자들은 YSI를 활용해 측정하였다. 자료의 측정 지역은 낙동강과 황강이 합류하는 지역이며, 보트에 YSI 장비를 부착하고 횡단하여 측정하였다. 측정한 데이터를 R 프로그램을 통해 세 가지 기법을 적용시켜 수질 변화 비교를 분석한다. 토폴로지 데이터 분석(topological data analysis, TDA)은 거대하고 복잡한 데이터로부터 유의미한 정보를 추출하는 데 사용하고, 자기조직화지도(Self-Organizing Map, SOM) 기법은 차원 축소와 군집화를 동시에 수행한다. k-평균 알고리즘(K-means clustering algorithm) 기법은 주어진 데이터를 k개의 클러스터로 묶는 머신러닝 비지도학습에 속하는 알고리즘이다. 세 가지 방법들의 주목적은 클러스터링이다. 클러스터 분석(Cluster analysis)이란 주어진 데이터들의 특성을 고려해 동일한 성격을 가진 여러 개의 그룹으로 대상을 분류하는 데이터 마이닝의 한 방법이다. 군집화 방법들인 TDA, SOM, K-means를 이용해 합류 지역의 수질 특성들을 클러스터링하여 수질 패턴들을 분석해 하천 수질 오염을 방지할 수 있을 것이다. 본 연구에서는 토폴로지 데이터 분석(topological data analysis, TDA), 자기조직화지도(Self-Organizing Map, SOM), k-평균 알고리즘(K-means clustering algorithm) 세 가지 기법을 이용하여 합류부에서의 수질 특성을 비교하며 어떤 기법이 합류의 특성을 더욱 뚜렷하게 나타내는지 규명했다. 합류의 특성을 군집화 방법을 이용해 알게 된다면, 합류부의 수질 변화 패턴을 다른 합류 지역에서도 적용할 수 있을 것으로 기대된다.

  • PDF

K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템 제안 (Proposal of a Monitoring System to Determine the Possibility of Contact with Confirmed Infectious Diseases Using K-means Clustering Algorithm and Deep Learning Based Crowd Counting)

  • 이동수;;김영광;신혜주;김진술
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.122-129
    • /
    • 2020
  • 전 세계적으로 무증상의 코로나바이러스 감염증-19 감염자가 자신이 감염된 것을 모르고 주변인들에게 전파할 수 있다는 가능성은 국민이 전염병 확산에 대한 불안과 두려움에서 벗어나지 못하고 있다는 점에서 여전히 매우 중요한 이슈이다. 본 논문에서는 K-평균 군집화 알고리즘 및 딥러닝 기반 군중 집계를 이용한 전염병 확진자 접촉 가능성 여부 판단 모니터링 시스템을 제안하였다. 모든 입력 학습 영상에 대해 300회 반복 학습한 결과, PSNR값은 21.51, 전체 데이터 셋에 대한 최종 MAE값은 67.984였다. 이는 확진자와 주변인과의 거리와 감염률 산출, 잠재적 환자 동선 주변 인원의 위험도 순 그룹 및 감염률 예측에 대한 영상 속 화질 정보, 관측치 간의 평균 절대 오차를 의미하며 각 CCTV 장면에서 군중의 수가 4,000명 이하일 때에는 평균 절대 오차 값이 0에 가까움을 증명하였다.