• 제목/요약/키워드: 클러스터 중심

검색결과 453건 처리시간 0.027초

빅데이터 분석을 이용한 이러닝 수강 후기 분석 (e-Learning Course Reviews Analysis based on Big Data Analytics)

  • 김장영;박은혜
    • 한국정보통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.423-428
    • /
    • 2017
  • 인터넷과 스마트 기기의 사용량 증가로 인해 다양한 교육정보와 많은 양의 데이터가 생성되어 빠르게 확산되고 있다. 최근 이러닝 이용률이 증가하면서 발생하는 빅데이터를 활용하여 학습자들의 교육 성과와 교육 시스템의 효과성을 극대화 하는 것을 목표로 하는 교육 데이터 관련 연구 분야에 대한 관심이 높아지고 있으며 온라인에서 학습자들이 학습한 수많은 기록과 데이터들이 정보로 쌓이게 된다. 이에 본 논문에서는 이러닝 학습자들이 시스템에 남긴 수강 기록을 기반으로 학습자 현황에 대해 객관적으로 파악할 수 있도록 신경망 알고리즘인 Word2Vec을 적용하여 단어 간 유사도를 구하고 클러스터링 알고리즘을 이용하여 군집화 하였다. Word2vec을 이용하여 학습을 시키면 연관된 의미의 단어가 나타나게 되고 학습을 반복해 나가는 과정에서 점차 가까운 벡터를 지니게 된다. 또한 클러스터 알고리즘을 이용하여 명사, 동사, 형용사, 부사가 중심점에서 최소의 거리를 두고 같은 거리에 위치해 있음을 실험 검증하였다.

적응적인 초기치 설정을 이용한 Fast K-means 및 Frizzy-c-means 알고리즘 (A Fast K-means and Fuzzy-c-means Algorithms using Adaptively Initialization)

  • 강지혜;김성수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.516-524
    • /
    • 2004
  • 본 논문에서는 K-means 또는 Fuzzy-c-means 알고리즘에서 클러스터의 중심점을 찾는 과정 중 임의로 선택되는 초기값 선정의 문제를 해결하고, 기존의 단점을 보완하는 새로운 방안으로서 데이터의 분포의 통계적 특성에 따른 초기값 선정 방법을 제안하였다. 기존의 초기값 선정 방법은 초기값에 따라 클러스터링이 매우 민감한 변화를 가져와, 최종적으로 종종 원치 않는 방향으로 가는 문제점을 갖고 있다. 이러한 초기값 선정의 문제가 인지되어 왔지만, 그 문제의 해결방안이 실제적으로 모색된 경우는 없었다. 본 논문에서는 데이타의 통계적 특성을 이용한 초기값 선정 방법을 적용하여, 클러스터링이 형성되는 시간의 단축 및 원치 않는 결과가 생성되는 경우를 약화시켜 시스템의 향상을 가져왔고, 이러한 제안된 알고리즘의 우수성을 기존의 알고리즘과 비교를 통하여 나타내었다.

색인어 가중치 부여 방법에 따른 K-Means 문서 클러스터링의 LSI 분석 (Latent Semantic Indexing Analysis of K-Means Document Clustering for Changing Index Terms Weighting)

  • 오형진;고지현;안동언;박순철
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.735-742
    • /
    • 2003
  • 정보검색 시스템에서 문서 클러스터링 기술은 사용자 질의에 대해 검색된 문서들을 문서간의 유사도를 기반으로 특정 주제에 따라 재배치하여 놓는 기술로써 사용자에게 검색의 편의성을 제공하고, 그 결과들을 시각적으로 보여줄 수 있다. 본 논문에서는 K-Means 알고리즘을 사용하여 문서를 클러스터링하며 문서를 대표하는 색인어에 가중치를 부여하는 기법에 대하여 논한다. 클러스터링 결과를 시각적으로 보여주기 위하여 문서와 클러스터 중심들을 2차원 공간으로 사상하기 위한 Latent Semantic Indexing 접근 방법을 적용하였다. 실험 결과 문서의 색인어에 대한 가중치 부여 방법을 동일하게 하거나 또는 유사한 수식을 적용한 사례보다는 로컬가중치, 글로벌가중치, 정규화 요소를 모두 부여한 사례에서 문서들이 2차원 벡터 공간에서 군집하여 분포하는 클러스터링 효과가 우수하였다. 특히 로컬 가중치와 글로벌 가중치에 logarithm을 적용하였을 때 문서 분포의 군집도는 현저하게 나타남을 알 수 있었다.

MFCM의 성능개선을 통한 블라인드 비선형 채널 등화 (Blind Nonlinear Channel Equalization by Performance Improvement on MFCM)

  • 박성대;우영운;한수환
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2158-2165
    • /
    • 2007
  • 본 논문에서는 비선형 블라인드 채널등화기의 구현을 위하여 가우시안 가중치(gaussian weights)를 이용한 개선된 퍼지 클러스터(Modified Fuzzy C-Means with Gaussian Weights: MFCM_GW) 알고리즘을 제안한다. 제안된 알고리즘은 기존 FCM 알고리즘의 유클리디언 거리(Euclidean distance) 값 대신 Bayesian Likelihood 목적 함수(fitness function)와 가우시안 가중치가 적용된 멤버십 매트릭스(partition matrix)를 이용하여, 비선형 채널의 출력으로 수신된 데이터들로부터 최적의 채널 출력 상태 값(optimal channel output states)들을 직접 추정한다. 이렇게 추정된 채널 출력 상태 값들로 비선형 채널의 이상적 채널 상태(desired channel states) 백터들을 구성하고, 이를 Radial Basis Function(RBF) 등화기의 중심(center)으로 활용함으로써 송신된 데이터 심볼을 찾아낸다. 실험에서는 무작위 이진 신호에 가우시안 잡음이 추가된 데이터를 사용하여 기존의 Simplex Genetic Algorithm(GA), 하이브리드 형태의 GASA(GA merged with simulated annealing(SA)), 그리고 과거에 발표되었던 MFCM 등과 그 성능을 비교 분석하였으며, 가우시안 가중치가 적용된 MFCM_GW를 이용한 채널등화기가 상대적으로 정확도와 속도 면에서 우수함을 보였다.

문화유산마케팅 유형과 산업화 전략 (Study on Types of Cultural Heritage Resources Marketing and Industrialization Strategy)

  • 심상민
    • 문화경제연구
    • /
    • 제19권2호
    • /
    • pp.51-72
    • /
    • 2016
  • 본 연구는 문화유산 자원을 활용한 마케팅 활동 유형을 분석하고 산업화 가능성을 높일 전략 기본 방향을 찾고자 한다. 문화유산마케팅을 통한 콘텐츠 산업화를 보여주는 기업과 해외주요국가 선도 사례를 분석하였다. 문화마케팅 모델 선행연구를 재구성하여 4개 유형과 산업화 시사점을 도출하였다. 문화유산 재창조와 문화유산 후원, 문화유산 상품화, 문화유산 미디어 등 4개 유형과 유형별 산업화 전략 기본 방향을 발견하였다. 본 연구는 기업을 중심으로 한 광범위한 문화마케팅 현장 협업구조가 함께 돌아가도록 하는 설계와 네트워크 조직화를 전략기본방향으로 제시한다. 디지털 헤리티지와 같이 국가 기관에서 제공하는 인력 정보 등을 적극 활용해 전문가 그룹과 연계하는 전략 방안도 마련하였다. 디지털 문화 콘텐츠플랫폼 사업을 고도화하는 경우라면 중앙정부로부터는 적절한 국고 지원을 확보하고 지방정부와는 산학연관 협력 관계를 조성하는 동시에 지역의 대학과 기업, 금융, 컨설팅 조직 등과도 유기적으로 연계해야 함을 강조하였다. 이는 총체적인 클러스터 생태계를 조성해나가는 과업이기도 하다. 이처럼 고도화된 문화유산마케팅 활동은 세계 각국과 개별지역 뿌리에 대한 재발견과 재창조라는 신성한 움직임으로 확산되어 성공적인 산업화를 실현할 수 있음을 본 논문은 확인하였다.

다중 클라이언트 환경에서 동형 암호를 이용한 프라이버시 보장형 K-평균 클러스터링 (Privacy-Preserving K-means Clustering using Homomorphic Encryption in a Multiple Clients Environment)

  • 권희용;임종혁;이문규
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권4호
    • /
    • pp.7-17
    • /
    • 2019
  • 기계 학습은 다양한 현상의 예측 및 분석 등을 가장 정확하게 수행하는 기술 중 하나이다. K-평균 클러스터링은 주어진 데이터들을 비슷한 데이터들의 군집으로 분류하는 기계 학습 기법의 한 종류로 다양한 분야에서 사용된다. K-평균 클러스터링의 성능을 높이기 위해서는 가능하면 많은 데이터에 기반한 분석을 수행하는 것이 바람직하므로, K-평균 클러스터링은 데이터를 제공하는 다수의 클라이언트들과 제공받은 데이터들을 사용하여 클러스터의 중심값을 계산하는 서버가 있는 모델에서 수행될 수 있다. 그러나 이 모델은 클라이언트들의 데이터가 민감한 정보를 포함하고 있는 경우, 서버가 클라이언트들의 프라이버시를 침해할 수 있다는 문제점이 있다. 본 논문에서는 다수의 클라이언트가 있는 모델에서 이러한 문제를 해결하기 위해 동형 암호를 사용하여 클라이언트의 프라이버시를 보호하며 기계 학습을 수행할 수 있는 프라이버시 보장형 K-평균 클러스터링 방법을 제안한다.

사과가지마름병원세균 Pseudomonas syringae pv. syringae WSPS007 균주의 유전체 해독 (Draft genome sequences of Pseudomonas syringae pv. syringae strain WSPS007 causing bacterial shoot blight on apple)

  • 임연정;유덕규;강민규;전용호;박덕환
    • 미생물학회지
    • /
    • 제55권1호
    • /
    • pp.80-82
    • /
    • 2019
  • Pseudomonas syringae pv. syringae WSPS007 균주는 대한민국 경상북도 영주시 사과 과원에서 나타난 가지마름병 병징으로부터 2013년 분리되었다. 본 논문에서는 6,238,498 bp(59.04% G+C 함량)인 WSPS007 균주의 전체 염기서열을 보고한다. 전체 지놈은 5,379개의 코딩서열, 65개의 tRNA, 16개의 rRNA 유전자를 가지고 있다. 특히 WSPS007 균주의 전체 염기서열 분석은 냉해와 관련된 빙핵 활성 유전자 클러스터를 중심으로 분석을 수행하였으며, P. syringae pv. syringae 국외 대표 균주인 PssB728a와 유사한 빙핵활성 유전자 구성을 가지고 있는 것으로 나타났다. 따라서 본 논문에서의 염기서열 분석 결과를 바탕으로 경상북도 일원 사과 과원에서 동해로 추정되는 병원균의 원인을 규명하기 위한 기본 자료를 제공하는데 있어서 의의가 있다고 사료된다.

투입부가성과 행동부가성이 산출부가성에 미치는 영향 : 연구개발특구 입주기업의 정부R&D보조금 조절효과를 중심으로 (The Effects of Input Additionality and Behavioural Additionality on the Output Additionality)

  • 곽민수;김병근
    • 기술혁신학회지
    • /
    • 제21권4호
    • /
    • pp.1313-1344
    • /
    • 2018
  • 본 연구는 정부 R&D보조금의 정책적 효과를 규명하기 위해 투입, 관리, 후속, 인지부가성이 산출부가성에 미치는 영향을 규명한다. 또한 투입, 관리, 후속, 인지부가성과 산출부가성의 관계에 대해 정부 R&D보조금 수혜 경험의 조절효과를 분석한다. 실증분석을 위해 연구개발특구 입주기업 중 연구개발특구육성사업에 참여한 경험이 있는 기업을 대상으로 설문조사를 시행하여 수집한 126개 기업의 응답 자료를 분석하였다. 분석결과 투입, 관리, 후속, 인지부가성과 산출부가성의 관계는 모두 긍정적 효과가 있는 것으로 확인되었고, R&D보조금 수혜경험의 조절효과에서는 투입효과성(R&D보조금 ${\times}$ 투입부가성)과 인지효과성(R&D보조금 ${\times}$ 인지부가성)에서 긍정적인 조절효과를 확인하였다. 추가적으로, 종업수가 많을수록, 업력이 낮을수록, NT와 ST산업에서, 첨단기술기업일수록 산출부가성에 긍정적인 영향을 끼치는 것으로 나타났다. 본 연구를 통해 그 동안 국내에서 진행되지 않았던 미시적 관점의 행동부가성에 대한 실증을 실시하여 국내 혁신클러스터 단위에서 투입 행동부가성과 산출부가성관의 관계, R&D보조금 수혜경험의 조절효과를 새롭게 규명하였다.

무선센서망 내 KOCED 라우팅 프로토콜 광역분야 성능평가 (KOCED performance evaluation in the wide field of wireless sensor network)

  • 김태현;박세영;윤대열;이종용;정계동
    • 문화기술의 융합
    • /
    • 제8권2호
    • /
    • pp.379-384
    • /
    • 2022
  • 무선 센서 네트워크에서는 직접 접근이 어려운 환경에 대량으로 센서 노드들이 배치된다. 배터리 교체나 재충전 등 전력 공급이 어렵다. 에너지를 센서 노드와 같이 사용하는 것이 매우 중요하다. 따라서, 네트워크의 수명을 늘리기 위해 중요한 고려 사항은 각 센서 노드의 에너지 소비를 최소화하는 것이다. 무선 센서 노드의 에너지가 에너지를 다하여 방전되면 센서 노드의 제 역할을 할 수 없으며, 네트워크 내 노드의 일정량(50% 또는 80%) 이상이 소진되면 네트워크가 제 역할을 하지 못한다. 따라서 노드의 에너지 소비를 최소화하고 네트워크를 장기간 유지하기 위해 다양한 프로토콜에서 제안된 방법이다. 우리는 클러스터의 중심점과 잔류 에너지를 고려하고 플롯 포인트와 K-평균을 고려한다(WSN은 최적의 클러스터링 클러스터링을 제안한다). KOCED 프로토콜에 대한 성능 평가를 하고자한다. 최근 머신러닝 방법 중 하나인 K-평균 알고리즘을 적용한 프로토콜을 비교하고 성능 평가 요소를 제시하고자 한다.

이동 단말기를 위한 Three-Tier 상황정보 수집 기법 (TTCG : Three-Tier Context Gathering Technique for Mobile Devices)

  • 소수환;김승훈
    • 한국산업정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.64-72
    • /
    • 2009
  • 기존의 센서네트워크의 연구는 센서에서 센싱된 데이터가 무선 센서네트워크를 통해서 효율적으로 정지싱크노드로 전달되는 연구가 주를 이루었다. 최근 이동성을 갖는 싱크노드의 연구가 활발히 진행되고 있지만 정지 싱크노드와 이동 싱크노드가 혼재하는 환경에 대한 연구는 미비한 실정이다. 본 논문에서는 기 구축된 클러스터 기반 다중홉 센서네트워크 환경에서 이동싱크들이 정지 싱크를 이용하여 데이터 수집이 가능한 기법을 제안한다. 이를 위해서 이동싱크들이 기존에 구축되어진 센서네트워크의 정지 싱크를 중심으로 클러스터링 되고 해당 정지 싱크를 이용하여 상황정보 수집이 가능하도록 하였다. 기존에 모바일 싱크를 위해 제안되었던 TTDD 라우팅 프로토콜과 비교하여 수학적 분석을 통해, 이동싱크의 수가 많아지거나 이동싱크의 이동횟수가 많아 질수록 더 우수한 성능을 보임을 확인하였다