• 제목/요약/키워드: 분산학습

검색결과 538건 처리시간 0.024초

센서 네트워크 환경에서 움직이는 소스 신호의 협업 검출 기법 (Cooperative Detection of Moving Source Signals in Sensor Networks)

  • 뉴엔후낫민;팜츄안;홍충선
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.726-732
    • /
    • 2017
  • 무선 센서 네트워크의 분산 센싱 및 예측에 대한 실제 Application에서 네트워크 환경 센싱 기능은 움직이는 소스 신호의 잡음 및 많은 센싱 정보들 때문에 매우 동적인 기능을 요구한다. 최근의 Distributed Online Convex Optimization 프레임워크는 분산된 방식으로 센서 네트워크를 통해 확률적인 학습 문제를 해결하기 위한 유망한 접근법으로 개발되었다. 기존의 Distributed Saddle Point Algorithm (DSPA)의 학습 결과에서 수렴 속도와 안정성은 이동성의 영향을 받을 수 있다. 이에 본 논문에서는 움직이는 소스 신호 시나리오의 동시 검출에서 예측을 안정화하고 보다 나은 수렵 속도를 달성하기 위해 통합 Sliding Windows 메커니즘을 제안한다.

이동 사용자의 다음 장소 예측을 위한 맵리듀스 기반의 분산 데이터 마이닝 (A MapReduce-Based Distributed Data Mining Approach to Next Place Prediction for Mobile Users)

  • 김종환;이석준;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.777-780
    • /
    • 2014
  • 본 논문에서는 휴대용 기기 사용자들의 이동 궤적을 기록한 대용량의 GPS 위치 데이터 집합으로부터 각 사용자의 이동 패턴 모델을 학습해내고, 이 모델을 적용하여 각 사용자의 다음 방문 장소를 효율적으로 예측할 수 있는 맵리듀스 기반의 분산 데이터 마이닝 시스템을 소개한다. 본 시스템은 크게 사용자별 이동 패턴 모델을 학습하는 후단부와 실시간으로 다음 방문 장소를 예측하는 전단부로 구성된다. 이 중에서 후단부는 주요 장소 추출, 이동 궤적 변환, 이동 패턴 모델 학습 등 총 3개의 맵리듀스 작업 모듈들로 구성된다. 이에 반해, 본 시스템의 전단부는 이동 경로 후보군 생성, 다음 장소 예측 등 총 2개의 맵리듀스 작업 모듈들로 구성된다. 그리고 본 시스템을 구성하는 각각의 작어마다 분산처리를 극대화할 수 있도록 맵과 리듀스 함수를 설계하였다. 끝으로, 대용량의 GeoLife 벤치마크 데이터 집합을 이용하여 본 논문에서 소개한 시스템의 예측 성능을 분석하기 위한 실험을 수행하였고, 이를 통해 본 시스템의 높은 성능을 확인할 수 있었다.

분산 딥러닝 모델 개발을 위한 고수준 분석 플랫폼 (High-level Analytics Platform for Development of Distributed Deep Learning Model)

  • 박경석;유찬희;;엄정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.804-806
    • /
    • 2020
  • 딥러닝(deep learning)은 기계학습 알고리즘 중 가장 널리 활용되고 있는 알고리즘이다. 딥러닝 기술은 산업, 과학, 국방 및 공공 부문을 비롯하여 거의 모든 분야에서 폭넓게 확산되고 있다. 그러나 기계학습 기술에 대한 이해와 프로그래밍 지식이 부족할 경우 자유롭게 활용하는 데는 제약이 따르고 있으며 빅데이터를 활용하여 일반 이용자들이 직접 분산 학습 모형을 개발하고 배포하는 데 어려움이 발생하고 있다. 이러한 요구를 충족시키기 위해 딥러닝 프레임워크의 저수준 API를 추상화하여 고수준 분석과 분산 딥러닝을 지원하고 일반 이용자들이 실무적으로 복잡한 딥러닝 기술을 활용할 수 있는 기술을 개발하였다. 플랫폼 개발과 함께 중요하게 고려해야 하는 요소 중 하나로 플랫폼의 배포와 확장성 역시 고려되어야 한다. 본 플랫폼은 조직 내 계산 자원을 이용하여 플랫폼을 배포할 수 있으며 상용 클라우드 서비스와 연동하여 배포할 수 있도록 설계됨에 따라 환경의 제약 없이 유연한 서비스 제공이 가능하다.

스파크 기반 딥 러닝 분산 프레임워크 성능 비교 분석 (A Comparative Performance Analysis of Spark-Based Distributed Deep-Learning Frameworks)

  • 장재희;박재홍;김한주;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.299-303
    • /
    • 2017
  • 딥 러닝(Deep learning)은 기존 인공 신경망 내 계층 수를 증가시킴과 동시에 효과적인 학습 방법론을 제시함으로써 객체/음성 인식 및 자연어 처리 등 고수준 문제 해결에 있어 괄목할만한 성과를 보이고 있다. 그러나 학습에 필요한 시간과 리소스가 크다는 한계를 지니고 있어, 이를 줄이기 위한 연구가 활발히 진행되고 있다. 본 연구에서는 아파치 스파크 기반 클러스터 컴퓨팅 프레임워크 상에서 딥 러닝을 분산화하는 두 가지 툴(DeepSpark, SparkNet)의 성능을 학습 정확도와 속도 측면에서 측정하고 분석하였다. CIFAR-10/CIFAR-100 데이터를 사용한 실험에서 SparkNet은 학습 과정의 정확도 변동 폭이 적은 반면 DeepSpark는 학습 초기 정확도는 변동 폭이 크지만 점차 변동 폭이 줄어들면서 SparkNet 대비 약 15% 높은 정확도를 보였고, 조건에 따라 단일 머신보다도 높은 정확도로 보다 빠르게 수렴하는 양상을 확인할 수 있었다.

수학학습에서 구분-대조 가설에 의한 교차연습의 효과 (The Effect of Interleaved-practice by the Discriminative-contrast hypothesis in Mathematics)

  • 류지민;박미정
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권2호
    • /
    • pp.199-212
    • /
    • 2023
  • 본 연구의 목적은 수학교과에서 학습하는 내용이 영역과 유형의 차이에 따라 구획연습과 교차연습의 성취도 차이가 나는지 알아보고 이 결과를 통해 수학학습에서의 교차연습의 효과가 '분산-연습 가설'에 의한 것인지 혹은 '구분-대조 가설'에 의한 것인지를 확인하는 것이다. 교차연습이 구획연습보다 효과적이라는 연구가 대부분이지만 그 원인에 대해서 선행 연구들은 일관된 결과를 보이고 있지 않다. 이에 본 연구에서는 D광역시 중학교 1학년 103명을 구획연습, 교차연습, 먼-구획연습, 먼-교차연습 집단으로 무작위 배치하여 4회에 걸쳐 학습활동을 하였고 일주일의 파지간격을 둔 후 최종검사를 실시하였다. 그 결과, 동일한 영역에서의 유사한 유형에서는 교차연습의 효과가 나타났고, 서로 다른 영역의 다른 유형에서는 교차연습의 효과가 나타나지 않았다. 또한, 이 결과를 통해 교차연습의 효과는 '분산-연습 가설'보다는 '구분-대조 가설'에 의한 것임을 확인할 수 있었다. 연구결과와 연구방법에 대한 논의를 통해 후속 연구가 필요한 연구문제를 제안하였다.

통계적 학습이론을 이용한 최적 군집화 (An Optimal Clustering Using Statistical Learning Theory)

  • 최준혁;전성해;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.229-233
    • /
    • 2005
  • 모집단의 최적군집 수를 자동으로 결정하고 군집내의 분산은 최소로 하고 군집 간의 분산은 최대로 하는 최적 군집화에 대한 연구는 대부분의 지능형 시스템에서 필요로 하는 모형전략이다. 하지만 아직도 대부분의 군집화 과정에서 분석가의 주관적인 경험에 의존하여 군집수가 결정되어 군집화가 이루어지고 있다. 예를 들어 K-평균 군집화 알고리즘에서도 초기에 K 값을 결정해 주어야 한다. 모집단을 제대로 대표하지 못한 K 값에 의한 군집화 결과는 심각한 오류를 범하게 된다. 본 논문에서는 통계적 학습이론을 이용하여 이러한 문제점을 해결하려고 하였다. VC-차원에 의한 Support Vector를 이용하여 최적의 군집화 기법을 제안하였다. 제안 방법의 성능 평가를 위하여 UCI 기계학습 데이터를 이용하여 객관적인 실험을 수행하였다.

  • PDF

적응형 미들웨어의 자가 진단을 위한 베이지안 네트워크를 사용한 진단엔진 (A Diagnosis Engine Using Bayesian Network for Self-management of Adaptive Middleware)

  • 최보윤;김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.220-222
    • /
    • 2006
  • 분산 어플리케이션은 동시에 여러 사용자가 각기 다른 환경에서 동기화된 프로세서를 사용하기 때문에 일정 한 성능을 유지하는 것이 무엇보다 중요하다. 진단엔진은 시스템을 진단하여 시스템 결함의 원인을 발견하여 시스템이 자가치료가 가능하게 한다. 적응형 미들웨어는 진단엔진을 사용해서 분산 어플리케이션이 로컬환경에 맞는 고른 서비스를 유지 할 수 있도록 한다. 본 논문은 베이지안 네트워크를 사용한 적응형 미들웨어의 진단엔진을 제안한다. 베이지안 네트워크는 상황인지분야에서 널리 사용되는 추론기법으로서, 수집 된 데이터를 통해서 그 구조를 학습하고 데이터를 증거 값으로 시스템 진단을 한다. 본 논문은 실험 대상자로부터 윈도우시스템에서 두 시간 동안 데이터를 수집하여 한 시간은 베이지안 네트워크 학습에 사용하고, 나머지는 베이지안 네트워크 성능평가에 사용하였다. 실험 결과 학습된 두 개의 베이지안 네트워크 모델은 각각 95.41%, 99.77%의 정확성을 보였다.

  • PDF

GA를 이용한 신경망의 가중치 최적화 (Neural Network Weight Optimization using the GA)

  • 문상우;공성곤
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.374-378
    • /
    • 1998
  • 신경망은 복잡하게 나타나는 비선형성을 가지는 실제의 다양한 문제들에 적용이 가능할 뿐만 아니라, 정보들이 가중치에 분산되어 저장됨으로서 강인성을 가지고 있다. 그러나 전방향 다층 신경망 구조를 학습할 수 있는 역전파 알고리즘은 초기 가중치의 영향에 의하여 학습된 결과가 지역 최소점에 빠지기 쉬운 경향이 있다. 본 논문에서는 이러한 문제점을 해결하기 위한 한가지 방법으로서 유전자 알고리즘을 이용하여 전방향 다층 신경망의 가중치를 학습하여, 지역 최소점에 빠지지 않고 학습이 이루어짐을 보인다.

  • PDF

프로젝트 기반 초등 수학교육의 학습양식 효과분석 (Effects of Pupils' Learning Styles in Project-based Elementary Mathematics Instruction)

  • 이명근;오유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제44차 하계학술발표논문집 19권2호
    • /
    • pp.261-264
    • /
    • 2011
  • 이 연구에서는 프로젝트 기반 초등수학교육에서 학업성취도와 수학적 태도에 대한 학습양식의 효과를 분석하였다. 이 연구는 프로젝트 기반 초등수학교육이 어떤 양식의 학습자에게 학업성취도와 수학적 태도 신장에 더 효과적인지 검증하여, 학습자 중심교육 환경 설계에 시사점을 제공하는데 목적이 있다. 104명의 초등학생을 대상으로 Kolb의 자기보고식 검사지를 사용하여 분산자, 융합자, 수렴자, 적응자 학습양식으로 분류하고, 4주간 12차시에 걸쳐 프로젝트 기반 수학교육을 실시하였다. 연구결과, 학습양식이 학업성취도와 수학적 태도 향상에 효과를 나타내었다. 프로젝트 기반 초등수학교육은 수렴자 학습양식의 학업성취도 향상에 효과적인 것으로 판단되었다. 또한, 수학적 태도의 세부요인에서는 수렴자 학습양식의 자신감, 목적의식 신장과 융합자 학습양식의 흥미신장에 효과적인 것으로 판단되었다.

  • PDF

빅 데이터 처리를 위한 적응적 사용자 및 토픽 모델링 기반 자동 TV 프로그램 추천시스템 (Adaptive User and Topic Modeling based Automatic TV Recommender System for Big Data Processing)

  • 김은희;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.195-198
    • /
    • 2015
  • 최근 TV 서비스의 가입자 및 TV 프로그램 콘텐츠의 급격한 증가에 따라 빅데이터 처리에 적합한 추천 시스템의 필요성이 증가하고 있다. 본 논문은 사용자들의 간접 평가 데이터 기반의 추천 시스템 디자인 시, 누적된 사용자의 과거 이용내역 데이터를 저장하지 않고 새로 생성된 사용자 이용내역 데이터를 학습하는 효율적인 알고리즘이면서, 시간 흐름에 따라 사용자들의 선호도 변화 및 TV 프로그램 스케줄 변화의 추적이 가능한 토픽 모델링 기반의 알고리즘을 제안한다. 빅데이터 처리를 위해서는 분산처리 형태의 알고리즘을 피할 수 없는데, 기존의 연구들 중 토픽 모델링 기반의 추론 알고리즘의 병렬분산처리 과정 중에 핵심이 되는 부분은 많은 데이터를 여러 대의 기계에 나누어 병렬분산 학습하면서 전역변수 데이터를 동기화하는 부분이다. 그런데, 이러한 전역데이터 동기화 기술에 있어, 여러 대의 컴퓨터를 병렬분산처리하기위한 하둡 기반의 시스템 및 서버-클라이언트간의 중재, 고장 감내 시스템 등을 모두 고려한 알고리즘들이 제안되어 왔으나, 네트워크 대역폭 한계로 인해 데이터 증가에 따른 동기화 시간 지연은 피할 수 없는 부분이다. 이에, 본 논문에서는 빅데이터 처리를 위해 사용자들을 클러스터링하고, 클러스터별 제안 알고리즘으로 전역데이터 동기화를 수행한 것과 지역 데이터를 활용하여 추론 연산한 결과, 클러스터별 지역별 TV프로그램 시청 토큰 별 은닉토픽 할당 테이블을 유지할 때 추천 성능이 더욱 향상되어 나오는 결과를 확인하여, 제안된 구조의 추천 시스템 디자인의 효율성과 합리성을 확인할 수 있었다.

  • PDF