• 제목/요약/키워드: 분할-정복

검색결과 44건 처리시간 0.021초

베이즈 정보 기준을 활용한 분할-정복 벌점화 분위수 회귀 (Model selection via Bayesian information criterion for divide-and-conquer penalized quantile regression)

  • 강종경;한석원;방성완
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.217-227
    • /
    • 2022
  • 분위수 회귀 모형은 변수에 숨겨진 복잡한 정보를 살펴보기 위한 효율적인 도구를 제공하는 장점을 바탕으로 많은 분야에서 널리 사용되고 있다. 그러나 현대의 대용량-고차원 데이터는 계산 시간 및 저장공간의 제한으로 인해 분위수 회귀 모형의 추정을 매우 어렵게 만든다. 분할-정복은 전체 데이터를 계산이 용이한 여러개의 부분집합으로 나눈 다음 각 분할에서의 요약 통계량만을 이용하여 전체 데이터의 추정량을 재구성하는 기법이다. 본 연구에서는 분할-정복 기법을 벌점화 분위수 회귀에 적용하고 베이즈 정보기준을 활용하여 변수를 선택하는 방법에 관하여 연구하였다. 제안 방법은 분할 수를 적절하게 선택하였을 때, 전체 데이터로 계산한 일반적인 분위수 회귀 추정량만큼 변수 선택의 측면에서 일관된 결과를 제공하면서 계산 속도의 측면에서 효율적이다. 이러한 제안된 방법의 장점은 시뮬레이션 데이터 및 실제 데이터 분석을 통해 확인하였다.

일반 트리를 미적으로 도시하기 위한 분할-정복 알고리즘 (A Divide_and _Conquer Algorithm for Drawing General Trees Aesthetically)

  • 이유진;정균락
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권1호
    • /
    • pp.117-124
    • /
    • 1999
  • 트리는 계층적인 구조를 표현하는 데 편리한 자료 구조로서 그 응용 분야가 정렬, 탐색, 컴파일러, 계층적 데이터베이스 모델, 조직 차트 등 매우 광범위하다. 트리를 시각적으로 도시하는 것은 단순히 노드를 나열하는 것보다 구조적 관계를 표현하는데 효과적이다. 트리를 크기가 제한된 하면세 도시할 경우에는 시각적 측면을 고려하여 가능한 한 최소의 면적에 도시하는 것이 필요하다. Tilford가 제안한 트리 도시 알고리즘은 왼쪽 알고리즘은 왼쪽부터 최소 간격을 유지하면서 노드의 위치를 결정하는 알고리즘의 특성 때문에 두 개의 높이가 큰 서브 트리가 양쪽으로 있을 때, 두 서브 트리 사이의 작은 서브트리들이 오른쪽에 공간이 있음에도 불구하고 왼쪽으로 치우치게 위치되는 단점을 가지고 있다. 본 논문에서는 노드들의 균형을 고려하여 배치하는 분할-정복 알고리즘을 개발하였고 알고리즘의 정확성을 증명하였다.

CUDA 및 분할-정복 기반의 효율적인 다차원 척도법 (An Efficient Multidimensional Scaling Method based on CUDA and Divide-and-Conquer)

  • 박성인;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.427-431
    • /
    • 2010
  • 다차원 척도법(multidimensional scaling)은 고차원의 데이터를 낮은 차원의 공간에 매핑(mapping)하여 데이터 간의 유사성을 표현하는 방법이다. 이는 주로 자질 선정 및 데이터를 시각화하는 데 이용된다. 그러한 다차원 척도법 중, 전통 다차원 척도법(classical multidimensional scaling)은 긴 수행 시간과 큰 공간을 필요로 하기 때문에 객체의 수가 많은 경우에 대해 적용하기 어렵다. 이는 유클리드 거리(Euclidean distance)에 기반한 $n{\times}n$ 상이도 행렬(dissimilarity matrix)에 대해 고유쌍 문제(eigenpair problem)를 풀어야 하기 때문이다(단, n은 객체의 개수). 따라서, n이 커질수록 수행 시간이 길어지며, 메모리 사용량 증가로 인해 적용할 수 있는 데이터 크기에 한계가 있다. 본 논문에서는 이러한 문제를 완화하기 위해 GPGPU 기술 중 하나인 CUDA와 분할-정복(divide-and-conquer)기법을 활용한 효율적인 다차원 척도법을 제안하며, 다양한 실험을 통해 제안하는 기법이 객체의 개수가 많은 경우에 매우 효율적일 수 있음을 보인다.

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

분할 정복 알고리즘 학습이 창의적 문제 해결에 미치는 효과 (Effect of Learning a Divide-and-conquer Algorithm on Creative Problem Solving)

  • 김윤영;김영식
    • 컴퓨터교육학회논문지
    • /
    • 제16권2호
    • /
    • pp.9-18
    • /
    • 2013
  • 정보 교과는 정보과학적 사고와 원리를 통해 창의적 문제해결력 함양을 교육목표로 하며, 문제 해결 방법과 절차 단원을 통하여 알고리즘 학습을 강조한다. 알고리즘 학습이 문제해결력 향상에 효과가 있다는 선행연구들을 바탕으로 창의적 문제해결력 향상에도 효과를 입증하는 연구들이 이루어지고 있다. 그러나 이러한 연구들이 알고리즘 내용보다는 CPS와 같은 교수학습 모형이나 콘텐츠에 의존하고 있기 때문에 알고리즘 학습의 중요성이 상대적으로 약해질 수 있다. 본 연구는 일반적인 문제해결과정과 창의적 문제해결과정이 동일하다는 관점에서 알고리즘 학습이 창의적 문제해결력 향상에 효과가 있음을 검증한다. 이를 위하여 일반적인 사고 가운데 창의적인 사고로 간주되는 유추 추론(analogical reasoning)에 대하여 살펴보고, 유추 추론에 필요한 바탕 지식으로 분할 정복 알고리즘을 선택하였다. 퀵 정렬 알고리즘 학습 실험 결과, 분할 정복 알고리즘의 원리 학습한 실험집단과 알고리즘의 절차만 학습한 통제집단이 퀵 정렬 문제를 해결하는 비율에는 차이가 없었으나, 탐색 문제에서는 실험집단이 통제집단 보다 이진 탐색을 사용하는 비율이 더 높았다. 이는 분할 정복과 같은 추상적인 원리를 포함하는 알고리즘 학습이 새로운 영역의 문제를 해결하는 유추 추론에 효과가 있으며, 이는 창의적 문제해결력 향상으로 이어질 수 있음을 의미한다.

  • PDF

대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형 (Divide and conquer kernel quantile regression for massive dataset)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.569-578
    • /
    • 2020
  • 분위수 회귀모형은 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 특히 커널 분위수 회귀모형은 비선형 관계식을 고려하기 위하여 양정치 커널함수(kernel function)에 의해 만들어지는 재생 커널 힐버트 공간(reproducing kernel Hilbert space)에서 비선형 조건부 분위수 함수를 추정한다. 그러나 KQR은 이차계획법으로 공식화되어 많은 계산비용을 필요로 하므로 컴퓨터 메모리 능력의 제한으로 대용량 자료의 분석은 불가능하다. 이러한 문제점을 해결하기 위하여 본 논문에서는 분할정복(divide and conquer) 알고리즘을 활용한 KQR 추정법(DC-KQR)을 제안한다. DC-KQR은 먼저 전체 훈련자료를 몇 개의 부분집합으로 무작위로 분할(divide)한 후, 각각의 부분집합에 대하여 KQR 분위수 함수를 추정하고 이들의 산술 평균을 이용하여 최종적인 추정량으로 통합(conquer)하는 기법이다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DC-KQR의 효율적인 성능과 활용 가능성을 확인하였다.

분할 정복법을 이용한 Haskell GC 조정 시간 개선 (Improving Haskell GC-Tuning Time Using Divide and Conquer)

  • 안형준;변석우;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.83-86
    • /
    • 2017
  • 단일 코어 프로세스의 성능 향상은 전력 소모, 발열 등의 이유로 한계에 달했다. 이에 대한 대안으로 멀티 코어가 등장했으며 매니 코어 기술에 대한 연구가 활발히 진행 중에 있다. 이렇듯 멀티 코어 환경이 보편화됨에 따라 병렬 프로그래밍의 중요성이 더욱 커졌다. 한편, 순수 함수형 언어 Haskell은 부수효과가 없고 다양한 병렬화 도구를 지원함으로써 다가오는 병렬 프로그래밍 시대에 적합한 언어라 할 수 있다. 이때 Haskell 병렬 프로그램의 성능은 메모리 재사용(Garbage Collection) 시간에 큰 영향을 받는다. 그래서 Haskell 병렬 프로그램의 성능 향상, 분석을 위한 메모리 프로파일링 도구가 필요하다. 이미 Haskell이 제공하는 메모리 프로파일링 도구로 ghc-gc-tune이 있지만 실행 속도 측면에서 개선이 필요하다. 본 연구에서는 분할 정복법을 이용해서 매 단계마다 탐색 영역을 4분의 1로 줄이도록 ghc-gc-tune을 개선했다. 개선된 ghc-gc-tune을 극대 독립 집합 프로그램과 K-means 프로그램에 적용한 결과, 평균 98%의 정확도로 실행 시간을 평균 7.78배 단축했다.

분할 정복법을 이용한 Haskell GC 조정 시간 개선 (Improving Haskell GC-Tuning Time Using Divide-and-Conquer)

  • 안형준;김화목;류샤오;김연어;변석우;우균
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제6권9호
    • /
    • pp.377-384
    • /
    • 2017
  • 발열 때문에 더이상 회로 집적도를 높일 수 없기 때문에 단일 코어 프로세서의 성능 향상은 한계에 달했다. 그래서 코어를 여러 개 사용하는 멀티 코어, 매니 코어 형태의 프로세서가 등장했으며 병렬 프로그래밍이 중요해졌다. 이러한 상황에서 병렬 프로그래밍에 여러 장점이 있는 순수 함수형 언어 Haskell이 주목받고 있다. Haskell은 식 계산 방식에서 이미 병렬성이 내재되어 있으며 병렬 구조를 지원하는 모나드 도구를 제공한다. 그런데 Haskell 병렬 프로그램의 성능은 메모리 재사용 시스템을 포함한 실행시간 시스템에 큰 영향을 받는다. 이미 Haskell이 제공하는 메모리 프로파일링 도구로 GC-tune이 있지만, GC-tune은 가능한 모든 GC 옵션에 대해 프로그램 실행 시간을 반복 측정하기 때문에 GC 조정 시간이 너무 오래 걸린다. 그래서 본 연구에서는 기본적인 분할 정복법을 이용해서 GC-tune의 탐색 영역을 매 단계마다 4분의 1로 줄이는 방법을 제안한다. 제안하는 방법을 두 가지 병렬 프로그램(극대 독립 집합 프로그램과 K-평균 프로그램)에 적용한 결과, 평균 98%의 정확도로 실행 시간을 평균 7.78배 단축시켰다.

서브-링의 신드롬 분석을 이용한 하이퍼큐브 진단 알고리즘 (Hypercube Diagnosis Algorithm Using Syndrome Analysis of Sub-Ring)

  • 김학원;김동균;최문석;이충세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.583-585
    • /
    • 2001
  • 하이퍼큐브의 정규적이며 계층적인 구조적 특성은 효율적인 진단 알고리즘 개발에 유리하게 적용될 수 있다. Feng et al.의 HADA/IHADA와 Choi와 Rhee의 적응적 큐브 분할 방법은 하이퍼큐브의 전체 노드를 하나의 링으로 임베딩하여 링의 진단 특성을 이용하기 위하여 분할 및 정복 방법을 이용하였다. 또한 Kranakis와 Pelc는 결함을 모두 포함하는 최소의 서브링을 하나의 노드로 하는 하이퍼큐브의 형태로 분할하는 HYP-DIAG 알고리즘을 제안하였다. 또한 최악의 경우에, 테스트 수만을 고려하여 2$^n$+3n/2의 테스트 수를 갖는 FAST-HYP-DIAG 알고리즘과 병렬 시간만을 고려하여 많아야 11테스트 라운드 이내에 진단을 수행하는 EXPRESS-HYF-DIAG 알고리즘을 제안하였다. 본 논문에서는 HYP-DIAG의 첫 번째 단계에서 얻어진 서브링들의 신드롬을 분석하여 테스트의 수와 테스트 라운드를 모두 고려하는 알고리즘을 제안한다.

  • PDF

스위칭 모드 퍼지 모델 기반 제어기를 위한 안정화 문제 해석 (Stabilization Analysis for Switching-Type Fuzzy-Model-Based Controller)

  • 김주원;주영훈;박진배
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.149-152
    • /
    • 2001
  • 본 논문은 연속 시간과 이산 시간에서의 스위칭 모드 퍼지 모델 기반 제어기의 새로운 설계 기법에 대해서 논의한다. 스위칭 모드 퍼지 모델 기반 제어기의 설계에는 Takagi-Sugeno(75) 퍼지 시스템이 사용된다. 이 스위칭 모드 퍼지 모델 기반 제어기는 "정복-분할(divide and conquer)"이라는 하향식 접근 방식을 이용한다. 이 방법은 여러 개의 규칙을 가지고 있는 시스템에서 유한의 하위 시스템으로 시스템을 분할하여 각각의 부분 해를 구하고 이들을 결합하여 전체 시스템의 해를 구하는 방법이다. 제어기의 설계 조건은 주어진 75 퍼지 시스템의 안정화를 보장하는 선형 행렬 부등식들(LMls)에 의해 결정된다. 적절한 시뮬레이션 예제를 통한 성능 비교를 통해 본 논문의 우수성을 입증한다.

  • PDF