• Title/Summary/Keyword: 데이터결합

Search Result 2,390, Processing Time 0.03 seconds

Time Series Prediction by Combining Evolutionary Neural Trees (진화 신경트리의 결합에 의한 시계열 예측)

  • 정제균;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.342-344
    • /
    • 1999
  • 신경트리(evolutionary neural trees)는 트리 구조의 신경망 모델로서 진화 알고리즘으로 학습하기에 적합한 구조이다. 본 연구에서는 진화 신경트리를 시계열 예측에 적용하였다. 시계열 데이터는 대개 잡음이 포함되어 있으며 동역학적인 특성을 지닌다. 본 논문에서는 견고한 예측 결과를 획득하기 위해 한 개의 신경트리가 아닌 여러개의 신경트리를 결합하여 예측 모델을 구성하는 committee machine을 소개한다. 출력 패턴가에 correlation이 최소가 되도록 상이한 신경트리를 선택하여 결합함으로써 모델 결합 효과를 최대화하는 방법을 사용하였다. 인공적인 잡음을 포함한 시계열 예측 문제와 실세계 데이터에 대한 실험에서 예측에 대한 정확도가 단일 모델을 사용한 경우 보다 향상되었다.

  • PDF

Proposing and Design of Combined Bit Data type (결합 비트(Combined Bit) 데이터 타입 제안 및 설계)

  • Lee, Jeong-Joon;Han, Yun-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.313-316
    • /
    • 2006
  • 네비게이션 시스템, PDA, DMB단말기, 휴대폰 등과 같이 모바일 단말기가 보편화 되면서 이 시스템을 유지하기 위한 데이터베이스 관리시스템의 수요가 증가하고 있다. 이러한 모바일 단말기는 기존의 데이터베이스 관리 시스템과는 달리 공간적인 소형화와 에너지 소비량을 최소화 해야 한다. 본 논문은 두 가지에 중점을 두어 결합 비트(combined bit)데이터 타입을 제안하고 구현방법을 제시했다. 결합 비트를 사용함으로써 저장 공간의 절약, 검색 속도 향상, 구성비트 복합 검색의 효율적 지원, 결합 비트의 도입으로 질의의 편리성의 이점이 있다.

  • PDF

Combined Application of Data Imbalance Reduction Techniques Using Genetic Algorithm (유전자 알고리즘을 활용한 데이터 불균형 해소 기법의 조합적 활용)

  • Jang, Young-Sik;Kim, Jong-Woo;Hur, Joon
    • Journal of Intelligence and Information Systems
    • /
    • v.14 no.3
    • /
    • pp.133-154
    • /
    • 2008
  • The data imbalance problem which can be uncounted in data mining classification problems typically means that there are more or less instances in a class than those in other classes. In order to solve the data imbalance problem, there has been proposed a number of techniques based on re-sampling with replacement, adjusting decision thresholds, and adjusting the cost of the different classes. In this paper, we study the feasibility of the combination usage of the techniques previously proposed to deal with the data imbalance problem, and suggest a combination method using genetic algorithm to find the optimal combination ratio of the techniques. To improve the prediction accuracy of a minority class, we determine the combination ratio based on the F-value of the minority class as the fitness function of genetic algorithm. To compare the performance with those of single techniques and the matrix-style combination of random percentage, we performed experiments using four public datasets which has been generally used to compare the performance of methods for the data imbalance problem. From the results of experiments, we can find the usefulness of the proposed method.

  • PDF

Effective Parallel Hash Join Algorithm Based on Histoftam Equalization in the Presence of Data Skew (데이터 편재 하에서 히스토그램 변환기법에 기초한 효율적인 병렬 해쉬 결합 알고리즘)

  • Park, Ung-Gyu;Choe, Hwang-Gyu;Kim, Tak-Gon
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.2
    • /
    • pp.338-348
    • /
    • 1997
  • In this pater, we first propose a data distribution framework to resolve load imbalance and bucket oerflow in parallel hash join.Using the histogram equalization technique, the framework transforms a histogram of skewed data to the desired uniform distribution that corresponds to the relative computing power of node processors in the system.Next we propose an effcient parallel hash join algorithm for handing skwed data based on the proposed data distribution methodology.For performance comparison of our algorithm with other hash join algorithms.we perform similation experiments and actual exeution on COREDB database computer with 8-node hyperube architecture. In these experiments, skwed data distebution of the join atteibute is modeled using a Zipf-like distribution.The perfomance studies undicate that our algorithm outperforms other algorithms in the skewed cases.

  • PDF

A flexible and powerful model for multi process control based on OPC(OLE for Process Control) and Distributed Security Services (OPC(OLE for Process Control)와 분산형 보안 서비스 기반의 유연한 멀티 프로세스 컨트롤 모델)

  • 심민석;박성규;유대승;김종환;이명재
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.739-741
    • /
    • 2004
  • 본 논문은 제어 구조의 표준으로 떠오르고 있는 OPC와 마이크로소프트사의 분산형 보안 서비스 개념(하부구조 서비스, 응용프로그램 지원 서비스)들을 사용하여 다양한 사용자에 대해서 차별화된 권한 구조를 제공할 수 있는 멀티 프로세스 컨트롤&모니터링 모델을 제안한다. 멀티 프로세스 컨트롤&모니터링 모델은 3-계층 구조(리소스, 로직, 그리고 프레젠테이션 계층)와 컴포넌트 개념을 기반으로 디자인하였기 때문에 엔터프라이즈 어플리케이션이 가지는 다양한 이점을 가질 수 있다. 리소스 계층은 다양한 OPC 기반 제어서버 시스템에서 제공하는 실시간 데이터(액세스 포인터 데이터) 및 저장 데이터들과 쉽고 유연하게 결합할 수 있으며, 로직 계층은 리소스 계층에서 제공하는 리소스들(실시간 및 저장 데이터)에 대한 보안 설정을 제공하고 실제, 가공, 가상 데이터 제공 및 생성하는 역할을 제공한다. 프레젠테이션 계층은 XML 기술을 사용하여 컨텐츠와 뷰를 분리하고 접속 기기들의 타입에 맞는 뷰를 동적으로 결합하여 제공함으로써 다양한 타입의 모니터링 기기들과 유연하게 결합하고 통합할 수 있는 이점을 갖는다.

  • PDF

Privacy Preserving Clustering (프라이버시를 보존하는 군집화)

  • Yoo Hyun-Jin;Kim Min-Ho;Ramakrishna R.S.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.473-476
    • /
    • 2004
  • 본 논문에서는 프라이버시를 침해 하지 않는 데이터 마이닝에 대해 다룬다. 방대한 데이터에서 유용한 정보를 추출하는 데이터 마이닝분야에서 데이터로부터 프라이버시 보존의 중요성이 부각되고 있다. 그래서 프라이버시의 침해를 막기 위한 방법으로 실제 데이터를 사용하지 않고 잡음이 들어간 데이터를 사용한다. 그리고 프라이버시를 침해하지 않기 위해 잡음이 들어간 데이터로부터 데이터의 확률 밀도 함수(PDF)만을 복원한다. 이렇게 복원된 확률 밀도 함수만을 이용하여 데이터 마이닝기술, 예를 들면 분류화에 곧바로 적용함으로써 프라이버시를 보존하는 것이다. 하지만 분류화에 사용되는 데이터의 1차원적인 확률 밀도 함수만 가지고는 군집화에 사용하기가 부적절하다. 따라서 본 논문에서는 군집화를 하기 위해 잡음이 들어간 데이터로부터 결합 확률 밀도 함수(Joint PDF)를 복원하고, 복원된 결합 확률 밀도 함수만 가지고 군집화를 할 수 있는 방법을 다룬다.

  • PDF

Module Design for Combination of Beacon and Sensor (비콘과 센서의 결합을 위한 모듈 설계)

  • Shin, dong-keun;Kim, hyung-jin;Lee, jun;Ra, in-ho
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2016.05a
    • /
    • pp.203-204
    • /
    • 2016
  • 본 논문에서는 비콘과 센서를 결합하고 비콘의 패킷 데이터에 센서 값을 포함하여 브로드캐스팅 되도록 구현하였다. 비콘은 본래 사용자가 비콘의 전파 범위에 인접했을 때 서버를 통해 사용자에게 정보 전송 서비스를 제공하기 때문에 인터넷 환경이 아닌 경우에는 서비스를 받을 수 없다. 본 논문에서는 비콘과 센서를 결합하여 비콘 주변의 모든 사용자에게 정보를 전달 하여 오프라인 상에서 주변의 센싱 데이터를 전송할 수 있는 기법을 제안하였다.

  • PDF

A study on compensation of incorrect recognition on HMM using multilayer perceptrons (신경망을 이용한 HMM의 오인식 보상에 관한 연구)

  • Pyo Chang Soo;Kim Chang Keun;Hur Kang In
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.27-30
    • /
    • 2000
  • 본 논문은 HMM(Hidden Markov Model)을 이용하여 인식을 수행할 경우의 오류를 최소화 할 수 있는 후 처리 과정으로 신경망을 결합시켜 HMM 단독으로 사용하였을 때 보다 높은 인식률을 얻을 수 있는 HMM과 신경망의 하이브리드시스템을 제안한다. HMM을 이용하여 학습한 후 학습에 참여하지 않은 데이터를 인식하였을 때 오인식 데이터를 정인식으로 인식하도록 HMM의 출력으로 얻은 각 출력확률을 후 처리에 사용될 MLP(Multilayer Perceptrons)의 학습용으로 사용하여 MLP를 학습하여 HMM과 MLP을 결합한 하이브리드 모델을 만든다. 이와 같은 HMM과 신경망을 결합한 하이브리드 모델을 사용하여 단독 숫자음과 4연 숫자음 데이터에서 실험한 결과 HMM 단독으로 사용하였을 때 보다 각각 약 $4.5\%$, $1.3\%$의 인식률 향상이 있었다. 기존의 하이브리드 시스템이 갖는 많은 학습시간이 소요되는 문제점과 실시간 음성인식시스템을 구현할 때의 학습데이터의 부족으로 인한 인식률 저하를 해결할 수 있는 방법임을 확인할 수 있었다.

  • PDF

A study on performance improvement of neural network using output probability of HMM (HMM의 출력확률을 이용한 신경회로망의 성능향상에 관한 연구)

  • 표창수;김창근;허강인
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2000.08a
    • /
    • pp.157-160
    • /
    • 2000
  • 본 논문은 HMM(Hidden Markov Model)을 이용하여 인식을 수행할 경우의 오류를 최소화 할 수 있는 후처리 과정으로 신경망을 결합시켜 HMM 단독으로 사용하였을 때 보다 높은 인식률을 얻을 수 있는 HMM과 신경망의 하이브리드시스템을 제안한다. HMM을 이용하여 학습한 후 학습에 참여하지 않은 데이터를 인식하였을 때 오인식 데이터를 정인식으로 인식하도록 HMM의 출력으로 얻은 각 출력확률을 후처리에 사용될 MLP(Multilayer Perceptrons)의 학습용으로 사용하여 MLP를 학습하여 HMM과 MLP을 결합한 하이브리드 모델을 만든다. 이와 같은 HMM과 신경망을 결합한 하이브리드 모델을 사용하여 단독 숫자음과 4연 숫자음 데이터에서 실험한 결과 HMM 단독으로 사용하였을 때 보다 각각 약 4.5%, 1.3%의 인식률 향상이 있었다. 기존의 하이브리드 시스템이 갖는 많은 학습시간이 소요되는 문제점과 실시간 음성인식시스템을 구현할 때의 학습데이터의 부족으로 인한 인식률 저하를 해결할 수 있는 방법임을 확인할 수 있었다.

  • PDF