• 제목/요약/키워드: on line algorithm

검색결과 2,426건 처리시간 0.043초

강화학습의 학습 가속을 위한 함수 근사 방법 (Function Approximation for accelerating learning speed in Reinforcement Learning)

  • 이영아;정태충
    • 한국지능시스템학회논문지
    • /
    • 제13권6호
    • /
    • pp.635-642
    • /
    • 2003
  • 강화학습은 제어, 스케쥴링 등 많은 응용분야에서 성공적인 학습 결과를 얻었다. 기본적인 강화학습 알고리즘인 Q-Learning, TD(λ), SARSA 등의 학습 속도의 개선과 기억장소 등의 문제를 해결하기 위해서 여러 함수 근사방법(function approximation methods)이 연구되었다. 대부분의 함수 근사 방법들은 가정을 통하여 강화학습의 일부 특성을 제거하고 사전지식과 사전처리가 필요하다. 예로 Fuzzy Q-Learning은 퍼지 변수를 정의하기 위한 사전 처리가 필요하고, 국소 최소 자승법은 훈련 예제집합을 이용한다. 본 논문에서는 온-라인 퍼지 클러스터링을 이용한 함수 근사 방법인 Fuzzy Q-Map을 제안하다. Fuzzy Q-Map은 사전 지식이 최소한으로 주어진 환경에서, 온라인으로 주어지는 상태를 거리에 따른 소속도(membership degree)를 이용하여 분류하고 행동을 예측한다. Fuzzy Q-Map과 다른 함수 근사 방법인 CMAC와 LWR을 마운틴 카 문제에 적용하여 실험 한 결과 Fuzzy Q-Map은 훈련예제를 사용하지 않는 CMAC보다는 빠르게 최고 예측율에 도달하였고, 훈련 예제를 사용한 LWR보다는 낮은 예측율을 보였다.

CBIR을 위한 코너패치 기반 재배열 DCT특징 분석 (Rearranged DCT Feature Analysis Based on Corner Patches for CBIR (contents based image retrieval))

  • 이지민;박종안;안영은;오상언
    • 전기학회논문지
    • /
    • 제65권12호
    • /
    • pp.2270-2277
    • /
    • 2016
  • In modern society, creation and distribution of multimedia contents is being actively conducted. These multimedia information have come out the enormous amount daily, the amount of data is also large enough it can't be compared with past text information. Since it has been increased for a need of the method to efficiently store multimedia information and to easily search the information, various methods associated therewith have been actively studied. In particular, image search methods for finding what you want from the video database or multiple sequential images, have attracted attention as a new field of image processing. Image retrieval method to be implemented in this paper, utilizes the attribute of corner patches based on the corner points of the object, for providing a new method of efficient and robust image search. After detecting the edge of the object within the image, the straight lines using a Hough transformation is extracted. A corner patches is formed by defining the extracted intersection of the straight line as a corner point. After configuring the feature vectors with patches rearranged, the similarity between images in the database is measured. Finally, for an accurate comparison between the proposed algorithm and existing algorithms, the recall precision rate, which has been widely used in content-based image retrieval was used to measure the performance evaluation. For the image used in the experiment, it was confirmed that the image is detected more accurately in the proposed method than the conventional image retrieval methods.

소음 환경에서 공간상관성을 이용한 배열이득 추정 (Array gain estimated by spatial coherence in noise fields)

  • 박지성;최용화;김재수;조성호;박정수
    • 한국음향학회지
    • /
    • 제35권6호
    • /
    • pp.427-435
    • /
    • 2016
  • 해양에서 배열센서를 사용하여 신호를 수신하는 경우 성능을 측정하는 척도로서 배열이득(Array Gain, AG)을 사용한다. 배열이득은 배열의 형상, 주파수 및 해양환경에 의한 소음의 방향성에 영향을 받는다. 본 논문에서는 배열이득을 모델링하고 예측하기 위하여 공간상관성을 이용하였으며, 해상실험을 통해서 예측모델을 검증하였다. 예측 모델에서는 임의형상의 배열 및 소음의 방향성을 고려할 수 있는 신호와 소음의 공간상관성을 사용하여 배열이득을 계산하였다. 해상실험에서는 예인음원을 이용하여 CW(Continuous Wave)를 수평배열센서로 수신하였으며, 송신신호 사이에 주변 소음을 측정하였고, 이로부터 개별센서와 배열센서의 SNR(Signal to Noise Ratio)을 계산하여 배열이득을 추정하였다. 최종적으로 실험적으로 측정한 배열이득과 예측모델을 이용한 배열이득을 비교 검증하였다.

시뮬레이션 프로그램 기반 실시간 자동재난 및 안내방송시스템의 설계 (Design and Implementation of a Real-time Automatic Disaster and Information Broadcasting System)

  • 이병문;박정인;강운구
    • 디지털융복합연구
    • /
    • 제10권7호
    • /
    • pp.141-152
    • /
    • 2012
  • 극장이나 대형 빌딩에서 현재 사용되고 있는 대표적인 화재감지기 기반의 피난 유도시스템은 대체적으로 아날로그 방식으로 운영되어 화재 발생 시 선로와 센서의 손실로 주 장치로 제대로 전달되지 않아서 정확한 발화위치 및 화재 진행위치를 알 수가 없다. 따라서 본 논문에서는 재난이 발생하였을 때 실시간으로 화재경보 사이렌과 상황에 맞는 최적의 피난유도 기능을 갖는 재난관리 안내방송 시스템을 제안하였다. 제안된 시스템의 유효성을 확인하기 위해 객체지향 기법으로 설계하여 재난안내시스템과 시뮬레이션프로그램을 구현하였다. 이 시스템은 실제 화재와 같은 비상상황이 발생할 경우 화재센서 네트워크를 통해서 건물 내의 LCD에 피난유도를 위한 정보(발생지점, 발생시간, 대피경로)를 출력하는 시뮬레이션프로그램과 연동하도록 구현하였다. 또한 이 시스템을 이용하여 화염연기 확산경로를 고려한 최적의 재난대피경로를 찾는 실험을 하였고 그 결과 제안한 시스템의 유효성을 확인할 수 있었다.

다중기준국 방식을 이용한 GPS 반송파 상대측위 정확도 향상 (Improvement of Relative Positioning Accuracy with GPS Carrier Phase Using Multi-Base Station)

  • 이재원
    • 한국측량학회지
    • /
    • 제26권6호
    • /
    • pp.617-624
    • /
    • 2008
  • 일반적으로 단일기준국을 이용하는 실시간 동적(Real Time Kinematic) GPS는 무선모뎀을 통해 반송파 오차보정량을 이동국으로 전송하여 현장에서 바로 고정밀의 위치를 결정할 수 있다. 하지만 단일기준국 방식은 각 위성마다의 시간대별 반송파 측정값을 지속적으로 제공해야 하며, 전송장해와 모뎀간의 거리 따른 증가 등으로 위치정확도가 저하되는 단점이 있다. 본 논문은 이러한 단점을 보완하기 위해 3대 이상의 다중기준국을 활용한 네트워크 기반의 GPS 반송파 상대측위기술을 구현하였으며, Visual C++로 제작된 실시간 모니터링 프로그램을 이용하여 RTK 네트워크를 구성하였다. 네트워크 구성에서 얻어지는 다중기준국의 오차보정량 가운데 최적의 값을 자동으로 선택하고, GPS buoy 이동국에 적용하여 해수면 관측을 수행하였으며, 이를 통해 얻어진 해수면 변동량을 단일기준국과 비교, 분석하여 결과를 도출하였다.

부산지역 교통관련 기사를 이용한 비정형 빅데이터의 정형화와 시각적 해석 (Structuring of unstructured big data and visual interpretation)

  • 이경준;노윤환;윤상경;조영석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1431-1438
    • /
    • 2014
  • 2013년 1월 1일부터 2013년 12월 31일까지의 부산지역지인 국제신문과 부산일보의 기사들 중 제목에 '부산'과 '교통'을 동시에 포함한 2889건의 기사 내용의 관계 또는 관련 있는 데이터에 내재되어 있는 의미 있는 패턴을 찾아내고자한다. 데이터마이닝 (datamining)의 일부인 텍스트마이닝(textmining)의 기법을 이용하여 사회네트워크분석 (SNA; social network analysis)을 실시하였다. 비정형 데이터의 정형화를 위해 빅데이터의 저장, 처리 및 분석을 위해 자바 기반의 오픈소스 프레임워크인 하둡 생태계 (Hadoop ecosystem)의 HDFS와 맵리듀스 (MapReduce)를 Linux (Ubuntu-12.04LTS) 환경에서 이용하였고, 기존의 R패키지에서 제공되는 사회 네트워크 분석보다 효율적인 시각화를 위해 각 노드 및 선에 비율에 따른 가중치를 주어 색상과 굵기로 해석할 수 있도록 새로운 알고리즘을 구현하였다.

An Evaluation of Multiple-input Dual-output Run-to-Run Control Scheme for Semiconductor Manufacturing

  • Fan, Shu-Kai-S.;Lin, Yen
    • Industrial Engineering and Management Systems
    • /
    • 제4권1호
    • /
    • pp.54-67
    • /
    • 2005
  • This paper provides an evaluation of an optimization-based, multiple-input double-output (MIDO) run-to-run (R2R) control scheme for general semiconductor manufacturing processes. The controller in this research, termed adaptive dual response optimizing controller (ADROC), can serve as a process optimizer as well as a recipe regulator between consecutive runs of wafer fabrication. In evaluation, it is assumed that the equipment model could be appropriately described by a pair of second-order polynomial functions in terms of a set of controllable variables. Of practical relevance is to consider a drifting effect in the equipment model since in common semiconductor practice the process tends to drift due to machine aging and tool wearing. We select a typical application of R2R control to chemical mechanical planarization (CMP) in semiconductor manufacturing in this evaluation, and there are five different CMP process scenarios demonstrated, including mean shift, variance increase, and IMA disturbances. For the controller, ADROC, an on-line estimation technique is implemented in a self-tuning (ST) control manner for the adaptation purpose. Subsequently, an ad hoc global optimization algorithm based on the dual response approach, arising from the response surface methodology (RSM) literature, is used to seek the optimum recipe within the acceptability region for the execution of next run. The main components of ADROC are described and its control performance is assessed. It reveals from the evaluation that ADROC can provide excellent control actions for the MIDO R2R situations even though the process exhibits complicated, nonlinear interaction effects between control variables, and the drifting disturbances.

교통표지판 인식을 위한 비젼시스템 (An Vision System for Traffic sign Recognition)

  • 김태우;강용석;차샘;배철수
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권2호
    • /
    • pp.45-50
    • /
    • 2009
  • 본 논문에서는 영상처리를 이용하여 온라인으로 교통표지판을 인식하는 비젼 시스템을 제안한다. 제안된 시스템은 넓은 두 개의 카메라, 즉 광각렌즈(wide-angle lends)와 망원렌즈(telephoto lends)를 장착하였고, 이미지처리 보드가 있는 PC로 구성되었다. 이 시스템은 색상, 밝기, 형태 등과 같은 정보를 이용하여 광각이미지의 교통표지판을 추출한 다음, 보다 큰 이미지에서 정확한 표지판 후보영역을 추출하기 위해 망원렌즈에서 포착된 이미지를 이용하여 처리하였다. 실험결과로써 수동으로 촬영한 비디오 연속장면에서 포착한 영상을 시용하여 실험한 결과 속도표지판은 추출율 96.5%, 인식률 34.4% 그리고 안내표지판은 추출율 100%, 인식률 40%의 결과를 나타내었다. 또한 간단한 실행과정으로 빠른 인식률을 얻을 수 있었으며, 도로상에서의 실험으로 시스템의 효용성을 입증하였다.

  • PDF

비직교 좌표변환에 의한 선회연소기내 난류재순환유동의 수치해석 (Numerical analysis of turbulent recirculating flow in swirling combustor by non-orthogonal coordinate transformation)

  • 신종근;최영돈
    • 대한기계학회논문집
    • /
    • 제12권5호
    • /
    • pp.1158-1174
    • /
    • 1988
  • 본 연구에서는 계단형 벽면조건을 없게 하기 위해서 비직교 좌표계(non-orth- ogonal coordinate system)를 사용하여 수치해석하였다. 비직교 좌표계를 이용한 수 치해석의 예는 Thompson등이 Laplace방정식 혹은 Poisson방정식을 해석함으로써 비직 교 격자망을 구성한 바 있고, Fahgri와 Asako는 대수적 비직교 좌표변환으로 유한차분 방정식을 유도하여 비정규경계면을 갖는 관로에서의 유동특성을 해석하였으며 이재헌 과 이상렬은 Fahgri와 Asako의 방법을 비정규경계면을 갖는 밀폐공간내에서의 자연대 류의 수치해석에 적용한 바 있다. 본 해석에서도 Fahgri와 Asako의 변환법으로 유한 차분방정식을 유도하였는데, 이 방법을 사용할 경우 확대관의 경사벽면을 계단형으로 만들지 않고 유한차분방정식을 유도할 수 있어서 계단형 벽면으로 인한 해의 오차를 제거할 수 있다. Fig.2는 본 해석에서 사용한 비직교 격자망을 나타낸다.

투명 e-퍼포먼스를 위한 텍스쳐 중화 시스템 개발 (Development of Texture Neutralization System for the Invisible e-Performance)

  • 이동훈;윤태수
    • 한국멀티미디어학회논문지
    • /
    • 제14권4호
    • /
    • pp.585-594
    • /
    • 2011
  • 연극이나 뮤지컬과 같은 라이브 퍼포먼스 분야에서는 관객의 몰입도를 극대화하기 위한 다양한 무대 효과가 사용된다. 이러한 무대 효과는 전통적인 연출 기법으로부터 장면에 몰입을 줄 수 있는 다양한 무대 효과를 위한 장치들을 활용하고 있다. 본 논문에서는 공간증강현실 기반의 사물의 표면 텍스쳐를 제어할 수 있는 새로운 디지털 시각 효과를 제안한다. 이를 위하여 프로젝터-카메라 시스템을 사용하여 임의의 물체의 표면을 중화할 수 있는 방법을 제시한다. 객체의 표면에 신중하게 결정된 보상 영상(Compensation Image)을 투영함으로써 투명한 객체처럼 나타나도록 만들기 위해, 본 논문에서는 간단하고 효과적인 오프라인 프로젝터-카메라 보정을 위한 호모그래피 방법(Homography Method)를 사용한다. 따라서 제안하는 Radiometric 매개 변수를 측정하기 위한 스마트 프로젝터(Smart Projector)의 기본 알고리즘은 연극이나 뮤지컬에서의 시간적 변화에 유용하게 사용될 것이다.