• 제목/요약/키워드: Input Normalization

검색결과 106건 처리시간 0.025초

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

  • 권오륜;민경필;전준철
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.19-32
    • /
    • 2007
  • 본 논문에서는 실시간 얼굴인증 시스템의 구축을 위한 LVQ 신경망 기반의 새로운 얼굴 인식 방법을 제안한다. 기존의 연구에서 PCA, LDA 변환이 많이 적용되며 신경망을 결합한 형태가 제안되고 있지만 신경망 학습 시간이 오래 걸리는 단점을 가지고 있다. LVQ 신경망은 학습 시간이 짧고 클래스간의 분리도를 최대화할 수 있는 교사학습방법이다. 따라서, 본 논문에서 제안된 방법은 동영상으로부터 실시간으로 입력되는 얼굴영상을 PCA와 LDA변환을 순차적으로 적용하여 부분공간상의 변환된 특징벡터로부터 LVQ 신경망의 학습을 통하여 얼굴을 인식한다. 외부조명의 영향에 강건한 인식시스템을 구축하기 위하여 얼굴검출 단계에서 검출된 얼굴영역은 밝기값의 최대-최소 정규화 방법에 의해 보정된 정규화 영상을 생성한다. 정규화된 얼굴영상은 PCA와 LDA 변환을 통해 부분공간상의 특징벡터로 변환된다. 변환된 훈련 데이터로부터 LVQ 신경망의 초기 중심 벡터를 결정하고 신경망의 학습률 향상을 위해 K-Means 클러스터링 알고리즘을 적용하며, 초기 중심 벡터를 이용하여 LVQ2 학습 방법에 의해 학습된 중심벡터는 클래스의 대표 벡터가 된다. 결국 각 클래스의 대표 벡터로부터 입력 영상의 특징벡터간의 유클리디언 거리 비교법을 적용하여 얼굴 인식을 수행한다. ORL 데이터베이스를 이용한 정지 영상에 대한 인식과 실시간으로 입력되는 영상에 대한 인식 등 두 가지 형태의 영상을 기반으로 실험한 결과 두 경우에 모두 제안된 방법이 기존의 인식 방법보다 인식률에서 우수함을 입증할 수 있었다.

  • PDF

자율차량 안정성을 위한 도로 거칠기 기반 제동압력 계산 시스템 (The road roughness based Braking Pressure Calculation System(BPCS) for an Autonomous Vehicle Stability)

  • 손수락;이병관;심손권
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.323-330
    • /
    • 2020
  • 본 논문은 자율차량 안정성을 위한 도로 거칠기 기반 제동압력 계산 시스템을 제안한다. 제동압력 계산 시스템는 차량의 전방 이미지를 랜덤 포레스트의 입력에 맞게 가공하는 이미지 정규화 모듈, 기상정보와 이미지 정규화 모듈에서 정규화된 차량 전방 이미지를 입력으로 사용하여 차량이 주행 중인 도로의 거칠기를 구별하는 랜덤 포레스트 기반 도로 거칠기 분류 모듈과 도로 거칠기에 따라 차량에 적용되는 마찰 계수를 수정하고, 전방 차량에 따라 최적 주행을 유지하는 브레이킹 강도를 결정하는 차량 브레이크 압력 제어 모듈로 구성된다. 본 논문은 제동압력 계산 시스템의 효율성을 검증하기 위해 제동압력 계산 시스템에 사용되는 랜덤 포레스트 모델을 중심으로 실험이 진행되었다. 실험 결과, 랜덤 포레스트 모델의 정확도는 SVM보다 약 2% 높았고, 정확한 랜덤 포레스트 모델 구성을 위해 7개의 특징이 중복 허용 임의 추출되어야 한다는 결론이 도출되었다. 따라서 제동압력 계산 시스템은 차량이 제동해야 하는 상황에서 정확성 모두를 만족할 수 있다.

물리정보신경망을 이용한 파동방정식 모델링 전략 분석 (Analysis on Strategies for Modeling the Wave Equation with Physics-Informed Neural Networks)

  • 조상인;최우창;지준;편석준
    • 지구물리와물리탐사
    • /
    • 제26권3호
    • /
    • pp.114-125
    • /
    • 2023
  • 편미분방정식의 해를 구하기 위한 여러 수치해법들의 한계와 순수 데이터 기반 기계학습의 단점을 극복하기 위해 물리정보신경망(physics-informed neural network, PINN)이 제안되었다. 물리정보신경망은 편미분방정식을 손실함수 구성에 직접 활용하여 기계학습 훈련에 물리적 제약을 주는 기법으로 파동방정식 모델링에도 활용될 수 있다. 그러나 물리정보신경망을 이용하여 파동방정식을 풀기 위해서는 신경망 훈련 시 입력에 대한 2차 미분이 수행되어야 하고, 그 결과로 출력되는 파동장은 복잡한 역학적 현상들을 포함하고 있어 섬세한 전략이 필요하다. 이 해설 논문에서는 물리정보신경망의 기본 개념을 설명하고 파동방정식 모델링에 활용하기 위한 고려사항들에 대해 고찰하였다. 이러한 고려사항에는 공간좌표 정규화, 활성함수 선정, 물리손실 추가 전략이 포함된다. 훈련자료의 공간좌표를 정규화한 후 사용하면 파동방정식 모델링을 위한 신경망 훈련에서 초기 조건이 더 정확하게 반영되는 것을 수치 실험을 통해 보였다. 또한 신경망을 통한 파동장 예측에 가장 적절한 활성함수를 선정하기 위해 여러 함수들의 특성을 비교했다. 특성 비교는 각 활성함수들의 입력자료에 대한 미분과 수렴성을 중심으로 이루어졌다. 마지막으로 신경망 훈련 중 손실함수에 물리손실을 추가하는 두가지 시나리오의 결과를 비교하였다. 수치 실험을 통해 훈련 초기부터 물리손실을 활용하는 전략보다 초기 훈련단계 이후부터 물리손실을 적용하는 커리큘럼 기반 학습전략이 효과적이라는 결과를 도출했다. 추가로 이 결과를 물리손실을 전혀 사용하지 않은 훈련 결과와 비교하여 PINN기법의 효과를 확인하였다.

Brain SPECT Processing에 있어서 Macro Program 사용의 유용성 (Usefulness of applying Macro for Brain SPECT Processing)

  • 김계환;이홍재;김진의;김현주
    • 핵의학기술
    • /
    • 제13권1호
    • /
    • pp.35-39
    • /
    • 2009
  • 서론 : 핵의학에 있어서 컴퓨터의 발전은 질적인 향상뿐 아니라 양적으로도 성장하고 있다. 다양한 소프트웨어를 사용하여 핵의학과 업무에 적용한다면 양질의 영상을 얻고 단순작업의 시간을 줄일 수 있을 것이다. 핵의학과 업무에 있어 컴퓨터를 이용한 processing에 할애하는 시간은 상당하여, 이 시간을 줄이는 방법으로 Macro라는 프로그램을 적용하기로 하였고, 단순 반복 작업이 많은 Brain SPECT SPM processing과 Brain SPECT PACS verify processing에 적용해 보기로 하였다. 실험재료 및 방법 : Brain SPECT에서 SPM processing과 작업 건수가 많은 PACS 작업 두 가지를 대상으로 하였다. SPM은 Brain의 Neuroimaging data를 분석하기 위한 소프트웨어 패키지로서 그룹간의 정량적인 분석을 목적으로 하고, Realignment, Normalization, Smoothing, Mapping 등의 복잡한 과정을 거쳐 결과를 만들어낸다. 이 과정을 Macro Program를 이용해서 간단하게 코딩하는 작업을 거쳐 만들어 보았다. PACS verify작업은 PACS로 보낸 영상을 간단하게 Color mapping, Gray scale 조정, 복사, 잘라 붙이는 과정으로 이루어지는데, 이를 Macro Program을 이용하여 직접 마우스 좌표를 입력하였다. 수작업으로 했을 때와 Macro Program을 활용했을 때 결과물을 만드는 시간을 기록하여 2007년 검사건수에 대입하여 결과를 도출하였다. 결과 : 2007년 SPM 검사 건수는 115건, PACS 작업 건수는 Diamox 검사 기준으로 834건이었다. SPM을 수작업은 숙련도에 따라 10분에서 15분 소요되었고, Macro를 사용시 5분 30초가 소요되었다. 검사 건수에 대입하여 년 평균 시간을 산출하면 SPM을 수작업으로 했을 시 숙련도에 따라 1150~1725분(19~29시간)이 소요되었고, Macro 사용 시에는 632분(10.5 시간)이 걸렸다. PACS는 수작업 시 2~3분이 걸렸으며, Macro를 사용 시에는 45초가 걸렸다. 이를 검사 건수에 대입하면 수작업 시 1668~2502분(28~42시간)이 걸렸고, Macro 사용시 625분(10시간)이 소요되어서 1043~1877분(17~31)시간이 절약 되었다. 결과적으로, SPM에 있어서 45~63%, PACS 작업에 있어서는 62~75%, 2007년 기준으로 전체 Brain SPECT Processing에서 55~70% 정도의 시간 절약 효과를 볼 수 있었다. 결론 : 2007년 검사 건수 기준으로 Macro 프로그램 사용시 상당한 시간절약 효과를 가져왔고 아무리 적은 시간이 걸리는 작업이라도 건수에 따라 많은 시간을 줄일 수 있다는 것을 확인하였다. 이는 검사실 근무자에게 검사하는 환자에게 더욱 집중할 수 있는 시간적 여유를 주어 안전사고 발생률을 더욱 줄일 수 있을 것이다. 그리고, 논문을 통해서 알 수 있는 것처럼, Brain SPECT 프로세싱뿐만 아니라 다른 다양한 분야의 단순반복 업무에 매크로를 활용함으로써 얻을 수 있는 시간적 이득과 작업 효율성은 상당할 것이라 생각되어진다.

  • PDF

스마트폰 다종 데이터를 활용한 딥러닝 기반의 사용자 동행 상태 인식 (A Deep Learning Based Approach to Recognizing Accompanying Status of Smartphone Users Using Multimodal Data)

  • 김길호;최상우;채문정;박희웅;이재홍;박종헌
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.163-177
    • /
    • 2019
  • 스마트폰이 널리 보급되고 현대인들의 생활 속에 깊이 자리 잡으면서, 스마트폰에서 수집된 다종 데이터를 바탕으로 사용자 개인의 행동을 인식하고자 하는 연구가 활발히 진행되고 있다. 그러나 타인과의 상호작용 행동 인식에 대한 연구는 아직까지 상대적으로 미진하였다. 기존 상호작용 행동 인식 연구에서는 오디오, 블루투스, 와이파이 등의 데이터를 사용하였으나, 이들은 사용자 사생활 침해 가능성이 높으며 단시간 내에 충분한 양의 데이터를 수집하기 어렵다는 한계가 있다. 반면 가속도, 자기장, 자이로스코프 등의 물리 센서의 경우 사생활 침해 가능성이 낮으며 단시간 내에 충분한 양의 데이터를 수집할 수 있다. 본 연구에서는 이러한 점에 주목하여, 스마트폰 상의 다종 물리 센서 데이터만을 활용, 딥러닝 모델에 기반을 둔 사용자의 동행 상태 인식 방법론을 제안한다. 사용자의 동행 여부 및 대화 여부를 분류하는 동행 상태 분류 모델은 컨볼루션 신경망과 장단기 기억 순환 신경망이 혼합된 구조를 지닌다. 먼저 스마트폰의 다종 물리 센서에서 수집한 데이터에 존재하는 타임 스태프의 차이를 상쇄하고, 정규화를 수행하여 시간에 따른 시퀀스 데이터 형태로 변환함으로써 동행 상태분류 모델의 입력 데이터를 생성한다. 이는 컨볼루션 신경망에 입력되며, 데이터의 시간적 국부 의존성이 반영된 요인 지도를 출력한다. 장단기 기억 순환 신경망은 요인 지도를 입력받아 시간에 따른 순차적 연관 관계를 학습하며, 동행 상태 분류를 위한 요인을 추출하고 소프트맥스 분류기에서 이에 기반한 최종적인 분류를 수행한다. 자체 제작한 스마트폰 애플리케이션을 배포하여 실험 데이터를 수집하였으며, 이를 활용하여 제안한 방법론을 평가하였다. 최적의 파라미터를 설정하여 동행 상태 분류 모델을 학습하고 평가한 결과, 동행 여부와 대화 여부를 각각 98.74%, 98.83%의 높은 정확도로 분류하였다.

영상합성을 통한 KOMPSAT-1 EOC의 분류정확도 및 환경정보 추출능력 향상 (Enhancement of Classification Accuracy and Environmental Information Extraction Ability for KOMPSAT-1 EOC using Image Fusion)

  • 하성룡;박대희;박상영
    • 한국지리정보학회지
    • /
    • 제5권2호
    • /
    • pp.16-24
    • /
    • 2002
  • 원격탐사 응용분야 중 토지피복 분류를 통한 지구환경의 원격탐지기법은 환경 관리, 도시계획 및 지리정보시스템의 응용분야에 광범위하게 사용되고 있는 접근방식이다. 본 연구는 다목적 실용위성(Korea Multi-Purpose Satellite : KOMPSAT)의 전자광학카메라(electro-optical camera : EOC)를 통해 취득한 영상의 토지피복 정보를 추출하는 방안을 제시하였다. 사용영상은 다중 분광정보를 보유하고 있는 공간해상도 30m의 Landsat TM과 6.6m의 공간해상도와 단일밴드로 구성되어 있는 KOMPSAT EOC영상이며, 연구 대상지역은 청주시 미호천 수계이다. 영상합성은 IHS(intensity hue saturation), HPF(high pass filtering), CN(color normalization), 그리고 Wavelet 변환방식을 적용하여 결과를 비교하였다. 합성된 영상은 RBF-NN(radial basis function neural network)과 ANN(artificial neural network)법을 이용하여 피복분류를 실시하였으며, 이상의 과정을 통해 최적 결과를 도출하는 영상합성 및 분류기법을 제시하였다.

  • PDF

PCA와 개선된 k-Nearest Neighbor를 이용한 모델 기반형 물체 인식 (Model-Based Object Recognition using PCA & Improved k-Nearest Neighbor)

  • 정병수;김병기
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.53-62
    • /
    • 2006
  • 주성분 분석법을 사용한 물체 인식 기술은 영상의 조명 변화가 있을 때 인식률이 떨어지는 경향이 있다. 본 논문에서는 실험영상이 학습영상에 대해 조명의 차이가 있는 경우에도 데이터 베이스안의 물체인지 가려내는 새로운 PCA 분석방법을 사용한 물체 인식 기술을 제안하는데 그 목적이 있다. 그리고 개선된 k-nearest neighbor를 이용하여 물체 인식률을 향상 시켰다. 본 논문에서 제안된 물체 인식 알고리즘은 히스토그램 이퀄라이제이션과 미디언 필터를 이용하여 영상을 전처리하고 그것을 학습시켜서 물체 공간을 생성한다. 이때 히스토그램 이퀄라이제이션를 사용하여 히스토그램을 펼침으로써 조명 변화에 영향을 감소시키는 결과를 나았고, 이것은 기본적인 주성분 분석방법과 휘도치 정규화를 한 방법 등과 비교해 본 결과 조명 변화의 영향을 최소화하여 좋은 인식률을 유지할 수 있었다. 그리고 모델 영상내의 각각의 물체의 대표 값을 만든다. 그런 후 테스트영상을 물체 공간에 투영 시켜서 나온 성분과 대표 값의 거리를 비교하여 인식하게 된다. 기존의 방식으로는 거리 계산오차가 많기 때문에 본 논문에서는 개선된 k-Nearest Neighbpr 이용하여 몇 개의 연속적인 입력영상에 대해 각 각의 모델 영상들을 인식의 단위로 이용하였다.

음성 분류 인공신경망을 활용한 자폐아 치료용 로봇의 지능화 동작 연구 (Motion Study of Treatment Robot for Autistic Children Using Speech Data Classification Based on Artificial Neural Network)

  • 이진규;이보희
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1440-1447
    • /
    • 2019
  • 현재 아이들의 자폐스펙트럼장애 유병률이 한층 더 높게 보고되고 있으며 다양한 형태의 장애 징후를 보이고 있다. 특히 이들은 사회적 의사소통 영역에서 의사소통장애로 인한 대화에 어려움을 겪고 있으며 이를 훈련을 통해 개선 시킬 필요가 대두된다. 이를 위해 본 연구에서는 사전 연구를 통해 설계된 로봇에 장착된 마이크를 통해 음성 정보를 취득하고 이러한 정보를 이용하여 지능적인 동작을 만드는 방식을 제안한다. 음성 정보를 로봇 동작으로 분류하기 위해 인공신경망을 이용하였으며 여러 신경망 기법중 합성곱 방식을 기본으로 한 순환신경망을 결합하여 정확도를 향상시키려고 하였다. 입력 음성 데이터의 전처리는 MFCC를 이용하여 분석하였으며 여러 데이터 정규화 및 인공신경망 최적화 기법을 활용하여 로봇의 동작을 추정하였다. 아울러 설계된 인공신경망은 기존에 사용한 구조 및 사람이 개입하여 분석하는 방법과의 정확도 비교 실험을 진행하여 분석 결과가 높은 정확도를 나타냈다. 향후 보다 높은 정확도를 가질 수 있는 로봇 동작을 설계하여 실제의 자폐아 치료 및 교육 환경에서 적용할 수 있기 위하여 다양한 형태의 데이터를 수집하고 효율적으로 전처리하는 방식에 대한 연구가 요구된다.

다채널 맛 평가시스템에 의한 시판음료의 판별분석 (Discriminant Analysis of Marketed Beverages Using Multi-channel Taste Evaluation System)

  • 박경림;배영민;박인선;조용진;김남수
    • Applied Biological Chemistry
    • /
    • 제47권3호
    • /
    • pp.300-306
    • /
    • 2004
  • 양이온 및 음이온 반응성의 고분자막 8종을 casting 법에 의하여 제조한 후 이온전극에 장착하여 다채널 맛 평가시스템의 비선택성 센서 어레이를 구성하였다. 맛 센서 어레이에 의한 전기화학계측은 전위법에 의하여 행하였으며, 이 때 센서 어레이를 구성하는 각각의 맛 센서로 측정한 전위간을 막 전위 증폭기를 거쳐 증폭한 후 다채널 A/D converter를 통하여 PC에 접속하였다. 식혜, 수정과, 감귤쥬스 등 6종 24점의 시판음료를 다채널 맛 평가시스템으로 분석한 후 각 센서의 계측신호에 대한 정규화를 행하고 주성분 분석을 행하였을 때 5종 음료군의 조합에서는 제1 주성분 및 제2 주성분의 합이 전체 데이터 변이의 $70.73{\sim}85.32%$를 설명하는 것으로 나타났으며 6종 음료군의 경우에는 제1 주성분 및 제2 주성분의 합과 제1 주성분, 제2 주성분 및 제3 주성분의 합이 전체데이터 변이의 81.46%와 89.56%를 각각 설명하는 것으로 나타났다. 3차원 공간상에 6종 음료군에 대한 계측결과를 맵핑하였을 때 이들의 구분이 가능하였으며, 5종 음료군의 조합에서는 2가지 경우에 있어 2차원 평면상에서 구분되었다.

색 재현 개선을 위한 CIELAB 색 공간 기반의 향상된 Multi -scale Retinex (Enhanced Integrated Multi-scale Retinex based on CIELAB Color Space for Improving Color Reproduction)

  • 경왕준;이태형;이철희;하영호
    • 대한전자공학회논문지SP
    • /
    • 제48권1호
    • /
    • pp.1-7
    • /
    • 2011
  • 본 논문에서는 디지털 영상의 지역적 계조 재현과 함께 입력 영상의 색상을 유지하는 영상 향상 기법을 제안한다. 기존의 지역적 계조 재현 방법인 통합된 다중 크기의 Retinex는 영상이 가지는 어두운 영역의 가시성 향상을 통한 향상된 계조 재현 결과를 가져왔다. 그러나 IMSR을 포함한 대부분의 지역적 계조 재현 방법은 RGB 색 공간에서 수행되어 인간시각시스템에 의해 인지되는 색상의 왜곡이 발생하게 된다. 본 논문에서는 이러한 색상의 왜곡을 줄이는 계조 재현을 위하여 장치 독립적인 CIELAB 색 공간에서 색상를 유지하고 높은 대비와 자연스러운 영상을 얻기 위한 계조 재현 및 채도 보상 기법을 제안한다. 제안한 방법은 먼저 CIELAB 색 공간에서 $L^*$값에 대해 IMSR 정규화 및 단순한 사상 함수를 수행하여 가시성을 향상 시킨다. 또한, sRGB 색역 경계값을 이용하여 LC 평면에서 밝기 변화에 대한 선형적인 채도 보상을 수행하였다. 그 결과 입력 영상의 계조 재현을 통해 가시성이 향상되었고, 기존의 IMSR과 비교하여 색상의 왜곡이 줄었으며, 주관적인 평가를 수행하여 비교 평가 하였다.