• Title/Summary/Keyword: Real-time image classification

검색결과 170건 처리시간 0.029초

컴퓨터 시각을 이용한 고속 터널 유고감지 시스템 (Vision-Based Fast Detection System for Tunnel Incidents)

  • 이희신;정성환;이준환
    • 한국ITS학회 논문지
    • /
    • 제9권1호
    • /
    • pp.9-18
    • /
    • 2010
  • 산악지형이 많은 우리나라는 자연환경 여건상 터널 수요가 많고 안전한 운영을 보장 할 수 있는 터널 유고감지 시스템에 대한 필요성도 커지고 있다. 본 논문에서는 터널 내 유고 상황을 실시간으로 감지하여 터널 사무소에 전달 터널의 안전한 운영을 도울 수 있는 터널 유고감지 시스템을 제안 하였다. 제안한 시스템은 차 영상 기법과 같은 단순한 영상 분석 알고리즘을 사용하여 시스템의 신속성을 높였으며 유고의 종류 보다는 유고상황의 발생여부를 정확히 판단하데 중점을 두어 시스템의 정확성도 확보하였다. 또한 영상 분석 장치 한 대당 네 대의 카메라를 수용할 수 있게 함으로써 시스템의 비용적인 측면도 고려하였다. 그리고 카메라의 대수에 따라 영상분석 장치를 추가함으로써 카메라 대수에 관계없이 시스템의 확장성을 용이하게 하였으며 터널 유고상황 정보를 웹에서도 접근 가능하게 하여 원격지의 다른 터널 시스템과의 연동 등의 추가 확장성도 고려하였다. 구현된 시스템을 실제 터널에서 실험한 결과 터널 내에서 발생한 장애물, 정지 사고차량, 차량 정체 지체, 사람 이륜차, 연기 화재, 조명 이상, 역 주행 등의 유고상황을 모두 실시간으로 정확히 감지하였다.

다채널 근전도 기반 딥러닝 동작 인식을 활용한 손 재활 훈련시스템 개발 및 사용성 평가 (Development and Usability Evaluation of Hand Rehabilitation Training System Using Multi-Channel EMG-Based Deep Learning Hand Posture Recognition)

  • 안성무;이건희;김세진;배소정;이현주;오도창;태기식
    • 대한의용생체공학회:의공학회지
    • /
    • 제43권5호
    • /
    • pp.361-368
    • /
    • 2022
  • The purpose of this study was to develop a hand rehabilitation training system for hemiplegic patients. We also tried to find out five hand postures (WF: Wrist Flexion, WE: Wrist Extension, BG: Ball Grip, HG: Hook Grip, RE: Rest) in real-time using multi-channel EMG-based deep learning. We performed a pre-processing method that converts to Spider Chart image data for the classification of hand movement from five test subjects (total 1,500 data sets) using Convolution Neural Networks (CNN) deep learning with an 8-channel armband. As a result of this study, the recognition accuracy was 92% for WF, 94% for WE, 76% for BG, 82% for HG, and 88% for RE. Also, ten physical therapists participated for the usability evaluation. The questionnaire consisted of 7 items of acceptance, interest, and satisfaction, and the mean and standard deviation were calculated by dividing each into a 5-point scale. As a result, high scores were obtained in immersion and interest in game (4.6±0.43), convenience of the device (4.9±0.30), and satisfaction after treatment (4.1±0.48). On the other hand, Conformity of intention for treatment (3.90±0.49) was relatively low. This is thought to be because the game play may be difficult depending on the degree of spasticity of the hemiplegic patient, and compensation may occur in patient with weakened target muscles. Therefore, it is necessary to develop a rehabilitation program suitable for the degree of disability of the patient.

정지궤도 천리안위성 해양관측센서 GOCI의 Tasseled Cap 변환계수 산출연구 (A Study of Tasseled Cap Transformation Coefficient for the Geostationary Ocean Color Imager (GOCI))

  • 신지선;박욱;원중선
    • 대한원격탐사학회지
    • /
    • 제30권2호
    • /
    • pp.275-292
    • /
    • 2014
  • 이 연구에서는 Geostationary Ocean Color Imager(GOCI) 센서에 적용할 수 있는 고유의 Tasseled Cap Transformation(TCT) 계수를 제시하고 있다. TCT는 다중밴드 센서 자료로부터 지표의 특성을 분석하는 전통적인 영상변환 방법 중 하나로 새로운 다중밴드 광학센서가 관측을 시작하는 경우 센서의 특성 차이로 인하여 각각의 육상관측 위성센서에 적합한 TCT 계수들이 장기 분석을 통하여 수립되어야 한다. GOCI 센서는 해양관측이 주 목적으로 개발되었으나 영상의 상당 부분은 육지를 관측하고 있으며 밴드 구성은 육지관측에도 일반적으로 이용되는 Visible-Near InfraRed(VNIR) 영역의 정보를 포함하고 있다. 또한 GOCI 센서의 높은 시간 해상도는 지표의 일별 변화의 관측에도 유용하게 사용될 수 있다. 이러한 장점을 이용하여 GOCI 센서에 대한 고유한 TCT가 제공된다면 GOCI 센서의 관측범위 내에서 준 실시간으로 지표변화에 대한 분석과 해석이 가능할 것이다. TCT는 일반적으로 "Brightness", "Greenness", "Wetness"의 세 가지 정보를 포함하지만, ShortWave InfraRed(SWIR) 파장대역이 없는 GOCI 센서의 경우에는 "Wetness"의 정보를 얻을 수 없다. GOCI 센서의 높은 시간 해상도의 활용을 극대화하기 위해서는 "Wetness"의 정보가 제공되어야 한다. "Wetness"의 정보를 얻기 위해 GOCI 주성분 분석(Principal Component Analysis: PCA) 공간을 MODIS TCT 공간에 선형 회귀하는 방법이 사용되었다. 이 연구에서 산출된 GOCI TCT 계수는 정지궤도의 특성에 의해 관측 시간대별로 다른 변환계수를 가질 수 있다. 이 차이를 알아보기 위하여 GOCI TCT 자료와 MODIS TCT 자료 사이의 상관관계가 비교되었다. 그 결과, "Brightness"와 "Greenness"는 4시 자료, "Wetness"는 2시 자료의 변환계수가 선택되었다. 최종적으로 산출된 변환계수의 적절성을 평가하기 위하여 GOCI TCT 자료는 MODIS TCT 영상 및 여러 육상 파라미터들과 비교되었다. GOCI TCT 영상은 MODIS TCT 영상보다 지표 피복의 분류가 더 세밀하게 표현되었으며, GOCI TCT 공간의 지표 피복 분포도 유의미한 결과를 보여줬다. 또한 GOCI TCT의 "Brightness", "Greenness", "Wetness" 자료는 Albedo($R^2$ = 0.75), Normalized Difference Vegetation Index(NDVI) ($R^2$ = 0.97), Normalized Difference Moisture Index(NDMI) ($R^2$ = 0.77)와 각각 비교적 높은 상관관계가 나타났다. 이러한 결과들은 적절한 TCT 계수의 산출이 이루어졌다는 것을 보여준다.

고속 해상 객체 분류를 위한 양자화 적용 기반 CNN 딥러닝 모델 성능 비교 분석 (Comparative Analysis of CNN Deep Learning Model Performance Based on Quantification Application for High-Speed Marine Object Classification)

  • 이성주;이효찬;송현학;전호석;임태호
    • 인터넷정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.59-68
    • /
    • 2021
  • 최근 급속도로 성장하고 있는 인공지능 기술이 자율운항선박과 같은 해상 환경에서도 적용되기 시작하면서 디지털 영상에 특화된 CNN 기반의 모델을 적용하는 관련 연구가 활발히 진행되고 있다. 이러한 해상 서비스의 경우 인적 과실을 줄이기 위해 충돌 위험이 있는 부유물을 감지하거나 선박 내부의 화재 등 여러 가지 기술이 접목되기에 실시간 처리가 매우 중요하다. 그러나 기능이 추가될수록 프로세서의 제품 가격이 증가하는 문제가 존재해 소형 선박의 선주들에게는 비용적인 측면에서 부담이 된다. 또한 대형 선박의 경우 자율운항선박의 시스템을 감안할 때, 연산 속도의 성능 향상을 위해 복잡도가 높은 딥러닝 모델의 성능을 개선하는 방법이 필요하다. 따라서 본 논문에서는 딥러닝 모델에 경량화 기법을 적용해 정확도를 유지하면서 고속으로 처리할 수 있는 방법에 대해 제안한다. 먼저 해상 부유물 검출에 적합한 영상 전처리를 진행하여 효율적으로 CNN 기반 신경망 모델 입력에 영상 데이터가 전달될 수 있도록 하였다. 또한, 신경망 모델의 알고리즘 경량화 기법 중 하나인 학습 후 파라미터 양자화 기법을 적용하여 모델의 메모리 용량을 줄이면서 추론 부분의 처리 속도를 증가시켰다. 양자화 기법이 적용된 모델을 저전력 임베디드 보드에 적용시켜 정확도와 처리 속도를 사용하는 임베디드 성능을 고려하여 설계하는 방법을 제안한다. 제안하는 방법 중 정확도 손실이 제일 최소화되는 모델을 활용해 저전력 임베디드 보드에 비교하여 기존보다 최대 4~5배 처리 속도를 개선할 수 있었다.

3차원 게임에서 객체들의 상호 작용을 디자인하기 위한 제어 기법 (A Control Method for designing Object Interactions in 3D Game)

  • 김기현;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.322-331
    • /
    • 2003
  • 3차원 게임은 게임 시나리오의 다양한 요소에 의한 복잡도가 증가함에 따라 게임 객체들의 상호 관계를 제어하기 위한 문제점을 가진다. 그러므로, 게임 시스템은 각 게임 객체들의 응답을 조정하는 방법의 필요성을 가진다. 또한, 게임 시나리오의 결과에 따라 게임 객체들의 행동 애니메이션을 제어하기 위한 개념들도 필요하다. 사실적 게임 시뮬레이션을 생성하기 위해 시스템은 게임 객체들의 상호작용을 디자인 할 수 있는 구조를 포함해야 한다. 본 논문에서 게임 시나리오상에 게임 객체들의 상호작용 설계를 위해 동적 제어를 디자인하는 기법을 소개한다. 이 방법을 위해 특정 규칙을 이용한 의사결정이 가능한 지능적 에이전트 기반 구조로써 게임 에이전트 시스템을 제안한다. 게임 에이전트 시스템은 환경 데이터 처리, 게임 객체 시뮬레이션, 게임 객체들간의 상호작용 제어, 게임 객체들의 다양한 상호 관계를 정의할수 있는 시각 저작 인터페이스를 제공하기 위해 이용되어진다. 이들 기술들은 게임 객체의 자율성과 연관된 충돌 회피 기법 등을 처리한다. 또한, 장면의 변경으로부터 게임 객체들의 일관된 의사 결정력을 가능하게 한다. 본 논문에서는 규칙기반 행동 제어가 게임 객체의 시뮬레이션을 안내하기 위해 디자인되어졌다. 시각적 요소들로 구성된 에이전트 상태 결정 네트워크는 정보전달과 게임 객체들 사이의 현상태를 추론할 수 있다. 이들 기법들은 실시간으로 게임 객체들간의 동작 상태 변이를 체크하고 모니터링 할 수 있다. 마지막으로 간단한 사례 연구 예와 함께 제어 기법의 타당성을 제시한다.

실시간 얼굴 검출을 위한 Cascade CNN의 CPU-FPGA 구조 연구 (Cascade CNN with CPU-FPGA Architecture for Real-time Face Detection)

  • 남광민;정용진
    • 전기전자학회논문지
    • /
    • 제21권4호
    • /
    • pp.388-396
    • /
    • 2017
  • 얼굴 검출에는 다양한 포즈, 빛의 세기, 얼굴이 가려지는 현상 등의 많은 변수가 존재하므로, 높은 성능의 검출 시스템이 요구된다. 이에 영상 분류에 뛰어난 Convolutional Neural Network (CNN)이 적절하나, CNN의 많은 연산은 고성능 하드웨어 자원을 필요로한다. 그러나 얼굴 검출을 위한 소형, 모바일 시스템의 개발에는 저가의 저전력 환경이 필수적이고, 이를 위해 본 논문에서는 소형의 FPGA를 타겟으로, 얼굴 검출에 적절한 3-Stage Cascade CNN 구조를 기반으로하는 CPU-FPGA 통합 시스템을 설계 구현한다. 가속을 위해 알고리즘 단계에서 Adaptive Region of Interest (ROI)를 적용했으며, Adaptive ROI는 이전 프레임에 검출된 얼굴 영역 정보를 활용하여 CNN이 동작해야 할 횟수를 줄인다. CNN 연산 자체를 가속하기 위해서는 FPGA Accelerator를 이용한다. 가속기는 Bottleneck에 해당하는 Convolution 연산의 가속을 위해 FPGA 상에 다수의 FeatureMap을 한번에 읽어오고, Multiply-Accumulate (MAC) 연산을 병렬로 수행한다. 본 시스템은 Terasic사의 DE1-SoC 보드에서 ARM Cortex A-9와 Cyclone V FPGA를 이용하여 구현되었으며, HD ($1280{\times}720$)급 입력영상에 대해 30FPS로 실시간 동작하였다. CPU-FPGA 통합 시스템은 CPU만을 이용한 시스템 대비 8.5배의 전력 효율성을 보였다.

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

  • 서상원;임우택;정영호;이태진;김휘용
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.855-865
    • /
    • 2018
  • 음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.

증강현실 시각화를 위해 K-최근접 이웃을 사용한 BIM 메쉬 경량화 알고리즘 (BIM Mesh Optimization Algorithm Using K-Nearest Neighbors for Augmented Reality Visualization)

  • 빠 빠 윈 아웅;이동환;박주영;조민건;박승희
    • 대한토목학회논문집
    • /
    • 제42권2호
    • /
    • pp.249-256
    • /
    • 2022
  • 최근 BIM (Building Information Modeling)과 AR (Augmented Reality)을 결합한 실시간 시각화 기술이 건설관리 의사 결정 및 처리 효율성을 높이는 데 도움이 된다는 것을 보여주기 위한 다양한 연구가 활발히 진행되고 있다. 그러나, 대용량 BIM 데이터는 AR에 적용할 경우 데이터 전송 문제, 이미지 단절, 영상 끊김 등과 같은 다양한 문제가 발생함으로 3차원(3D) 모델의 메쉬 최적화를 통해 시각화의 효율성을 향상시켜야 한다. 대부분의 기존 메쉬 경량화 방법은 복잡하고 경계가 많은 3D 모델의 메쉬를 적절하게 처리할 수 없다. 이에 본 연구에서는 고성능 AR 시각화를 위해 BIM 데이터를 재구성하기 위한 k-최근접이웃(KNN) 분류 프레임워크 기반 메쉬 경량화 알고리즘을 제안하였다. 제안 알고리즘은 선정된 BIM 모델을 삼각형 중심 개념 기반의 Unity C# 코드로 경량화하였고 모델의 데이터 세트를 활용하여 정점 사이의 거리를 정의할 수 있는 KNN로 분류되었다. 그 결과 전체 모델과 각 구조의 경량화 메쉬 점 및 삼각형 개수가 각각 약 56 % 및 약 42 % 감소됨을 확인할 수 있었다. 결과적으로, 원본 모델과 비교했을 때 경량화한 모델은 시각적인 요소 및 정보 손실이 없었고, 따라서, AR 기기 활용 시 고성능 시각화를 향상시킬 수 있을 것으로 기대된다.

강제동원 구술자료의 관리와 활용 -일제강점하강제동원피해진상규명위원회 소장 구술자료를 중심으로- (Management and Use of Oral History Archives on Forced Mobilization -Centering on oral history archives collected by the Truth Commission on Forced Mobilization under the Japanese Imperialism Republic of Korea-)

  • 권미현
    • 기록학연구
    • /
    • 제16호
    • /
    • pp.303-339
    • /
    • 2007
  • '일제강점하 강제동원 피해'라 함은 만주사변 이후 태평양전쟁에 이르는 시기에 일제에 의하여 강제동원 되어 군인 군속 노무자 위안부 등의 생활을 강요당한 자가 입은 생명 신체 재산 등의 피해를 말한다. 강제동원 피해 역사를 복원하기 위한 노력이 피해당사자, 유족, 시민단체, 학계 등에서 이루어져왔고, 그 결과 2004년 3일 5일 ${\ll}$일제강점하 강제동원피해 진상규명등에 관한 특별법${\gg}$ (2007년 5월 17일 일부 개정)이 제정 공포되었다. 이를 근거로 2004년 11월 10일 국무총리 소속으로 일제강점하 강제동원피해진상규명위원회(이하 강제동원위원회)가 발족하였고, 2005년 2월 1일부터 일제강점하 강제동원 피해의 진상을 규명하여 역사적 진실을 밝히는 것을 목적으로 업무를 수행하고 있다. 주요 업무는 강제동원 피해신고접수 및 피해신고조사(피해자 및 유족 심사 결정), 진상조사신청접수 및 진상조사, 진상조사 및 피해판정 불능에 관한 사항, 피해판정에 따른 호적정정, 강제동원 관련 국내외 자료수집 분석 및 보고서 작성, 유해발굴 및 수습 봉환, 사료관 및 추도공간 조성사업 등이다. 강제동원위원회는 피해조사 및 진상조사 업무를 위해 다양한 기록을 발굴 수집해 오고 있다. 여타 피해의 역사가 그러하듯이 이미 공개되었거나 새롭게 발굴되는 기록은 강제동원의 다양한 역사상을 확인하기 어려울 만큼 그 양이나 질에 면에서 부족하다. 피해의 역사에서 피해당사자의 이야기는 기록의 부재를 메우기도 하고, 기록 이상의 근거적 가치를 갖기도 한다. 강제동원위원회는 피해생존자와의 구술면담을 통해 다수의 구술자료를 생산하였고 조사업무에 활용하며 체계적인 관리방법을 토대로 관리하고 대중적인 활용까지 꾀하고 있다. 강제동원위원회의 구술자료는 생산 당시부터 철저한 기획에 의해 이루어졌고, 생산단계부터 관리와 활용의 편의성을 염두에 두고 디지털매체의 생산을 유도했다. 또한 조사업무 과정에서 생산되는 구술자료의 한계를 극복하기 위해 수차례 면담자 교육을 실시하고, 면담자로 하여금 구술당시의 상황을 면담일지로 남기도록 했다. 강제동원위원회는 소장 기록을 관리하는 별도의 기록관리시스템을 갖고 있지 않다. 디지털 아카이브는 피해 진상 관리시스템과 전자결재시스템을 통해 생산되어 관리되지 않는 생산 수집 기증 기록을 등록 검색하는 역할을 한다. 구술자료는 디지털 아카이브에 등록이 되어, 실물과 중복 보존되고 있다. 구술자료는 등록과 동시에 분류, 기술행위가 이루어지고 구술자료의 관리 아이디인 등록번호, 분류번호, 비치번호 등을 부여받게 된다. 강제동원위원회는 구술자료의 적극적인 활용을 위하여 구술기록집의 발간을 지속적으로 해오고 있고, 영상물 등의 제작을 계획하고 있다. 강제동원위원회의 구술자료는 정부차원의 조사 업무 과정에서 생산된 것이라는 한계, 예산부족이나 기록관리시스템 등의 부재 등을 넘어서 한시조직으로서 가능한 적극적인 방법으로 생산 관리 활용되고 있다. 축적된 구술자료는 향후 특별법에 규정되어 있는 대로 사료관 등이 건립된다면 대중 이용자들을 위해 더 체계적으로 관리 활용될 것이다.

적대적 생성 모델을 활용한 사용자 행위 이상 탐지 방법 (Anomaly Detection for User Action with Generative Adversarial Networks)

  • 최남웅;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.43-62
    • /
    • 2019
  • 한때, 이상 탐지 분야는 특정 데이터로부터 도출한 기초 통계량을 기반으로 이상 유무를 판단하는 방법이 지배적이었다. 이와 같은 방법론이 가능했던 이유는 과거엔 데이터의 차원이 단순하여 고전적 통계 방법이 효과적으로 작용할 수 있었기 때문이다. 하지만 빅데이터 시대에 접어들며 데이터의 속성이 복잡하게 변화함에 따라 더는 기존의 방식으로 산업 전반에 발생하는 데이터를 정확하게 분석, 예측하기 어렵게 되었다. 따라서 기계 학습 방법을 접목한 SVM, Decision Tree와 같은 모형을 활용하게 되었다. 하지만 지도 학습 기반의 모형은 훈련 데이터의 이상과 정상의 클래스 수가 비슷할 때만 테스트 과정에서 정확한 예측을 할 수 있다는 특수성이 있고 산업에서 생성되는 데이터는 대부분 정답 클래스가 불균형하기에 지도 학습 모형을 적용할 경우, 항상 예측되는 결과의 타당성이 부족하다는 문제점이 있다. 이러한 단점을 극복하고자 현재는 클래스 분포에 영향을 받지 않는 비지도 학습 기반의 모델을 바탕으로 이상 탐지 모형을 구성하여 실제 산업에 적용하기 위해 시행착오를 거치고 있다. 본 연구는 이러한 추세에 발맞춰 적대적 생성 신경망을 활용하여 이상 탐지하는 방법을 제안하고자 한다. 시퀀스 데이터를 학습시키기 위해 적대적 생성 신경망의 구조를 LSTM으로 구성하고 생성자의 LSTM은 2개의 층으로 각각 32차원과 64차원의 은닉유닛으로 구성, 판별자의 LSTM은 64차원의 은닉유닛으로 구성된 1개의 층을 사용하였다. 기존 시퀀스 데이터의 이상 탐지 논문에서는 이상 점수를 도출하는 과정에서 판별자가 실제데이터일 확률의 엔트로피 값을 사용하지만 본 논문에서는 자질 매칭 기법을 활용한 함수로 변경하여 이상 점수를 도출하였다. 또한, 잠재 변수를 최적화하는 과정을 LSTM으로 구성하여 모델 성능을 향상시킬 수 있었다. 변형된 형태의 적대적 생성 모델은 오토인코더의 비해 모든 실험의 경우에서 정밀도가 우세하였고 정확도 측면에서는 대략 7% 정도 높음을 확인할 수 있었다.