• 제목/요약/키워드: 컴퓨터 비전 기술

검색결과 404건 처리시간 0.021초

컨볼루션 뉴럴 네트워크를 이용한 군중 행동 감지 (Crowd Behavior Detection using Convolutional Neural Network)

  • 와셈 울라;파트 우 민 울라;백성욱;이미영
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권6호
    • /
    • pp.7-14
    • /
    • 2019
  • 감시 영상에서 군중 행동의 자동 모니터링 및 감지는 보안, 안전 및 자산 보호와 같은 방대한 응용 프로그램으로 인해 컴퓨터 비전 분야에서 중요한 관심을 받고 있다. 또한 연구 커뮤니티에서 군중 분석 분야가 점차 증가하고 있다. 이를 위해서는 군중들의 행동을 감지하고 분석하는 것이 매우 필요하다. 본 논문에서는 스마트 시티에 설치된 감시 카메라의 비정상적인 활동을 감지하는 딥러닝 기반 방법을 제안하였다. 미세 조정된 VGG-16모델은 트레이닝된 공개적으로 사용 가능한 벤치마크 군중 데이터 셋을 실시간 스트리밍으로 테스트한다. CCTV카메라는 비디오 스트림을 캡쳐하는데, 비정상적인 활동이 감지되면 경보가 발생하여 추가 손실 전에 즉각적인 조치가 이루어지도록 가장 가까운 경찰서로 전송된다. 우리는 제안된 방법이 기존의 첨단 기술 보다 성능이 뛰어남을 실험으로 입증하였다.

(sLa-Camera-pRd)타입의 구동시간 단축 방법 (The Method to Reduce the Driving Time in (sLa-Camera-pRd) type)

  • 김순호;김치수
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.1-7
    • /
    • 2018
  • 미소칩을 PCB상에 실장하는 장비에서 그 칩을 이동해주는 역할은 겐트리가 하고 있다. 그런데 겐트리의 기계적 한계 때문에 생산성을 증가시키는 것은 쉽지 않다. 따라서 본 논문에서는 생산성을 높일 수 있는 방법을 소프트웨어적으로 해결하고자 한다. 이를 위해 겐트리의 이동 시간을 단축함으로써 생산성을 향상시킬 수 있는 방법을 제시한다. 먼저, 현재 사용하고 있는 방법(stop-motion)에 대해 총 이동 시간을 계산해 보았다. 그리고 본 논문에서 제시하는 이동 시간 단축 방법(moving-motion)에 대해서도 총 이동 시간을 계산해 보았다. 이 방법은 카메라 앞에서 멈추지 않고 부품 검사를 함으로써 이동 시간을 줄이는 것이다. 그 결과 본 논문에서 제시한 방법이 16%의 시간을 단축하였음을 보여주었다. 향후에는 다른 타입에 대해서도 시간 계산 방법을 연구하는 것이다.

Unity3D를 이용한 스트랩 다운 영상 추적기의 동역학 및 유도 법칙 알고리즘의 상호-시뮬레이션 방법에 관한 연구 (Study on Co-Simulation Method of Dynamics and Guidance Algorithms for Strap-Down Image Tracker Using Unity3D)

  • 마린미카엘;김태호;방효충;조한진;조영기;최용훈
    • 한국항공우주학회지
    • /
    • 제46권11호
    • /
    • pp.911-920
    • /
    • 2018
  • 본 연구에서는 스트랩 다운 영상 탐색기를 활용한 유도무기와 목표물 사이의 관측각을 효과적으로 추적할 수 있는 연구를 수행하였고 이를 시각적으로 시뮬레이션 가능한 테스트 베드를 구축하였다. 영상 정보를 이용하여 목표물 추적을 위한 Lucas Kanade의 Optical flow 알고리즘과 같은 희박 특징점 추적 알고리즘 구현 시 고성능의 특징점 분포를 유지시키는 법을 기술하였으며, 특징점 추적 문제를 특징점 관리의 개념으로 확장하여 연구하였다. 이를 구현하기 위해 Unity3D 엔진을 이용하여 시각 환경을 구성하고 OpenCV를 이용하여 영상 처리 시뮬레이션을 개발하였다. 상호-시뮬레이션을 위해 매틀랩(Matlab) 시뮬링크(Simulink)로 동적 시스템 모델링을 하였고, Unity3D를 이용한 시각 환경을 구성, OpenCV를 이용한 컴퓨터 비전 작업을 수행하였다.

깊이 영상 카메라로부터 획득된 3D 영상의 품질 향상 방법 (A method of improving the quality of 3D images acquired from RGB-depth camera)

  • 박병서;김동욱;서영호
    • 한국정보통신학회논문지
    • /
    • 제25권5호
    • /
    • pp.637-644
    • /
    • 2021
  • 일반적으로, 컴퓨터 비전, 로보틱스, 증강현실 분야에서 3차원 공간 및 3차원 객체 검출 및 인식기술의 중요성이 대두되고 있다. 특히, 마이크로소프트사의 키넥트(Microsoft Kinect) 방식을 사용하는 영상 센서를 통하여 RGB 영상과 깊이 영상을 실시간 획득하는 것이 가능해짐으로 인하여 객체 검출, 추적 및 인식 연구에 많은 변화를 가져오고 있다. 본 논문에서는 다시점 카메라 시스템 상에서의 깊이 기반(RGB-Depth) 카메라를 통해 획득된 영상을 처리하여 3D 복원 영상의 품질을 향상하는 방법을 제안한다. 본 논문에서는 컬러 영상으로부터 획득한 마스크 적용을 통해 객체 바깥쪽 잡음을 제거하는 방법과 객체 안쪽의 픽셀 간 깊이 정보 차이를 구하는 필터링 연산을 결합하여 적용하는 방법을 제시하였다. 각 실험 결과를 통해 제시한 방법이 효과적으로 잡음을 제거하여 3D 복원 영상의 품질을 향상할 수 있음을 확인하였다.

스마트 감시 애플리케이션을 위해 Deep CNN을 이용한 폭력인식 (Violence Recognition using Deep CNN for Smart Surveillance Applications)

  • 파튜 유 민 울라;아민 울라;칸 무함마드;이미영;백성욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권5호
    • /
    • pp.53-59
    • /
    • 2018
  • 최근 컴퓨터 비전 기술의 발전으로 스마트도시에서는 합리적인 정확도로 복잡한 동작을 인식할 수 있다. 이와는 대조적으로, 싸움과 칼에 관련된 사건과 같은 폭력적인 인식은 관심을 덜 이끌었다. 시각적인 감시 능력은 거리나 교도소에서의 싸움을 감지하는데 사용될 수 있다. 이 논문에서 우리는 감시 카메라에 대한 심층 학습 기반의 폭력 인식 방법을 제안했다. 컨볼루션 뉴럴 네트워크(CNN) 모델은 폭력 인식을 위한 싸움과 칼의 벤치마크 데이터 셋에 대해 훈련하고 세부적으로 조정된다. 비정상적인 이벤트가 감지되면 가장 가까운 경찰서로 경보를 보내는 즉각적인 조치를 취할 수 있다. 제안된 방법의 실험 결과는 99.21%의 정확도를 달성함으로써 다른 최첨단 CNN모델을 능가했다.

객체 인식 정확도 개선을 위한 이미지 초해상도 기술 (Image Super-Resolution for Improving Object Recognition Accuracy)

  • 이성진;김태준;이충헌;유석봉
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.774-784
    • /
    • 2021
  • 객체 검출 및 인식 과정은 컴퓨터비전 분야에서 매우 중요한 과업으로써, 관련 연구가 활발하게 진행되고 있다. 그러나 실제 객체 인식 과정에서는 학습된 이미지 데이터와 테스트 이미지 데이터간 해상도 차이로 인하여 인식기의 정확도 성능이 저하되는 문제가 종종 발생한다. 이를 해결하기 위해 본 논문에서는 객체 인식 정확도 향상을 위한 이미지 초해상도 기법을 제안하여 객체 인식 및 초해상도 통합 프레임워크를 설계하고 개발하였다. 세부적으로는 11,231장의 차량 번호판 훈련용 이미지를 웹 크롤링, 인조데이터 생성 등을 통해 자체적으로 구축하고, 이를 활용하여 이미지 좌우 반전에 강인하도록 목적함수를 정의하여 이미지 초해상도 인공 신경망을 훈련시켰다. 제안 방법의 성능을 검증하기 위해 훈련된 이미지 초해상도 및 번호 인식기 1,999장의 테스트 이미지에 실험하였고, 이를 통해 제안한 초해상도 기법이 문자 인식 정확도 개선 효과가 있음을 확인하였다.

Balanced Attention Mechanism을 활용한 CG/VR 영상의 초해상화 (CG/VR Image Super-Resolution Using Balanced Attention Mechanism)

  • 김소원;박한훈
    • 융합신호처리학회논문지
    • /
    • 제22권4호
    • /
    • pp.156-163
    • /
    • 2021
  • 어텐션(Attention) 메커니즘은 딥러닝 기술을 활용한 다양한 컴퓨터 비전 시스템에서 활용되고 있으며, 초해상화(Super-resolution)를 위한 딥러닝 모델에도 어텐션 메커니즘을 적용하고 있다. 하지만 어텐션 메커니즘이 적용된 대부분의 초해상화 기법들은 Real 영상의 초해상화에만 초점을 맞추어서 연구되어, 어텐션 메커니즘을 적용한 초해상화가 CG나 VR 영상 초해상화에도 유효한지는 알기 어렵다. 본 논문에서는 최근에 제안된 어텐션 메커니즘 모듈인 BAM(Balanced Attention Mechanism) 모듈을 12개의 초해상화 딥러닝 모델에 적용한 후, CG나 VR 영상에서도 성능 향상 효과를 보이는지 확인하는 실험을 진행하였다. 실험 결과, BAM 모듈은 제한적으로 CG나 VR 영상의 초해상화 성능 향상에 기여하였으며, 데이터 특징과 크기, 그리고 네트워크 종류에 따라 성능 향상도가 달라진다는 것을 확인할 수 있었다.

합성곱 신경망을 이용한 손상된 볼트의 이미지 분류 (Image Classification of Damaged Bolts using Convolution Neural Networks)

  • Lee, Soo-Byoung;Lee, Seok-Soon
    • 항공우주시스템공학회지
    • /
    • 제16권4호
    • /
    • pp.109-115
    • /
    • 2022
  • 딥러닝 기법과 컴퓨터 비전 기술을 융합한 합성곱 신경망 알고리즘은 고성능 컴퓨팅 시스템을 기반으로 이미지 데이터의 분류를 가용하게 한다. 본 논문에서는 합성곱 신경망 알고리즘을 대표적인 딥러닝 프레임워크인 텐서플로와 학습 기법을 이용하여 구현하고 이미지 분류 문제에 적용한다. 모델의 지도학습에 필요한 데이터는 동일 종류의 볼트를 이용하여 나사산이 정상인 볼트와 나사산이 손상된 볼트로 구분하여 이미지를 생성하였다. 소량의 이미지 데이터를 이용한 학습 모델은 좋은 성능으로 볼트의 손상을 탐지하였다. 그리고 모델의 내부 구성에 따른 학습 성능을 비교하기 위해 합성곱 신경망 내 컨볼루션 레이어의 개수를 변경하고 과적합 회피기법을 선택 적용하여 이미지 분류 성능을 확인하였다.

딥러닝 알고리즘 기반 교통법규 위반 공익신고 영상 분석 시스템 (Analysis System for Public Interest Report Video of Traffic Law Violation based on Deep Learning Algorithms)

  • 최민성;문미경
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.63-70
    • /
    • 2023
  • 고화질 블랙박스의 확산과 '스마트 국민제보', '안전신문고' 등 모바일 애플리케이션의 도입에 따른 영향으로 교통법규 위반 공익신고가 급증하였으며, 이로 인해 이를 처리할 담당 경찰 인력은 부족한 상황이 되었다. 본 논문에서는 교통법규 위반 공익신고 영상 중, 가장 많은 비중을 차지하는 차선위반에 대해 딥러닝 알고리즘을 활용하여 자동 검출할 수 있는 시스템의 개발내용에 관해 기술한다. 본 연구에서는 YOLO 모델과 Lanenet 모델을 사용하여 차량과 실선 객체를 인식하고 deep sort 알고리즘을 사용하여 객체를 개별로 추적하는 방법, 그리고 차량 객체의 바운딩 박스와 실선 객체의 범위가 겹치는 부분을 인식하여 진로변경 위반을 검출하는 방법을 제안한다. 본 시스템을 통해 신고된 영상에 대해 교통법규 위반 여부를 자동 분석해줌으로써 담당 경찰 인력 부족난을 해소할 수 있을 것으로 기대한다.

박물관 넘어 도망친 화가들 (Painters who Climbed Out the Museum and Disappeared)

  • 김현지;송지언;여화선;강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.358-360
    • /
    • 2020
  • 본 팀은 웹캠으로 촬영한 영상에서 원하는 물체를 선택하여 텍스처를 선택한 이미지의 스타일로 변환하는 프로젝트를 수행했다. 영상을 세그멘테이션하고 원하는 물체만을 원하는 텍스처로 변환하여 최종 아웃풋을 얻는다. 제안하는 네트워크는 물체를 다양한 스타일로 바꾸는 것이 가능한데, 이 중에서 이미지에 명화의 화풍을 입히는 것을 중점으로 하여 데모를 구현했다. 빠른 속도로 네트워크를 실행하기 위해 기존 연구들에 비디오 처리의 관점을 접목했다. 여러 프레임을 묶어 옵티컬 플로우를 생성하고, 첫 번째 프레임을 인스턴스 세그멘테이션한 후 마스크를 추출했다. 이후 마스크 영역만 뽑아낸 이미지를 새로운 입력으로 하여 스타일 트랜스퍼를 거치고, 이 첫번째 프레임과 나머지 프레임들의 옵티컬 플로우로 나머지 프레임들의 세그멘테이션과 스타일 트랜스퍼를 예측하여 다시 비디오 프레임으로 만들어 주었다. 본 알고리즘은 옵티컬 플로우 설정으로 네트워크의 계산량을 줄이며 속도를 개선했다. 빠른 데이터 처리로 사용자가 원하는 물체의 텍스쳐가 바뀔 수 있게 되었고, 이는 현실 세계가 실제로 바뀐 듯한 느낌을 들게 한다. 또한, 컴퓨터 비전에서 활발하게 연구되었던 분야를 AR로 끌어와 두 분야의 융합 가능성을 열었다. 현재 코로나의 영향으로 집에서 취미생활을 즐기는 인구가 많아졌다. 본 연구를 통해 많은 사람에게 집에서 쉽게 명화의 감성을 즐기고 느낄 수 있는 양질의 콘텐츠를 제공해주려 한다. 또한, 박물관과 미술관 등의 기관에서도 이 기술이 활용될 수 있다. 명화를 느낄 수 있는 다양한 콘텐츠를 이용하여 박물관이나 미술관의 홍보 효과도 기대할 수 있다.

  • PDF