• 제목/요약/키워드: 객체기반 영상분류

검색결과 215건 처리시간 0.027초

SoC 환경에서 TIDL NPU를 활용한 딥러닝 기반 도로 영상 인식 기술 (Road Image Recognition Technology based on Deep Learning Using TIDL NPU in SoC Enviroment)

  • 신윤선;서주현;이민영;김인중
    • 스마트미디어저널
    • /
    • 제11권11호
    • /
    • pp.25-31
    • /
    • 2022
  • 자율주행 자동차에서 딥러닝 기반 영상처리는 매우 중요하다. 자동차를 비롯한 SoC(System on Chip) 환경에서 실시간으로 도로 영상을 처리하기 위해서는 영상처리 모델을 딥러닝 연산에 특화된 NPU(Neural Processing Unit) 상에서 실행해야 한다. 본 연구에서는 GPU 서버 환경에서 개발된 7종의 오픈소스 딥러닝 영상처리 모델들을 TIDL (Texas Instrument Deep Learning) NPU 환경에 이식하였다. 성능 평가와 시각화를 통해 본 연구에서 이식한 모델들이 SoC 가상환경에서 정상 작동함을 확인하였다. 본 논문은 NPU 환경의 제약으로 인해 이식 과정에 발생한 문제들과 그 해결 방법을 소개함으로써 딥러닝 모델을 SoC 환경에 이식하려는 개발자 및 연구자가 참고할 만한 사례를 제시한다.

임펄스 잡음 환경에서 비잡음 화소의 패턴을 사용한 영상복원 (Image Restoration using Pattern of Non-noise Pixels in Impulse Noise Environments)

  • 천봉원;김만고;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.407-409
    • /
    • 2021
  • 4차 산업혁명의 영향으로 산업현장에 인공지능 및 자동화와 같은 다양한 기술들이 접목되고 있으며, 이에 따라 데이터처리의 중요성이 높아지고 있다. 디지털 영상은 다양한 원인으로 잡음이 발생할 수 있으며, 영상인식 및 분류, 객체추적과 같은 다양한 시스템에 영향을 미칠 수 있다. 이러한 단점을 보완하기 위해 비잡음 화소의 패턴 정보에 기반한 영상복원 알고리즘을 제안한다. 제안한 알고리즘은 필터링 마스크 내부의 비잡음 화소의 분포에 따라 보간법 적용이 가능한 패턴, 영역 분할에 기반한 패턴, 무작위로 배치된 화소 패턴으로 구분하여 필터링 과정을 스위칭하였으며, 임펄스 잡음에 훼손된 영상에서 디테일한 정보를 보존하며 영상을 복원한다. 제안한 알고리즘은 기존 임펄스 잡음 제거 알고리즘에 비해 우수한 성능을 보였다.

  • PDF

MPEG-4 시스템 기반의 다시점 전환 시스템 구조 및 재생기 구현 (Multi-View Point switch System Structure & Implementation of Video player in MPEG-4 based)

  • 이준철;이정원;장용석;김승호
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.80-93
    • /
    • 2007
  • 본 논문은 현재 MPEG-4의 3차원 오디오/비디오(3-Dimensional Audio Video, 3DAV) 기술표준에서 다시점 비디오(Multi-view video)서비스를 제공할 수 있는 객체기술자(Object Descriptor)와 기초스트림기술자(Elementary Stream Descriptor)의 구조를 제안한다. 기존의 MPEG-4 시스템 상에서 확장영역을 사용하여 다시점 동영상 서비스를 제공 할 수 있는 객체기술자와 기초스트림의 구조를 각각 정의 하여 분류한 후 각 경우에 대해 분석한다. 기존 시스템의 확장만으로 송수신측과 연계되어 상관관계가 고려된 다시점 비디오 서비스 제공하는 것이 부적합하다는 것을 보인다. 그리고 다시점 영상 전송시 수신측에서 각 시점간의 상관관계를 고려하여 시점 스위칭을 할 수 있는 새로운 객체 기술자를 추가한 구조를 제안한다. 이를 통하여 다시점 비디오 서비스에서 사용자 요구에 따른 시점 전환을 가능하게 하면서, 필요한 시점에 대한 정보만을 전송해서 수신측에 부하를 줄일 수 있다.

딥러닝 기반 불량노면 객체 인식 모델 개발 (Development of an abnormal road object recognition model based on deep learning)

  • 최미형;우제승;홍순기;박준모
    • 융합신호처리학회논문지
    • /
    • 제22권4호
    • /
    • pp.149-155
    • /
    • 2021
  • 본 연구에서는 전동 이동기기를 이용하는 교통약자의 이동을 제한하는 노면 불량 요소를 딥러닝을 이용해 자동 검출하는 불량 노면객체 인식모델을 개발하고자 한다. 이를 위하여 부산시 관내 5개 지역에서 실제 전동 이동 보조 장치가 이동할 것으로 예상되는 보행로, 주행로를 대상으로 하여 노면 정보를 수집하였으며 이때 도로 정보 수집은 데이터 수집을 보다 용이하게 하기 위하여 소형 차량을 이용하였다. 데이터는 노면과 주변을 그 주변을 구성하는 객체로 구분하여 영상을 수집하였다. 수집된 데이터로부터 교통약자의 이동을 저해하는 정도에 따라 분류하여 보도블록의 파손등급 검출과 같은 일련의 인식 항목을 정의하였고, YOLOv5 딥러닝 알고리즘을 해당 데이터에 적용하여 실시간으로 객체를 인식하는 불량노면 객체 인식 딥러닝 모델을 구현하였다. 연구의 최종단계에서 실제 주행을 통해 객체 단위로 분리 수집된 영상 데이터의 가공, 정제 및 어노테이션 과정을 수행한 후 모델 학습과 검증을 거쳐 불량노면객체를 자동으로 검출하는 딥러닝 모델의 성능 검증 과정을 진행하였다.

중계 영상을 활용한 야구 경기 분석 방법 (Baseball Game Analysis Method Using Broadcast Video)

  • 손종웅;이명진
    • 방송공학회논문지
    • /
    • 제25권4호
    • /
    • pp.576-586
    • /
    • 2020
  • 레이더나 라이더 센서를 활용한 야구 경기 분석은 많은 비용이 요구된다. 본 논문에서는 중계 비디오에서 피치 샷과 타구 샷을 검출하고, 카메라의 움직임 기반 타구 궤적 생성 알고리즘을 제안한다. 제안하는 알고리즘은 객체 검출과 옵티컬 플로우 기반 피치 샷과 타구 샷 검출 이후, 프레임 간 변환 관계를 통해 프레임 내 타구 위치와 타구 궤적을 계산한다. 제안 방법은 KBO 중계 영상 시퀀스 3개에 대해 성능을 평가하였고 피치 샷과 타구 샷 검출 정확도와 검출률은 89-95[%] 이내의 성능을 보였으며, 평균 타구 위치 거리차이는 13.6[m], 방향 차이 7.5°, 파울 분류 정확도 98.6%의 성능을 보였다.

딥러닝 기반의 Multi Scale Attention을 적용한 개선된 Pyramid Scene Parsing Network (Modified Pyramid Scene Parsing Network with Deep Learning based Multi Scale Attention)

  • 김준혁;이상훈;한현호
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.45-51
    • /
    • 2021
  • 딥러닝의 발전으로 인하여 의미론적 분할 방법은 다양한 분야에서 연구되고 있다. 의료 영상 분석과 같이 정확성을 요구하는 분야에서 분할 정확도가 떨어지는 문제가 있다. 본 논문은 의미론적 분할 시 특징 손실을 최소화하기 위해 딥러닝 기반 분할 방법인 PSPNet을 개선하였다. 기존 딥러닝 기반의 분할 방법은 특징 추출 및 압축 과정에서 해상도가 낮아져 객체에 대한 특징 손실이 발생한다. 이러한 손실로 윤곽선이나 객체 내부 정보에 손실이 발생하여 객체 분류 시 정확도가 낮아지는 문제가 있다. 이러한 문제를 해결하기 위해 의미론적 분할 모델인 PSPNet을 개선하였다. 기존 PSPNet에 제안하는 multi scale attention을 추가하여 객체의 특징 손실을 방지하였다. 기존 PPM 모듈에 attention 방법을 적용하여 특징 정제 과정을 수행하였다. 불필요한 특징 정보를 억제함으로써 윤곽선 및 질감 정보가 개선되었다. 제안하는 방법은 Cityscapes 데이터 셋으로 학습하였으며, 정량적 평가를 위해 분할 지표인 MIoU를 사용하였다. 실험을 통해 기존 PSPNet 대비 분할 정확도가 약 1.5% 향상되었다.

3차원 모델링을 위한 라이다 데이터로부터 특징점 추출 방법 (Key Point Extraction from LiDAR Data for 3D Modeling)

  • 이대건;이동천
    • 한국측량학회지
    • /
    • 제34권5호
    • /
    • pp.479-493
    • /
    • 2016
  • 항공 레이저 스캐너(ALS)로부터 획득한 라이다(LiDAR) 데이터는 지형지물을 모델링하기 위해서 널리 사용되고 있으며, 특히 정밀 3차원 건축물 및 도시모델, 엄밀정사영상 등 고품질의 공간정보를 효율적으로 구축하기 위하여 라이다 데이터를 이용한 3차원 모델링에 관한 연구가 지속적으로 수행되고 있다. 불규칙적으로 분포된 고밀도의 라이다 데이터로부터 객체를 3차원으로 모델링하기 위해서는 시스템 캘리브레이션, 노이즈 제거 및 지면과 객체를 분리하기 위한 필터링, 객체의 종류 및 특성에 따른 데이터 분류, 기하학적 특성 및 동질성에 기반한 데이터 분할, 분할면의 군집화 및 묘사, 분할면의 재구성과 조합에 의한 모델링, 품질검사 등 일련의 복잡한 과정들이 수반된다. 라이다 데이터를 이용한 많은 모델링 방법들은 데이터 분할 과정을 포함하고 있지만, 본 논문에서는 라이다 데이터를 분할하지 않고 객체를 구성하는 중요하고 대표적인 특징점들을 추출하여 건물 모델링에 활용하는 방법을 제안하고 있다. 복잡하고 다양한 건물 형태를 시뮬레이션한 데이터와 실제 데이터에 적용하여 제안한 방법의 타당성 및 정확도를 검증하였다.

공간패턴을 이용한 자동 비닐하우스 추출방법 (Automated Vinyl Green House Identification Method Using Spatial Pattern in High Spatial Resolution Imagery)

  • 이종열;김병선
    • 대한원격탐사학회지
    • /
    • 제24권2호
    • /
    • pp.117-124
    • /
    • 2008
  • 지형지물은 각각의 특징적 요인을 내포하고 있다. 이 특징적 요인들은, 공간해상도에 따라 정도의 차이가 있겠지만, 수집된 위성영상에도 반영된다. 이러한 요인들 중에서는 영상분류에 활용될 경우 영상 분류의 정확도를 높혀주고, 때로는 이것이 거의 물체인식의 수준까지 기여할 수 있는 것들이 있다. 이 연구에서는 텍스춰 및 지형지물의 배열에 있어서 특징적 현상을 보이는 비닐하우스를 대상으로 spatial auto-corelation 개념을 기반으로 자동적으로 이를 인지하는 방법을 개발하였다. 사용된 알고리즘은 디지타이징과 같은 사람의 직접적인 개입이 없이 자동화된 방법으로 비닐하우스의 특정한 패턴이 반복적으로 나타나는 것을 감지할 수 있도록 개발되었다. 패틴의 인식에 더하여 비닐하우스의 기하학적 모양을 고려하는 방법도 도입하였다. 그럼으로써 비닐하우스의 추출에 단순히 화소 단위의 분석이 아닌 보다 객체지향적인 방법으로 비닐하우스를 추출하도록 하였다. 개발된 방법을 제주지역의 IKONOS에 적용시켜 본 결과 연구대상지역내의 비닐하우스가 매우 정확하게 적출되었다.

화재 탐지 영역의 이미지와 동영상 인식 사이 인공지능 모델 성능 비교 연구 (A Comparative Study on Artificial in Intelligence Model Performance between Image and Video Recognition in the Fire Detection Area)

  • 이정록;이대웅;정서현;정상
    • 한국재난정보학회 논문집
    • /
    • 제19권4호
    • /
    • pp.968-975
    • /
    • 2023
  • 연구목적: 화재 탐지시 불꽃/연기의 오탐지율이 높은 것을 확인하고 오탐지율을 낮추기 위해 화재 상황을 인식하여 분류하는 방법과 데이터셋을 제안하고자 한다. 연구방법: 동영상을 학습데이터로 활용하여 화재 상황의 특징을 추출하여 분류모델에 적용하고, 평가는 한국정보화진흥원(NIA)에서 진행하는 화재 데이터셋을 이용하여 Yolov8, Slowfast의 모델 성능을 비교 및 분석하였다. 연구결과: YOLO는 배경의 영향에 따라 탐지 성능이 민감하게 변화하며, 화재의 규모가 너무 크거나 작을 때에도 화재를 제대로 감지하지 못했다. SlowFast는 동영상의 시간 축을 같이 학습하기 때문에 비정형 객체에 대해 주변이 흐리거나 밝아 형상을 명확하게 유추할 수 없는 상황에서도 우수하게 화재를 탐지하는 것을 확인했다. 결론: 화재 탐지율은 이미지 데이터 방식보다는 동영상 기반의 인공지능 인식(Detection) 모델을 활용했을 때 더 적절했음을 확인했다.

예측 후보 영역에서의 지역적 대비 차 계산 방법을 활용한 실시간 소형 표적 검출 (Real-time Small Target Detection using Local Contrast Difference Measure at Predictive Candidate Region)

  • 반종희;왕지현;이동화;유준혁;유성은
    • 한국산업정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.1-13
    • /
    • 2017
  • 본 논문에서는 낮은 SNR을 가지는 적외선 영상에서 강인한 소형 표적 검출을 위해 모폴로지 차 연산을 수행하여 표적 후보 영역을 찾고 화소 라벨링을 통해 후보 영역의 위치를 찾는다. 기존의 모폴로지 연산 기반의 표적 검출 방법들은 적외선 영상에 존재하는 클러터에 취약하다는 단점으로 인해 검출 정확도가 낮다. 이러한 문제를 해결하기 위해 본 논문에서는 후보 영역에서 표적과 배경 잡음을 분류하기 위해 Moravec 알고리즘과 LCM(Local Contrast Measure) 알고리즘을 결합함으로써 표적 향상과 배경 잡음 억제를 동시에 달성한다. 또한, 제안하는 알고리즘은 기존에 실시간 표적 검출을 위해 개발되었던 모폴로지 연산과 가우시안 거리 함수를 이용한 표적 검출 방법의 단일 객체에 제한적인 검출 문제를 해결하여 복수 객체를 효율적으로 검출할 수 있다.