• Title/Summary/Keyword: RGB 영상

Search Result 723, Processing Time 0.023 seconds

Object Detection and Performance Comparison based on RGB image and thermal infrared radiation (RGB 영상과 열 적외선 영상 기반 객체 탐지 알고리즘 수행 및 성능 비교)

  • Kim, Shin;Lee, Yegi;Yoon, Kyoungro;Lim, Hanshin;Lee, Hee Kyoung;Choo, Hyon-gon;Seo, Jeongil
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.176-179
    • /
    • 2020
  • 현재 대부분의 객체 탐지 알고리즘은 RGB 영상을 기반으로 개발되고 있다. 하지만 안개가 끼거나 비가 오는 날 또는 방중에 촬영한 RGB 영상은 흐리거나 잘 보이지 않아 높지 않은 객체 탐지 결과를 보여줄 수 있다. 열 적외선 영상은 열 센서로 인해 만들어지든 영상으로 RGB 영상에 비해 기상조건이나 촬영 시간대에 상관없이 취득 될 수 있다. 본 논문에서는 RGB 영상과 열 적외선 영상을 기반으로 객체 탐지 알고리즘을 수행하고 각 영상에 따른 객체 탐지 성능을 비교한다. 야간에 취득한 RGB 영상과 열 적외선 영상에 객체 탐지를 수행하였으며, 열 적외선 영상 기반 결과가 RGB 영상 기반일 때 보다 더 높은 정확도를 보여주었다. 추가적으로 밤 시간대의 RGB 영상과 열 적외선 영상을 선정하여 객체 탐지 네트워크를 튜닝하였으며, fine-tuned 네트워크를 이용하여 객체 탐지한 실험 결과 역시 열 적외선 영상이 RGB 영상보다 더 높은 객체 탐지 정확도를 보이는 것을 확인할 수 있었다.

  • PDF

Performance Analysis of Object Detection Neural Network According to Compression Ratio of RGB and IR Images (RGB와 IR 영상의 압축률에 따른 객체 탐지 신경망 성능 분석)

  • Lee, Yegi;Kim, Shin;Lim, Hanshin;Lee, Hee Kyung;Choo, Hyon-Gon;Seo, Jeongil;Yoon, Kyoungro
    • Journal of Broadcast Engineering
    • /
    • v.26 no.2
    • /
    • pp.155-166
    • /
    • 2021
  • Most object detection algorithms are studied based on RGB images. Because the RGB cameras are capturing images based on light, however, the object detection performance is poor when the light condition is not good, e.g., at night or foggy days. On the other hand, high-quality infrared(IR) images regardless of weather condition and light can be acquired because IR images are captured by an IR sensor that makes images with heat information. In this paper, we performed the object detection algorithm based on the compression ratio in RGB and IR images to show the detection capabilities. We selected RGB and IR images that were taken at night from the Free FLIR Thermal dataset for the ADAS(Advanced Driver Assistance Systems) research. We used the pre-trained object detection network for RGB images and a fine-tuned network that is tuned based on night RGB and IR images. Experimental results show that higher object detection performance can be acquired using IR images than using RGB images in both networks.

An Scene Analysis is for Soccer Game Video using TV Broadcasting Pattern (방송 영상 패턴을 이용한 축구 경기 장면 분석)

  • 최영수;유채곤;이성환;황치정
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.490-492
    • /
    • 2000
  • 본 논문에서는 방송영상 특성을 이용한 축구 경기 장면 분석을 제안한다. 동영상의 프레임들을 분할하기 위해서는 급격한 장면 변화나 화면의 색상과 같은 화면의 형식적인 변화가 주요 결정사항이다. 그러나 축구경기와 같은 동영상에서의 하이라이트는 화면의 형식적인 변화와는 조금 다른 의미를 가진다. 그러므로, 축구 경기 동영상에서 하이라이트 부분을 검출하기 위해서는 장면의 변화와 더불어 화면의 의미를 해석할 필요가 있다. 본 논문에서는 축구 경기 동영상의 모든 프레임을 순차적으로 검사한다. 임의의 프레임에 대하여 RGB 정보의 분석을 통하여 영상의 구성내용을 파악한 후, 구성 내용의 위치와 분포를 참조하여 하이라이트 여부를 판단한다. 제안된 방법에서는 RGB 값의 변화 문제를 해결하기 위하여, 주 RGB 범위 군집화(Dominant RGB Grouping) 방법을 통하여 임의의 영상에서 RGB 값의 변화에 최대한 덜 민감한 방법으로 대상의 RGB 정보를 취득할 수 있는 방법을 사용하였다.

  • PDF

An Adaptive Filtering Method for Enhancement of Inter-color Plane Estimation in HEVC RExt RGB Images (HEVC RExt RGB 영상의 색평면 간 예측 향상을 위한 적응적 필터링 기법)

  • Choi, Jangwon;Choe, Yoonsik
    • Journal of Broadcast Engineering
    • /
    • v.18 no.4
    • /
    • pp.647-650
    • /
    • 2013
  • HEVC RExt(High Efficiency Video Coding Range Extension) set a goal to support RGB/YUV 4:2:2 4:4:4 color sampling and over 10 bit-depth images. Unlike the previous 4:2:0 color sampling images, RGB images have the high correlation in inter-color planes. Using this characteristic, some methods which are contributed in JCT-VC standardization meetings estimate the pixel values of inter-color plane. But when we use the estimation of inter-color plane in RGB images, high frequency components of RGB images are caused to reduce the coding efficiency because they usually have the low inter-color plane correlation. Therefore, in this paper, we propose an adaptive low pass filtering method in the inter-color plane estimation. Using this method, we can improve the estimation efficiency of inter-color plane in RGB images. The experimental results with HEVC RExt RGB test sequences show that the proposed method has 0.6% BD(Bjontegaard Distortion)-rate gain and some increased complexity compared to the previous inter-color plane estimation method.

RGB-D Image Feature Point Extraction and Description Method for 3D Object Recognition (3차원 객체 인식을 위한 RGB-D 영상 특징점 추출 및 특징 기술자 생성 방법)

  • Park, Noh-Young;Jang, Young-Kyoon;Woo, Woon-Tack
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.448-450
    • /
    • 2012
  • 본 논문에서는 Kinect 방식의 RGB-D 영상센서를 사용하여, 깊이(Depth) 영상으로부터 3차원 객체의 기하정보를 표현하는 표면 정규 벡터(Surface Normal Vector)를 추출하고, 그 결과를 영상화하는 방법을 제안하며, 제안된 방법으로 생성된 영상으로부터 깊이 영상의 특징점 및 특징 기술자를 추출하여 3차원 객체 인식 성능을 향상시키는 방법을 제안한다. 또한 생성된 RGB-D 특징 기술자들을 객체 단위로 구분 가능한 코드북(CodeBook) 학습을 통한 인식방법을 제안하여 객체의 인식 성능을 높이는 방법을 제안한다. 제안하는 RGB-D 기반의 특징 추출 및 학습 방법은 텍스쳐 유무, 카메라 회전 및 이동 변화 등의 환경변화에 강건함을 실험적으로 증명하였으며, 이 방법은 Kinect 방식의 RGB-D 영상을 사용하는 3차원 객체/공간 인식 및 추적, 혹은 이를 응용하는 증강현실 시스템에 적용하여 사용될 수 있다.

Improvement of Image Retrieval Efficiency Using 2D Projection Maps (2차원 투영 맵을 이용한 영상 검색 효율 개선)

  • 안상건;이은애;하석운
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.159-162
    • /
    • 2003
  • 컬러 특징을 나타내는 전형적인 방법으로 RGB 컬러히스토그램이 있다. RGB 컬러 히스토그램은 RGB 컬러 공간을 일련의 bin으로 나누고 각 bin의 컬러 값에 대응하는 영상 픽셀의 빈도 수를 카운트하는 것으로 영상 검색에서 널리 쓰이고 있다. 그러나 RGB 컬러히스토그램은 영상의 미세한 장면 변화에도 크게 달라지기 때문에 검색 결과에 많은 영향을 줄 수 있다. 본 논문에서는 RGB 컬러히스토그램의 이러한 특성을 개선할 수 있는 새로운 컬러 특징 표현 방법을 제안한다. 제안하는 방법은 RGB 컬러 공간으로부터 RG, GB, BR의 세 가지 평면으로 투영시킨 2차원 투영 맵(2D Projection Maps)을 사용한다. 영상 검색에 대한 실험 결과로부터 제안한 2차원 투영 맵이 RGB 컬러히스토그램보다 더 향상된 검색 효율을 나타내었다.

  • PDF

A Study to Improve the Classification Accuracy of Mosaic Image over Korean Peninsula: Using PCA and RGB Indices (한반도 모자이크 영상의 분류 정확도 향상 기법 연구: PCA 기법과 RGB 지수를 활용하여)

  • Moon, Jiyoon;Lee, Kwangjae
    • Korean Journal of Remote Sensing
    • /
    • v.38 no.6_4
    • /
    • pp.1945-1953
    • /
    • 2022
  • Korea Aerospace Research Institute produces mosaic images of the Korean Peninsula every year to promote the use of satellite images and provides them to users in the public sector. However, since the pan-sharpening and color balancing methodologies are applied during the mosaic image processing, the original spectral information is distorted. In addition, there is a limit to analyze using mosaic images as mosaic images provide only Red, Green and Blue bands excluding Near Infrared (NIR) band. Therefore, in order to compensate for these limitations, this study applied the Principal Component Analysis (PCA) technique and indices extracted from R, G, B bands together for image classification and compared the classification results. As a result of the analysis, the accuracy of the mosaic image classification result was about 67.51%, while the accuracy of the image classification result using both PCA and RGB indices was about 75.86%, confirming that the accuracy of the image classification result can be improved. As a result of comparing the PCA and the RGB indices, the accuracy of the image classification result was about 64.10% and 74.05% respectively. Through this, it was confirmed that the classification accuracy using the RGB indices was higher among the two techniques, and implications were derived that it was important to use high quality reference or supplementary data. In the future, additional indices and techniques are needed to improve the classification and analysis results of mosaic images, and related research is expected to increase the utilization of images that provide only R, G, B or limited spectral information.

Convenient View Calibration of Multiple RGB-D Cameras Using a Spherical Object (구형 물체를 이용한 다중 RGB-D 카메라의 간편한 시점보정)

  • Park, Soon-Yong;Choi, Sung-In
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.3 no.8
    • /
    • pp.309-314
    • /
    • 2014
  • To generate a complete 3D model from depth images of multiple RGB-D cameras, it is necessary to find 3D transformations between RGB-D cameras. This paper proposes a convenient view calibration technique using a spherical object. Conventional view calibration methods use either planar checkerboards or 3D objects with coded-pattern. In these conventional methods, detection and matching of pattern features and codes takes a significant time. In this paper, we propose a convenient view calibration method using both 3D depth and 2D texture images of a spherical object simultaneously. First, while moving the spherical object freely in the modeling space, depth and texture images of the object are acquired from all RGB-D camera simultaneously. Then, the external parameters of each RGB-D camera is calibrated so that the coordinates of the sphere center coincide in the world coordinate system.

A Method of Detecting PV Panel Using RGB- IR Imaging Drone (RGB- IR 이미징 드론을 사용한 PV 패널 탐지 방법)

  • Sim, Kyudong;Kim, Jaeguk;Lee, Sang Hwa;Park, Jong- Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.259-261
    • /
    • 2019
  • 본 논문에서는 RGB-IR 이미징 센서가 탑재된 드론을 사용하여 태양광 발전소의 태양광(PV) 패널을 탐지하는 방법을 제안한다. 태양광 발전소에서 드론에 설치된 IR 영상의 활용은 PV 패널의 결함 여부를 판단하는데 큰 도움이 된다. 그러나 IR 영상만을 사용해서 태양광 패널을 탐지하고 결함 여부를 판단하는 것은 태양광에 의해 생긴 정반사로 인해 정확도가 떨어진다. 본 논문에서 제안하는 시스템은 드론을 이용해서 IR 영상과 RGB 영상을 동시에 획득하고 활용하는 시스템을 제안한다. 제안된 시스템으로부터 IR 영상과 RGB 영상으로 패널 탐지의 정확도를 향상시키고, 태양광에 의한 정반사와 같이 오검출 될 수 있는 문제를 극복할 수 있다.

  • PDF

Enhancing A Neural-Network-based ISP Model through Positional Encoding (위치 정보 인코딩 기반 ISP 신경망 성능 개선)

  • DaeYeon Kim;Woohyeok Kim;Sunghyun Cho
    • Journal of the Korea Computer Graphics Society
    • /
    • v.30 no.3
    • /
    • pp.81-86
    • /
    • 2024
  • The Image Signal Processor (ISP) converts RAW images captured by the camera sensor into user-preferred sRGB images. While RAW images contain more meaningful information for image processing than sRGB images, RAW images are rarely shared due to their large sizes. Moreover, the actual ISP process of a camera is not disclosed, making it difficult to model the inverse process. Consequently, research on learning the conversion between sRGB and RAW has been conducted. Recently, the ParamISP[1] model, which directly incorporates camera parameters (exposure time, sensitivity, aperture size, and focal length) to mimic the operations of a real camera ISP, has been proposed by advancing the simple network structures. However, existing studies, including ParamISP[1], have limitations in modeling the camera ISP as they do not consider the degradation caused by lens shading, optical aberration, and lens distortion, which limits the restoration performance. This study introduces Positional Encoding to enable the camera ISP neural network to better handle degradations caused by lens. The proposed positional encoding method is suitable for camera ISP neural networks that learn by dividing the image into patches. By reflecting the spatial context of the image, it allows for more precise image restoration compared to existing models.