• 제목/요약/키워드: Image rectification

검색결과 96건 처리시간 0.02초

반 밀집 정합에 기반한 저가형 3차원 주름 데이터 복원 (A Low Cost 3D Skin Wrinkle Reconstruction System Based on Stereo Semi-Dense Matching)

  • 장천;황보택근
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.25-33
    • /
    • 2009
  • 본 논문은 스테레오 영상에 기반한 3차원 주름 데이터 복원 시스템을 제안한다. 일반적으로, 3차원 데이터 복원 연구는 스테레오 영상 또는 비디오 영상을 통해, 문화유산과 같은 건물이나 주변 환경에 적용하는 연구가 최근 활발히 진행되고 있다. 3차원 데이터 복원에서 사물 측정의 목적은 각 영상간의 깊이 정보 계산을 통해 3차원 데이터를 획득하는 것이다. 본 연구를 진행하기 위해선 몇 가지 고려해야할 사항이 있다. 첫째로, 카메라 성능과 비 균일한 구성의 피부, 그리고 조명의 영향 때문에 촬영 시 주름의 완전한 정보를 얻기가 힘들다. 따라서 본 논문은 주름의 정보를 최대한 완전하게 얻기 위해, 근접 촬영이 가능한 접사렌즈를 사용하였다. 둘째로, 피부 영상은 영상 분할이나 특징점을 추출하는데 부정확한 문제점이 있어, 스테레오 영상의 밀집 정보를 얻기가 힘들다. 따라서 본 논문은 주름의 정확한 깊이 정보 계산을 위해 반 밀집에 기반한 스테레오 정합 알고리즘을 사용한다. 본 시스템은 기존의 3차원 스캐너와 비교해 비용 절감의 효과가 있으며, 실험 결과 일반적인 모델링 방법보다 고성능의 결과를 보여주며 이를 통해 활용방안이 많을 것으로 예상된다.

  • PDF

유출유 모니터링을 위한 해경 항공 영상의 개별정사보정 (Individual Ortho-rectification of Coast Guard Aerial Images for Oil Spill Monitoring)

  • 오연곤;배억안;최경아;이임평
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1479-1488
    • /
    • 2022
  • 해양에서는 선박충돌, 침몰 등으로 인하여 기름이 유출되는 사고가 간헐적으로 일어난다. 이러한 사고가 발생하였을 때 신속한 대책 마련을 위해 유출유 현황을 정확히 파악해야 한다. 이를 위해 해양경찰은 고정익비행기 또는 헬기로 대상 지역을 순찰하며 육안이나 영상 촬영을 통해 확인하는데, 유출유로 오염된 면적과 지도 상의 정확한 위치를 파악하는데 어려움이 있었다. 이에 본 연구는 유출유 현황 파악을 위해 해경에서 수집한 항공 영상을 개별적으로 지상기준점 없이 자동으로 직접 지오레퍼런싱(georeferencing)하여 정사보정하는 기술을 개발한다. 먼저, 영상 등 센서 정보를 가시화한 화면에서 지오레퍼런싱에 필요한 메타정보를 문자인식기술을 통해 추출한다. 추출된 정보를 바탕으로 영상의 외부표정요소를 결정한다. 결정된 외부표정요소를 이용해서 영상을 개별적으로 정사보정한다. 이러한 방법으로 통해 생성한 개별정사영상의 정확도는 수십 미터에서 최대 100 m 정도로 평가되었다. 지상기준점을 사용하지 않았고, 위치와 자세 센서의 관측 오차, 카메라 초점거리 등 내부표정요소의 오차를 고려할 때 상당히 양호한 수준이었다. 해양에서 유출유 오염 지역에 대한 현황 파악을 위해 적절한 수준으로 판단된다. 향후 비행 중 촬영 영상에 대한 실시간 전송이 가능해지면, 제안된 개별정사보정 기술을 통해 실시간으로 개별 정사영상을 생성할 수 있게 된다. 이를 기반으로 유출유 오염 현황에 대한 신속한 파악과 대책 수립에 효과적으로 활용할 수 있다.

영상을 활용한 시설물 안전점검 작업 효율성 향상 방안 연구 (A Study on Improving the Efficiency of Facility Safety Inspection Work Using Images)

  • 전경식;김진태;이병길
    • 한국측량학회지
    • /
    • 제39권3호
    • /
    • pp.179-186
    • /
    • 2021
  • 일반적으로 구조물에서의 손상을 조사하고 손상 크기를 측정하는 일상안전점검 활동은 지금까지 점검인력에 의한 육안점검에 크게 의존하고 있다. 이러한 인력에 의한 시설물의 상태 및 성능점검은 조사자의 주관적 판단에 의존하는 경우가 많기 때문에 측정결과의 일관성과 반복성이 저하될 수 있다. 특히 접근이 어려운 곳에 위치한 손상은 육안에 의한 경험에 주로 의존하고 있으며, 필요한 경우에 사다리를 이용하는 안전하지 못한 방법이 주로 사용되고 있다. 이에 본 연구에서는 안전점검 조사자 간 편차를 줄여 객관성을 확보하고, 작업자의 안전성을 강화할 수 있는 영상 활용 기법을 제안하고자 하였다. 본 연구에서는 촬영대상과의 거리와 촬영각도에 따른 영상의 변화를 보정하는 방법으로 평면사영변환을 적용하였다. 실험대상에 대한 변환된 영상에서 손상 크기를 분석한 결과 손상 크기 측정의 정확도는 목표 수준인 5.0mm와 0.005m2를 만족시킬 수 있는 것으로 확인되었다. 제안된 영상 보정 기법을 적용한 현장검증시험 결과, 구조물에 발생된 균열의 길이의 변동계수는 5.4~7.0%에서 0.072~0.12%로 감소하였고, 손상 면적의 변동계수는 10.9%에서 1.6%로 줄어들었고, 측정의 정확도가 향상되는 것을 확인하였다. 그러므로 안전점검 활동에서의 영상 활용 기법에 대한 본 연구를 통해 손상 크기 측정 정확도 향상 및 안전점검 보고서와 외관조사망도에 대한 신뢰도 향상을 기대할 수 있을 것으로 판단된다.

An Evaluation of ETM+ Data Capability to Provide 'Forest-Shrub land-Range' Map (A Case Study of Neka-Zalemroud Region-Mazandaran-Iran)

  • Latifi Hooman;Olade Djafar;Saroee Saeed;jalilvand Hamid
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.403-406
    • /
    • 2005
  • In order to evaluate the Capability of ETM+ remotely- sensed data to provide 'Forest-shrub land-Rangeland' cover type map in areas near the timberline of northern forests of Iran, the data were analyzed in a portion of nearly 790 ha located in Neka-Zalemroud region. First, ortho-rectification process was used to correct the geometric errors of the image, yielding 0/68 and 0/69 pixels of RMS. error in X and Y axis, respectively. The original and panchromatic bands were fused using PANSHARP Statistical module. The ground truth map was made using 1 ha field plots in a systematic-random sampling grid, and vegetative form of trees, shrubs and rangelands was recorded as a criteria to name the plots. A set of channels including original bands, NDVI and IR/R indices and first components of PCI from visible and infrared bands, was used for classification procedure. Pair-wise divergence through CHNSEL command was used, In order to evaluate the separability of classes and selection of optimal channels. Classification was performed using ML classifier, on both original and fused data sets. Showing the best results of $67\%$ of overall accuracy, and 0/43 of Kappa coefficient in original data set. Due to the results represented above, it's concluded that ETM+ data has an intermediate capability to fulfill the spectral variations of three form- based classes over the study area.

  • PDF

Optical Character Recognition for Hindi Language Using a Neural-network Approach

  • Yadav, Divakar;Sanchez-Cuadrado, Sonia;Morato, Jorge
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.117-140
    • /
    • 2013
  • Hindi is the most widely spoken language in India, with more than 300 million speakers. As there is no separation between the characters of texts written in Hindi as there is in English, the Optical Character Recognition (OCR) systems developed for the Hindi language carry a very poor recognition rate. In this paper we propose an OCR for printed Hindi text in Devanagari script, using Artificial Neural Network (ANN), which improves its efficiency. One of the major reasons for the poor recognition rate is error in character segmentation. The presence of touching characters in the scanned documents further complicates the segmentation process, creating a major problem when designing an effective character segmentation technique. Preprocessing, character segmentation, feature extraction, and finally, classification and recognition are the major steps which are followed by a general OCR. The preprocessing tasks considered in the paper are conversion of gray scaled images to binary images, image rectification, and segmentation of the document's textual contents into paragraphs, lines, words, and then at the level of basic symbols. The basic symbols, obtained as the fundamental unit from the segmentation process, are recognized by the neural classifier. In this work, three feature extraction techniques-: histogram of projection based on mean distance, histogram of projection based on pixel value, and vertical zero crossing, have been used to improve the rate of recognition. These feature extraction techniques are powerful enough to extract features of even distorted characters/symbols. For development of the neural classifier, a back-propagation neural network with two hidden layers is used. The classifier is trained and tested for printed Hindi texts. A performance of approximately 90% correct recognition rate is achieved.

Target-free vision-based approach for vibration measurement and damage identification of truss bridges

  • Dong Tan;Zhenghao Ding;Jun Li;Hong Hao
    • Smart Structures and Systems
    • /
    • 제31권4호
    • /
    • pp.421-436
    • /
    • 2023
  • This paper presents a vibration displacement measurement and damage identification method for a space truss structure from its vibration videos. Features from Accelerated Segment Test (FAST) algorithm is combined with adaptive threshold strategy to detect the feature points of high quality within the Region of Interest (ROI), around each node of the truss structure. Then these points are tracked by Kanade-Lucas-Tomasi (KLT) algorithm along the video frame sequences to obtain the vibration displacement time histories. For some cases with the image plane not parallel to the truss structural plane, the scale factors cannot be applied directly. Therefore, these videos are processed with homography transformation. After scale factor adaptation, tracking results are expressed in physical units and compared with ground truth data. The main operational frequencies and the corresponding mode shapes are identified by using Subspace Stochastic Identification (SSI) from the obtained vibration displacement responses and compared with ground truth data. Structural damages are quantified by elemental stiffness reductions. A Bayesian inference-based objective function is constructed based on natural frequencies to identify the damage by model updating. The Success-History based Adaptive Differential Evolution with Linear Population Size Reduction (L-SHADE) is applied to minimise the objective function by tuning the damage parameter of each element. The locations and severities of damage in each case are then identified. The accuracy and effectiveness are verified by comparison of the identified results with the ground truth data.