• 제목/요약/키워드: 영상 간 변환

검색결과 843건 처리시간 0.033초

데이터 증강을 위한 순환 생성적 적대 신경망 기반의 아스팔트와 콘크리트 균열 영상 간의 변환 기법 (CycleGAN Based Translation Method between Asphalt and Concrete Crack Images for Data Augmentation)

  • 심승보
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.171-182
    • /
    • 2022
  • 구조물을 안전하게 관리하기 위해서는 우선적으로 건전한 유지가 전제되어야 한다. 이 같은 구조물의 건전성을 결정하는 요인 중에서 가장 대표적인 예로는 균열을 들 수 있다. 여러 가지 원인에 의해 발생하는 균열은 다양한 종류와 형태로 구조물에 손상을 입힌다. 무엇보다 이러한 균열이 방치될 경우 위험도가 증가하여 안전사고로 이어질 수 있다. 이러한 문제점을 경감하기 위하여 최근 들어 딥러닝과 컴퓨터 비전 기술을 활용하여 손상을 점검하는 방법들이 소개되고 있다. 이 같은 방법들은 대체로 충분한 양의 학습 데이터가 필요한 것이 사실이다. 하지만, 학습을 위한 영상 데이터의 충분한 확보가 어렵다는 점은 딥러닝 균열 탐지 알고리즘의 성능에 부정적인 영향을 미친다. 따라서 본 논문에서는 이에 대한 문제의식을 바탕으로 영상 변환 기법을 활용하여 균열 영상 데이터를 증강하는 방법을 제시했다. 이는 아스팔트 균열 영상을 콘크리트 균열 영상으로 변환하거나 혹은 이와 반대로 콘크리트 균열 영상을 아스팔트 균열 영상으로 변환하여 딥러닝 신경망 모델을 학습하기 위한 영상 데이터를 확보하는 방법이다. 이를 통해 학습 데이터의 다양성을 향상시켜 강건한 균열 탐지 알고리즘 개발에 기여할 수 있기를 기대한다.

수정 윈도우를 이용한 얼굴 특징점의 추적 (Facial Feature Tracking With Modified Windows)

  • 김정선;조남익
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.169-172
    • /
    • 2001
  • 본 논문은 얼굴의 특징점 추적을 위하여 얼굴 회전 변환과의 크기 변환을 고려한 BMA(Block matching alogorithm)을 이용한 방법을 제안한다. 우선 얼굴의 크기 변화를 구하기 위하여 얼굴 영역을 분리하여 그 면적을 구한다. 이 면적을 이전 프레임에서 구한 얼굴 영역의 면적과 비교하여 크기 비례를 계산한다. 다음으로 각 특징점을 중심으로 하는 8방위 영역의 화소들로 집합을 설정한다. 집합을 설정할 때에는 얼굴의 크기 변화를 고려하여 영역 내 화소들을 포함하는 양을 수정한다. 그리고 새로운 영상에서 화소 집합간의 거리가 가장 작은 화소를 새로운 특징점으로 지정한다. 이 때, 회전 변화를 고려하여 화소 집합의 순서를 순차적으로 바꿔 집합 간 거리를 산출한다. 제안하는 방법은 회전과 크기 변환에 강인한 특성을 보일 뿐 아니라, 단순한 움직임 예측 방법인 BMA보다도 쉽고 빠르게 계산된다.

  • PDF

Deflicker-aware Quantization

  • 남준우;양정엽;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.263-266
    • /
    • 2009
  • H.264/AVC 표준의 화면내 부호화 방법은 화면내 예측을 통한 예측값과 현재 블록의 화소값의 차이를 변환 계수로 변환하고, 이를 양자화 및 엔트로피 부호화하는 순서로 부호화가 진행된다. 그러나 화면내 부호화 방법은 영상간의 시간적 상관성을 이용하지 않고 비교적 상관도가 낮은 공간적 상관성을 이용하기 때문에 화면간 부호화 방법에서는 발견되지 않는 flicker 효과가 발생하게 된다. 일반적으로 flicker 효과는 양자화 및 역양자화 과정에서 변환 계수값의 차이가 크게 증가하기 때문에 발생한다. 따라서 화면내 부호화 방법을 사용하면 flicker 효과로 인해 주관적인 화질이 크게 열화됨에도 불구하고, 이를 위한 해결책이 많지 않다. 본 논문에서는 flicker 효과를 정의하고 flicker 효과의 발생 이유를 분석한다. 이를 바탕으로 flicker 효과를 효과적으로 감소시킬 수 있는 양자화 방법을 제안한다.

  • PDF

실시간 내장형 응용을 위한 2차원 웨이브렛 변환 프로세서 (2D DWT Processor for Real-time Embedded Applications)

  • 정갑천;박성모
    • 전자공학회논문지CI
    • /
    • 제40권2호
    • /
    • pp.17-25
    • /
    • 2003
  • 본 논문에서는 상태 변수 표현 방법에 따른 알고리즘 분할을 통해 2차원 웨이브렛 변환 연산을 실시간으로 처리할 수 있는 프로세서 구조를 제안하였다. 제안된 프로세서 구조는 영상입력에 대하여 행, 열 방향을 동시에 고려하여 데이터 플로우 방식으로 처리함으로써 중간적인 결과의 메모리 저장 및 읽기에 소요되는 전달 지연 시간을 감소할 수 있어 실시간 처리에 적합한 VLSI 구조이다. 필터의 길이를 K라할 때 프로세서는 내부에 4개의 곱셈기, 4개의 덧셈기 및 NK-N 크기의 메모리를 가지는 등의 하드웨어 복잡도가 낮아 웹 카메라 서버와 같은 내장형의 응용에 매우 적합한 구조이고, 쉽게 어레이 구조로 확장할 수 있어 고성능을 요구하는 다양한 영상 처리 응용에도 사용 가능하다.

스캔 포맷 변환이 있는 효율적인 MPEG-2 동영상 트랜스코딩을 위한 고속 움직임 추정 기법 (Fast Motion Estimation Algorithm for Efficient MPEG-2 Video Transcoding with Scan Format Conversion)

  • 송병철;천강욱
    • 방송공학회논문지
    • /
    • 제8권3호
    • /
    • pp.288-296
    • /
    • 2003
  • ATSC (Advanced Television System Committee)에서는 18가지의 DTV (Digital Television)를 위한 동영상 포맷들을 제정하였다. ATSC 포맷들은 스캔 포맷, 크기 포맷, 프레임율 포맷 등의 적당한 조합들이다. 효과적인 MPEG-2 트랜스코딩을 위해서는 이런 포맷들 간의 변환도 지원할 수 있어야 한다. 여러 포맷 변환들 중에서 특히 스캔 포맷 변환은 프레임율과 크기 변화가 함께 일어나기 때문에 상대적으로 구현하기가 힘들다. 스캔포맷 변환으로 픽쳐 타입도 함께 변하기 때문에 트랜스코더의 움직임 추정부 (motion estimation; ME)에 상당한 연산량 부담을 주게 된다. 이런 문제를 해결하기 위해 본 논문은 스캔포맷 변환을 지원하는 MPEG-2 동영상 트랜스코딩을 위한 고속 움직임 추정 알고리즘을 제안한다. 먼저, 트랜스코더의 수신단은 입력 비트열로부터 재 부호화(re-encoding)에 적합한 후보 움직임 벡터들을 추출한다. 그런 다음. 가중치 중간값 선택기(weighted median selector)를 이용하여, 여러 후보 움직임 벡터들 중에서 최적의 움직임 벡터를 선택한다. 모의 실험 결과는 제안한 움직임 추정 알고리즘이 전역 탐색 기법(Full Search Algorithm: FSA)에 비해 현저하게 적은 연산량을 가지면서, FSA와 거의 동일한 PSNR 성능을 가짐을 증명한다.

프랙탈 영상 부호화용 블럭 분류기 (Block Classifier for Fractal Image Coding)

  • 박경배;정우석;김정일;정근원;이광배;김현욱
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.691-700
    • /
    • 1995
  • 프레탈을 이용한 대부분의 영상 부호화하는 최적의 유사 변환점을 얻기 위해서 방대한 비교 연산이 필요하여 장시간의 부호화 시간이 요구되는 문제점이 있다. 이러 한 문제는 블럭특성에 적합한 블럭 분류기를 설계함으로써 해결할 수 있다. 일반적으 로 공간 영역에서 보다는 주파수 영역에서 좀더 정확하고 다양한 블럭의 형태를 예측 할 수 있다. 본 논문에서는 DCT특성을 이용하여 블럭의 형태를 예측할 수 있는 블럭 분류기를 제안하였다. 이 분류기는 프랙탈 특징과 부합하여 부호와 시간을 줄임과 동 시에 복원된 영상의 화질을 높이는 장점이 있다. 주파수 영역에서의 AC 계수의 크기는 다양한 블럭 형태를 예측 가능하게 함으로써 최적의 축소 변환점을 얻기 위한 도메인 블럭과 레인지 블럭간에 비교 연산을 줄일 수 있다. 특히 DCT 각 계수의 부호값은 프 랙탈 적용을 위한 8가지 변환에 대해 불필요한 변환을 생략함으로써 2가지 변환만으로 도 축소 변환점을 찾는 장점을 나타낸다.

  • PDF

지형공간정보체계에서 수치영상자료 취득의 정확도 향상을 위한 주사기의 검정 방법 (Scanner Calibration Method for Higher Accuracy at Acquisition of Digital Imagery Data in GSIS)

  • 최철순
    • 대한공간정보학회지
    • /
    • 제1권2호
    • /
    • pp.153-158
    • /
    • 1993
  • 주사기(scanner)에 의해 수치영상자료를 취득하는 과정에 있어서 기존 사진이나 도면의 좌표체계는 수치영상의 좌표체계로서 변환되므로 이들 좌표체계 간의 변환관계를 설정하는 것은 매우 중요한 일이다. 또한 주사기의 주사운동에 따라 왜곡이 발생할 수 있으므로 이를 보정하기 위한 연구도 이루어져야 한다. 본 연구에서는 항공사진을 주사기에 의해 수치화하는 과정에서의 좌표계의 변환관계를 설정하고 주사기의 왜곡을 검정하기 위한 최적검정모형식을 결정하는 과정을 수행하였다. 그 결과 본 연구에 이용된 주사기에 대한 최적검정모형식이 결정되었다. 또한, 본 연구의 수행과정은 기하학적인 해석을 통하여 검정을 수행하였으므로 타 기종의 주사기를 검정하는 데 있어서도 적용이 가능하다.

  • PDF

기준선 기반 이진 형상 부호화기 (Baseline based Binary Shape Coder)

  • 이시화;조대성;조유신;손세훈;장의선;신재섭;서양석
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.114-124
    • /
    • 1997
  • 이진 영상 부호화는 종래의 영상 처리에 객체 기반 처리 기능을 제공한다. 이진 영상 부호화를 위하여 본 논문에서는 기준선을 기반으로 하는 새로운 이진 영상 부호화 방식을 제안한다. 종래 이진 부호화기와 달리 본 방식은 객체의 외곽선을 추적하면서2차원의 영상 데이터를 1차원으로 변환하여 이를 부호화한다. 추출되는 데이터는 기준선의 시작점과 거리값 리스트 그리고 변환값 리스트이다. 무손실 부호화에서 이들은 모두 부호화되나 손실 부호화에서는 가변 샘플링을 통하여 구간별로 비슷한 손실정도를 갖도록 조정이 되어 선택된 거리값들 만이 부호화 된다. 또한 프레임간의 움직임 보상에서도 거리값과 변환값을 이용하여 빠른 처리 속도를 갖도록 하였다. 실험결과 현재 MPEG-4 잠정표준안에 채택되어 있는 CAE방식에 비하여 객관적 평가에서는 정지영상부호화(intra 모드)에서는 앞서며, 동영상부호화(inter 모드)에서는 떨어지고 있다. 그러나 주관적인 평가에서는 두 경우 모두 좋은 것으로 평가받고 있다.

  • PDF

스테레오 카메라 추적을 이용한 모바일 3차원 디스플레이 상의 실시간 증강현실 (Real-Time Augmented Reality on 3-D Mobile Display using Stereo Camera Tracking)

  • 박정식;서병국;박종일
    • 방송공학회논문지
    • /
    • 제18권3호
    • /
    • pp.362-371
    • /
    • 2013
  • 본 논문에서는 스테레오 카메라 추적을 이용한 모바일 3차원 디스플레이 상의 실시간 증강현실 프레임웍에 대하여 기술한다. 모델 기반 추적 방법에 기초하여 카메라 포즈는 스테레오 카메라 간의 기하 관계를 만족하도록 동시 추정된다. 동시 추정된 카메라 포즈를 통해 가상 콘텐츠는 교정된 스테레오 영상에 올바르게 증강된다. 스테레오 카메라 추적과 스테레오 영상 교정은 서로 다른 쓰레드에서 수행하고, 영상 형식 변환 및 스테레오 영상 교정은 GPU로 고속으로 처리함으로써 실시간으로 수행된다. 제안된 프레임웍은 스테레오 카메라와 3차원 디스플레이가 장착된 스마트폰에서 구현되었다.

모폴로지을 이용한 비디오 영상에서의 자동 문자 추출 (Automatic Text Extraction in Video Images using Morphology)

  • 장인영;고병철;김길천;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.418-420
    • /
    • 2001
  • 본 논문에서는 뉴스 비디오의 정지 영상에서 뉴스 자막과 배경 문자를 추출하기 위한 새로운 방법을 제안한다. 본 논문에서는 일차적으로 입력 컬러 영상을 그레이 영상으로 변환한 후 입력 영상의 명암 대비를 강화시키기 위해 명암 대비 스트레칭을 적용한다. 이후 명암 대비 스트레칭된 영상의 분할을 위해 적응적 임계값을 적용하고 다음 단계에서 문자와 유사한 영역들을 적당한 크기 의 structuring element를 이용하여 제거하는 1차 하부 단계와 모폴로지 녹임(erosion)을 적용한 영상과 모폴로지(열림닫힘[OpenClose]+닫힘열림[CloseOpen])/2가 적용된 영상 사이의 차이 영상을 구하는 2차 하부 단계를 적용시킨다. 마지막 단계에서 각 후보 영역들 중 실제 자막 영역을 추출해내기 위해, 후보 문자 영역의 화소수 비율과 외곽선의 화소수의 비율, 그리고 장축과 단축간의 비율 등에 대해 필터링을 적용한다. 본 논문에서는 임의의 300개의 뉴스영상을 입력 값으로 실험한 결과 93.6%의 우수한 인식률을 얻을 수 있었다. 또한 본 논문에서 제안한 방법은 structuring element의 크기 조절을 통해 크기가 다른 다양한 이미지에서도 좋은 성능을 거둘 수 있다.

  • PDF