• 제목/요약/키워드: 영상 코드화

검색결과 206건 처리시간 0.021초

PCA에 기반한 압축영역에서의 MPEG Video 검색기법 (PCA-Based MPEG Video Retrieval in Compressed Domain)

  • 이경화;강대성
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.28-33
    • /
    • 2003
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 스트림으로부터 DCT DC 계수를 추출하구 이들로 구성된 DE 영상으로부터 장면 전환 검출을 수행한 후 대표 프레임을 추출한다. 또한 추출된 대표 프레임을 PCA(Principal Component Analysis) 방법을 이용하여 데이터베이스의 색인 정보로 저장한 후 입력된 질의 영상과 가장 유사한 대표 영상들을 검색하는 방법에 대해 제안한다. 즉, 추출된 대표 프레임에 대해 주성분해석 기법을 적용하여 통계적인 특성을 가진 데이터를 특징으로 추출함으로써 코드워드의 수에 따른 코드북을 생성하고 이를 데이터베이스의 색인 정보로 저장한다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 나타내고 또한 통계적인 데이터의 특성을 이용하기 때문에 처리 시간과 상당한 양의 메모리 공간을 줄일 수 있음을 확인하였다.

체인 코드 트리밍과 가중 원형 정합을 이용한 인쇄체 숫자 인식 (Machine-printed Numeral Recognition using Weighted Template Matching with Chain Code Trimming)

  • 정민철
    • 지능정보연구
    • /
    • 제13권4호
    • /
    • pp.35-44
    • /
    • 2007
  • 본 논문에서는 인쇄체 숫자를 인식하기 위해 가중 원형 정합(weighted template matching) 방법을 제안한다. 원형 정합은 입력 영상 전체를 하나의 전역적인 특징으로 처리하는데 반해, 제안된 가중 원형 정합은 패턴의 특징이 나타나는 국부적인 영역에 해밍 거리(Hamming distance)의 가중치를 두어 패턴 특징을 강조하여 숫자 패턴의 인식률을 높인다. 또한 원형 정합은 영상을 이진화(binarization)할 때 발생되는 패턴의 윤곽선을 울퉁불퉁하게 만드는 랜덤 노이즈에 취약하다. 이러한 랜덤 노이즈를 제거하기 위해 본 논문에서는 체인 코드 트리밍(chain code trimming)방법을 제안한다. 체인 코드 트리밍은 패턴의 외부 윤곽선과 내부 윤곽선의 체인 코드 분석을 통해 특정 유형의 체인 코드를 제거, 교정함으로써 이루어진다. 실험에서는 기존의 원형 정합을 사용했을 때와 체인 코드 트리밍을 한 후 가중 원형 정합을 사용했을 때의 혼돈 행렬(confusion matrix)을 서로 비교한다. 실험 결과는 본 논문에서 제안한 방법에 의해 인쇄체 숫자의 인식률이 크게 향상된 것을 보인다.

  • PDF

디지털 경제를 주도할 디지털 컨텐츠 산업의 육성방향

  • 박영일
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 국제컨퍼런스 디지털컨텐츠 활용을 통한 지식경영의 확산
    • /
    • pp.1-11
    • /
    • 1999
  • o 디지털컨텐츠(멀티미디어컨텐츠)란 무엇인가\ulcorner 멀티미디어 : 기존 아날로그 기술에서 개별적으로 성장했던 문자, 음성, 사진, 비디오, 애니메이션의 미디어 영역들이 디지털 기술이 발달하면서 통합된 미디어를 말함. 디지털화는 글, 소리, 그림, 영상, 숫자 등의 온갖 정보들을 컴퓨터가 인식할 수 있는 신호(2진수 코드)로 바꾸는 것임. (중략)

  • PDF

자기 조직화 지도 모형을 이용한 인종별 얼굴 영상 군집화 기법 (Face Data Clustering Method for Face Recognition Using Self Organizing Feature Map)

  • 권혜련;고병철;변혜란;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.577-579
    • /
    • 2003
  • 본 논문에서는 생체인식 분야 중 얼굴인식의 검색 정확성 향상 및 검색 시간을 단축하기 위한 단계로 인종별 얼굴영상 데이터베이스에 대한 군집화 기법을 연구하였다. 우선, 일반적으로 얼굴 및 이미지 검색에 사용되는 다양한 특징을 추출하고, 추출한 다차원의 특징 데이터들로부터 다 인종 얼굴 데이터를 유사한 인종별로 정확하게 군집화 하기 위해 최적의 특징벡터를 자동으로 선택 할 수 있는 방법을 제안하였다. 군집결과 분석을 위해 자기 조직화 지도 모형을 이용하였는데, 이는 2차원 분석 및 가시화에 유용하며, 학습 후 코드북벡터를 사용하여 유사한 의미간의 거리부터 검색할 수 있는 특징을 가지고 있다. 특징추출에 관한 실험결과 인종별 구분을 위한 특징벡터로는 웨이블릿 주파수 성분(lowpass 성분)과 CbCr 특징벡터가 인종별 군집화에 가장 유용한 특징으로 선택되었으며. 추출된 특징을 바탕으로 semantic map을 구성하여 제안방법의 효율성을 제시하였다.

  • PDF

대용량 위성영상의 무감독 분류를 위한 K-means 군집화 알고리즘의 병렬처리 (Parallel Processing of K-means Clustering Algorithm for Unsupervised Classification of Large Satellite Imagery)

  • 한수희
    • 한국측량학회지
    • /
    • 제35권3호
    • /
    • pp.187-194
    • /
    • 2017
  • 본 연구는 대용량 위성영상의 신속한 무감독 분류를 위해 k-means 군집화 알고리즘을 병렬처리하는 방법을 소개한다. K-means 군집화 알고리즘은 대표적인 무감독분류 알고리즘으로서 주로 감독분류의 전처리 단계로 활용되지만 연산 집약적이고 사용자의 개입이 적어 병렬처리의 효과를 분명하게 나타낼 수 있다. 병렬처리 코드는 OpenMP 기반의 멀티쓰레딩을 이용하여 구현하였다. 실험은 1대의 PC에서 시행하였으며 이 PC의 CPU에는 8개의 멀티코어가 집적되어 있다. 실험 영상으로는 7개 밴드로 구성한 30m 해상도의 LANDSAT 8 OLI 영상과 8개 밴드로 구성한 10m 해상도의 Sentinel-2A 영상을 사용하였다. 각각 10개 군집을 사용하여 순차처리 및 병렬처리를 수행한 결과 병렬처리가 순차처리에 비해 6배 내외의 속도를 나타내었다. 순차처리와 병렬처리 결과의 일치성 평가를 위해 각 군집의 중심값과 분류된 화소의 수를 비교하고 분류 결과 영상간 차분을 수행하였고 결과로 모든 정보가 일치하였다. 본 연구는 병렬처리를 통해 대용량 위성영상의 처리 속도를 상당히 향상시킬 수 있음을 입증하고 있다는 점에서 의미가 있다고 판단된다. 아울러 OpenMP 기반의 멀티쓰레드를 이용하면 비교적 쉽게 병렬처리를 구현할 수 있지만 false sharing의 발생을 억제하도록 코드를 설계하는데 주의를 기울여야 함도 확인할 수 있었다.

3차원 객체 인식을 위한 RGB-D 영상 특징점 추출 및 특징 기술자 생성 방법 (RGB-D Image Feature Point Extraction and Description Method for 3D Object Recognition)

  • 박노영;장영균;우운택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.448-450
    • /
    • 2012
  • 본 논문에서는 Kinect 방식의 RGB-D 영상센서를 사용하여, 깊이(Depth) 영상으로부터 3차원 객체의 기하정보를 표현하는 표면 정규 벡터(Surface Normal Vector)를 추출하고, 그 결과를 영상화하는 방법을 제안하며, 제안된 방법으로 생성된 영상으로부터 깊이 영상의 특징점 및 특징 기술자를 추출하여 3차원 객체 인식 성능을 향상시키는 방법을 제안한다. 또한 생성된 RGB-D 특징 기술자들을 객체 단위로 구분 가능한 코드북(CodeBook) 학습을 통한 인식방법을 제안하여 객체의 인식 성능을 높이는 방법을 제안한다. 제안하는 RGB-D 기반의 특징 추출 및 학습 방법은 텍스쳐 유무, 카메라 회전 및 이동 변화 등의 환경변화에 강건함을 실험적으로 증명하였으며, 이 방법은 Kinect 방식의 RGB-D 영상을 사용하는 3차원 객체/공간 인식 및 추적, 혹은 이를 응용하는 증강현실 시스템에 적용하여 사용될 수 있다.

신경 회로망 벡터 양자화를 이용한 움직임 탐색 영역의 예측 (Motion Search Region Prediction using Neural Network Vector Quantization)

  • 유대현;김재창
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.161-169
    • /
    • 1996
  • 본 논문에서는 동영상 압축의 핵심 기술인 움직임 벡터 추정에 있어서 신경 회로망을 이용한 벡터 양자화에 의해 탐색 영역을 예측하는 방법을 제안한다. 훈련영상을 입력으로 하여 전역 탐색법 등에 의하여 구해진 움직임 벡터를 이용하여 움직임 벡터 코드 북을 생성하고 이를 예측 탐색 점으로 이용한다. 움직임 벡터 코드 북을 생성하기 위해서 병렬 처리 특성과 다양한 학습 알고리즘을 갖는 신경 회로망을 이용하였다. 제안된 방법은 움직임 벡터들의 높은 공간적 상관성을 이용하게 되고 결과적으로 적은 탐색 점으로 움직임 벡터를 추정할 수 있으므로 계산량을 줄일 수 있을 뿐 아니라 움직임 벡터를 표현하기 위해 소요되는 비트 수도 크게 줄일 수 있다. 모의 실험을 통하여 제안된 방식이 기존의 고속 블록 매칭 알고리즘보다 우수함을 보였다.

  • PDF

IoT에서 스테가노그라피와 QR 코드를 이용한 영상 정보의 보안 (Security of Image Information using Steganography and QR Code in IoT)

  • 임용순;강은영;박재표
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.31-37
    • /
    • 2015
  • 사물인터넷(IoT)의 여러 분야에서 영상 정보의 보안은 매우 중요하며, 그 보안(저작권 등)을 표시하는 여러 방안을 연구하고 있다. 본 논문에서는 IoT에서 사용하는 영상 정보는 이산 코사인 변환(DCT)과 양자화를 통하여 계수값(QC)으로 변환된다. 그리고 워터마크(메시지)는 QR Code를 통하여 새로운 부호화된 메시지(WMQR)를 만든다. QC와 WMQR은 스테가노그래피 LSB 기법을 적용하고, 영상정보의 보안(저작권 등)을 얻을 수 있다. 스테가노그래피의 LSB 기법은 위치(Secret Key)의 결정에 따라 메시지를 삽입할 수 있다. 부호화된 영상은 인터넷을 통하여 수신자에게 전송하게 된다. 역 과정에서는 영상과 QR 코드, 워터마크(Message)를 얻을 수 있다. 영상정보의 보안에서 워터마크를 추출하는 방법은 부호화된 영상과 Secret Key 만을 사용하며, DCT와 양자화 과정을 통하여 워터마크(Message)를 분리하여 얻을수 있다. 본 논문에서 우리는 영상정보의 보안의 방법을 개선할수 있었으며, 이 모의실험을 통하여 영상의 화질(PSNR), 정규화 상관도(NC)를 통하여 높은 보안성을 얻을 수 있었다.

OpenCL 및 Embedded GPU를 이용한 영상 특징 추출 및 파노라마 영상 생성의 병렬화 (Parallelization of Feature Detection and Panorama Image Generation using OpenCL and Embedded GPU)

  • 강승헌;이승재;이만희;박인규
    • 방송공학회논문지
    • /
    • 제19권3호
    • /
    • pp.316-328
    • /
    • 2014
  • 본 논문에서는 최신 embedded GPU를 사용하여 영상의 특징 추출 알고리즘(SIFT, SURF)을 병렬화하고, 특징 추출 및 정합 결과를 이용하여 파노라마 영상을 GPU에서 고속으로 생성하는 방법을 제안한다. 병렬화 된 알고리즘의 GPGPU(general purpose computation on GPU) 구현은 최신 스마트폰의 embedded GPU에서 지원하기 시작한 OpenCL을 이용하였다. 본 논문에서는 GPU에서 OpenGL Shading Language(GLSL)를 이용한 기존의 병렬화와 OpenCL을 이용한 새로운 병렬화 구현 결과를 효과적인 코드 구현 방법과 수행속도 관점에서 비교하였다. 실험결과, OpenCL은 GLSL과 유사한 수행 속도를 보였으며 embedded CPU와 비교하여 약 3~4배 빠른 수행속도를 보였다. 구현한 특징 추출 결과의 응용 사례로써, 특징 정합을 통한 영상 정합을 GPU상에서 병렬 수행하여 여러 장의 영상으로부터 파노라마 영상을 고속으로 생성하는 사례를 보인다.

초음파 영상에서 변형된 직교 골레이 코드를 이용한 동시 다중 송신 집속 기법 (Multiple Transmit Focusing Method With Modified Orthogonal Golay Codes for Ultrasound Imaging)

  • 김배형;송태경
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권3호
    • /
    • pp.217-231
    • /
    • 2003
  • 상보적인 특성을 갖는 골레이 수열을 이용하여 코드화된 신호를 송신하는 것은 SNR과 침투도를 향상시킬 수 있는 효과적인 방법이다. 그러나 각 주사선을 형성하기 위해 두 개의 상보적인 이진 코드를 연속하여 두 번 송신하기 때문에 프레임 율이 반으로 감소하게 된다 특히 이 방법은 측방향 해상도를 향상시키기 위해 다중 집속 기법(multi-zone focusing method)을 적용하면 송신 집속점의 개수에 따라 송신 횟수가 늘어나므로 프레임 율(frame rate)이 크게 저하된다. 본 논문에서는 이러한 문제를 해결하기 위해 변형된 직교 골레이 코드를 이용한 동시 다중 송신 집속 기법을 제안하였다 제안한 방법은 프레임 율의 저하 없이도 두 쌍의 직교 골레이 코드를 사용하여 서로 다른 위치에 동시에 송신 집속할 수 있다. 그리고 수신시에 정합 과정을 통해 분리, 압축한 다음 일반적인 다중 집속 기법과 같이 집속된 빔들을 결합함으로써 기존의 골레이 코드를 사용하는 송신 고정 집속 기법과 같은 프레임 율을 유지하면서도 측방향 해상도를 개선할 수 있다. 실제 초음파 영상을 위해 송신 신호로 사용되는 골레이 코드는 전송 전력 효율(Transmit Power Efficiency)을 높일 수 있도록 변형되었다. 컴퓨터 모사 실험과 실제 실험 결과는 제안한 방법이 기존의 방법에 비해 매우 향상된 측방향 해상도와 침투도를 갖는 초음파 영상을 제공한다는 것을 보여준다.