• 제목/요약/키워드: Wavelet video

검색결과 171건 처리시간 0.025초

휴대 전화를 위한 웨이블릿 기반의 비디오/오디오 플레이어 (Wavelet Based Video/Audio Player for Cellular Phone)

  • 정진환;한상범;류은석;유혁;김일진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.493-495
    • /
    • 2003
  • 최근의 휴대 전화는 단순한 음성 통신 기기 역할 뿐만 아니라 데이터 통신 기기로도 쓰이고 있으며, CDMA-2000 망 보급으로 인하여 데이터 통신 대역폭이 멀티미디어 데이터를 처리 할 수 있을 만큼 증대 되었다. 하지만 휴대 전화는 하드웨어 성능이 음성 통신 기기로 최적화 되어 있고 휴대성을 높이기 위해 저전력의 저 성능 프로세서를 탑재 하였기 때문에 소프트웨어 방식의 비디오/오디오 재생이 매우 힘들다. 특히. 널리 사용되는 비디오/오디오 표준(MPEG-x, H.26x, 등등)은 압축 최우선의 방식으로써 계산량이 매우 크기 때문에 휴대 전화에서 하드웨어 도움 없이 소프트웨어로만 재생하기에는 적합하지 않다. 본 논문에서는 이러한 문제를 해결하기 위해 먼저 일반 목적의 널리 사용되는 코덱의 문제점과 휴대전화의 하드웨어 자원에 관해 알아 보고, 연산량을 효과적으로 조절할 수 있는 웨이블릿 함수를 이용하여 휴대 전화 시스템에 적합한 비디오/오디오 코덱을 제안한다. 또한 비디오 디코딩에 필요한 연산을 측정하고 실제 휴대 전화에 적용하여 그 성능을 확인 한다.

  • PDF

시공간 엔트로피 임계법과 카메라 패닝 보상을 이용한 객체 기반 동영상 분할 (Object-Based Video Segmentation Using Spatio-temporal Entropic Thresholding and Camera Panning Compensation)

  • 백경환;곽노윤
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.126-133
    • /
    • 2003
  • 본 논문은 비디오 시퀸스에 카메라 패닝 보상과 2차원 시공간 엔트로피 임계법을 적용하여 추출한 객체포함영역을 대상으로 영상 분할을 수행하는 이동객체 분할 기법에 관한 것이다. 우선, 웨이블렛 변환에 의해 구성한 피라미드 계층 구조상에서 카메라 패닝 벡터를 추정하여 전역 움직임을 보상한다. 이후, 전역 움직임이 보상된 기준영상을 대상으로 각 프레임간에서 2차원 시공간 엔트로피 임계법을 적용하여 이동 객체가 포함될 가능성이 있는 영역을 블록 단위로 추출한다 다음으로, 2차원 시공간 엔트로피 임계법에 의해 분류된 영역을 토대로 각 블록을 움직임 블록, 준 움직임 블록, 비 움직임 블록 중 어느 하나로 분류한 검색 테이블을 작성한다. 이어서, 검색 테이블을 참조하여 초기 탐색 계층 및 탐색 영역을 적응적으로 선정함으로써 피라미드 계층 구조상에서 효율적인 고속 움직임 추정을 수행하여 이동 객체에 해당하는 객체포함영역만을 추출한다. 최종적으로, 이렇게 추출된 객체포함영역에서 임계 기울기 영상을 정의한 후, 이를 기준 삼아 객체포함영역에 화소단위의 형태학 기반 영상 분할 알고리즘을 적용함으로써 비디오 시퀸스에 포함된 이동 객체를 분할한다. 컴퓨터 시뮬레이션 결과를 통해 고찰할 때, 제안된 방법은 이동 객체에 대한 상대적으로 우수한 분할 특성을 제공할 수 있고, 특히 저대조 경계면의 분할 특성을 제고시키고 있음을 확인할 수 있다.

  • PDF

실시간 응용을 위한 웨이블릿 변환 기반의 얼굴 검출 (Wavelet Transform-based Face Detection for Real-time Applications)

  • 송해진;고병철;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권9호
    • /
    • pp.829-842
    • /
    • 2003
  • 최근 화상 회의, 화상 전화, 모바일 환경에서의 화상 통신, 얼굴 인식을 이용한 보안 시스템 등의 상업화에 힘입어 비디오에서의 얼굴 검출 및 추적 기술은 눈부신 발전을 이룩하였다. 또한, 얼굴 요소 검출은 요소 그 자체뿐 아니라 정화한 얼굴 영역 검출을 위한 필수 단계로서 중요한 연구 주제가 되고 있다. 그러나 영상에 나타난 복잡한 배경과 카메라 조작 및 조명에 의한 색상 왜곡 그리고 다양한 조명 조건 둥은 얼굴 검출 및 추적, 요소 검출에 있어 여전히 큰 장애가 되고 있다. 이에 따라, 본 논문에서는 실시간 화상 통신을 위한 새로운 얼굴 영역 검출 및 추적 알고리즘과 검출된 얼굴 영역에서 효과적으로 눈 영역을 검출할 수 있는 알고리즘을 제안한다. 제안하는 얼굴 검출 알고리즘은 복잡한 배경과 다양한 조명 조건에 관계없이 얼굴을 검출하고 추적하기 위해 웨이블릿 변환된 세 종류의 부 영역을 이용하여 얼굴 형판을 생성하고 웨이블릿 변환된 입력 영상과의 유사도를 측정하여 얼굴을 검출한다. 특히 다양한 조명 조건을 극복하기 위해 최소-최대 정규화와 히스토그램 평활화를 혼합 적용하여 매우 밝거나, 매우 어두운 영상에서의 얼굴 오 검출 및 놓침을 줄일 수 있었으며 세 가지 크기의 얼굴 형판을 이용함으로써 입력 영상에 존재하는 다양한 크기의 얼굴도 검출할 수 있었다. 또한 효과적인 얼굴 추적 알고리즘을 통해 다음 프레임에서의 얼굴 위치를 예측하고 예측된 얼굴 위치를 중심으로 탐색 영역을 정해 형판 정합을 수행함으로써 얼굴 검출률을 높이면서 수행 시간도 단축시킬 수 있었다. 수직, 수평방향 투영을 이용한 합리적인 눈 검출 알고리즘은 어두운 조명이나 부정확한 얼굴 영역에서도 만족스러운 결과를 보여주었다.26$이었으며, 점차 감소, 다시 증가하여 담금 10일에는 $3.42{\sim}3.69$이었다. 시험구별로는 KKR이 가장 낮았다. 총산은 담금 1일에 $0.29{\sim}0.82%$였으며 담금 6일에 $1.75{\sim}2.53%$로 최고값을 나타내었으며 그 후 감소하여 담금 10일에는 $1.61{\sim}2.34%$였다. 시험구간에는 KKR, SKR이 비교적 높은 값을 나타내었다. 무기질 함량은 발효기간이 경과할수록 증하였고 Ca는 $2.95{\sim}36.76$, Cu는 $0.01{\sim}0.14$, Fe는 $0.71{\sim}3.23$, K는 $110.89{\sim}517.33$, Mg는 $34.78{\sim}122.40$, Mn은 $0.56{\sim}5.98$, Na는 $0.19{\sim}14.36$, Zn은 $0.90{\sim}5.71ppm$을 나타내었으며, 시험구별로 보면 WNR, BNR구가 Na만 제외한 다른 무기성분 함량이 가장 높았다.O to reduce I/O cost by reusing data already present in the memory of other nodes. Finally, chunking and on-line compression mechanisms are included in both models. We demonstrate that we can obtain significantly high-performance

웨이블릿 영역에서의 선택적 부분 영상 암호화 (Selectively Partial Encryption of Images in Wavelet Domain)

  • 서영호;;김동욱
    • 한국통신학회논문지
    • /
    • 제28권6C호
    • /
    • pp.648-658
    • /
    • 2003
  • 영상/비디오 컨텐츠의 사용이 급증함에 따라 유료 및 비밀유지를 필요로 하는 영상데이터에 대한 보안문제가 크게 대두되고 있다. 본 논문에서는 영상데이터를 숨기기 위한 영상 암호화 방식을 제안하였다. 이 방법은 웨이블릿 영역에서 양자화과정을 마친 영상 데이터를 대상으로 한다. 본 논문은 영상의 전체데이터가 아닌 부분데이터를 암호화하는 방식을 사용하는데, 세 가지 형태의 부분데이터 추출방식을 사용하였다. 먼저, 웨이블릿 변환이 원영상을 주파수 대역으로 재편성함을 이용하여 영상정보 중 특정 주파수를 숨김으로서 전체 영상을 인식할 수 없도록 하였다. 각 화소를 나타내는 데이터에서도 모든 데이터를 사용하지 않고 MSB만을 선택하여 암호화 대상에 포함시켰다. 마지막으로 특정 부대역의 화소들을 무작위로 선택하였으며, 이 때 선형귀환 시프트 레지스터(Linear Feedback Shift Register, LFSR)를 사용하였다. LFSR의 초기값과 출력비트의 선택에 있어서 암호화키의 일부분을 사용함으로써 암호화 강도를 더욱 높였다. 제안한 방법을 소프트웨어로 구현하여 약 500개의 영상을 대상으로 실험한 결과 원영상 데이터의 약 1/1000의 데이터 양을 암호화함으로써 원영상을 인식할 수 없을 정도의 암호화효과를 얻을 수 있음을 알 수 있었다. 따라서 제안한 방법은 작은 양의 암호화로 효과적으로 영상을 숨기는 방법임을 확인할 수 있었다. 본 논문에서는 부대역의 선택과 LFSR 출력 중 사용비트의 양에 따른 여러 방식을 제안하였으며, 이들의 암호화 수행시간과 암호화효과 사이에 상보적인 관계가 있음을 보여, 적용분야에 따라 선택적으로 사용할 수 있음을 보였다. 또한 본 논문의 방식들은 응용계층에서 수행되는 것으로, 현재 유·무선 통합 네트워크의 중요한 문제로 대두되고 있는 끝과 끝 (end-to-end)의 보안에 대한 좋은 해결방법으로 사용될 수 있으리라 기대된다.

블라인드 워터마킹을 내장한 실시간 비디오 코덱의 FPGA기반 단일 칩 구조 및 설계 (FPGA-based One-Chip Architecture and Design of Real-time Video CODEC with Embedded Blind Watermarking)

  • 서영호;김대경;유지상;김동욱
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1113-1124
    • /
    • 2004
  • 본 논문에서는 입력 영상을 실시간으로 압축 및 복원할 수 있는 하드웨어(hardware, H/W)의 구조를 제안하고 처리되는 영상의 보안 및 보호를 위한 워터마킹 기법(watermarking)을 제안하여 H/W로 내장하고자 한다. 영상압축과 복원과정을 하나의 FPGA 칩 내에서 처리할 수 있도록 요구되는 모든 영상처리 요소를 고려하였고 VHDL(VHSIC Hardware Description Language)을 사용하여 각각을 효율적인 구조의 H/W로 사상하였다. 필터링과 양자화 과정을 거친 다음에 워터마킹을 수행하여 최소의 화질 감소를 가지고 양자화 과정에 의해 워터마크의 소실이 없으면서 실시간으로 동작이 가능하도록 하였다. 구현된 하드웨어는 크게 데이터 패스부(data path part)와 제어부(Main Controller, Memory Controller)로 구분되고 데이터 패스부는 영상처리 블록과 데이터처리 블록으로 나누어진다. H/W 구현을 위해 알고리즘의 기능적인 간략화를 고려하여 H/W의 구조에 반영하였다. 동작은 크게 영상의 압축과 복원과정으로 구분되고 영상의 압축 시 대기지연 시간 없이 워터마킹이 수행되며 전체 동작은 A/D 변환기에 동기하여 필드단위의 동작을 수행한다. 구현된 H/W는 APEX20KC EP20K600CB652-7 FPGA 칩에서 69%(16980개)의 LAB(Logic Array Block)와 9%(28352개)의 ESB(Embedded System Block)을 사용하였고 최대 약 82MHz의 클록주파수에서 안정적으로 동작할 수 있어 초당 67필드(33 프레임)의 영상에 대해 워터마킹과 압축을 실시간으로 수행할 수 있었다.

EZW 비트열의 ZTR 심벌을 이용한 디지털 워터마킹 (Digital Watermarking of EZW Coded Image using ZTR symbol)

  • 김현우;이호근;이명영;하영호
    • 대한전자공학회논문지SP
    • /
    • 제42권1호
    • /
    • pp.43-50
    • /
    • 2005
  • 본 논문은 기존의 EZW 압축방법을 이용하여 EZW 비트스트림에 이진으로 부호화된 영상을 삽입하고 추출하는 방법을 제안한다. EZW 부호화 방법은 두 가지 경로를 가지는데, 첫 번째 경로는 P, N, IZ, ZTR의 네가지 심벌을 가진다. 두 번째 경로에서는 이 심벌들에 대해 세부적인 값을 부호화한다. 제안한 방법에서는 첫 번째 경로의 ZTR 심벌을 이용하여, 웨이블릿 변환에 의해 전송되는 원영상의 고주파수 영역에 나타나는 ZTR 심벌에 워터마크를 삽입한다. 제안한 디지털 워터마킹 방법은 낮은 비트율에서 좋은 성질을 보여주었다. 향후 비디오나 3차원 영상의 워터마킹은 새로운 영역으로 자리 잡을 것이다.

홀로마킹: Fresnel 홀로그램을 이용한 디지털 워터마킹 기법 (HoloMarking: Digital Watermarking Method using Fresnel Hologram)

  • 최현준;서영호;유지상;김동욱
    • 한국통신학회논문지
    • /
    • 제34권6C호
    • /
    • pp.604-610
    • /
    • 2009
  • 본 논문에서는 디지털 콘텐츠의 위 변조, 불법사용 및 복제를 방지하기 위하여 비가시성과 공격에 대한 강인성을 동시에 만족하는 디지털 워터마킹 방법을 소개한다. 이 방법은 워터마크 자체의 강인성을 향상시키기 위해 Fresnel 변환을 이용하여 생성한 워터마크(디지털 홀로그램)를 삽입한다. 워터마크의 삽입위치는 원 영상의 주파수 특성과 워터마크로 사용되는 디지털 홀로그램의 특성을 고려하여 선정한다. 또한 삽입할 워터마크의 양은 2DDWT(2-dimensional discrete wavelet transform)의 변환 레벨을 고려하여 결정한다. 본 알고리듬은 C++을 이용하여 구현하였으며, 자체 제작한 광학 시스템을 테스트 베드로 하여 비가시성과 강인성을 실험하였다. 실험결과 삽입한 워터마크의 비가시성이 충분히 만족되었고, 일반적인 공격방법에 대해 추출된 워터마크의 에러율이 15% 이하의 강인성을 보였다.

실시간 Dense Disparity Map 추출을 위한 고성능 가속기 구조 설계 (High Performance Coprocessor Architecture for Real-Time Dense Disparity Map)

  • 김정길;;김신덕
    • 정보처리학회논문지A
    • /
    • 제14A권5호
    • /
    • pp.301-308
    • /
    • 2007
  • 본 논문에서는 위상기반 양안스테레오정합 알고리즘을 이용, 실시간으로 dense disparity map을 추출 가능한 고성능 가속기 구조를 설계하였다. 채택된 알고리즘은 웨이블릿 기반의 위상차 기법의 강건성과 위상상관 기법의 기본적인 control 기법을 결합한 Local Weighted Phase Correlation(LWPC) 스테레오정합 알고리즘으로서 4개의 주요 단계로 구성이 되어 있다. 해당 알고리즘의 효율적인 병렬 하드웨어의 설계를 위하여, 제안된 가속기는 각 단계의 기능블록은 SIMD(Single Instruction Multiple Data Stream) 모드로 동작하게 되며, 전체적으로 각 기능 블록은 파이프라인(pipeline) 모드로 실행된다. 그 결과 제안된 구조에서 제시된 파이프라인 동작 모드의 선형 배열 프로세서는 행렬 순차수행 방법에 의한 2차원 영상처리에서 전치메모리의 필요를 제거하면서도 연산의 일반성과 고효율을 유지하게 한다. 제안된 하드웨어 구조는 Xilinx HDL을 이용하여 필요한 하드웨어 자원을 look up table, flip flop, slice, memory의 소모량으로 표현하였으며, 그 결과 실시간 처리 성능의 단일 칩 구현 가능성을 보여주었다.

새로운 에지 방향 보간법을 이용한 효율적인 디인터레이싱 알고리듬 (An Efficient Deinterlacing Algorithm Using New Edge-Directed Interpolation)

  • 김민기;정제창
    • 방송공학회논문지
    • /
    • 제12권2호
    • /
    • pp.185-192
    • /
    • 2007
  • 보간법은 영상을 개선하거나 스캔율 변환 및 디인터레이싱(Deinterlacing), 리프팅 기반 웨이블릿 변환과 같은 많은 영상처리 분야에서 응용되는 기술이다. 이들 응용 사례 가운데 스캔율 변환 및 디인터레이싱은 디지털 TV 응용 분야에서 제안되었다. 본 논문에서는 새로운 에지 방향 보간법을 이용하여 효율적인 디인터레이싱 알고리듬을 제안한다. 제안된 디인터레이싱 알고리듬은 하나의 필드를 사용하는 화면내(Intra-Field) 디인터레이싱 방법이다. 가장 대표적인 ELA를 비롯하여 기존의 화면내 디인터레이싱 방법으로는 에지 성분을 비롯한 영상의 중요 정보가 상당 부분 소실되기 때문에 본 논문에서는 영상의 방향성을 고려한 보간 방법을 제안함으로써, 특히 방향성 에지와 같이 인간 시각에 민감한 성분이 많은 영상에 화질 열화를 방지하고자 한다. 다수의 동영상들에 대한 실험 결과 제안된 방법은 기존의 화면내 디인터레이싱 방법들에 비하여 주관적 화질뿐만 아니라 객관적인 성능도 우수함을 알 수 있다.

Feature-Based Image Retrieval using SOM-Based R*-Tree

  • Shin, Min-Hwa;Kwon, Chang-Hee;Bae, Sang-Hyun
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.223-230
    • /
    • 2003
  • Feature-based similarity retrieval has become an important research issue in multimedia database systems. The features of multimedia data are useful for discriminating between multimedia objects (e 'g', documents, images, video, music score, etc.). For example, images are represented by their color histograms, texture vectors, and shape descriptors, and are usually high-dimensional data. The performance of conventional multidimensional data structures(e'g', R- Tree family, K-D-B tree, grid file, TV-tree) tends to deteriorate as the number of dimensions of feature vectors increases. The R*-tree is the most successful variant of the R-tree. In this paper, we propose a SOM-based R*-tree as a new indexing method for high-dimensional feature vectors.The SOM-based R*-tree combines SOM and R*-tree to achieve search performance more scalable to high dimensionalities. Self-Organizing Maps (SOMs) provide mapping from high-dimensional feature vectors onto a two dimensional space. The mapping preserves the topology of the feature vectors. The map is called a topological of the feature map, and preserves the mutual relationship (similarity) in the feature spaces of input data, clustering mutually similar feature vectors in neighboring nodes. Each node of the topological feature map holds a codebook vector. A best-matching-image-list. (BMIL) holds similar images that are closest to each codebook vector. In a topological feature map, there are empty nodes in which no image is classified. When we build an R*-tree, we use codebook vectors of topological feature map which eliminates the empty nodes that cause unnecessary disk access and degrade retrieval performance. We experimentally compare the retrieval time cost of a SOM-based R*-tree with that of an SOM and an R*-tree using color feature vectors extracted from 40, 000 images. The result show that the SOM-based R*-tree outperforms both the SOM and R*-tree due to the reduction of the number of nodes required to build R*-tree and retrieval time cost.

  • PDF