• 제목/요약/키워드: 에지 방향정보

검색결과 247건 처리시간 0.022초

DCT와 정보 화소 밀도를 이용한 PDA로 획득한 명함 영상에서의 영역 해석 (Region Analysis of Business Card Images Acquired in PDA Using DCT and Information Pixel Density)

  • 김종흔;장익훈;김남철
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1159-1174
    • /
    • 2004
  • 본 논문에서는 PDA에 장착된 카메라를 사용하여 획득한 명함 영상에 대한 효율적인 영역 해석 알고리듬을 제안한다. 제안된 방법은 크게 영역 분할, 정보 영역 분류, 문자 영역 분류의 3개 과정으로 구성된다. 영역 분할에서는 입력 명함 영상을 8${\times}$8 크기의 블록으로 나누고 각 블록을 저주파 대역에서의 정규화 된 DCT 계수의 에너지를 이용하여 정보 블록과 배경 블록으로 분류한 다음, 블록에 대한 영역 라벨링을 통하여 정보 영역과 배경 영역으로 분할한다. 정보 영역 분류에서는 각 정보 영역을 블록 신호의 수평, 수직 방향 에지 성분과 저주파 대역에서의 DCT 계수의 에너지 비와 이진화 된 정보 영역 내에서의 흑화소인 정보 화소의 밀도를 이용하여 문자 영역과 배경 영역으로 분류한다. 문자 영역 분류에서는 분류된 문자 영역을 정보 화소의 밀도와 평균 런 길이를 이용하여 다시 큰 문자와 작은 문자 영역으로 분류한다. 실험결과 제안된 영역 해석 방법은 여러 종류의 명함을 다양한 주변 여건에서 PDA로 획득한 시험 영상에 대하여 정보 영역과 배경 영역을 잘 분할하고, 정보 영역을 문자 영역과 그림 영역으로 잘 분류하며, 다시 문자 영역을 큰 문자와 작은 문자 영역으로 잘 분류함을 보였다 그리고 제안된 영역 분할 방법과 정보 영역 분류 방법은 기존의 방법들보다 각각 약 2.2-10.1%와 7.7%의 에러율 향상을 보였다.

영역정보기반의 유전자알고리즘을 이용한 텍스트 후보영역 검출 (Detection of Text Candidate Regions using Region Information-based Genetic Algorithm)

  • 오준택;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.70-77
    • /
    • 2008
  • 본 논문은 화소 단위의 정보가 아닌 분할된 영역들의 정보를 기반으로 유전자 알고리즘을 이용한 텍스트 후보영역 검출방안을 제안한다. 먼저, 영상분할을 수행하기 위해 색상별 화소분류와 비동질적인 군집의 감소를 위한 영역 단위의 재분류 알고리즘을 수행한다. 색상별 화소분류에 이용되는 EWFCM(Entropy-based Weighted Fuzzy C-Means) 알고리즘은 공간정보를 추가한 개선된 FCM 알고리즘으로써, 잡음에 강건한 특징을 가진다. EWFCM 알고리즘에 의해 분류된 화소들의 군집정보를 기반으로 수행되는 영역 단위의 재분류는 화소나 군집 단위의 재분류에 비해 효과적으로 영상에 존재하는 비동질적인 군집들을 감소시킬 수 있다. 그리고 텍스트 후보영역 검출은 분할된 영역들로부터 추출한 방향성 에지 성분에 대한 분산값 및 에너지, 크기, 개수 등의 정보를 기반으로 유전자알고리즘에 의해 수행된다. 이는 화소 단위의 정보를 이용한 방법보다 더 명확한 텍스트 영역정보를 획득할 수 있으며, 향후 자동문자인식에서 좀 더 손쉽게 이용될 수 있다. 실험 결과 제안한 분할방법은 기존 방법이나 화소나 군집 기반의 재분류보다 좋은 결과를 보였으며, 텍스트 후보영역 검출에서도 화소 단위의 정보를 이용한 기존 방법보다 더 좋은 결과를 보여 제안방법의 유효성을 확인하였다.

영상 부호화 효율을 위한 새로운 화면 내 부호화 방법 (New Intra Coding Scheme for Improving Video Coding Efficiency)

  • 김지언;노대영;정세윤;이진호;오승준
    • 방송공학회논문지
    • /
    • 제16권3호
    • /
    • pp.448-461
    • /
    • 2011
  • H.264/AVC는 새로운 부호화 기술에 의해 이전 비디오 부호화 표준보다 높은 성능을 나타낸다. 이러한 부호화 기술들 중 화면내 예측 부호화 기술은 부호화 효율을 높이는 중요 기술이다. H.264/AVC의 화면내 예측 부호화 기술에서 예측 모드 정보를 부호화하기 위해 최우선 모드를 이용하며 최우선 모드의 선택율은 매우 높다. 또한 일반적으로 자연 영상이나 동영상의 경우 균일한 특성을 나타내는 영역을 많이 포함하고 있으며, 이러한 영역은 주변 블록과의 상관도가 매우 높다. 따라서 주변 블록의 예측 모드, 화소 에지의 방향성을 이용하면 복호화기에서도 현재 블록의 최적의 예측 모드를 결정할 수 있다. 본 논문에서는 화면내 부호화 효율을 향상시키기 위해 예측 모드 정보를 전혀 전송하지 않는 복호화기 예측을 이용한 화면내 SKIP 부호화 모드를 제안한다. 제안하는 방법은 주변 블록의 정보만을 이용하여 예측 모드를 결정하고 기존의 예측/변환 방법을 이용하여 부호화를 실시하며 예측 모드 정보는 전혀 전송하지 않는다. 부호화가 생략된 예측 모드 정보는 주변 블록의 정보만을 이용하여 결정된 것이기 때문에 복호화기가 부호화기에서 결정된 예측 모드와 동일하게 결정할 수 있다. 실험 결과 제안하는 방법은 H.264/AVC의 참조 소프트웨어인 JM 17.0에 비하여 CIF 영상에서 1.40%, 720p 영상에서는 3.24%의 비트 감소를 나타내었다.

웨이블릿 영역에서 색차를 이용한 디모자이킹 방법 (Demosaicking Method Using Color Difference in Wavelet Domain)

  • 정보규;성영민;김병철;엄일규
    • 대한전자공학회논문지SP
    • /
    • 제47권4호
    • /
    • pp.41-48
    • /
    • 2010
  • 본 논문에서는 웨이블릿 영역에서 색차를 이용한 효과적인 디모자이킹 방법을 제안한다. 저주파 영역의 웨이블릿 계수는 관찰된 고주파 계수를 이용한 에지 방향적인 보간에 의해 구해진다. 손실된 고주파 계수는 추정된 저주파 계수에 의해 얻어진다. 고주파수 영역에서 결함을 줄이고 시각적인 질을 향상시키기 위해서 웨이블릿 영역에서 색차 방법을 이용하여 고주파수 계수를 업데이트 한다. 웨이블릿 영역에서 제안한 디모자이킹 방법을 시뮬레이션하고, 기존의 디모자이킹 방법들과 비교를 하였다. 실험 결과를 통해 제안 방법이 향상된 디모자이킹 결과를 발생시킨다는 것을 보여주었다.

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

DNN과 HoG Feature를 이용한 도로 소실점 검출 방법 (Method for Road Vanishing Point Detection Using DNN and Hog Feature)

  • 윤대은;최형일
    • 한국콘텐츠학회논문지
    • /
    • 제19권1호
    • /
    • pp.125-131
    • /
    • 2019
  • 소실점이란 실제 공간의 평행한 선들이 영상 내에 투영되면서 한곳에 모이는 점으로, 도로 공간에서의 소실점은 매우 중요한 공간정보이다. 도로 공간에서의 소실점을 이용해 추출된 차선의 위치를 개선하거나, 깊이지도 영상을 생성할 수 있다. 본 논문에서는 자동차의 시점을 기준으로 도로를 촬영한 영상을 Deep Neural Network(DNN)과 Histogram of Oriented Gradient(HoG) Feature를 이용한 소실점 검출 방법을 제안한다. 제안하는 알고리즘에서는 영상을 블록별로 나눠서 주요 에지 방향을 추출하는 HoG Feature 추출 단계와 DNN 학습 단계, 그리고 Test 단계로 나뉜다. 학습단계에서는 자동차 시점으로 기준으로 도로 영상 2300장으로 학습을 진행한다. 그리고 Test 단계에서는 Normalized Euclidean Distance(NormDist) 방법을 사용하여 제안하는 알고리즘의 효율성을 측정한다.

계층적 특징 결합 및 검증을 이용한 자연이미지에서의 장면 텍스트 추출 (Scene Text Extraction in Natural Images using Hierarchical Feature Combination and Verification)

  • 최영우;김길천;송영자;배경숙;조연희;노명철;이성환;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.420-438
    • /
    • 2004
  • 이미지에 인위적 또는 자연적으로 포함된 텍스트는 이미지의 내용을 함축적이고 구체적으로 표현하는 중요한 정의이다. 이러한 정보를 실시간에 추출하여 정확히 인식할 수 있다면 다양한 분야에서 활용될 수 있다. 본 논문에서는 자연이미지에 포함된 장면 텍스트를 추출하는 방법으로서 텍스트의 색 연속성, 자기 변화 및 색 변화와 같은 낮은 수준의 이미지 특징으로 텍스트 후보 영역을 찾고, 다해상도 (Multi-resolution) 웨이블릿(Wavelet) 변환을 이용하여 높은 수준의 텍스트 특징인 획의 구성 여부로 검증하는 계층적인 구조를 제안한다. 색 연속성 특징은 대부분의 텍스트는 동일한 색으로 구성된다는 특징을 이용하는 것이고, 밝기 변화 특징은 텍스트 영역은 주변과의 밝기 변화가 존재하며 에지 밀도가 높은 특징을 이용한다. 또한, 색 변화 특징은 텍스트 영역은 주변 배경과의 색 변화가 존재하며, 밝기 변화보다 민감한 색 분산 값으로 표현할 수 있다는 장점을 이용한다. 높은 수준의 텍스트 특징으로서 다해상도 웨이블릿 변환을 이용하여 텍스트 획의 방향성 정보를 추출하고, 추출된 정보를 SVM(Support Vector Machine) 분류기로 검증하여 최종 영역을 확정한다. 제안한 방법을 다양한 종류의 이미지에 적용한 결과 배경이 복잡해도 비교적 안정적으로 텍스트 영역을 추출하는 것을 확인할 수 있었다.