• 제목/요약/키워드: image partitioning

검색결과 106건 처리시간 0.026초

각 분할 스핀 영상을 사용한 3차원 얼굴 특징점 검출 방법 (Robust 3D Facial Landmark Detection Using Angular Partitioned Spin Images)

  • 김동현;최강선
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.199-207
    • /
    • 2013
  • 스핀 영상은 3차원 표면의 특징을 효과적으로 표현하기 때문에 3차원 얼굴에서 특징점을 검출하는데 많이 이용된다. 하지만 기존의 스핀 영상은 표면의 법선 벡터 방향에 따라 매우 다른 스핀 영상이 만들어지는 단점이 있다. 또한 해당 영역 내에 존재하는 모든 점을 2차원으로 변환하여 고려하기 때문에 3차원 표면 특징이 모호해질 수 있다. 본 논문에서는 검색 영역을 분할한 스핀 영상을 이용하는 3차원 얼굴 특징점 검출 방법을 제안하였다. 기준점으로부터 떨어진 각도에 따라 검색범위를 분할하여 분할된 영역 내 점들에 대해 스핀 영상을 구성하여 방향에 따른 특징 추출을 극대화했다. 법선 벡터 평탄화를 이용하여 표면 법선 벡터 방향에 대한 잡음 민감성을 줄여 정확한 형태의 스핀 영상을 얻도록 했다. 실험을 통해 제안한 방법으로 찾은 특징점과 실측 특징점과의 거리차를 비교하여 기존방법에 비해 약 34% 향상된 정확도를 얻음을 확인했다.

세분화된 탐색 영역을 이용한 고속 전영역 움직임 예측 알고리즘 (A Fast Full Search Motion Estimation Algorithm using Partitioned Search Window)

  • 박상준;진순종;정제창
    • 한국통신학회논문지
    • /
    • 제32권1C호
    • /
    • pp.9-15
    • /
    • 2007
  • 본 논문에서는 비디오 부호화의 움직임 예측에 사용되는 블록 정합 알고리즘의 계산량을 줄이는 고속 전영역 탐색 알고리즘을 제안한다. 블록 정합 알고리즘에서 사용되는 기존의 나선형 탐색 방법은 탐색 영역의 중심에서 시작하여 탐색 지점을 화소 단위로 이동하면서 움직임 예측을 수행하기 때문에 움직임이 적은 영상에 적합하다. 본 논문에서는 탐색 영역을 작은 영역으로 세분화한 후 각 영역을 새로운 탐색 순서에 따라 움직임 예측을 수행함으로써 움직임이 많은 영상을 효과적으로 탐색할 수 있다. 또한 움직임 벡터 판정시 영상의 복잡도에 따라 최적의 순서로 비용을 계산하여 복잡도를 줄이는 방법을 제안한다. 실험 결과에서 제안하는 알고리즘이 기존의 나선형 전역 탐색 방법에 비해 예측화질의 열화 없이 최대 99%까지 계산량을 감소시키는 것을 확인할 수 있다.

고해상도 영상 압축을 위한 SPIHT 기반의 부대역 분할 압축 방법 (SPIHT-based Subband Division Compression Method for High-resolution Image Compression)

  • 김우석;박병서;오관정;서영호
    • 방송공학회논문지
    • /
    • 제27권2호
    • /
    • pp.198-206
    • /
    • 2022
  • 본 논문에서는 초고해상도를 갖는 복소 홀로그램을 압축하기 위한 전용 코덱에서 SPIHT (set partitioning in hierarchical trees)를 사용할 경우에 발생할 수 있는 문제점을 해결하기 위한 방법을 제안한다. 복소 홀로그램을 위한 코덱의 개발은 크게 전용 압축 방법을 만드는 방법과 HEVC 및 JPEG2000과 같은 앵커 코덱을 이용하고 전후처리 기법을 추가하는 방법으로 구분될 수 있다. 전용 압축 방법을 만드는 경우에 복소 홀로그램의 공간적인 특성을 해석하기 위한 별도의 변환 도구가 필요하다. EZW와 SPIHT 같은 부대역 단위의 제로트리 기반의 알고리즘들은 고해상도의 영상에 대해서 코딩할 경우에 비트스트림 제어 시 온전한 부대역의 정보가 제대로 전송되지 못하는 문제점을 갖는다. 본 논문에서는 이와 같은 문제를 해결하기 위한 웨이블릿 부대역의 분할 방법을 제안한다. 분할한 부대역을 각각 압축하는 것으로 부대역 전역의 정보가 균일하게 유지하도록 한다. 제안하는 방법은 기존 방법에 비하여, PSNR 대비 더 좋은 복원 결과를 보여주었다.

A technique for predicting the cutting points of fish for the target weight using AI machine vision

  • Jang, Yong-hun;Lee, Myung-sub
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.27-36
    • /
    • 2022
  • 본 논문에서는 이러한 어류 가공 현장의 문제점을 개선하기 위해서 AI 머신 비전을 이용한 어류의 목표 중량 절단 예측기법을 제안한다. 제안하는 방법은 먼저 입력된 물고기의 평면도와 정면도를 촬영하여 이미지기반의 전처리를 수행한다. 그런 다음 RANSAC(RANdom SAMmple Consensus)를 사용하여 어류의 윤곽선을 추출한 다음 3D 모델링을 사용하여 물고기의 3D 외부 정보를 추출한다. 이어서 추출된 3차원 특징 정보와 측정된 중량 정보를 머신러닝하여 목표 중량에 대한 절단 지점을 예측하기 위한 신경망 모델을 생성한다. 마지막으로 제안기법을 통해 예측된 절단 지점으로 직접 절단한 뒤 그 중량을 측정하였다. 그리고 측정된 무게를 목표 무게와 비교하여 MAE(Mean Absolute Error) 와 MRE(Mean Relative Error)와 같은 평가 방법을 사용해 성능을 평가하였다. 그 결과, 목표 중량과 비교해 3% 이내의 평균 오차율을 달성하였다. 제안된 기법은 향후 자동화 시스템과 연계되어 수산업 발전에 크게 기여할 것으로 전망한다.

오디오 데이터 내 개인 신상 정보 검출과 마스킹을 위한 인공지능 API의 활용 및 음성 분할 방법의 연구 (A System of Audio Data Analysis and Masking Personal Information Using Audio Partitioning and Artificial Intelligence API)

  • 김태영;홍지원;김도희;김형종
    • 정보보호학회논문지
    • /
    • 제30권5호
    • /
    • pp.895-907
    • /
    • 2020
  • 최근 기존 텍스트 기반 콘텐츠 외 멀티미디어 콘텐츠의 영향력이 급증함에 따라 콘텐츠 내 정보들을 처리할 수 있도록 도와주는 서비스가 콘텐츠 이용에 큰 편리함을 주고 있다. 이러한 서비스의 대표적인 기능으로는 중요 정보에 대한 검색과 마스킹이 있다. 텍스트 데이터와 이미지 데이터의 검색 및 마스킹 기술을 제공해주는 솔루션들은 활발히 보급되고 있어 쉽게 접할 수 있다. 그러나 오디오 콘텐츠의 경우, 검색 및 마스킹의 필요성은 인식되지만 기술의 난이도로 인해 범용적으로 적용되는 솔루션을 찾는 것이 쉽지 않다. 본 논문은 음성 분할을 이용하여 오디오 데이터 내 정보 검색과 마스킹 기능을 제공하는 웹 애플리케이션을 제안한다. 추가적으로, 국내외 인공지능 기반 음성 인식 API에 대한 분석을 통해 적절한 API의 선택을 진행하였으며, 정규식을 이용한 개인 신상 정보의 검출 방법을 제시하였다. 마지막으로 구현결과의 정확도를 측정하여 성능을 검증하였다. 본 논문의 기여점은 오디오 데이터 내 특정 패턴의 검출 및 마스킹 기능을 설계하고 실험을 통해 검증한 것에 있다.

표면분할을 이용한 시차공간상에서의 모델 기반 평면검출 (Model-Based Plane Detection in Disparity Space Using Surface Partitioning)

  • 하홍준;이창훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권10호
    • /
    • pp.465-472
    • /
    • 2015
  • 본 논문에서는 시차공간상의 평면검출 방법을 제안하고 그 성능을 평가한다. 다양한 표면을 평면으로 근사하고 검출함으로써 시차공간에 나타난 장면을 간소화하고 수식화하여 다루기 쉽도록 한다. 또한 시차공간에서 근사적으로 구한 평면은 3차원 공간상에서 실측 크기로 표현 가능하고 장애물 검출 및 카메라 위치 추정에 활용할 수 있다. 먼저 스테레오 매칭 기술을 이용해 두 개의 영상으로부터 2차원 공간상에 좌표쌍마다 시차값을 가지는 시차공간을 생성한다. x 또는 y축의 전체적인 추이를 반영하도록 돕는 선 단순화 기법을 이용하여 시차값의 접선 기울기를 추정한다. 기울기 쌍의 조합에 따라 10개의 라벨을 시차공간의 좌표쌍에 부여한다. 상하좌우 방향으로 인접하고 동일한 라벨을 가지는 좌표쌍을 연결하여 군집을 생성하고 최소자승법을 이용해 각 군집에 대한 평면식을 추정한다. 시차공간 내에서 평면식을 만족하는 점들이 가장 많은 평면을 검출하고 이를 시차공간을 가장 잘 간소화한 N개의 평면으로 선택한다. 평면검출의 성능을 정량적으로 평가하였고 그 결과는 3차원 원뿔과 원통에서 각각 97.9%, 86.6% 품질을 보였다. 스테레오 비전 알고리즘의 성능을 평가하기 위해 대표적으로 이용되는 Middlebury와 KITTI 실험데이터로부터 제안된 평면검출 방법은 훌륭하게 평면을 검출하였다.

Fine-scalable SPIHT Hardware Design for Frame Memory Compression in Video Codec

  • Kim, Sunwoong;Jang, Ji Hun;Lee, Hyuk-Jae;Rhee, Chae Eun
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제17권3호
    • /
    • pp.446-457
    • /
    • 2017
  • In order to reduce the size of frame memory or bus bandwidth, frame memory compression (FMC) recompresses reconstructed or reference frames of video codecs. This paper proposes a novel FMC design based on discrete wavelet transform (DWT) - set partitioning in hierarchical trees (SPIHT), which supports fine-scalable throughput and is area-efficient. In the proposed design, multi-cores with small block sizes are used in parallel instead of a single core with a large block size. In addition, an appropriate pipelining schedule is proposed. Compared to the previous design, the proposed design achieves the processing speed which is closer to the target system speed, and therefore it is more efficient in hardware utilization. In addition, a scheme in which two passes of SPIHT are merged into one pass called merged refinement pass (MRP) is proposed. As the number of shifters decreases and the bit-width of remained shifters is reduced, the size of SPIHT hardware significantly decreases. The proposed FMC encoder and decoder designs achieve the throughputs of 4,448 and 4,000 Mpixels/s, respectively, and their gate counts are 76.5K and 107.8K. When the proposed design is applied to high efficiency video codec (HEVC), it achieves 1.96% lower average BDBR and 0.05 dB higher average BDPSNR than the previous FMC design.

필터방식 얼굴검출 하드웨어의 저전력 설계 (Low Power Design of Filter Based Face Detection Hardware)

  • 김윤구;정용진
    • 대한전자공학회논문지SD
    • /
    • 제45권6호
    • /
    • pp.89-95
    • /
    • 2008
  • 본 논문에서는 필터방식 얼굴검출 하드웨어를 저전력 설계하고 그에 따른 전력 소모량을 분석하였다. 얼굴검출 하드웨어는 입력되는 영상에서 얼굴의 위치를 검출하며 내부적으로 6개 모듈과 11개의 모듈 간 버퍼가 삽입되어 각 모듈이 순환 연산한다. 따라서 저전력 설계를 위해 SLEEP 모드와 ACTIVE 모드를 적용하였고, 해당 하드웨어에 모듈별 그리고 레지스터별 클럭게이팅(Clock Gating) 기술을 적용하였다. 추가적으로 모듈간 버퍼는 메모리 파티션을 통해 메모리에서 소비하는 전력양을 줄였으며 게이트 레벨에서도 저전력 설계 기술(Gate level power optimization)을 적용하였다. 이는 삼성 0.18um 공정의 STD130 라이브러리를 사용하여 Synopsis(사)의 Power-Compiler를 통해 구현되었으며 동사의 Prime-Power에 의해 소비 전력량을 측정하였다. 그 결과 저전력 설계 기술을 적용하기 전과 비교하여 ACTIVE 모드일 경우 약 68%의 전력 소모를 줄였다.

세분화된 탐색 범위에서의 방향 지향적 전영역 고속 탐색 알고리즘 (Direction-Oriented Fast Full Search Algorithm at the Divided Search Range)

  • 임동영;박상준;정제창
    • 방송공학회논문지
    • /
    • 제12권3호
    • /
    • pp.278-288
    • /
    • 2007
  • 본 논문에서는 비디오 부호화의 움직임 예측에 사용되는 블록 정합 알고리즘의 계산량을 줄이는 고속 전영역 탐색 알고리즘을 제안한다. 블록 정합 알고리즘에서 사용되는 기존의 나선형 탐색 알고리즘은 탐색 영역의 중심에서 시작하여 탐색 지점을 화소 단위로 이동화면서 움직임 예측을 수행하기 때문에 움직임이 적은 영상에 적합하다. 본 논문에서는 움직임이 작은 영상 뿐 아니라 움직임이 많은 영상에서도 효율적인 움직임 예측을 하기 위해 다음과 같은 알고리즘을 제안한다. 먼저 초기 문턱 값을 계산함에 있어서 확장된 예측기를 사용하여 보다 최소값에 근사한 문턱값을 계산한다. 그리고 탐색영역을 블록으로 세분화 한 후 각 영역을 새로운 탐색 순서에 따라 움직임 예측을 수행하고 방향성에 따라 영역을 재분할한다. 재분할된 영역이 가지는 방향성에 따라 방향 지향적인 탐색 순서를 적용한다. 실험 결과에서 제안하는 알고리즘이 기존의 나선형 전영역 탐색 알고리즘에 비해 객관적인 화질의 열화 없이 계산량이 평균적으로 약 94% 감소하는 것을 확인할 수 있다.

퍼지 성능 측정자를 결합한 최적 클러스터 분석방법 (An Optimal Cluster Analysis Method with Fuzzy Performance Measures)

  • 이현숙;오경환
    • 한국지능시스템학회논문지
    • /
    • 제6권3호
    • /
    • pp.81-88
    • /
    • 1996
  • 클러스터링은 주어진 데이타 집합의 패턴을 비슷한 성질을 가지는 그룹으로 나누어 패턴 상호간의 관계를 정립하기 위한 방법론이다. 이러한 클러스터링 기법을 위하여 많은 알고리즘이 개발되었고, 패턴인식과 영상처리 등의 여러 공학영역에 적용되어 왔다. 대부분의 실세계 데이타는 그 경계가 명확하지 않으므로 그 특성을 보다 정확히 반영하기 위하여 퍼지이론이 도입되었다.이와 같은 클러스터 분석 방법은 보다 적절히 으용하기 위하여 클러스터링의 적절성을 평가하기 위한 방법론과 함께 연구되어야 한다. 이를 위하여 각 데이타 패턴이 얼마나 잘 분류되었는지를 수학적으로 계산하기 위한 함수들이 제안되었다. 그러나 클로스터 타당성 문제는 주어지 클러스터링 방법론의 특성, 그 알고리즘에서 사용한 파라메터의 성질, 주어진 입력 데이타 집합의 특성 등 여러 복잡한 상황을 포함하고 있으므로 기존의 연구에서와 같이 하나의 함수를 이용하여 해결하기는 어렵다. 그러므로 본 논문에서는 기존에 연구되어온 타당성 측정 함수를 조사하고 그의 단점을 고찰하여 이를 해결하기 위한 방법으로 4가지성능 측정자를 제안하고 이의 결합에 의하여 형성된 클러스터 타당성의 정도를 구하는 방법론을 제시하고자 한다. 또한 이러한 방법은 퍼지 클러스터링을 위한 학습 알고리즘과 결함하여 클러스터의 수나 데이타의 분포에 대한 정보없이 최적 클러스터를 찾아주는 방법에 응용될 수 있음을 보인다.

  • PDF