• 제목/요약/키워드: Downsampling

검색결과 43건 처리시간 0.212초

사용자 인터페이스 기능의 개인용 3D 방송단말을 위한 얼굴 및 눈인식 알고리즘의 고속 검출 방법 (High Speed Face and Eye Detection Algorithm for Personal 3D Broadcasting Devices with User Interactive Function)

  • 송혁;곽수영;배진우;최병호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.428-429
    • /
    • 2011
  • 3D 디스플레이 장치는 디스플레이 장치의 시점 수에 따라 다시점 디스플레이 장치 및 스테레오 디스플레이 장치로 구분할 수 있다. 스테레오 디스플레이 장치는 좌우 두 개의 영상을 디스플레이 방식에 따라 영상포맷을 변경하여 디스플레이에 보여지고 다시점 디스플레이는 두 개 이상의 영상 데이터를 포함하는 것으로 구분할 수 있다. 영상의 화질문제로 인하여 최근 3DTV는 스테레오 방식을 사용하고 있으며 대기업에서 양산하고 있는 기술이다. 스테레오 방식에서는 개인용 단말의 경우 사용자의 위치 및 눈의 위치에 따라 깊이감을 달리 보여주는 장치가 개발되고 있어 이에 대한 연구를 진행하였다. 이와같은 기술의 흐름에 맞춰 3D 디스플레이 장치를 위한 눈 추적 알고리즘을 구현하였다. 본 논문에는 카메라에서 입력되는 영상에서 얼굴영역을 Haar training 방법을 통하여 추출하였으며 PCA 방법을 통하여 눈 영역을 추출하였다. 알고리즘의 복잡도로 인하여 연산량을 줄이기 위하여 Downsampling 방법을 활용하여 연산량을 약 26% 감소시켰다. 본 연구 결과를 통하여 얼굴 및 눈 추적 알고리즘 구현시 최적화를 위하여 필요한 프로세스를 예측할 수 있다.

  • PDF

RandomForest와 XGBoost를 활용한 한국어 텍스트 분류: 서울특별시 응답소 민원 데이터를 중심으로 (Korean Text Classification Using Randomforest and XGBoost Focusing on Seoul Metropolitan Civil Complaint Data)

  • 하지은;신현철;이준기
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.95-104
    • /
    • 2017
  • 2014년 서울시는 시민의 목소리에 신속한 응대를 목표로 '서울특별시 응답소' 서비스를 시작하였다. 접수된 민원은 내용을 바탕으로 카테고리 확인 및 담당부서로 분류 되는데, 이 부분을 자동화시킬 수 있다면 시간 및 인력 비용이 감소될 것이다. 본 연구는 2010년 6월 1일부터 2017년 5월 31일까지 7년치 민원 사례 17,700건의 데이터를 수집하여, 최근 화두가 되고 있는 XGBoost 모델을 기존 RandomForest 모델과 비교하여 한국어 텍스트 분류의 적합성을 확인하였다. 그 결과 RandomForest에 대비 XGBoost의 정확도가 전반적으로 높게 나타났다. 동일한 표본을 활용하여 업 샘플링과 다운 샘플링 시행 후에는 RandomForest의 정확도가 불안정하게 나타난 반면, XGBoost는 전반적으로 안정적인 정확도를 보였다.

  • PDF

웨이블릿 리프팅과 비트평면 부호화에 기반한 새로운 문서 코덱 시스템 (A New Document Codec System based on Wavelet Lifting and Bitplane Coding)

  • 이호석
    • 한국멀티미디어학회논문지
    • /
    • 제6권5호
    • /
    • pp.805-815
    • /
    • 2003
  • 본 논문은 문서 분할, 웨이블릿 리프팅, 그리고 비트 평면 부호화에 기반한 문서 압축과 복원 시스템을 제시한다. 압축 과정에서 문자들의 모양을 유지하기 위하여 문서 분할을 사용한다. 웨이블릿 변환 방법으로는 웨이블릿 리프팅을 사용하며 웨이블릿 계수 값에 대하여 비트 평면을 구성하여 중요 서브블럭 단위로 압축을 수행한다. 중요 서브블록 부호화를 통하여 압축율을 높임과 동시에 압축속도 향상도 이룩하였다. 양자화로는 서브밴드 단위의 비 트 쉬프트 방법을 사용하였다. 웨이블릿 리프팅의 전단계로 색차변환, 부표본화를 수행하였으며, 서브블록 부호화의 전단계로 그레이코드 변환을 수행하였다. 여러 영상과 문서를 대 상으로 실험하여 시스템의 성능을 확인하였다.

  • PDF

Color Morphological Pyramids를 이용한 이미지 분할 (Image Segmentation Using Color Morphological Pyramids)

  • 이석기;최은희;김석태
    • 한국정보통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.789-795
    • /
    • 2002
  • 컬러 이미지는 Gray Scale 이미지와는 달리 3가지 채널의 조합으로 이루어지고 방대한 정보량 때문에 효과적인 이미지 분할이 어렵다. 본 논문에서는 범용성 있는 Color Morphological Pyramids(CMP)구조를 제안하고, 그를 이용한 이미지 분할을 보인다. 이미지 피라미드 구조는 최초 이미지의 반복적인 필터링과 샘플링에 의해 면적비가 $2^{\int}({\int}=1,2,....,N)$이 되는 순차적 이미지 계열이다. 본 방법에서는 CMP를 이용하여 RGB, HSI, CMY 등의 컬러 공간에서 연속적인 필터링 처리로 불필요한 크기의 물체 및 잡음을 제거하고, 다운샘플링과정으로 해상도를 낮춰준다. 생성된 CMP에서 인접 레벨 이미지간에는 이웃한 픽셀 벡터간의 상대거리를 이용한 연결식을 사용하여 새 레벨의 이미지를 생성한 후 이를 이미지 분할한다. 이미지 분할실험을 통하여 본 방법의 유효성을 검증한다.

AR Anchor System Using Mobile Based 3D GNN Detection

  • Jeong, Chi-Seo;Kim, Jun-Sik;Kim, Dong-Kyun;Kwon, Soon-Chul;Jung, Kye-Dong
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권1호
    • /
    • pp.54-60
    • /
    • 2021
  • AR (Augmented Reality) is a technology that provides virtual content to the real world and provides additional information to objects in real-time through 3D content. In the past, a high-performance device was required to experience AR, but it was possible to implement AR more easily by improving mobile performance and mounting various sensors such as ToF (Time-of-Flight). Also, the importance of mobile augmented reality is growing with the commercialization of high-speed wireless Internet such as 5G. Thus, this paper proposes a system that can provide AR services via GNN (Graph Neural Network) using cameras and sensors on mobile devices. ToF of mobile devices is used to capture depth maps. A 3D point cloud was created using RGB images to distinguish specific colors of objects. Point clouds created with RGB images and Depth Map perform downsampling for smooth communication between mobile and server. Point clouds sent to the server are used for 3D object detection. The detection process determines the class of objects and uses one point in the 3D bounding box as an anchor point. AR contents are provided through app and web through class and anchor of the detected object.

High-Resolution Satellite Image Super-Resolution Using Image Degradation Model with MTF-Based Filters

  • Minkyung Chung;Minyoung Jung;Yongil Kim
    • 대한원격탐사학회지
    • /
    • 제39권4호
    • /
    • pp.395-407
    • /
    • 2023
  • Super-resolution (SR) has great significance in image processing because it enables downstream vision tasks with high spatial resolution. Recently, SR studies have adopted deep learning networks and achieved remarkable SR performance compared to conventional example-based methods. Deep-learning-based SR models generally require low-resolution (LR) images and the corresponding high-resolution (HR) images as training dataset. Due to the difficulties in obtaining real-world LR-HR datasets, most SR models have used only HR images and generated LR images with predefined degradation such as bicubic downsampling. However, SR models trained on simple image degradation do not reflect the properties of the images and often result in deteriorated SR qualities when applied to real-world images. In this study, we propose an image degradation model for HR satellite images based on the modulation transfer function (MTF) of an imaging sensor. Because the proposed method determines the image degradation based on the sensor properties, it is more suitable for training SR models on remote sensing images. Experimental results on HR satellite image datasets demonstrated the effectiveness of applying MTF-based filters to construct a more realistic LR-HR training dataset.

컬리 모폴로지 피라미드를 이용한 컬러 이미지의 에지 검출 (Edge Detection in Color Image Using Color Morphology Pyramid)

  • 남태희;이석기
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.65-69
    • /
    • 2001
  • 컬러 이미지는 Gray 이미지와는 다르게 색상으로 표현하는 정보가 많이 포함되어있으며 이미지 내 각 픽셀의 색상과 픽셀 값이 적녹청(RGB) 3개 값의 조합으로 결정된다.본 논문에서는 새로운 칼라 모폴로지 피라미드를 제안하고. 제안된 칼라 모폴고지의 유용성평가를 위해 이미지에서 기본적이고도 중요한 에지 검출을 보인다. 이미지 피라미드 구조는최초 이미지의 반복적인 필터링과 샘플링에 의해 면적비가 2$^{-1}$(ι= 1, 2, . . . ,N)이 되는 순차적 이미지 계열이다. 본 방법에서는 CMP를 이용하여 RGB, CMY, XYZ 등 컬러공간에서 연속적인 필터링 처리로 불필요한 크기의 물체 및 잡음을 제거하고, 다운샘플링과정으로 해상도를 낮춰준다. 생성된 CMP에서, 인접 레벨 이미지간에는 이웃한 픽셀 벡터간의 상대거리를 이용한 연결식이 사용되어 새 레벨의 이미지를 생성하며 이를 에지로 검출한다.

하위 레벨 보간을 이용한 손실 정보 추정과 영상 해상도 향상 기법 (Loss Information Estimation and Image Resolution Enhancement Technique using Low)

  • 김원희;김종남
    • 한국콘텐츠학회논문지
    • /
    • 제9권11호
    • /
    • pp.18-26
    • /
    • 2009
  • 영상 해상도 향상 알고리즘은 영상 확대 및 영상 복원을 위한 기반 기술로 사용되며, 해상도 향상 과정에서 문제점은 흐려짐 현상이나 블록 현상으로 인한 화질 열화의 발생이다. 본 논문에서는 하위 레벨 보간을 이용한 손실 정보 추정과 영상 해상도 향상 기법을 제안한다. 제안하는 방법에서는 획득한 저해상도 영상의 다운샘플링-보간 과정을 이용해서 손실 정보를 계산하고, 손실 정보의 보간을 통해서 손실 정보를 추정하며, 가중치 계수와 결합한 추정 손실 정보를 고해상도로 보간 된 영상에 적용한다. 동일한 영상을 이용한 실험 결과, 제안한 방법이 기존의 방법들보다 PSNR에서 평균 2.3dB 이상 향상된 것을 검증하였고, 윤곽선 및 문자의 인식 정도에 대한 주관적인 화질 비교 결과도 개선되었음을 확인하였다. 제안한 방법은 영상 개선을 필요로 하는 다양한 비디오 응용 분야에서 유용하게 사용될 수 있다.

에지를 이용한 문서영상의 기울기 보정 (Skew Correction of Document Images using Edge)

  • 주재현;오정수
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1487-1494
    • /
    • 2012
  • 본 논문에서 선명 화질은 물론 저화질 문서영상에서 에지를 이용해 문서영상의 기울기를 검출하고, 보정하는 알고리즘을 제안한다. 제안된 알고리즘은 영상 복잡도를 이용해 문자영역을 선택하여 에지를 검출하고, 이들을 다양한 방향으로 투영하여 투영 히스토그램들을 생성한다. 그리고 히스토그램들에서 에지 집중도를 평가하여 문서영상의 기울기를 검출하고 기울어진 문서 영상을 보정한다. 고속 기울기 검출을 위해 부표본화와 3단 coarse-to-fine 탐색 알고리즘을 사용한다. 선명 화질과 저화질 영상의 기울기 검출에서 제안된 알고리즘의 최대 검출 오차와 평균오차가 기존 유사 알고리즘의 50% 정도이고, 기울기 검출 시간은 25%정도로 감소된다. 모바일기기로 취득된 밝기 불균일 영상에서는 기존 알고리즘은 적절한 2진 영상을 얻을 수 없어 기울기 검출이 어려우나 제안된 알고리즘의 평균 검출 오차 0.1o 이하로 기울기를 검출한다.

Design and Implementation of System for Estimating Diameter at Breast Height and Tree Height using LiDAR point cloud data

  • Jong-Su, Yim;Dong-Hyeon, Kim;Chi-Ung, Ko;Dong-Geun, Kim;Hyung-Ju, Cho
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.99-110
    • /
    • 2023
  • 논문은 LiDAR 점군 데이터를 사용하여 흉고 직경과 수고를 예측하는 ForestLi 시스템을 제안한다. ForestLi 시스템이 LiDAR 점군 데이터를 처리하는 과정은 다음과 같이 여러 단계로 진행된다. 다운샘플링, 이상점 제거, 지표면 분할, 지표면 정규화, 수간 추출, 개체목 분할, 흉고 직경 측정, 수고 측정. LiDAR 점군 데이터를 처리하는 상용 시스템 LiDAR360은 하측 식생과 개체목 분할 오류를 사용자가 직접 수정해야 한다. ForestLi 시스템은 하측 식생에 해당하는 LiDAR 점군 데이터를 자동으로 제거한다. 결과적으로 ForestLi 시스템이 LiDAR360보다 전체 수행시간을 줄이고, 흉고 직경과 수고 예측의 정확성을 높였다. 실험을 통해서 제안된 ForestLi가 LiDAR360 시스템보다 흉고 직경과 수고 측정의 정확성과 전체 실행시간 측면에서 우수하다는 것을 보여주었다.