• 제목/요약/키워드: 단일 시스템 이미지

검색결과 136건 처리시간 0.031초

영상디지털도어록용 단일 사람 검출 알고리즘 구현 (Implementation of a Single Human Detection Algorithm for Video Digital Door Lock)

  • 신성환;이상락;최한고
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.127-134
    • /
    • 2012
  • 영상디지털도어록(Video digital door lock, VDDL) 시스템은 문으로 출입하는 사람을 검출하고 사람 영상을 획득한다. 도어록 설계 시 고려할 사항은 배터리 기반으로 동작하므로 속도가 빠른 사람 검출 알고리즘을 적용하여 전류소모를 최소화해야 한다. 그리고 도어록은 고정된 카메라에서 영상을 촬영하므로 배경영상을 이용한 사람 검출이 높은 신뢰성을 얻을 수 있다. 본 논문에서는 이러한 요구조건에 충족하며 VDDL에 적합한 단일 사람검출 알고리즘을 다루고 있는데, 획득한 영상에서 이동하는 물체를 감지하고 영상처리를 통해 물체가 사람인지를 판별한다. 제안된 영상처리 알고리즘은 두 단계로 이루어져 있다. 첫째, 배경영상과 피부색 정보를 통해 사람 이미지 영역을 구한다. 둘째, 인체비례 정보를 기반으로 폴라 히스토그램을 이용하여 사람 유무를 판단한다. 개발된 알고리즘은 도어록에 설치하고 실험을 통해 성능을 확인하였다.

웹 마이닝과 협력적 정보 여과를 이용한 개인화 서비스의 성능 개선 방안 (Improving Web Personalization Service Using Web Mining and Collaborative Filtering)

  • 이치훈;고세진;김용환;이필규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.63-65
    • /
    • 2000
  • 웹 개인화 기술의 발달은 많은 업체들이 기존 고객의 유지와 신규 고객의 확보를 위한 수단을 제공하였다. 현재의 개인화 기술은 크게 내용 기반 그리고 협력적 정보 여과 방식에 기반한 기술로 나뉘어질 수 있다. 내용 기반 정보 여과 방식에 기반한 개인화 기술은 멀티미디어 정보로 표현된 대부분의 웹 오브젝트(페이지, 이미지, 동영상, 사운드, 상품 등)에는 적용하기 어렵고, 협력적 정보 여과방식은 Cold Start Problem과 단일 도메인내에서의 개인화 서비스만이 가능하다는 문제점이 있다. 본 논문에서는 협력적 정보 여과 방식과 데이터 마이닝 기술 중의 연관 규칙 생성 방법을 혼합한 웹 개인화 시스템을 제안한다. 다양한 멀티미디어 형태로 표현되는 웹 오브젝트의 내용 분석이 어려우므로, 각각의 오브젝트를 하나의 아이템으로 인식하고 개인화 서비스를 시도하는 협력적 정보 여과 방식을 채택하였다. 협력적 정보 여과의 결과로 발견된 도메인별 유사 사용자의 웹 오브젝트 사용 정보를 연관 규칙 생성 알고리즘에 적용하여 오브젝트간의 연관성을 발견한다. 발견된 오브젝트간의 연관성은 서로 다른 정보 도메인의 오브젝트가 현재 사용자에게 흥미있는 것인가를 예측할 수 있는 자료로서 사용될 수 있다. 협력적 정보 여과 방식에 의해 생성된 오브젝트의 선호도값과 오브젝트 연관성 정보를 비교하여 사용자에게 개인화된 웹 서비스를 제공한다.

  • PDF

비전 센서를 사용하는 실시간 물류 파악 시스템 구현 (Implementation of Real-time Logistics Identification System using Vision Sensors)

  • 김동휘;박민혁;박성재;박정규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.172-174
    • /
    • 2022
  • 국내에서 물류를 처리하는 회사에서는 다양한 형태의 제품을 입출고 처리하고 있다. 다양한 형태의 제품을 처리하기 위해서 수작업으로 분류 업부를 수행하고 있다. 본 논문에서는 적은 인력으로 고효율을 내기 위해 비전 센서를 사용하는 실시간 QR코드 탐지 방법을 제안한다. 제한하는 시스템은 비전 센서를 사용하여 물류의 QR코드 인식을 실시간으로 처리가 가능하다. 제안하는 시스템은 물류의 단인 QR 코드 인식이 아닌 다중 인식을 통해서 다량의 QR 코드를 빠르게 파악할 수 있다. 연구에서는 시스템을 실제 구현하여 검증을 진행하여 비전 센터를 통해서 이미지에서 다중 QR 인식을 확인하였다.

  • PDF

YOLO 알고리즘을 활용한 터널 GPR 이미지 내 강지보재 탐지 (Detection of Steel Ribs in Tunnel GPR Images Based on YOLO Algorithm)

  • 배병규;안재훈;정현준;유창균
    • 한국지반공학회논문집
    • /
    • 제39권7호
    • /
    • pp.31-37
    • /
    • 2023
  • 터널은 지중에 건설되는 구조물이므로 육안으로 터널 강지보재의 위치 등의 확인이 불가능하다. 이에, 터널 유지관리시에는, 일반적으로 GPR 이미지를 활용하여 강지보재 탐지를 수행한다. 인공신경망을 통한 GPR 이미지 분석에 대한 연구는, 주로 지하배관, 도로 손상 등의 탐지에 집중되어 있으며, 강지보재 등의 터널 GPR 데이터를 분석한 사례는 해외와 국내 모두 제한적이다. 본 연구에서는, 합성곱 신경망을 기반으로 하는 1단계 객체인식 알고리즘인 YOLO를 활용하여, GPR 데이터를 바탕으로 한 터널 강지보재의 위치 탐지를 자동화하고, 그 성능을 분석한다. 원본 이미지 데이터는 총 512개이며 원본 이미지 데이터로 이루어진 데이터 세트와 원본 이미지 데이터와 증식기법이 적용된 이미지 데이터를 병합한 2,048개의 데이터로 이루어진 데이터 세트를 해석에 활용하였다. 증식한 데이터를 사용한 모델의 강지보재 누락율(전체 강지보재와 탐지하지 못한 지보재 숫자의 비율)은 0.38%, 원본 데이터만을 활용한 모델의 강지보재 누락율은 7.18%로 나타났다. 따라서, 분석 자동화 측면에서는, 증식기법이 적용된 데이터 세트를 활용하는 것이 더 실용적일 것으로 판단된다.

비직교 다중변조 방식을 이용한 고속 가시광통신 시스템에 대한 연구 (A Study on High Speed Visible Light Communication System Using Non-orthogonal Multiple Modulation Scheme)

  • 한두희;이규진
    • 융합정보논문지
    • /
    • 제10권2호
    • /
    • pp.32-38
    • /
    • 2020
  • 본 논문에서는 가시광 통신시스템에서 고속 전송을 위한 변조 기법에 대해서 분석하고, 최적의 비직교 다중 전송을 위한 Dimming level 및 송신 전력 비율에 대해서 연구하였다. 기존의 가시광 통신은 전송 속도를 높이기 위한 멀티전송이 어렵다는 단점이 있다. 송신단에서 고속 전송을 위해서는 반드시 다중 전송기법이 필요한데, 일반적인 가시광 통신은 다중 전송에 한계가 있기 때문에 고속 전송을 위한 다양한 연구가 진행되고 있다. 최근에는 이미지 센서인 Optical Camera Communication(OCC)을 가시광 통신에 적용한 VLC-OCC가 연구되어 기존 가시광 통신이 가지는 다중 전송의 한계를 극복하였다. 그러나 VLC-OCC 방식은 외부 조도의 영향을 더 많이 받고, 수신단에서 검출이 어렵다는 단점이 있다. 또한, 다중 전송을 위한 LED 매트릭스의 위치 인식과 딥러닝을 위한 데이터 셋 신호처리를 위한 Processing-time이 필요하기 때문에 시스템의 복잡도가 증가하게 된다. 이러한 문제를 해결하기 위해 본 논문에서는 비직교 다중 전송 방식을 적용한 고속 가시광 통신을 위한 다중 변조 방식과 그에 따른 향후 연구 방향을 제안하였다.

단일 채널에서 블라인드 음원분리를 통한 하이브리드 BCI시스템 최적화 (The Optimization of Hybrid BCI Systems based on Blind Source Separation in Single Channel)

  • 양 다린;트렁 하우 뉘엔;김종진;정완영
    • 융합신호처리학회논문지
    • /
    • 제19권1호
    • /
    • pp.7-13
    • /
    • 2018
  • 현재의 연구에서는 소음을 제거하기 위해 블라인드 소스 분리(BSS)접근 방식에 의해 최적화된 두뇌-컴퓨터 인터페이스(BCI)를 제안했다. 모터 이미지(MI)신호와 정상 상태 시각적 제거 전위(SSVEP)신호는 신호 대 잡음비(SNR)의 증가로 인해 쉽게 검출되었다. 또한, MI와 SSVEP사이의 조합은 일반적으로 현재 BCI에서 생성되는 명령 수를 증가시킬 수 있다. 현재 시스템은 계산 시간을 줄이고 BCI를 실제 용도에 가깝게 하기 위해 단일 채널 EEG신호를 사용했다. 또한, 복잡한 신경 네트워크(CNN)가 다중 클래스 분류 모델로 사용되었다. 우리는 비 MS/BCI와 BBS/BCI사이의 정확성 측면에서 성능을 평가했다. 결과적으로 BBS+BCI의 정확도는 비 BBS+BCI의 정확도보다 $16.15{\pm}25.12%$더 높은 수준에 도달했다. 사용하지 않을 때보다 BBS를 사용함으로써 전반적으로 제안된 BCI시스템은 비교적 정확한 다차원 제어 애플리케이션에 적용될 가능성을 입증했다.

실시간 영상확대 칩의 메모리 구조에 관한 연구 (A study on memory structure of real time video magnifyng chip)

  • 여경현;박인규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.1109-1112
    • /
    • 1999
  • 본 논문에서는 영상확대 chip의 video 입력부에 부분화면을 저장할 frame memory의 구조를 개선하고자 하였다. 영상확대 video scaler인 gm833×2는 입력단 측에 frame buffer memory가 필요하게 되지만, 이를 외부에 장착하려면 일반적으로 대용량의 FIFO 메모리를 사용하게 된다. 이것은 dualport SRAM으로 구성이 되며, 메모리 제어를 고가의 FIFO칩에 의존하는 결과를 가져온다. 또한 기존의 scaler chip은 단순히 확대처리만을 하며, 입력 전, 후에 data의 변경 또는 이미지처리가 불가능한 구조가 된다. 본 논문에서는 외부에 필요한 메모리를 내장한 새로운 기능의 chip을 설계하는 데에 있어 필수적인 메모리제어 로직을 제안하고자 한다. 여기서는 더 나은 기능의 향상된 메모리 제어회로를 제시하고 이를 One-chip에 집적할 수 있도록 하였다 이를 사용한 Video Scaler Processor chip은 SDRAM을 별도의 제어회로 없이 외부에 장착할 수 있도록 하여 scaler의 기능을 향상시키면서 전체 시스템의 구조를 간단히 할 수 있을 것으로 기대된다. 본 논문에서는 먼저 메모리 제어회로를 포함한 Video Scaler Processor chip의 메모리제어 하드웨어의 구조를 제시하고, 메모리 access model과 제어로직을 소개하고자 한다.

  • PDF

동적 모자이크 기반의 전경 움직임 추적 및 압축전송 (Foreground Motion Tracking and Compression/Transmission of Based Dynamic Mosaic)

  • 박동진;윤인모;김찬수;현웅근;김남호;정영기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.741-744
    • /
    • 2003
  • 본 논문은 모자이크 배경을 생성하고 변화되는 정보만을 전송함으로서 동적기반 압축시스템을 제안한다. 동적 모자이크 배경은 카메라 움직임 정보를 이용하여 단일영상으로 점진적으로 통합된다. 카메라 움직임 예측을 위해 각각의 영상들과 이전영상과의 원근투영 매개변수를 순차적으로 계산하였다. 카메라 움직임은 배경영역과 전경영역에서 식별함으로서 배경상에서 강건하게 계측된다. 수정된 블록기반 움직임계측은 배경영역을 분리하는데 이용되었다.

  • PDF

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

효율적인 영상데이터 처리를 위한 SIMD기반 매니코어 프로세서 구현 (Implementation of SIMD-based Many-Core Processor for Efficient Image Data Processing)

  • 최병국;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-9
    • /
    • 2011
  • 최근 모바일 멀티미디어 기기들의 사용이 증가하면서 고성능, 저전력 멀티미디어 프로세서에 대한 필요성이 높아지고 있는 추세이다. 주문형반도체 (ASIC)는 모바일 멀티미디어에서 요구되는 고성능을 만족시키지만 다양한 형태의 멀티미디어 애플리케이션에서 요구되는 범용성을 만족시키지 못한다. 반면 DSP기반의 시스템은 범용성에 기인하여 다양한 형태의 애플리케이션에서 사용될 수 있으나, 주문형반도체 보다 높은 가격, 전력소모 및 낮은 성능을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 범용성을 유지하면서 고성능, 저전력으로 영상데이터 처리가 가능한 단일 명령어 다중 데이터(Single Instruction Multiple Data, SIMD)처리 방식의 매니코어 프로세서를 제안한다. 제안한 SIMD기반 매니코어 프로세서는 16개의 프로세싱 엘리먼트(processing element, PE)로 구성되어 영상데이터 처리에 내재한 무수한 데이터 레벨 병렬성을 높인다. 모의 실험한 결과, 제안한 SIMD기반 매니코어 프로세서는 현재 상용 고성능 프로세서보다 평균 22배의 성능, 7배의 에너지 효율 및 3배의 시스템 면적 효율을 보였다.