• 제목/요약/키워드: 컴퓨터 비전 기술

검색결과 407건 처리시간 0.026초

유사 가버 특징에 기반한 텍스쳐 분류 (Texture Classification Based on Gabor-like Feature)

  • 손지훈;김성영
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.147-153
    • /
    • 2017
  • 텍스쳐를 효과적으로 표현하는 것은 컴퓨터 비전 분야에서 매우 중요한 과정이다. 효과적인 텍스쳐 표현을 통해 텍스쳐 분류나 텍스쳐 분할 등의 처리 성능을 향상시킬 수 있다. 가버 필터는 텍스쳐 표현을 위해 오랫동안 사용된 다해상도 스케일 기반의 방법이다. 가버 필터는 텍스쳐 분류나 분할에 높은 성능을 제공한다. 그러나 처리 과정의 연산량으로 인해 처리 시간이 매우 많이 소요되어 실제 응용에서는 사용하기 어려운 문제가 있다. 본 논문에서는 가버 필터와 유사하게 다해상도 스케일 기반으로 텍스쳐를 표현할 수 있는 새로운 특징 표현 방법을 제안한다. 제안한 방법은 주파수 공간에서 방향과 스케일을 기반으로 다해상도 스케일 기반으로 텍스쳐를 표현한다. 2가지 실험 영상 집합에 대해 분류 실험을 수행하여 제안한 특징의 유용성을 확인하였다. 가버 필터와 유사한 분류 성능을 제공하면서 처리 속도는 가버 필터의 5%이하로 줄일 수 있는 것을 확인하였다.

3차원 측정점으로부터의 객체 자동인식 (Automatic Object Recognition in 3D Measuring Data)

  • 안성준
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.47-54
    • /
    • 2009
  • 측정점으로부터의 3차원 객체 자동인식은 컴퓨터비전, 지능형로봇 등의 분야에서 주요 연구주제이다. 본 논문에서 저자는 측정오차가 포함되어 있으며 정렬되지 않은 대용량 3차원 측정점으로부터 객체를 자동적으로 추출하며 그 형상계수를 추정하는 소프트웨어 기술에 대한 소개를 하고자 한다. 해당 소프트웨어는 기능적으로 상호 연결된 형상모델 제시, 측정점 분할, 형상모델 맞춤의 세 부분으로 이루어졌으며 최단거리 최소제곱법(ODF)이 핵심요소이다. ODF는 형상모델과 측정점 사이의 최단거리의 제곱합을 최소화하는 형상모델 계수를 추정한다. 무작위로 선정된 부분 측정점에 대한 임시 형상모델로서 이차 곡면이 ODF에 의하여 구하여지면 우리는 이로부터 3차원 객체를 자동적으로 추출하는 과정인 최종 형상모델 제시, 측정점 분할, 형상모델 맞춤에 필요한 초기값을 제공할 수 있다. 소개된 소프트웨어 기술을 실제 3차원 측정점에 적용함으로써 그의 성능을 확인하고자 한다.

개인 정보가 노출된 목표 객체의 블로킹 알고리즘 (A Blocking Algorithm of a Target Object with Exposed Privacy Information)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.43-49
    • /
    • 2019
  • 초고속의 유무선 인터넷은 다양한 형태의 미디어 데이터를 손쉽게 획득할 수 있는 유용한 창구이다. 이에 반해, 일반인들이 개인 정보가 노출된 대상 객체를 포함하고 있는 미디어 데이터까지도 인터넷을 통해 용이하게 획득할 수 있으므로 사회적으로 문제가 되고 있다. 본 논문에서는 입력되는 여러 가지 종류의 영상으로부터 개인 정보가 노출된 대상 객체를 학습 알고리즘을 이용해 강인하게 검출하고, 검출된 대상 객체 영역을 효과적으로 블로킹하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 뉴럴 네크워크 기반의 학습 알고리즘을 사용해 영상으로부터 개인 정보를 포함하고 있는 대상 객체만을 검출한다. 그런 다음, 격자형 모자이크를 생성해 이전 단계에서 검출된 대상 객체 영역 위에 오버랩함으로써 개인 정보를 포함하고 있는 객체 영역을 효과적으로 블로킹한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 영상으로부터 개인 정보가 노출된 대상 영역을 강인하게 검출하고, 검출된 영역을 모자이크 처리를 통해 효과적으로 블로킹한다는 것을 보여준다. 본 논문에서 제시된 객체 블로킹 방법은 객체 보안, 물체 추적, 영상 블로킹 등과 같은 컴퓨터 비전과 관련된 여러 응용 분야에서 유용하게 활용될 것으로 예상된다.

필터링 기반의 잡음 제거를 통한 피부 영역의 추출 (Extraction of Skin Regions through Filtering-based Noise Removal)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.672-678
    • /
    • 2020
  • 최근 들어 초고속의 영상 촬영이 가능한 저가이며 성능이 우수한 카메라가 등장함에 따라서 물체의 미세한 움직임까지 정확하게 묘사한 초고속의 영상들이 보편화되고 있는 실정이다. 본 논문에서는 빠른 속도로 입력되는 초고속의 영상으로부터 예기치 않게 포함된 잡음을 제거한 다음, 잡음이 제거된 영상으로부터 피부 영역과 같이 개인 정보를 대표할 수 있는 관심 영역을 추출하는 방법을 제안한다. 본 논문에서는 먼저 입력받은 초고속의 영상으로부터 비정상적인 전기 신호로 인해 발생한 잡음을 양방향의 필터를 적용하여 제거한다. 그런 다음, 사전 학습을 통해 생성한 색상 분포 모델을 사용하여 영상 내에 포함된 개인 정보를 대표하는 관심 영역인 피부 영역을 정확하게 추출한다. 실험 결과에서는 본 연구에서 소개된 알고리즘이 여러 가지의 초고속 영상으로부터 잡음을 제거한 다음 관심 영역을 강인하게 추출한다는 것을 보여준다. 본 논문에서 제시된 접근 방법은 영상 전처리, 잡음 제거, 목표 영역의 추적 및 감시 등과 같은 컴퓨터 비전 및 패턴인식과 관련된 여러 가지의 응용 분야에서 유용하게 사용될 것으로 예상된다.

농업 공공 빅데이터를 이용한 머신러닝 기반 생산량 및 판매 수익금 예측 (Machine Learning-based Production and Sales Profit Prediction Using Agricultural Public Big Data)

  • 이현조;김용기;구현정;채철주
    • 스마트미디어저널
    • /
    • 제11권4호
    • /
    • pp.19-29
    • /
    • 2022
  • IoT 기술의 발전에 따라 스마트팜을 활용하는 농가가 증가하고 있다. 스마트팜은 환경을 모니터링하고, 원격 또는 자동으로 최적의 내부 환경을 조성하여 작물의 생산량 및 품질을 향상시킨다. 이를 위해 수집되는 농업 디지털 데이터를 활용하여 작물의 생산성을 예측하는 기술에 대한 연구가 활성화되고 있다. 그러나 생산량 예측을 위한 연구에서는 기존의 통계자료를 바탕으로 하는 통계모델 기반의 연구가 대부분이며, 이에 따라 예측 정확도가 낮은 문제점이 존재한다. 본 연구에서는 시설 원예 스마트팜에 수집된 농업 디지털 데이터를 활용하여 다양한 머신러닝 모델을 통해 생산량 및 판매 수익금을 예측하고, 성능을 비교하였다. 성능을 비교한 모델은 다중선형회귀, 서포트벡터머신, 인공신경망, 순환신경망, LSTM, ConvLSTM이다. 성능 비교 결과 ConvLSTM가 R2 값 및 RMSE 값에서 가장 우수한 성능을 나타내었다.

Deep Compression의 프루닝 문턱값 동적 조정 (Dynamic Adjustment of the Pruning Threshold in Deep Compression)

  • 이여진;박한훈
    • 융합신호처리학회논문지
    • /
    • 제22권3호
    • /
    • pp.99-103
    • /
    • 2021
  • 최근 CNN(Convolutional Neural Network)이 다양한 컴퓨터 비전 분야에서 우수한 성능으로 널리 사용되고 있다. 그러나 CNN은 계산 집약적이고 많은 메모리가 요구되어 한정적인 하드웨어 자원을 가지는 모바일이나 IoT(Internet of Things) 기기에 적용하기 어렵다. 이런 한계를 해결하기 위해, 기존의 학습된 모델의 성능을 최대한 유지하며 네트워크의 크기를 줄이는 인공신경망 경량화 연구가 진행되고 있다. 본 논문은 신경망 압축 기술 중 하나인 프루닝(Pruning)의 문턱값을 동적으로 조정하는 CNN 압축 기법을 제안한다. 프루닝될 가중치를 결정하는 문턱값을 실험적, 경험적으로 정하는 기존의 기술과 달리 정확도의 저하를 방지하는 최적의 문턱값을 동적으로 찾을 수 있으며, 경량화된 신경망을 얻는 시간을 단축할 수 있다. 제안 기법의 성능 검증을 위해 MNIST 데이터 셋을 사용하여 LeNet을 훈련시켰으며, 정확도 손실 없이 약 1.3 ~ 3배의 시간을 단축하여 경량화된 LeNet을 얻을 수 있었다.

딥러닝 기반 Wi-Fi 센싱 시스템의 효율적인 구축을 위한 지능형 데이터 수집 기법 (CALS: Channel State Information Auto-Labeling System for Large-scale Deep Learning-based Wi-Fi Sensing)

  • 장정익;최재혁
    • 전기전자학회논문지
    • /
    • 제26권3호
    • /
    • pp.341-348
    • /
    • 2022
  • Wi-Fi가 거의 모든 곳에서 사용이 가능한 환경이 도래하면서 Wi-Fi 기반의 센싱 시스템의 활용가능성에 대한 학계의 주목과 함께 활발한 연구가 진행되고 있다. 최근에는 채널 상태 정보(CSI)를 활용한 딥러닝 기술의 비약적 발달로 높은 감지 성능을 달성하고 있다. 하지만, 새로운 대상 도메인에 적용하기 위해서는 명시적인 데이터 수집 및 모델 재학습 과정의 값비싼 적응 노력 없이는 여전히 실질적으로는 사용하기가 어렵다. 본 연구에서는 딥러닝 기반의 Wi-Fi 센싱 시스템을 위한 훈련데이터 수집 및 레이블링을 자동으로 진행하는 CSI 자동 레이블링 시스템(CALS)를 제안한다. 제안 시스템은 CSI 데이터 수집 과정에서 컴퓨터 비전 기술을 함께 활용하여, 지도학습용으로 수집된 CSI 데이터에 대한 레이블링을 자동으로 수행토록 하였다. CALS의 효율성을 보이기 위해 라즈베리파이를 이용하여 프로토타입 시스템을 구현하고, 실내 환경에서의 사람 존재 감지를 수행하는 3가지 모델에 대해 학습과 평가를 진행하였다. 자동 수집된 데이터를 진행하여 학습을 활용하는 방식으로 실시간 데이터에 대해 평가를 진행했을 때 90% 이상의 높은 정확도를 달성하였다.

리테일 마케팅 고도화를 위한 CCTV 영상 데이터 기반의 AI 융합 응용 서비스 활용 모델 연구 (A Study on the Application Model of AI Convergence Services Using CCTV Video for the Advancement of Retail Marketing)

  • 김종율;김혁중
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.197-205
    • /
    • 2021
  • 최근 리테일 산업계에서는 COVID-19 등의 다양한 외부 환경 위협으로부터의 대응과 AI 기술을 활용한 경쟁력을 갖추기 위한 정보기술 융합 및 활용 요구가 증가하고 있으나 리테일 산업에서의 데이터를 활용하기 위한 연구와 응용 서비스의 활용사례가 매우 부족하다. 본 연구는 CCTV 영상 데이터 기반의 AI 활용 응용 서비스 활용 사례연구로 리테일 공간에서의 CCTV 영상 데이터 수집, 객체 탐지 및 추적 AI 모델 활용, 실시간 추적된 객체와 트래킹 데이터를 저장하기 위한 시계열 데이터베이스 활용, 시계열 데이터를 활용한 모니터링, 리테일 공간의 혼잡도와 관심도를 분석하기 위한 히트맵, 리테일 공간에서의 실시간 상황 모니터링, COVID-19와 같은 사회적 위협으로부터의 접촉자 분석과 추적을 위한 사회적 거리 두기 현황, 비인가자의 보안 구역의 접근 모니터링 애플리케이션을 설계하고 이를 실제 구현하여 리테일 공간에서의 CCTV 영상 데이터를 활용한 애플리케이션 설계를 통해 CCTV 영상 데이터 기반의 AI 융합 응용 서비스 활용 모델을 제시하였으며, 실제 구현을 통해 설계된 활용 모델을 검증하였다.

실시간 온라인 수업 및 시험 태도 데이터 세트 설계 및 구현 (Real-time Online Study and Exam Attitude Dataset Design and Implementation)

  • 김준식;이찬휘;송혁;권순철
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.124-132
    • /
    • 2022
  • 최근 코로나바이러스감염증-19(COVID-19)로 인해 온라인 원격 수업과 비대면 시험으로 인해 수업 태도 및 시험 부정행위에 대한 관리가 어려움을 겪고 있다. 따라서 온라인으로 학생들의 행동을 자동으로 인식하고 검출하는 시스템이 필요하다. 사람의 행동을 인식하는 행동 인식의 경우 컴퓨터 비전에서 많이 연구되는 기술 중 하나이다. 이러한 시스템을 개발하기 위해서는 온라인 수업 및 시험에서 주요 정보가 될 수 있는 사람의 팔 움직임 정보와 주변 물체에 대한 정보를 포함하는 데이터가 필요하다. 기존 데이터 세트는 여러 분야에 대해 분류를 하거나 일상생활 행동으로 구성되어 있어 본 시스템에 적용시키기에 어려움이 있다. 본 논문에서는 실시간으로 진행되는 온라인 시험 및 수업에서 태도를 분류할 수 있는 데이터 세트를 제시한다. 또한, 기존의 행동 인식 데이터 세트와의 비교를 통해 제안된 데이터 세트가 올바르게 구성되었는지를 보여준다.

인공지능에 활용되는 공학수학 합성곱(convolution) 교수·학습자료 연구 (A Study on Teaching of Convolution in Engineering Mathematics and Artificial Intelligence)

  • 이상구;남윤;이재화;김응기
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권2호
    • /
    • pp.277-297
    • /
    • 2023
  • 합성곱(convolution)은 인공지능(artificial intelligence)에서 컴퓨터 비전(computer vision), 심층학습(deep learning) 등의 분야를 이해하고 응용하려면 알아야 하는 중요한 수학적 연산이다. 그러나 현재의 공학수학 교과과정의 합성곱 내용은 독립적인 주제가 아니라 단편적으로 다루어지고 있어서 그 의미를 충분히 전달하지 못하고 있다. 이에 본 논문에서는 공학수학에서 인공지능 교육과 연계할 수 있도록 개발한 합성곱 교수·학습 자료를 제시한다. 먼저 기존 공학과 인공지능 기술의 통합적 관점에서 합성곱에 대한 배경지식과 응용 사례를 정리하고, 코딩을 이용한 교육이 가능하도록 파이썬(Python)/SageMath 코드를 개발하여 제공한다. 또한 합성곱 지식이 인공지능에서 어떻게 활용되는지 보여주는 구체적인 예시로, 이미지 분류에 사용되는 합성곱신경망(Convolutional Neural Network, CNN)을 개발된 코드와 함께 제공한다. 본 교수·학습자료는 합성곱 개념을 쉽고 효과적으로 교육할 수 있도록 공학수학의 보충 자료로 활용가능하며, 학습자는 코딩을 통해 합성곱을 배우고 본인의 전공과 관련된 인공지능 기술을 학습하는 데 이를 이용할 수 있다.