• 제목/요약/키워드: Computer vision system

검색결과 1,056건 처리시간 0.025초

확장된 RNN을 활용한 사람재인식 시스템에 관한 연구 (A Study on Person Re-Identification System using Enhanced RNN)

  • 최석규;허문걸
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.15-23
    • /
    • 2017
  • 사람의 빈번한 자세 변화, 그리고 background clutter과 occlusion으로 인해 Person Re-identificatio는 컴퓨터 비전 분야에서 가장 어려운 부분이다. 비겹침 카메라의 이미지는 어떤 사람을 다른 사람과 구별하기 어렵게 한다. 더욱 나은 성능 일치를 달성하기 위해 대부분의 방법은 특징 선택과 거리 메트릭을 개별적으로 사용한다. 그렇게 차별화된 표현과 적절한 거리를 얻을 수 있고, 사람과 중요한 특징의 무시 사이의 유사성을 설명할 수 있다. 이러한 상황은 우리가 이 문제를 다루는 새로운 방법을 고려하도록 한다. 본 논문에서는 Person Re-identification를 위한 3단 계층네트워크를 갖는 향상되고 반복적인 신경 회로망을 제안하였다. 특히 RNN(Revurrent Neural Network) 모델은 반복적인 EM(Expectation Maximum) 알고리즘과 3단 계층 네트워크를 포함하고, 차별적 특징과 지표 거리를 공동으로 학습한다. 반복적인 EM 알고리즘은 RNN 이전에 연속해 있는 CNN(Convoutional Neural Network)의 특징 추출 능력을 충분히 사용할 수 있다. 자율 학습을 통해 EM 프레임 워크는 패치의 레이블을 변경하고 더 큰 데이터 세트를 훈련할 수 있다. 네트워크를 더 잘 훈련시키기 위해 3단 계층 네트워크를 통해 CNN, RNN 및 풀링 계층이 공동으로 특징 추출을 할 수 있다. 실험 결과에 따르면 비전처리 분야에서 다른 연구자의 접근 방식과 비교할 때 이 방법은 경쟁력 있는 정확도를 얻을 수 있다. 이 방법에 대한 다른 요소의 영향은 향후 연구에서 분석되고 평가될 것이다.

영역기반 초저속 부호화를 위한 인간 시각 체계에 기반한 계층적 영상 분할 (Hierarchical Image Segmentation Based on HVS Characteristic for Region-Based Very Low Bit Rate Coding)

  • 송근원;박영식;한규필;남재열;하영호
    • 전자공학회논문지S
    • /
    • 제36S권1호
    • /
    • pp.70-80
    • /
    • 1999
  • 본 논문에서는 인간 시각 체계에 기반하여 주관적 화질의 열화없이 전송 정보량을 효과적으로 줄일 수 있고, 또한 전송 정보량을 조절할 수 있는 영역기반 초적속 부호화에 적합한 새로운 계층적 영상 분할 알고리즘을 제한한다. 제안한 알고리즘은 각 단계에서 수리 형태학에 기반한 영상 분할과 인간 시각 체계를 고려한 영역 볍합 고조로 이루어져 있다. 영상분할은 3단계의 계층적 구조로 이루어져 있으며, 영역 병합은 각 단계에서 인간 시각 체계에 기반하여 인간 시각이 구분할 수 없는 두 인접 영역의 쌍들을 추출한 후 영역 병합을 수행한다. 이때 인간 시각 체계에 기반하여 병합할 영역을 추출하고 제안한 병합을 우선 순위 함수에 의한 병합 우선 순위에 따른 영역 볍합ㅇ르 차례로 수행하여 영역의 수를 효과적으로 줄임으로써 영역기반 초저속 부호화시 과다한 윤곽선 정보로 인한 병목현상을 개선할 수 있다. 그리고 각 단계에서의 영역 병합시 정보량 조절 요소 값에 따라 전송 정보량을 조절할 수 있어 기존의 방법보다 유연한 분할 구조를 나타낸다. 실험을 통하여 제안한 방법은 기존의 방법보다 PSNR 및 주관적 화질은 유사하나, 전송할 윤곽선 정보는 상당히 줄일 수 있어 영역기반 초적속 부호화를 위한 효율적 영상 분할 알고리즘임을 알 수 있다.

  • PDF

국부 평균과 공간 활성도를 이용한 에지 강조 오차확산법 (Edge-Enhanced Error Diffusion Halftoning using Local mean and Spatial Activity)

  • 곽내정;권동진;김영길;안재형
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.77-82
    • /
    • 2006
  • 디지털 해프토닝은 연속계조영상과 시각적으로 유사한 이진 영상을 얻기 위한 방법이다. 이러한 해프토닝 방법 중에서 오차 확산 해프토닝은 다른 해프토닝 방법에 비해 우수한 화질을 보이지만 에지가 흐려지는 단점이 있다. 이러한 단점을 개선하기 위해, 본 논문은 인간의 시각이 국부 평균 밝기를 인식하고 공간적인 작은 변화량을 인식하지 못하는 특성을 이용하여 에지를 강조하는 개선된 오차 확산 해프토닝을 제안한다. 제안 방법은 원 화소의 명암값과 $3{\times}3$ 블록의 평균 명암값과의 차이 값에 공간적 위치 값에 따른 가중치를 결합하여 국부 공간 변화량을 구한다. 그 후 정규화된 공간 활성도(local activity)에 평균 명암도를 곱하여 에지 강조 정보량(IEE : information of edge enhancement)을 구하여 IEE를 양자화기 입력에 더하여 에지를 강조한다. 컴퓨터 시뮬레이션은 제안 방법이 기존의 방법에 비해 영상의 에지가 강조되어 시각적으로 선명한 영상을 생성하며 물체의 경계가 잘 보존됨을 보여준다. 또한 거리에 따른 에지 상관도와 로컬 평균 일치도에서도 기존의 방법에 비해 개선된 결과를 보여준다.

운동선수와 대학생 남녀의 동체 시력 및 동적 입체시에 관한 비교 연구 (Dynamic Visual Acuity and Dynamic Stereoacuity of Athletes and Nonathletes)

  • 이민아;오재만;정주현
    • 한국안광학회지
    • /
    • 제14권3호
    • /
    • pp.43-49
    • /
    • 2009
  • 목적: 본 연구는 운동 선수와 일반 대학생 남녀를 대상으로 정지 시력과 동체 시력, 정적 입체시와 동적 입체시를 측정, 분석함으로써 앞으로의 동체 시력과 동적 입체시 연구에 기초 자료를 얻고자 하였다. 방법: 양안의 정지 시력이 1.0 이상인 대전고등학교 야구부 선수 20명과 건양대학교 남학생 20명, 여학생 20명을 대상으로 본 연구에서 제작한 회전 거울식 동체 시력 측정장치와 동적 입체시 측정 프로그램을 이용하여 정지 시력, 동체 시력, 정적 동적입체시를 측정하였다. 결과: 운동 선수군과 일반 남자군, 일반 여자군에서 정지 시력과 정적 입체시에는 유의한 차이를 나타내지 않았다. 동체 시력은 세 그룹 모두 유의한 차이를 보였으며, 운동 선수군에서 가장 높은 동체 시력을 나타내었고, 일반 남자군, 일반 여자군 순으로 동체 시력이 낮게 측정되었다. 또한, 일반 남자군과 일반 여자군의 동적 입체시에는 유의한 차이가 나타나지 않았으나, 운동 선수군은 이 두 그룹에 비해 유의한 수준으로 높은 동적 입체시를 나타내었다. 결론: 본 연구의 결과를 토대로 앞으로의 연구에 도움을 줄 수 있을 것으로 보이며, 다양한 분야에 동체 시력과 동적 입체시 검사를 응용한다면 많은 도움을 줄 수 있을 것으로 사료된다.

  • PDF

중소기업 스마트공장 구축을 위한 OpenCV 기반 재고관리 시스템의 설계 및 구현 (Design and Implementation of OpenCV-based Inventory Management System to build Small and Medium Enterprise Smart Factory)

  • 장수환;정종필
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.161-170
    • /
    • 2019
  • 다품종 대량 생산 중소기업 공장에서는 제품의 종류가 다양하고 그 수량이 많기 때문에 재고의 관리를 위한 인력과 경비가 낭비되고 있다. 또한 재고의 현황을 실시간으로 확인 할 방법이 마련 되있지 않아서 재고의 과적재, 과부족 현상으로 인한 경제적 피해를 받고 있다. 실시간 데이터 수집 환경을 구축하기 위한 많은 방안이 있지만 대부분 구축비용과 시간이 중소 중견기업이 감당하기 어려운 수준이다. 그렇기 때문에 중소 중견기업의 스마트 공장은 구현되기 어려운 현실을 마주하고 있으며, 적절한 대책을 찾기 힘든 실정이다. 따라서 본 논문에서는 현재 생산품 관리 기술로 많이 채택되는 바코드, QR코드와 함께 라벨에 표기되어 있는 글자추출을 통해 기존 재고관리 방법의 확장에 대한 내용을 구현하고 그 효과를 평가하였다. 기술적으로는 컴퓨터 이미지 처리를 통해서 기존의 생산품의 입출고 관리를 위한 방법인 재고라벨 및 바코드에 대한 자동인식 및 분류를 하기 위한 OpenCV를 이용한 전처리, 구글 비젼 API의 OCR(Optical Character Recognition)기능을 통해서 글자를 추출하고, Zbar를 통해서 바코드를 인식할 수 있게 설계하였고, 값비싼 장비를 사용하지 않고 라즈베리파이를 통해 실시간 영상을 통한 인식으로 재고를 관리할 수 있는 방법을 제안한다.

비정규직이 인식한 조직커뮤니케이션이 직무만족과 조직몰입에 미치는 영향 (The Influence of Organizational Communication Recognized by Irregular Workers on Job Satisfaction and Organizational Commitment)

  • 최재원;이석기;천성용
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.101-111
    • /
    • 2021
  • 최근 다양한 사회경제적 이슈 및 갈등을 야기하고 있는 비정규직은 대체로 고용에 대한 불안감으로 인해 조직에 대한 충성도나 직무만족도가 낮을 수밖에 없는데, 이를 개선하기 위한 방안으로 본 연구는 비정규직의 조직커뮤니케이션 만족도가 직무만족과 조직몰입에 미치는 영향을 분석하고자 하였다. 제 7차 인적자본기업 패널조사 자료 중 비정규직 설문데이터를 구조방정식 모형분석 등을 활용하여 분석하는 방식으로 연구를 진행하였으며, 연구결과는 다음과 같다. 첫째, 비정규직이 인식한 조직커뮤니케이션은 직무만족과 조직몰입에 정(+)의 영향을 미치는 것으로 분석되었다. 둘째, 비정규직의 직무만족은 조직몰입에 정(+)의 영향을 미치는 것으로 분석되었다. 셋째, 비정규직의 커뮤니케이션 만족과 조직몰입의 관계에 있어서 직무만족이 매개작용을 하고 있는 것으로 분석되었다. 본 연구는 기존의 서비스업 위주의 연구에서 연구대상을 비정규직으로 확대하였으며, 보다 다양한 업종을 아울렀다는데 의의가 있다. 본 연구의 결과는 비정규직의 조직유효성 향상을 위해 미션 및 비젼 공유, 커뮤니케이션 활성화 제도가 필요함을 시사하고 있다.

반려동물용 자동 사료급식기의 비용효율적 사료 중량 예측을 위한 딥러닝 방법 (A Deep Learning Method for Cost-Effective Feed Weight Prediction of Automatic Feeder for Companion Animals)

  • 김회정;전예진;이승현;권오병
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.263-278
    • /
    • 2022
  • 최근 IoT 기술의 발달로 외출 중에도 반려동물에 급여하도록 자동 사료급식기가 유통되고 있다. 그러나 자동급식에서 중요한 중량을 측정하는 저울 방식은 쉽게 고장이 나고, 3D카메라 방식은 비용이 든다는 단점이 있으며, 2D카메라 방식은 중량 측정의 정확도가 떨어진다. 특히 사료가 복합된 경우 중량 측정 문제는 더욱 어려워질 수 있다. 따라서 본 연구의 목적은 2D카메라를 사용하면서도 중량을 정확하게 추정할 수 있는 딥러닝 접근법을 제안하는 것이다. 이를 위해 다양한 합성곱 신경망을 이용하였으며, 그중 ResNet101 기반 모델이 3.06 gram의 평균 절대 오차와 3.40%의 평균 절대비 오차를 기록하며 가장 우수한 성능을 보였다. 본 연구의 결과로 사료와 같이 규격화된 물체의 중량을 확보가 용이한 2D 이미지를 통해서만 예측할 필요가 있을 경우 유용한 정보로 활용될 수 있다.

샴 네트워크를 사용하여 추적 레이블을 사용하지 않는 다중 객체 검출 및 추적기 학습에 관한 연구 (Training of a Siamese Network to Build a Tracker without Using Tracking Labels)

  • 강정규;송유승;민경욱;최정단
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.274-286
    • /
    • 2022
  • 이동객체 추적은 컴퓨터 비전 분야에서 오랜 시간 동안 연구가 진행되어 온 분야로 자율주행이나 운전 보조 시스템 등의 시스템에서 아주 중요한 역할을 수행하고 있다. 이동객체 추적 기술은 일반적으로 객체를 검출하는 검출기와 검출된 객체를 추적하는 추적기의 결합으로 이루어져 있다. 검출기는 다양한 데이터셋이 공개되어 사용되고 있기 때문에 쉽게 좋은 모델을 학습할 수 있지만, 추적기의 경우 상대적으로 공개된 데이터셋도 적고 직접 데이터셋을 구성하는 것도 검출기 데이터셋에 비해 굉장히 오랜 시간을 소요한다. 이에 검출기를 따로 개발하고, 별도의 추적기를 학습 기반이 아닌 방식을 활용하여 개발하는 경우가 많은데 이런 경우 두 개의 시스템이 차례로 작동하게 되어 전체 시스템의 속도를 느리게 하고 앞단의 검출기의 성능이 변할 때마다 별도로 추적기 또한 조정해줘야 한다는 단점이 있다. 이에 본 연구는 검출용 데이터셋만을 사용하여 검출과 추적을 동시에 수행하는 모델을 구성하는 방법을 제안한다. 데이터 증강 기술과 샴 네트워크를 사용하여 단일 이미지에서 객체를 검출 및 추적하는 방법을 연구하였다. 공개 데이터셋에 실험을 진행하여 학습 결과 높은 속도로 작동하는 이동객체 검출 및 추적기를 학습할 수 있음을 검증하였다.

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

수체 추출을 위한 Geo-SAM 기법의 응용: 국토위성영상 적용 실험 (Application of Geo-Segment Anything Model (SAM) Scheme to Water Body Segmentation: An Experiment Study Using CAS500-1 Images)

  • 이하영;김광섭;이기원
    • 대한원격탐사학회지
    • /
    • 제40권4호
    • /
    • pp.343-350
    • /
    • 2024
  • Meta에서 신속한 영상 분할 기능을 제공하는 대규모 컴퓨터 비전 생성 모델을 발표한 이후, 여러 활용 분야에서 이를 적용하려는 연구가 이루어지고 있다. 이 연구에서는 위성 영상 자료에 Segment Anything Model (SAM)을 사용할 수 있는 QGIS 플러그인 Geo-SAM을 사용하여 수체 객체 탐지와 추출에 대한 SAM의 적용성을 조사해 보고자 하였다. 실험 대상 자료는 국토위성(Compact Advanced Satellite 500, CAS500-1) 영상을 사용하였다. 이 자료를 가지고 SAM을 적용하여 얻은 결과는 같은 입력 영상으로부터 수작업으로 제작한 수체 객체 자료, Open Street Map (OSM)의 수체 자료, 국토지리정보원의 수계 수치지도와 비교하였다. SAM 처리 결과와 비교 대상 자료를 이용하여 추출된 모든 객체를 대상으로 계산한 경계사각형의 교집합/합집합의 평균값을 나타내는 mean Intersection over Union (mIoU)은 각각 0.7490, 0.5905, 0.4921로 나타났고, 각 자료에서 공통으로 나타나거나 추출된 객체에 대해 계산한 결과는 차례대로 0.9189, 0.8779, 0.7715로 나타났다. SAM을 적용한 결과와 다른 비교 자료와의 공간적 일치도를 분석한 결과, SAM에서는 한 개의 수체 객체를 여러 개의 분할 요소로 나타내므로 수체 객체 분류를 지원하는 의미 있는 결과를 보이고 있음을 알 수 있다.