• 제목/요약/키워드: 사용가능한 데이터 마스크

검색결과 18건 처리시간 0.031초

Tiny-YOLOv3와 ResNet50을 이용한 실시간 마스크 표정인식 (Real-time mask facial expression recognition using Tiny-YOLOv3 and ResNet50)

  • 박규리;박나연;김승우;김승혜;김진산;고병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.232-234
    • /
    • 2021
  • 최근 휴먼-컴퓨터 인터페이스, 가상현식, 증강현실, 지능형 자동차등에서 얼굴표정 인식에 대한 연구가 활발히 진행되고 있다. 얼굴표정인식 연구는 대부분 맨얼굴을 대상으로 하고 있지만 최근 코로나-19로 인해 마스크 착용한 사람들이 많아지면서, 마스크를 착용했을 때의 표정인식에 대한 필요성이 증가하고 있다. 본 논문은 마스크를 착용했을 때에도 실시간으로 표정 분류가 가능한 시스템개발을 목표로 구동에 필요한 알고리즘을 조사했고, 그 중 Tiny-YOLOv3와 ResNet50 알고리즘을 이용하기로 했다. 얼굴과 표정 데이터셋 등에서 모은 이미지 데이터를 사용하여 실행해 보고 그 적절성 및 성능에 대해 평가해 보았다.

  • PDF

새로운 Free Rectangle 특징을 사용한 Adaboost 기반 얼굴검출 방법 (A Face Detection Method Based on Adaboost Algorithm using New Free Rectangle Feature)

  • 홍용희;한영준;한헌수
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권2호
    • /
    • pp.55-64
    • /
    • 2010
  • 본 논문은 수행시간이 빠르면서 효율성이 높은 새로운 Free Rectangle 특징을 사용한 Adaboost 알고리즘 기반 얼굴 검출 방법을 제안한다. 제안하는 Free Rectangle 특징은 동일한 면적의 분리가 가능한 두 개의 사각형으로 구성된 마스크로부터 정의된다. Haar-like 특징은 다양성을 높이기 위해 일반적으로 두 개 이상의 사각 영역으로 구성한 복잡한 마스크 구조를 갖는다. 하지만, 제안하는 특징 마스크는 두 사각형이 특징 윈도우 안에 놓이는 위치와 크기에 따라 효율성이 좋은 다양한 특징을 얻을 수 있다. 또한 제안하는 특징은 일반 Haar-like 특징과 달리 마스크 형태에 상관없이 두 사각 영역의 화소 합의 차만 계산함으로 수행 시간을 크게 줄일 수 있다. 실세계 영상에서 제안하는 Adaboost 알고리즘 기반 얼굴 검출 기법은 빠른 검출 속도와 높은 검출 결과를 보여 학습 데이터만을 바꿔 다른 물체 검출에도 쉽게 적용이 가능하다.

손을 다루는 컴퓨터 비전 작업들을 위한 멀티 모달 합성 데이터 생성 방법 (Generating A Synthetic Multimodal Dataset for Vision Tasks Involving Hands)

  • 이창화;이선경;김동욱;정찬양;백승렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1052-1055
    • /
    • 2020
  • 본 논문에서는 3D 메시 정보, RGB-D 손 자세 및 2D/3D 손/세그먼트 마스크를 포함하여 인간의 손과 관련된 다양한 컴퓨터 비전 작업에 사용할 수 있는 새로운 다중 모달 합성 벤치마크를 제안 하였다. 생성된 데이터셋은 기존의 대규모 데이터셋인 BigHand2.2M 데이터셋과 변형 가능한 3D 손 메시(mesh) MANO 모델을 활용하여 다양한 손 포즈 변형을 다룬다. 첫째, 중복되는 손자세를 줄이기 위해 전략적으로 샘플링하는 방법을 이용하고 3D 메시 모델을 샘플링된 손에 피팅한다. 3D 메시의 모양 및 시점 파라미터를 탐색하여 인간 손 이미지의 자연스러운 가변성을 처리한다. 마지막으로, 다중 모달리티 데이터를 생성한다. 손 관절, 모양 및 관점의 데이터 공간을 기존 벤치마크의 데이터 공간과 비교한다. 이 과정을 통해 제안된 벤치마크가 이전 작업의 차이를 메우고 있음을 보여주고, 또한 네트워크 훈련 과정에서 제안된 데이터를 사용하여 RGB 기반 손 포즈 추정 실험을 하여 생성된 데이터가 양질의 질과 양을 가짐을 보여준다. 제안된 데이터가 RGB 기반 3D 손 포즈 추정 및 시맨틱 손 세그멘테이션과 같은 품질 좋은 큰 데이터셋이 부족하여 방해되었던 작업에 대한 발전을 가속화할 것으로 기대된다.

출력 평면에서 빔 확산을 위한 홀로그래픽 디퓨저의 구현 (Implementation of the holographic diffuser for beam expending in the output plane)

  • 최경식;윤진선;김남;최윤선;최병소
    • 한국광학회:학술대회논문집
    • /
    • 한국광학회 2000년도 하계학술발표회
    • /
    • pp.238-239
    • /
    • 2000
  • 페이지 지향 데이터의 고밀도 홀로그래픽 데이터 저장 시스템이나 홀로그래피 현상에서 필름에 기록되는 스펙트럼을 평탄화하기 위해 확산 광원의 사용은 필수적이다. 또한, 출력 평면에서 균일한 분포를 갖는 회절 빔의 세기 분포와 회절 격자로서의 높은 회절 효율, 홀로그램 손상 시 재생 가능한 용장성 (redundancy)의 증가를 위해 간유리나 특정 패턴들로 인코딩된 유사 랜덤 디퓨저가 이용되고 있으나, 이들은 무한한 공간 대역폭을 갖기 때문에 공간적으로 유한한 데이터 마스크만이 이용되거나 기록 매질이 임의의 크기로 제한된다면, 입사 광원의 전력 낭비와 균일도 측면에서 비효율적이고, 여러 단계의 제작과정이 필요한 단점을 가지고 있다.$^{(1-3)}$ (중략)

  • PDF

칼라지도영상에서의 벡터링 영역 추출 방법 (Extraction of Vectoring Regions in Color Map Image)

  • 김성영;유윤주;한영미;허봉식;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.266-271
    • /
    • 1998
  • 본 논문에서는 칼라지도영상으로부터 GIS의 벡터링 과정에 사용할 벡터링 영역(도로, 해안선, 등고선 등)을 추출하는 방법에 대해 연구하였다. 입력영상으로는 트루칼라영상을 사용할 경우 추출 영역의 칼라가 비교적 균일하게 분포되지만 데이터량이 방대하여 처리에 어려움이 있어 현실적이지 못하므로 이를 양자화하여 256칼라 영상으로 변환한 후 사용할 수 있도록 하였다. 추출 단계에서는 Lab칼라공간에서 mahalanobis 거리 및 방향성 마스크를 사용하여 다양한 칼라 분포를 흡수할 수 있도록 하여 배경 영역을 배제하면서 연결성이 있는 추출결과를 얻을수 있도록 하였다. 그리고 추출된 결과를 원영상과 중첩해 보면서 기호, 문자 등의 요소로 인해 끊어진 영역이나 추출시 발생되는 피할 수 없는 잡영을 편집하여 제거할 수 있는 기능을 제공하였다. 추출된 결과는 벡터링 작업에 직접 사용 가능한 형태로 추출되도록 하였는데 실제 벡터링 작업에 다양한 추출영역을 사용해 봄으로써 이를 검증하였다.

  • PDF

청각 장애인을 위한 수어 영상-자연어 번역 서비스 및 모바일 어플리케이션 구현 (Developing a mobile application serving sign-language to text translation for the deaf)

  • 조수민;조성연;신소연;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1012-1015
    • /
    • 2021
  • Covid-19 로 인한 마스크 착용이 청각장애인들의 소통을 더 어렵게 하는 바, 제 3 자의 도움 없이 쌍방향 소통을 가능하게 하는 서비스의 필요성이 커지고 있다. 이에 본 논문은 소통의 어려움을 겪는 청각장애인과 비청각장애인을 위한 쌍방향 소통 서비스에 대한 연구와 개발 과정, 기대 효과를 담는다. 서비스는 GRU-CNN 하이브리드 아키텍처를 사용하여 데이터셋을 영상 공간 정보와 시간 정보를 포함한 프레임으로 분할하는 영상 분류 기법과 같은 딥 러닝 알고리즘을 통해 수어 영상을 분류한다. 해당 연구는 "눈속말" 모바일 어플리케이션으로 제작 중이며 음성을 인식하여 수어영상과 텍스트로 번역결과를 제공하는 청각장애인 버전과 카메라를 통해 들어온 수어 영상을 텍스트로 변환하여 음성과 함께 제공하는 비청각장애인 버전 두 가지로 나누어 구현한다. 청각장애인과 비장애인의 쌍방향 소통을 위한 서비스는 청각장애인이 사회로 나아가기 위한 가장 기본적인 관문으로서의 역할을 할 것이며 사회 참여를 돕고 소통이라는 장벽을 넘어서는 발돋움이 될 것이라 예측된다.

Rule과 Case를 활용한 설계 의사결정 지원 시스템 (Decision Supporting System for Shadow Mask′s Development Using Rule and Case)

  • 김민성;진홍기;정사범;손기목;예병진
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.315-322
    • /
    • 2002
  • 최근에 경험적 지식을 체계화하는 방법으로 사례기반추론(CBR: Case Based Reasoning) 및 규칙기반추론(RBR: Rule Based Reasoning)이 여러 분야에서 이용되고 있다. CBR과 RBR이 각각 활용되기도 하지만 문제 해결의 정확성을 높이기 위해 복합된 형태로 사용되기도 하고, 흑은 효과적으로 문제를 해결하기 위해 문제 해결 단계별로 각각 사용되기도 한다 또한 데이터에서 지식을 추출하기 위한 세부 알고리즘으로는 인공지능과 통계적 분석기법 등이 활발하게 연구 및 적용되고 있다. 본 연구는 모니터의 핵심 부품인 섀도우마스크(Shadow Mask)를 개발하는데 있어 도면 협의부터 설계가지의 과정에 CBR과 RBR을 활용하고 발생되는 데이터를 이용하여 진화(Evolution)하는 지식기반시스템(Knowledge Based System)으로 구축하는 것을 목적으로 하고 있다. 특히 도면 협의시 인터넷상에 웹서버 시스템을 통하여 규격 (User Spec.)을 생성하고 이를 이용하여 자동으로 도면이 설계되도록 하고 저장된 사례들을 공유할 수 있도록 하여 도면 검토 시간이 단축되고 검토의 정확성을 기할 수 있어 실패비용을 감소시켰다. 그리고 실제 설계시 CBR과 RBR을 활용하여 자동설계를 할 수 있게 하였고 현장에서 발생되는 데이터를 지식화하여 유사사례 설계가 가능하도록 하였다. 지식기반시스템은 신속한 도면 검토가 가능하므로 인원 활용이 극대화되고, 섀도우 마스크 설계자와 마스터 패턴 설계자 사이의 원활한 의사소통을 통해 고객과의 신뢰성 확보와 신인도 향상을 기대할 수 있는 효과가 있다. 그리고 고급설계자에게만 의지되어온 것을 어느 정도 해결할 수 있고, 신입설계자에게는 훌륭한 교육시스템이 될 수 있다.한 도구임을 입증하였다는 점에서 큰 의의를 갖는다고 하겠다.운 선용품 판매 및 관련 정보 제공 등 해운 거래를 위한 종합적인 서비스가 제공되어야 한다. 이를 위해, 본문에서는 e-Marketplace의 효율적인 연계 방안에 대해 해운 관련 업종별로 제시하고 있다. 리스트 제공형, 중개형, 협력형, 보완형, 정보 연계형 등이 있는데, 이는 해운 분야에서 사이버 해운 거래가 가지는 문제점들을 보완하고 업종간 협업체제를 이루어 원활한 거래를 유도할 것이다. 그리하여 우리나라가 동북아 지역뿐만 아니라 세계적인 해운 국가 및 물류 ·정보 중심지로 성장할 수 있는 여건을 구축하는데 기여할 것이다. 나타내었다.약 1주일간의 포르말린 고정이 끝난 소장 및 대장을 부위별, 별 종양개수 및 분포를 자동영상분석기(Kontron Co. Ltd., Germany)로 분석하였다. 체의 변화, 장기무게, 사료소비량 및 마리당 종양의 개수에 대한 통계학적 유의성 검증을 위하여 Duncan's t-test로 통계처리 하였고, 종양 발생빈도에 대하여는 Likelihood ration Chi-square test로 유의성을 검증하였다. C57BL/6J-Apc$^{min/+}$계 수컷 이형접합체 형질전환 마우스에 AIN-76A 정제사료만을 투여한 대조군의 대장선종의 발생률은 84%(Group 3; 21/25례)로써 I3C 100ppm 및 300ppm을 투여한 경우에 있어서는 각군 모두 60%(Group 1; 12/20 례, Group 2; 15/25 례)로 감소하는 경향을 나타내었다. 대장선종의 마리당 발생개수에 있어서는 C57BL/6J-Apc$^{min/+}$계 수컷 이형접합체 형질전환 마우스에 AIN-76A 정제사료만을 투여한

  • PDF

대화형 멀티미디어 방송을 위한 객체 저장 방법 (Object Store Method for Interactive Multimedia Broadcasting)

  • 한대영;황부현;김대인;김재인;나철수
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.51-59
    • /
    • 2009
  • 통방융합으로 인한 데이터 방송이 상용화됨에 따라 멀티미디어 객체에 대한 다양한 부가 정보를 제공하는 대화형 멀티미디어 방송 서비스가 가능하게 되었다. 대화형 멀티미디어 방송의 중요한 요소 중 하나는 방송 제공자와 시청자와의 데이터 상호 운용성이다. 상호 운용성이 높을수록 사용자의 요청이 있을때 즉각적으로 시청자 관심 객체에 대한 정보를 제공할 수 있다. 본 논문에서는 대화형 멀티미디어 방송의 상호 운용성을 높이기 위한 객체 저장 방법을 제안한다. 제안 방법은 객체의 마스크 영상에서 객체 영역을 균등 분할하고, 각 영역에 대하여 객체정보 포함 최소 비율 검사를 통해 저장 영역을 비트합 형태로 군집화하여 저장한다. 그리고 실험을 통하여, 제안하는 방법이 기존의 대화형 멀티미디어 방송에 비하여 객체영역 정보 저장을 위한 공간 사용을 줄임으로써 보다 효율적임을 확인한다.

딥러닝 기반 구름 및 구름 그림자 탐지를 통한 고해상도 위성영상 UDM 구축 가능성 분석 (Applicability Analysis of Constructing UDM of Cloud and Cloud Shadow in High-Resolution Imagery Using Deep Learning)

  • 김나영;윤예린;최재완;한유경
    • 대한원격탐사학회지
    • /
    • 제40권4호
    • /
    • pp.351-361
    • /
    • 2024
  • 위성영상은 구름, 구름 그림자, 지형 그림자 등을 포함한 다양한 요소를 포함하고 있으며, 이러한 요소들을 정확히 식별하고 제거하는 것은 원격 탐사 분야에서 위성영상의 신뢰성을 유지하기 위해 필수적이다. 이를 위해 Landsat-8, Sentinel-2, Compact Advanced Satellite 500-1 (CAS500-1)과 같은 위성들은 분석준비자료(Analysis Ready Data)의 일환으로 영상과 함께 사용가능한 데이터 마스크(Usable Data Mask, UDM)를 제공하고 있으며, UDM 데이터의 정확한 구축을 위해 구름 및 구름 그림자 탐지가 필수적이다. 기존의 구름 및 구름 그림자 탐지 기법은 임계값 기반 기법과 인공지능 기반 기법으로 나뉘며, 최근에는 많은 양의 데이터를 처리하는 데 유리한 딥러닝 네트워크를 활용한 인공지능 기법이 많이 사용되고 있다. 본 연구에서는 오픈소스 데이터 셋을 통해 훈련된 딥러닝 네트워크 기반 구름 및 구름 그림자 탐지를 통해 고해상도 위성영상의 UDM 구축 가능성을 분석하고자 하였다. 딥러닝 네트워크의 성능을 검증하기 위해 Landsat-8, Sentinel-2, CAS500-1 위성영상과 함께 제공된 기구축된 UDM 데이터와 딥러닝 네트워크가 생성한 탐지 결과 간의 유사성을 분석하였다. 그 결과, 딥러닝 네트워크가 생성한 탐지 결과는 높은 정확도를 나타냈다. 또한 UDM을 제공하지 않는 고해상도 위성영상인 KOMPSAT-3/3A 영상에 적용하였다. 실험 결과, 딥러닝 네트워크를 통하여 고해상도 위성영상 내에 존재하는 구름 및 구름 그림자를 효과적으로 탐지한 것을 확인하였다. 이를 통해 고해상도 위성영상에서도 딥러닝 네트워크를 사용하여 UDM 데이터를 구축할 수 있는 가능성을 확인하였다.

화상회의 영상에서 움직이는 화자의 분할 및 추적 알고리즘 (Segmentation and Tracking Algorithm for Moving Speaker in the Video Conference Image)

  • 최우영;김한메
    • 전기전자학회논문지
    • /
    • 제6권1호
    • /
    • pp.54-64
    • /
    • 2002
  • 본 논문에서는 화상회의 영상 데이터에서 화자를 분할하고, 그 움직임을 추적하는 알고리즘을 제안하였다. 실시간 처리가 가능하도록 화자 분할과 움직임 추적 순으로 처리되는 알고리즘으로 단순화하였다. 분할 한계에서는 차분 방법에 의해 구한 움직임 정보와 영상의 밝기 정보를 사용하여 화자를 분할하였다. 분할된 화자로부터 기준 마스크 영상을 생성하였다. 움직임 추적 단계에서는 움직임 추적에 불필요한 블록들은 제외함으로써 빠르게 움직임을 추적할 수 있는 블록정합 알고리즘을 사용하여 추적하였다. 시뮬레이션에서 여러 시험 영상에 제안한 알고리즘을 적용하여 움직이는 화자를 분할하고, 그 움직임를 추적하는 올바른 결과를 얻을 수 있었다.

  • PDF