• Title/Summary/Keyword: 사용가능한 데이터 마스크

Search Result 18, Processing Time 0.023 seconds

Real-time mask facial expression recognition using Tiny-YOLOv3 and ResNet50 (Tiny-YOLOv3와 ResNet50을 이용한 실시간 마스크 표정인식)

  • Park, Gyuri;Park, Nayeon;Kim, Seungwoo;Kim, Seunghye;Kim, Jinsan;Ko, Byungchul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.232-234
    • /
    • 2021
  • 최근 휴먼-컴퓨터 인터페이스, 가상현식, 증강현실, 지능형 자동차등에서 얼굴표정 인식에 대한 연구가 활발히 진행되고 있다. 얼굴표정인식 연구는 대부분 맨얼굴을 대상으로 하고 있지만 최근 코로나-19로 인해 마스크 착용한 사람들이 많아지면서, 마스크를 착용했을 때의 표정인식에 대한 필요성이 증가하고 있다. 본 논문은 마스크를 착용했을 때에도 실시간으로 표정 분류가 가능한 시스템개발을 목표로 구동에 필요한 알고리즘을 조사했고, 그 중 Tiny-YOLOv3와 ResNet50 알고리즘을 이용하기로 했다. 얼굴과 표정 데이터셋 등에서 모은 이미지 데이터를 사용하여 실행해 보고 그 적절성 및 성능에 대해 평가해 보았다.

  • PDF

A Face Detection Method Based on Adaboost Algorithm using New Free Rectangle Feature (새로운 Free Rectangle 특징을 사용한 Adaboost 기반 얼굴검출 방법)

  • Hong, Yong-Hee;Han, Young-Joon;Hahn, Hern-Soo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.15 no.2
    • /
    • pp.55-64
    • /
    • 2010
  • This paper proposes a face detection method using Free Rectangle feature which possesses a quick execution time and a high efficiency. The proposed mask of Free Rectangle feature is composed of two separable rectangles with the same area. In order to increase the feature diversity, Haar-like feature generally uses a complex mask composed of two or more rectangles. But the proposed feature mask can get a lot of very efficient features according to any position and scale of two rectangles on the feature window. Moreover, the Free Rectangle feature can largely reduce the execution time since it is defined as the only difference of the sum of pixels of two rectangles irrespective of the mask type. Since it yields a quick detection speed and good detection rates on real world images, the proposed face detection method based on Adaboost algorithm is easily applied to detect another object by changing the training dataset.

Generating A Synthetic Multimodal Dataset for Vision Tasks Involving Hands (손을 다루는 컴퓨터 비전 작업들을 위한 멀티 모달 합성 데이터 생성 방법)

  • Lee, Changhwa;Lee, Seongyeong;Kim, Donguk;Jeong, Chanyang;Baek, Seungryul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.1052-1055
    • /
    • 2020
  • 본 논문에서는 3D 메시 정보, RGB-D 손 자세 및 2D/3D 손/세그먼트 마스크를 포함하여 인간의 손과 관련된 다양한 컴퓨터 비전 작업에 사용할 수 있는 새로운 다중 모달 합성 벤치마크를 제안 하였다. 생성된 데이터셋은 기존의 대규모 데이터셋인 BigHand2.2M 데이터셋과 변형 가능한 3D 손 메시(mesh) MANO 모델을 활용하여 다양한 손 포즈 변형을 다룬다. 첫째, 중복되는 손자세를 줄이기 위해 전략적으로 샘플링하는 방법을 이용하고 3D 메시 모델을 샘플링된 손에 피팅한다. 3D 메시의 모양 및 시점 파라미터를 탐색하여 인간 손 이미지의 자연스러운 가변성을 처리한다. 마지막으로, 다중 모달리티 데이터를 생성한다. 손 관절, 모양 및 관점의 데이터 공간을 기존 벤치마크의 데이터 공간과 비교한다. 이 과정을 통해 제안된 벤치마크가 이전 작업의 차이를 메우고 있음을 보여주고, 또한 네트워크 훈련 과정에서 제안된 데이터를 사용하여 RGB 기반 손 포즈 추정 실험을 하여 생성된 데이터가 양질의 질과 양을 가짐을 보여준다. 제안된 데이터가 RGB 기반 3D 손 포즈 추정 및 시맨틱 손 세그멘테이션과 같은 품질 좋은 큰 데이터셋이 부족하여 방해되었던 작업에 대한 발전을 가속화할 것으로 기대된다.

Implementation of the holographic diffuser for beam expending in the output plane (출력 평면에서 빔 확산을 위한 홀로그래픽 디퓨저의 구현)

  • Choi, Kyung-Sik;Yoon, Jin-Sun;Kim, Nam;Choi, Yoon-Sun;Choi, Byung-So
    • Proceedings of the Optical Society of Korea Conference
    • /
    • 2000.08a
    • /
    • pp.238-239
    • /
    • 2000
  • 페이지 지향 데이터의 고밀도 홀로그래픽 데이터 저장 시스템이나 홀로그래피 현상에서 필름에 기록되는 스펙트럼을 평탄화하기 위해 확산 광원의 사용은 필수적이다. 또한, 출력 평면에서 균일한 분포를 갖는 회절 빔의 세기 분포와 회절 격자로서의 높은 회절 효율, 홀로그램 손상 시 재생 가능한 용장성 (redundancy)의 증가를 위해 간유리나 특정 패턴들로 인코딩된 유사 랜덤 디퓨저가 이용되고 있으나, 이들은 무한한 공간 대역폭을 갖기 때문에 공간적으로 유한한 데이터 마스크만이 이용되거나 기록 매질이 임의의 크기로 제한된다면, 입사 광원의 전력 낭비와 균일도 측면에서 비효율적이고, 여러 단계의 제작과정이 필요한 단점을 가지고 있다.$^{(1-3)}$ (중략)

  • PDF

Extraction of Vectoring Regions in Color Map Image (칼라지도영상에서의 벡터링 영역 추출 방법)

  • 김성영;유윤주;한영미;허봉식;김민환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.266-271
    • /
    • 1998
  • 본 논문에서는 칼라지도영상으로부터 GIS의 벡터링 과정에 사용할 벡터링 영역(도로, 해안선, 등고선 등)을 추출하는 방법에 대해 연구하였다. 입력영상으로는 트루칼라영상을 사용할 경우 추출 영역의 칼라가 비교적 균일하게 분포되지만 데이터량이 방대하여 처리에 어려움이 있어 현실적이지 못하므로 이를 양자화하여 256칼라 영상으로 변환한 후 사용할 수 있도록 하였다. 추출 단계에서는 Lab칼라공간에서 mahalanobis 거리 및 방향성 마스크를 사용하여 다양한 칼라 분포를 흡수할 수 있도록 하여 배경 영역을 배제하면서 연결성이 있는 추출결과를 얻을수 있도록 하였다. 그리고 추출된 결과를 원영상과 중첩해 보면서 기호, 문자 등의 요소로 인해 끊어진 영역이나 추출시 발생되는 피할 수 없는 잡영을 편집하여 제거할 수 있는 기능을 제공하였다. 추출된 결과는 벡터링 작업에 직접 사용 가능한 형태로 추출되도록 하였는데 실제 벡터링 작업에 다양한 추출영역을 사용해 봄으로써 이를 검증하였다.

  • PDF

Developing a mobile application serving sign-language to text translation for the deaf (청각 장애인을 위한 수어 영상-자연어 번역 서비스 및 모바일 어플리케이션 구현)

  • Cho, Su-Min;Cho, Seong-Yeon;Shin, So-Yeon;Lee, Jee Hang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.1012-1015
    • /
    • 2021
  • Covid-19 로 인한 마스크 착용이 청각장애인들의 소통을 더 어렵게 하는 바, 제 3 자의 도움 없이 쌍방향 소통을 가능하게 하는 서비스의 필요성이 커지고 있다. 이에 본 논문은 소통의 어려움을 겪는 청각장애인과 비청각장애인을 위한 쌍방향 소통 서비스에 대한 연구와 개발 과정, 기대 효과를 담는다. 서비스는 GRU-CNN 하이브리드 아키텍처를 사용하여 데이터셋을 영상 공간 정보와 시간 정보를 포함한 프레임으로 분할하는 영상 분류 기법과 같은 딥 러닝 알고리즘을 통해 수어 영상을 분류한다. 해당 연구는 "눈속말" 모바일 어플리케이션으로 제작 중이며 음성을 인식하여 수어영상과 텍스트로 번역결과를 제공하는 청각장애인 버전과 카메라를 통해 들어온 수어 영상을 텍스트로 변환하여 음성과 함께 제공하는 비청각장애인 버전 두 가지로 나누어 구현한다. 청각장애인과 비장애인의 쌍방향 소통을 위한 서비스는 청각장애인이 사회로 나아가기 위한 가장 기본적인 관문으로서의 역할을 할 것이며 사회 참여를 돕고 소통이라는 장벽을 넘어서는 발돋움이 될 것이라 예측된다.

Decision Supporting System for Shadow Mask′s Development Using Rule and Case (Rule과 Case를 활용한 설계 의사결정 지원 시스템)

  • 김민성;진홍기;정사범;손기목;예병진
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.05a
    • /
    • pp.315-322
    • /
    • 2002
  • 최근에 경험적 지식을 체계화하는 방법으로 사례기반추론(CBR: Case Based Reasoning) 및 규칙기반추론(RBR: Rule Based Reasoning)이 여러 분야에서 이용되고 있다. CBR과 RBR이 각각 활용되기도 하지만 문제 해결의 정확성을 높이기 위해 복합된 형태로 사용되기도 하고, 흑은 효과적으로 문제를 해결하기 위해 문제 해결 단계별로 각각 사용되기도 한다 또한 데이터에서 지식을 추출하기 위한 세부 알고리즘으로는 인공지능과 통계적 분석기법 등이 활발하게 연구 및 적용되고 있다. 본 연구는 모니터의 핵심 부품인 섀도우마스크(Shadow Mask)를 개발하는데 있어 도면 협의부터 설계가지의 과정에 CBR과 RBR을 활용하고 발생되는 데이터를 이용하여 진화(Evolution)하는 지식기반시스템(Knowledge Based System)으로 구축하는 것을 목적으로 하고 있다. 특히 도면 협의시 인터넷상에 웹서버 시스템을 통하여 규격 (User Spec.)을 생성하고 이를 이용하여 자동으로 도면이 설계되도록 하고 저장된 사례들을 공유할 수 있도록 하여 도면 검토 시간이 단축되고 검토의 정확성을 기할 수 있어 실패비용을 감소시켰다. 그리고 실제 설계시 CBR과 RBR을 활용하여 자동설계를 할 수 있게 하였고 현장에서 발생되는 데이터를 지식화하여 유사사례 설계가 가능하도록 하였다. 지식기반시스템은 신속한 도면 검토가 가능하므로 인원 활용이 극대화되고, 섀도우 마스크 설계자와 마스터 패턴 설계자 사이의 원활한 의사소통을 통해 고객과의 신뢰성 확보와 신인도 향상을 기대할 수 있는 효과가 있다. 그리고 고급설계자에게만 의지되어온 것을 어느 정도 해결할 수 있고, 신입설계자에게는 훌륭한 교육시스템이 될 수 있다.한 도구임을 입증하였다는 점에서 큰 의의를 갖는다고 하겠다.운 선용품 판매 및 관련 정보 제공 등 해운 거래를 위한 종합적인 서비스가 제공되어야 한다. 이를 위해, 본문에서는 e-Marketplace의 효율적인 연계 방안에 대해 해운 관련 업종별로 제시하고 있다. 리스트 제공형, 중개형, 협력형, 보완형, 정보 연계형 등이 있는데, 이는 해운 분야에서 사이버 해운 거래가 가지는 문제점들을 보완하고 업종간 협업체제를 이루어 원활한 거래를 유도할 것이다. 그리하여 우리나라가 동북아 지역뿐만 아니라 세계적인 해운 국가 및 물류 ·정보 중심지로 성장할 수 있는 여건을 구축하는데 기여할 것이다. 나타내었다.약 1주일간의 포르말린 고정이 끝난 소장 및 대장을 부위별, 별 종양개수 및 분포를 자동영상분석기(Kontron Co. Ltd., Germany)로 분석하였다. 체의 변화, 장기무게, 사료소비량 및 마리당 종양의 개수에 대한 통계학적 유의성 검증을 위하여 Duncan's t-test로 통계처리 하였고, 종양 발생빈도에 대하여는 Likelihood ration Chi-square test로 유의성을 검증하였다. C57BL/6J-Apc$^{min/+}$계 수컷 이형접합체 형질전환 마우스에 AIN-76A 정제사료만을 투여한 대조군의 대장선종의 발생률은 84%(Group 3; 21/25례)로써 I3C 100ppm 및 300ppm을 투여한 경우에 있어서는 각군 모두 60%(Group 1; 12/20 례, Group 2; 15/25 례)로 감소하는 경향을 나타내었다. 대장선종의 마리당 발생개수에 있어서는 C57BL/6J-Apc$^{min/+}$계 수컷 이형접합체 형질전환 마우스에 AIN-76A 정제사료만을 투여한

  • PDF

Object Store Method for Interactive Multimedia Broadcasting (대화형 멀티미디어 방송을 위한 객체 저장 방법)

  • Han, Dae-Young;Hwang, Bu-Hyun;Kim, Dae-In;Kim, Jae-In;Na, Choul-Su
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.2
    • /
    • pp.51-59
    • /
    • 2009
  • Interactive multimedia broadcasting can serve various additional information of object in multimedia because of the commercialized data broadcasting by communication and broadcasting convergence. One of the most important factors in interactive multimedia broadcasting is User-Centric Interoperability. The higher User-Centric Interoperability, the more information of user-interest objects are served quickly by user request. This proposed method finds own area of the object in mask video and divides the area into equal parts. And then it store as a form of bitsum after clustering the area. As a result of experiment, We confirm the method is efficient to use space for storing position information of the object.

Applicability Analysis of Constructing UDM of Cloud and Cloud Shadow in High-Resolution Imagery Using Deep Learning (딥러닝 기반 구름 및 구름 그림자 탐지를 통한 고해상도 위성영상 UDM 구축 가능성 분석)

  • Nayoung Kim;Yerin Yun;Jaewan Choi;Youkyung Han
    • Korean Journal of Remote Sensing
    • /
    • v.40 no.4
    • /
    • pp.351-361
    • /
    • 2024
  • Satellite imagery contains various elements such as clouds, cloud shadows, and terrain shadows. Accurately identifying and eliminating these factors that complicate satellite image analysis is essential for maintaining the reliability of remote sensing imagery. For this reason, satellites such as Landsat-8, Sentinel-2, and Compact Advanced Satellite 500-1 (CAS500-1) provide Usable Data Masks(UDMs)with images as part of their Analysis Ready Data (ARD) product. Precise detection of clouds and their shadows is crucial for the accurate construction of these UDMs. Existing cloud and their shadow detection methods are categorized into threshold-based methods and Artificial Intelligence (AI)-based methods. Recently, AI-based methods, particularly deep learning networks, have been preferred due to their advantage in handling large datasets. This study aims to analyze the applicability of constructing UDMs for high-resolution satellite images through deep learning-based cloud and their shadow detection using open-source datasets. To validate the performance of the deep learning network, we compared the detection results generated by the network with pre-existing UDMs from Landsat-8, Sentinel-2, and CAS500-1 satellite images. The results demonstrated that high accuracy in the detection outcomes produced by the deep learning network. Additionally, we applied the network to detect cloud and their shadow in KOMPSAT-3/3A images, which do not provide UDMs. The experiment confirmed that the deep learning network effectively detected cloud and their shadow in high-resolution satellite images. Through this, we could demonstrate the applicability that UDM data for high-resolution satellite imagery can be constructed using the deep learning network.

Segmentation and Tracking Algorithm for Moving Speaker in the Video Conference Image (화상회의 영상에서 움직이는 화자의 분할 및 추적 알고리즘)

  • Choi Woo-Young;Kim Han-Me
    • Journal of IKEEE
    • /
    • v.6 no.1 s.10
    • /
    • pp.54-64
    • /
    • 2002
  • In this paper, we propose the algorithm for segmenting the moving speaker and tracking its movement in the video conference image. For real time processing, we simplify the algorithm which is processed in the order of the segmenting and the tracking step. In the segmenting step, the speaker object is segmented from the image by using both the motion information obtained from the difference method and the illuminance information of image. The reference mask image is created from segmented speaker object. In the tracking step, the moving speaker is tracked by using simple block matching algorithm of which computation time is reduced by discarding the blocks which are classified into the unuseful blocks. In the simulation, we can get the good result of segmenting and tracking the moving speaker by applying the proposed algorithm to several test images.

  • PDF