• 제목/요약/키워드: 이미지 데이터 셋

검색결과 302건 처리시간 0.023초

표정 분류 연구 (Analysis of facial expression recognition)

  • 손나영;조현선;이소현;송종우
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.539-554
    • /
    • 2018
  • 최근 등장하는 다양한 사물인터넷 기기 혹은 상황인식 기반의 인공지능에서는 사용자와 기기의 상호작용이 중요시 된다. 특히 인간을 대상으로 상황에 맞는 대응을 하기 위해서는 인간의 표정을 실시간으로 인식하여 빠르고 정확한 판단을 내리는 것이 필요하다. 따라서, 보다 빠르고 정확하게 표정을 인식하는 시스템을 구축하기 위해 얼굴 이미지 분석에 대한 많은 연구들이 선행되어 왔다. 본 연구에서는 웹사이트 Kaggle에서 제공한 48*48 8-bit grayscale 이미지 데이터셋을 사용하여 얼굴인식과 표정분류로 구분된 두 단계를 거치는 얼굴표정 자동 인식 시스템을 구축하였고, 이를 기존의 연구와 비교하여 자료 및 방법론의 특징을 고찰하였다. 분석 결과, Face landmark 정보에 주성분분석을 적용하여 단 30개의 주성분만으로도 빠르고 효율적인 예측모형을 얻을 수 있음이 밝혀졌다. LDA, Random forest, SVM, Bagging 중 SVM방법을 적용했을 때 가장 높은 정확도를 보이며, LDA방법을 적용하는 경우는 SVM 다음으로 높은 정확도를 보이며, 매우 빠르게 적합하고 예측하는 것이 가능하다.

Online Multi-Object Tracking by Learning Discriminative Appearance with Fourier Transform and Partial Least Square Analysis

  • Lee, Seong-Ho;Bae, Seung-Hwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.49-58
    • /
    • 2020
  • 본 연구는 온라인 다중 객체 추적 환경에서 모든 객체의 상태(예. 위치 및 크기) 및 identifications (IDs)를 추적하는 문제를 다룬다. 프레임들 간 검출 결과들을 연관하여 객체들의 궤도를 점진적으로 완성하는 tracking-by-detection 접근법을 기반으로 온라인 다중 객체 추적 문제를 해결하고자 한다. 정확한 온라인 연관을 수행하기 위해 이산 푸리에 변환과 부분 최소 제곱법(partial least square, PLS) 분석을 기반으로 하는 새로운 온라인 외형 학습 방법을 제안한다. 즉, 먼저 주파수 도메인에서 추적에 용이한 객체 특징량을 추출하기 위해 추적 객체에 대한 이미지를 푸리에 이미지로 변환한다. 나아가 객체간의 주파수 특징을 보다 잘 구별할 수 있도록 PLS기반 부분 공간을 학습한다. 제안된 외형 학습을 최신 신뢰도 기반 연관 기법과 결합하였고, 다중 객체 추적평가 분야에서 국제적으로 공인된 MOT 벤치마크 챌린지 데이터 셋에서 최신 다중 객체 추적 알고리즘과 비교평가를 수행하였다.

자율주행 차량의 학습 데이터 자동 생성 시스템 개발 (Development of Autonomous Vehicle Learning Data Generation System)

  • 윤승제;정지원;홍준;임경일;김재환;김형주
    • 한국ITS학회 논문지
    • /
    • 제19권5호
    • /
    • pp.162-177
    • /
    • 2020
  • 자율주행시스템에서 다양한 센서를 기반으로 한 외부환경 인지는 주행안전성과 직접적인 관계가 있다. 최근 머신러닝/심층 신경망 기술의 발전으로 심층 신경망 기반의 인지 모델이 사용됨에 따라, 인지 알고리즘의 올바른 학습과 이를 위한 양질의 학습데이터가 필수적으로 요구된다. 그러나 자율주행에 발생할 수 있는 모든 상황을 데이터를 수집하는 것은 현실적인 어려움이 많다. 해외와 국내의 교통 환경의 차이로 인지 모델의 성능이 저하되기도 하며, 센서가 정상동작을 못하는 악천우에 대한 데이터는 수집이 어려우며 질적인 부분을 보장하지 못한다. 때문에, 실제 도로가 아닌 시뮬레이터 내 가상 도로 환경을 구축하여 합성 데이터를 수집하는 접근법이 필요하다. 본 논문에서는 국내 실정에 맞게 국내 도로 상황을 모사한 시뮬레이터 환경 안에 날씨와 조도, 차량의 종류와 대수, 센서의 위치를 다양화하여 학습데이터를 수집하였고, 보다 더 좋은 성능을 위해 적대적 생성 모델을 활용하여 이미지의 도메인을 보다 실사에 가깝게 바꾸고 다양화 하였다. 그리고 위 데이터로 학습한 인지 모델을 실제 도로 환경에서 수집한 시험 데이터에 성능 평가를 진행하여, 실제 환경 데이터만으로 학습한 모델과 비슷한 성능을 내는 것을 보였다.

이미지에서 3차원 인물복원 기법을 사용한 패션쇼 애니메이션 생성기법 (Fashion-show Animation Generation using a Single Image to 3D Human Reconstruction Technique)

  • 안희준;미나르 마드올 라흐만
    • 한국산업정보학회논문지
    • /
    • 제24권5호
    • /
    • pp.17-25
    • /
    • 2019
  • 본 논문은 단일 이미지를 패션쇼 워킹 영상으로 변환하는 기술을 소개한다. 일반인이 가상으로 패션모델이 되어 보는 흥미로운 응용일 뿐 아니라, 나아가 가상 착용기술과 함께 결합하게 되면 의상착용결과의 동적인 확인이 가능한 기술이다. 본 논문에서 사용한 기술은 이미지에서 3차원 인간신체 모델을 추정 복원해 주는 SMPLify 기법에 기초하여, 인체 모델에서 의상을 포함한 사람으로 모델을 확장하고, 이에 애니메이션 기법을 적용하여 구현되었다. 인체와 의상을 포한한 사람의 3차원 모델은 2차원 이미지 상에서 기하변형과 깊이정보를 사용하여 복원하였다. 패션 데이터 셋에 적용해 본 결과 정자세의 경우에는 성공적인 수준의 결과를 보였으나, 상용수준의 성능을 위해서는 이미지의 분할 기술, 매핑기술 및 가려진 영역의 복원기술 등 선 후처리 기술에 보완이 필요한 것으로 확인되었다.

샴 네트워크 기반 객체 추적을 위한 표적 이미지 교환 모델 (Target Image Exchange Model for Object Tracking Based on Siamese Network)

  • 박성준;김규민;황승준;백중환
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.389-395
    • /
    • 2021
  • 본 논문에서는 샴 네트워크 기반의 객체 추적 알고리즘의 성능 향상을 위한 표적 이미지 교환 모델을 제안한다. 샴 네트워크 기반의 객체 추적 알고리즘은 시퀀스의 첫 프레임에서 지정된 표적 이미지만을 사용하여 탐색 이미지 내에서 가장 유사한 부분을 찾아 객체를 추적한다. 첫 프레임의 객체와 유사도를 비교하기 때문에 추적에 한 번 실패하게 되면 오류가 축적되어 추적 객체가 아닌 부분에서 표류하게 되는 현상이 발생한다. 따라서 CNN(Convolutional Neural Network)기반의 모델을 설계하여 추적이 잘 진행되고 있는지 확인하고 샴 네트워크 기반의 객체 추적 알고리즘에서 출력되는 점수를 이용하여 표적 이미지 교환 시기를 정의하였다. 제안 모델은 VOT-2018 데이터 셋을 이용하여 성능을 평가하였고 최종적으로 정확도 0.611 견고도 22.816을 달성하였다.

인공신경망을 이용한 USB 인식 시스템 (A USB classification system using deep neural networks)

  • 우세형;박지수;은성배;차신
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.535-538
    • /
    • 2022
  • IoT 디바이스의 Plug & Play를 위하여 IoT 디바이스의 대표적인 유선 인터페이스인 USB의 종류를 이미지를 통하여 인식하는 모듈을 개발한다. IoT 디바이스를 구동시키기 위해서는 통신 및 디바이스 하드웨어를 구동하기 위한 드라이버가 필요하다. IoT 디바이스에 연결되는 유선 인터페이스를 스마트폰의 카메라 촬영을 통하여 얻은 이미지를 이용하여서 해당 통신 인터페이스를 인식한다. 대표적인 유선 인터페이스인 USB에 대하여 인공신경망 기반의 기계학습을 통하여 USB의 종류를 분류한다. 인공신경망의 충분한 학습을 위하여 인터넷을 통하여 USB 이미지를 수집하고, 이미지 처리를 통하여 추가적인 이미지 데이터 셋을 확보한다. 합성곱 신경망과 더불어서 다양한 심층 인공신경망으로 인식기를 구현하여서 그 성능을 비교, 평가한다.

  • PDF

인공 지능을 이용한 흉부 엑스레이 이미지에서의 이물질 검출 (Detecting Foreign Objects in Chest X-Ray Images using Artificial Intelligence)

  • 한창화
    • 한국방사선학회논문지
    • /
    • 제17권6호
    • /
    • pp.873-879
    • /
    • 2023
  • 본 연구는 인공지능(AI)을 사용하여 흉부 엑스레이 이미지에서 이물질을 탐지하는 방법을 탐구하였다. 의료영상학, 특히 흉부 엑스레이는 폐렴이나 폐암과 같은 질병을 진단하는 데 매우 중요한 역할을 한다. 영상의학 검사가 증가함에 따라 AI는 효율적이고 빠른 진단을 위한 중요한 도구가 되었다. 하지만 이미지에는 단추나 브래지어 와이어와 같은 일상적인 장신구를 포함한 이물질이 포함될 수 있어 정확한 판독을 방해할 수 있다. 본 연구에서는 이러한 이물질을 정확하게 식별하는 AI 알고리즘을 개발하였고, 미국 국립보건원 흉부 엑스레이 데이터셋을 가공하여 YOLOv8 모델을 기반으로 처리하였다. 그 결과 정확도, 정밀도, 리콜, F1-score가 모두 0.91에 가까울 정도로 높은 탐지 성능을 보였다. 이번 연구는 AI의 뛰어난 성능에도 불구하고 이미지 내 이물질로 인해 판독 결과가 왜곡될 수 있는 문제점을 해결함으로써 영상의학 분야에서 AI의 혁신적인 역할과 함께, 임상 구현에 필수적인 정확성에 기반하여 신뢰성을 강조하였다.

VCM 을 위한 다중 스케일 특징 압축 방법 (multi-scale feature compression for VCM)

  • 한희지;최민석;정순흥;곽상운;추현곤;정원식;서정일;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.140-142
    • /
    • 2022
  • 최근 신경망 기반 기술들의 발달에 따라, 신경망 기술들은 충분히 높은 임무 수행 성능을 달성하고 있으며 사물인터넷, 스마트시티, 자율주행 등 다양한 환경을 고려한 응용 역시 활발히 연구되고 있다. 하지만 이러한 신경망의 임무 다양성과 복잡성은 더욱 많은 비디오 데이터가 요구되며 대역폭이 제한된 환경을 고려한 응용에서 이러한 비디오 데이터를 효과적으로 전송할 방법이 필요하다. 이에 따라 국제 표준화 단체인 MPEG 에서는 신경망 기계 소비에 적합한 비디오 부호화 표준 개발을 위해 Video Coding for Machines (VCM) 표준화를 진행하고 있다. 본 논문에서는 신경망의 특징 부호화 효율을 개선하기 위하여 VCM 을 위한 다중 스케일 특징 압축 방법을 제안한다. COCO2017 데이터셋의 검증 영상을 기반으로 제안방법을 평가한 결과, 압축된 특징의 크기는 원본 이미지의 0.03 배이며 6.8% 미만의 임무 정확도 손실을 보였다.

  • PDF

다중스펙트럼을 이용한 횡단보도 보행자 검지에 관한 연구 (A study on the detection of pedestrians in crosswalks using multi-spectrum)

  • 김정훈;최두현;이종선;이동화
    • 한국산업정보학회논문지
    • /
    • 제27권1호
    • /
    • pp.11-18
    • /
    • 2022
  • 주간 및 야간의 보행자 감지를 위해서는 다중 스펙트럼 활용이 필수적이다. 본 논문에서는 교통사고의 위험성이 높은 교차로에서 횡단보도 근처의 보행자를 24시간 검출하기 위해 컬러 카메라 및 열화상 적외선 카메라를 사용하였다. 보행자 탐지를 위해서 YOLO v5 객체 검출기를 사용하였으며 컬러 이미지와 열화상 이미지를 동시에 사용하여 감지 성능을 향상 시켰다. 제안된 시스템은 실제 횡단보도 현장에서 확보한 주·야간 다중 스펙트럼(색상 및 열화상) 보행자 데이터 셋에서 Iou 0.5 기준 0.94 mAP의 높은 성능을 보였다.

합성곱 신경망을 적용한 Optical Camera Communication 시스템 성능 분석 (Performance Analysis of Optical Camera Communication with Applied Convolutional Neural Network)

  • 김종인;박현선;김정현
    • 스마트미디어저널
    • /
    • 제12권3호
    • /
    • pp.49-59
    • /
    • 2023
  • 차세대 무선 통신기술로 알려져 있는 Optical Camera Communication(OCC)은 많은 연구가 진행 되고 있다. 이러한 OCC 기술은 통신 환경에 의해 성능이 좌우되며 이를 개선하기 위해 다양한 전략이 연구되고 있다. 그중 가장 두각을 나타내고 있는 방법은 딥러닝 기술을 사용하여 OCC의 수신기에 CNN을 적용하는 방법이다. 하지만 대부분의 연구에서는 CNN을 단순히 송신기를 검출하는데 사용하고 있다. 본 논문에서는 CNN을 송신기 검출 뿐만 아니라 Rx 복조 시스템에 적용하여 실험한다. 그리고 OCC 시스템의 데이터 이미지는 다른 이미지 데이터셋과는 다르게 비교적 분류가 간단하기 때문에 대부분의 CNN 모델에서 높은 정확도의 결과가 나타날 것이라는 가설을 세웠다. 가설을 증명하기 위해 OCC 시스템을 설계 및 구현하여 데이터를 수집하였고 12가지의 다양한 CNN 모델에 적용하여 실험했다. 실험 결과 파라미터수가 많은 고성능의 CNN 모델 뿐만 아니라 경량화 CNN 모델에서도 99% 이상의 정확도를 달성하였고 이를 통해 스마트폰과 같은 저성능 계산 장치에 OCC 시스템 적용이 가능함을 확인했다.