• 제목/요약/키워드: 딥러닝 기반 컴퓨터비전

검색결과 108건 처리시간 0.033초

딥러닝을 활용한 향상된 라벨인식 방법에 관한 연구 (A Study on Improved Label Recognition Method Using Deep Learning.)

  • 유성근;조성만;송민정;전소연;임송원;정서경;박상일;박구만;김희태;이대성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.447-448
    • /
    • 2018
  • 라벨인식과 같은 광학 문자 인식은 영상처리를 활용한 컴퓨터 비전의 대표적인 연구분야이다. 본 연구에서는 딥러닝 기반의 라벨인식 시스템을 고안하였다, 생산 라인에 적용되는 라벨인식 시스템은 인식 속도가 중요하기 때문에 기존의 R-CNN기반의 딥러닝 신경망보다 월등히 빠른 오브젝트 검출 시스템 YOLO를 활용하여 문자를 학습 및 인식 시스템을 개발하였다. 본 시스템은 기존 시스템에 근접하는 문자인식 정확도를 제공하고 자동으로 문자영역을 검출 가능하며, 라벨의 인쇄불량을 판독하도록 하였다. 또한 개발, 배포, 적용이 한번에 가능한 프레임워크를 통하여 생산현장에서 발생하는 다양한 이미지 처리에 활용될 전망이다.

딥러닝 기반 비디오 캡셔닝의 연구동향 분석 (Analysis of Research Trends in Deep Learning-Based Video Captioning)

  • 려치;이은주;김영수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.35-49
    • /
    • 2024
  • 컴퓨터 비전과 자연어 처리의 융합의 중요한 결과로서 비디오 캡셔닝은 인공지능 분야의 핵심 연구 방향이다. 이 기술은 비디오 콘텐츠의 자동이해와 언어 표현을 가능하게 함으로써, 컴퓨터가 비디오의 시각적 정보를 텍스트 형태로 변환한다. 본 논문에서는 딥러닝 기반 비디오 캡셔닝의 연구 동향을 초기 분석하여 CNN-RNN 기반 모델, RNN-RNN 기반 모델, Multimodal 기반 모델, 그리고 Transformer 기반 모델이라는 네 가지 주요 범주로 나누어 각각의 비디오 캡셔닝 모델의 개념과 특징 그리고 장단점을 논하였다. 그리고 이 논문은 비디오 캡셔닝 분야에서 일반적으로 자주 사용되는 데이터 집합과 성능 평가방안을 나열하였다. 데이터 세트는 다양한 도메인과 시나리오를 포괄하여 비디오 캡션 모델의 훈련 및 검증을 위한 광범위한 리소스를 제공한다. 모델 성능 평가방안에서는 주요한 평가 지표를 언급하며, 모델의 성능을 다양한 각도에서 평가할 수 있도록 연구자들에게 실질적인 참조를 제공한다. 마지막으로 비디오 캡셔닝에 대한 향후 연구과제로서 실제 응용 프로그램에서의 복잡성을 증가시키는 시간 일관성 유지 및 동적 장면의 정확한 서술과 같이 지속해서 개선해야 할 주요 도전과제와 시간 관계 모델링 및 다중 모달 데이터 통합과 같이 새롭게 연구되어야 하는 과제를 제시하였다.

딥러닝기반 YOLO를 활용한 후숙과일 분류 및 숙성 예측 시스템 (Deep Learning-based Mango Classification and Prediction System of Fruit Ripening using YOLO)

  • 김영민;박승민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.187-188
    • /
    • 2021
  • 본 논문에서는 실시간으로 web-cam을 이용해, 후숙과일의 불량 여부를 판단, 분류하고 불량이 없는 후숙과일의 이미지 분석을 통하여 숙성도 예측하는 시스템을 소개한다. 실시간 다중 객체인식에 탁월한 yolo모델을 활용해, 과일의 불량여부 판단 후 분류하고, 이미지를 획득한 뒤, k-mean clustering 알고리즘을 이용해, 이미지를 segmentation 한다. segmentation된 이미지에 grabcut 알고리즘의 foreground-extraction을 사용해 배경 제거를 한 뒤, cluster의 중심색상값 색상값의 면적%, 전체 면적을 이용해 현재 숙성도를 계산하고 이를 이용해 과일의 후숙 시간 데이터와 비교, 숙성이 완료될 시간을 예측한다. 기존 수작업으로 이루어지고 있는 과일의 분류작업의 인력 감소 및 정확성을 높일 수 있는 알고리즘을 제안한다.

  • PDF

컴퓨터 비전과 딥러닝 라이브러리 기반 골퍼 자세 판단 및 코칭 시스템 (Implementation of Computer Vision and Deep Learning-Based Golfer Pose-Estimation System And Coaching System)

  • 변우진;심영선;유혜승;강석훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1040-1043
    • /
    • 2020
  • 본 논문에서는 골퍼의 자세 교정을 위해 레슨 프로 혹은 코치가 수행하는 교육을 담당하는 시스템을 구현한다. 이 시스템은 골프를 배우고자 하는 골퍼와 자세를 교정하고자 하는 골퍼를 대상으로 한다. 프로 골퍼의 스윙자세 영상을 촬영하고 딥러닝 라이브러리로 관절, 클럽의 위치를 디지털로 식별하여 표준 자세 정보를 입수한다. 그리고 사용자의 영상을 촬영하여 표준자세 정보와 비교 후 올바른 자세를 도표 및 시각적으로 제공 할 수 있도록 한다. 사람이 하는 방식 보다 객관적이고, 센서방식 보다 경제적인 시스템으로 골프교육산업의 활성화에 기여 할 수 있을 것이다.

객체 분할 기법을 활용한 자동 라벨링 구축 (Auto Labelling System using Object Segmentation Technology)

  • 문준휘;박성현;최지영;신원선;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.222-224
    • /
    • 2022
  • 객체 분할 분야의 딥러닝 기반 컴퓨터 비전 응용들은 성능을 향상하기 위하여 STOA 기법들이 사전학습하여 배포한 하이퍼파라미터와 모델을 통해 학습하는 전이학습 방법을 사용한다. 이 과정에서 사용되는 커스텀 데이터 셋들은 Ground Truth 정보를 생성하기 위한 라벨링 작업에서 시간이나 라벨러등의 많은 자원을 필요로 한다. 본 고에서는 딥러닝 신경망에서 사용되는 커스텀 데이터 셋 구축을 위하여 시간이나 라벨러등의 자원을 적게 사용할 수 있도록 객체 분할 기법을 활용한 자동 라벨링 구축 방법을 제시한다.

  • PDF

딥러닝 기반의 객체 탐지 모델을 활용한 과수 생육 단계 판별 시스템 (A System for Determining the Growth Stage of Fruit Tree Using a Deep Learning-Based Object Detection Model)

  • 방지현;박준;박성욱;김준영;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제11권4호
    • /
    • pp.9-18
    • /
    • 2022
  • 인공지능 기술의 발전으로 다양한 분야에서 AI가 접목된 시스템에 대한 관심이 급증하고 있다. 농업에서도 정보통신 기술을 적용한 스마트팜이 활용되고 있으며, 자율주행, 인공위성, 빅데이터 등의 다양한 첨단 기술을 접목하여 데이터 기반의 정밀 농업이 상용화되고 있다. 국내의 경우 시설농업 분야 스마트농업의 상용화 사례가 증가하고 있으나 시설원예 분야에 투자 편증이 심하여, 시설농업과 노지 농업의 투자 격차가 지속해서 벌어지고 있다. 특히, 과수, 식물공장 분야는 투자 규모가 작다. 또한, 빅데이터 수집, 활용 체계가 미흡하다는 문제점이 있다. 이에 본 논문에서는 농업의 빅데이터를 활용하는 방안으로 딥러닝 기반의 객체 탐지 모델을 활용한 과수 생육 단계 판별 시스템을 제안한다. 해당 시스템은 농업 현장에서 사용할 수 있도록 하이브리드 앱을 설계 및 구현하며 과수 생육단계 판별을 위한 객체 탐지 기능을 제공한다.

Detecting Adversarial Examples Using Edge-based Classification

  • Jaesung Shim;Kyuri Jo
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.67-76
    • /
    • 2023
  • 딥러닝 모델이 컴퓨터 비전 분야에서 혁신적인 성과를 이루어내고 있으나, 적대적 예제에 취약하다는 문제가 지속적으로 제기되고 있다. 적대적 예제는 이미지에 미세한 노이즈를 주입하여 오분류를 유도하는 공격 방법으로서, 현실 세계에서의 딥러닝 모델 적용에 심각한 위협이 될 수 있다. 본 논문에서는 객체의 엣지를 강조하여 학습된 분류 모델과 기본 분류 모델 간 예측 값의 차이를 이용하여 적대적 예제를 탐지하는 모델을 제안한다. 객체의 엣지를 추출하여 학습에 반영하는 과정만으로 분류 모델의 강건성을 높일 수 있으며, 모델 간 예측값의 차이를 통하여 적대적 예제를 탐지하기 때문에 경제적이면서 효율적인 탐지가 가능하다. 실험 결과, 적대적 예제(eps={0.02, 0.05, 0.1, 0.2, 0.3})에 대한 일반 모델의 분류 정확도는 {49.9%, 29.84%, 18.46%, 4.95%, 3.36%}를 보인 반면, Canny 엣지 모델은 {82.58%, 65.96%, 46.71%, 24.94%, 13.41%}의 정확도를 보였고 다른 엣지 모델들도 이와 비슷한 수준의 정확도를 보여, 엣지 모델이 적대적 예제에 더 강건함을 확인할 수 있었다. 또한 모델 간 예측값의 차이를 이용한 적대적 예제 탐지 결과, 각 epsilon별 적대적 예제에 대하여 {85.47%, 84.64%, 91.44%, 95.47%, 87.61%}의 탐지율을 확인할 수 있었다. 본 연구가 관련 연구 분야 및 의료, 자율주행, 보안, 국방 등의 응용 산업 분야에서 딥러닝 모델의 신뢰성 제고에 기여할 것으로 기대한다.

합성곱 신경망 기반의 딥러닝에 의한 수치표면모델의 객체분류 (Semantic Classification of DSM Using Convolutional Neural Network Based Deep Learning)

  • 이대건;조은지;이동천
    • 한국측량학회지
    • /
    • 제37권6호
    • /
    • pp.435-444
    • /
    • 2019
  • 최근 딥러닝(DL)은 여러 분야에서 급속도로 활용되고 있으며, 특히 영상으로부터 객체를 인식하여 분류하고 인식하기 위한 컴퓨터비전 분야에서 활발하게 연구가 진행되고 있다. 영상분야에서는 주로 합성곱 신경망(CNN)을 이용한 딥러닝 모델의 성능 향상에 주력하고 있다. 대부분의 합성곱 신경망은 영상을 학습시켜 영상분류 및 객체인식에 활용하고 있지만, 본 논문에서는 독일 사진측량, 원격탐사 및 공간정보학회(DGPF)가 구축하고 국제 사진측량 및 원격탐사학회(ISPRS)가 제공하는 데이터 셋 중에서 수치표면모델(DSM)과 이 데이터로부터 생성한 경사 및 주향 정보를 효율성과 성능이 우수하다고 평가받는 합성곱 신경망기반의 SegNet 모델에 적용하여 객체를 분류하고 분석하였다. 딥러닝은 고사양의 컴퓨터 시스템과 다량의 학습 데이터와 라벨 데이터가 필요하고, 다수의 시행착오에 의한 풍부한 경험이 요구된다. 또한 본 논문에서는 한정된 수량의 데이터로부터 효율적인 학습을 위한 데이터 생성 방법을 제시하고 수치표면모델을 분류하였다. 분석 결과 수치표면모델 데이터와 이로부터 도출한 부가적인 데이터를 딥러닝 모델에 적용해도 객체를 타당한 정확도로 분류할 수 있음을 확인하였다.

딥 러닝 기법을 활용한 이미지 내 한글 텍스트 인식에 관한 연구 (Research on Korea Text Recognition in Images Using Deep Learning)

  • 성상하;이강배;박성호
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.1-6
    • /
    • 2020
  • 본 연구에서는 컴퓨터 비전의 분야 중 하나인 문자 인식에 관한 연구를 수행했다. 대표적인 문자인식 기법 중 하나인 광학식 문자 판독 기법의 경우 일정한 규격과 서식에서 벗어나게 되면 인식률이 떨어진다는 한계점이 있다. 따라서 본 연구에서는 딥 러닝 기법을 적용해 이러한 문제점을 해결하고자 한다. 또한 기존의 문자 인식 연구의 경우 대부분 영어 및 숫자 인식에 국한되어 있다. 따라서 본 연구는 한글 인식을 위한 딥 러닝 기반 문자 인식 알고리즘을 제시한다. 알고리즘은 1-NED 평가 방법에서 0.841의 점수를 얻었으며, 이는 영어 인식 결과와 비슷한 수치이다. 본 연구를 통해 딥 러닝 기반 한글 인식 알고리즘의 성능을 확인할 수 있으며, 이를 통해 향후 연구방향에 대해 제시한다.

컴퓨팅 계산 오프로딩 위해 ROS를 사용한 딥러닝 기반의 자율주행카트 (Deep Learning Based Autonomous-Driving Cart Using ROS for Computation Offloading)

  • 한지수;박지윤;김채원;박상수;김현수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.100-103
    • /
    • 2021
  • IoT 와 인공지능을 접하려는 시도는 최근 들어서 많은 발전을 보이고 있다. 본 논문은 컴퓨팅 파워가 제한되는 작은 디바이스 IoT 의 한계를 극복하기 위하여 ROS 를 이용하여 복잡한 연산을 무선 통신으로 오프로딩하는 기법을 제안한다. 제안된 자율주행카드 시스템은 카트 이용 고객 개개인을 검출하고 추적하되 컴퓨터 비전 알고리즘과 LiDAR 센서를 이용하며, 음성인식 알고리즘을 적용하여 기계와 인간의 감성공학적 소통이 가능한 융합형 자율주행카트를 구현한다.