• 제목/요약/키워드: 컴퓨터 비전 기술

검색결과 409건 처리시간 0.027초

동영상 분할 및 분석 기술을 통한 딥 러닝 기반의 동영상 이해 (Video Understanding through Video Analysis based on Deep Learning)

  • 김규경;임희석
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.65-68
    • /
    • 2017
  • 동영상 콘텐츠는 빠른 인터넷과 동영상을 수요, 공급 할 수 있는 기기가 늘어남에 따라 폭발적으로 성장하고 있다. 이에 맞춰 동영상 콘텐츠에 대한 연구의 중요성은 점점 증가하고 있으며 이러한 연구들을 필요로 하는 소비자들 또한 크게 늘어나고 있다. 그러나 동영상 콘텐츠의 폭발적인 성장과 다르게 동영상의 이해에 관한 연구는 아직까지도 큰 성과 없이 성장을 제대로 하지 못하고 있다. 이 논문에서는 이러한 동영상에 대한 고차원적인 수준의 분석 및 분할 기술을 통해 동영상의 이해를 가능케 하는 모델의 설계와 원리를 소개한다. 또한 이 기술을 활용하여 동영상 콘텐츠의 성장을 활용하는 방법 및 그에 대한 비전을 소개하는 논문이다.

  • PDF

대화형 하이퍼 비디오 저작을 위한 객체 기반 추적 방법 (An Object-based Tracking Scheme for Interactive HyperVideo)

  • 황본우;손형진;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.427-429
    • /
    • 2001
  • 컴퓨터 비전 기술을 이용한 효과적인 객체 추적 기술은 인공 시각, 컴퓨터와 인간의 상호작용(HCI), 영상 기반 제어 장치, 감시 시스템 등 다양한 분야의 응용에 있어 중요한 연구 과제이다. 특히 최근 들어 초고속 통신망의 보급으로 인해 인터넷 방송과 같은 실시간 동영상 전송 기술이 가능해 짐에 따라 단순한 텍스트와 정지영상을 제공하는 하이퍼텍스트 환경에서 사운드를 포함하는 동영상 데이터를 제공하는 하이퍼미디어 환경으로 변하고 있다. 이러한 하이퍼미디어 환경에서의 객체 추적은 객체 단위의 링크가 가능한 하이퍼비디오 구현에 있어서 필수적이다. 따라서 본 논문에서는 다양한 동영상 데이터 상의 객체를 효과적으로 추적하는 알고리즘을 제안하고자 한다.

  • PDF

타이포그래피 기술을 접목시킨 자막 가독성 개선 연구 - 모바일 환경에서 Noto Sans Korean 폰트를 중심으로 - (A Research on Improving Readability of subtitles combined with typography in Hangeul - Focusing on Noto Sans Korean fonts in mobile environment)

  • 박재홍
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.47-48
    • /
    • 2021
  • 본 연구는 타이포그래피 기술을 접목한 동영상과 기본 자동 자막을 사용한 동영상의 한글 자막 가독성을 비교·분석하여 모바일 동영상 시청 시 한글 자막의 가독성 개선을 위한 기초자료를 제공하는 데 목적이 있다. 연구의 목적을 위해 기본으로 설정되는 자동 자막을 사용한 동영상과 타이포그래피 기술을 적용·개선한 한글 폰트를 자막에 적용한 동영상을 비교하는 설문을 실시하였다. 시각디자인 전공자(73명)과 비전공자(52명)간의 자막 가독성 설문조사의 결과를 비교·분석하였다. 또한, 모바일을 통해 외국어 동영상 시청 시 자막 설정 기능에서 중요하게 여겨지는 요인과 현재 자막 설정 기능 중 불편하게 여기는 요인을 분석하였다. 수집된 설문의 자료는 Windows SPSS 26.0을 사용하여 분석하였다. 자막 설정 기능에서 중요하게 여겨지는 요인과 현재 자막 설정 기능의 불편 사항 등에 대한 인식의 차이를 살펴보기 위해 빈도분석, 𝑥2 검정, t 검정, 일원변량분석(one-way ANOVA) 등을 실시하였다.

  • PDF

의미론적 영상 분할의 정확도 향상을 위한 에지 정보 기반 후처리 방법 (Post-processing Algorithm Based on Edge Information to Improve the Accuracy of Semantic Image Segmentation)

  • 김정환;김선혁;김주희;최형일
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.23-32
    • /
    • 2021
  • 컴퓨터 비전 분야의 의미론적 영상 분할(Semantic Image Segmentation) 기술은 이미지를 픽셀 단위로 분할 하여 클래스를 나누는 기술이다. 이 기술도 기계 학습을 이용한 방법으로 성능이 빠르게 향상되는 중이며, 픽셀 단위의 정보를 활용할 수 있는 높은 활용성이 주목받는 기술이다. 그러나 이 기술은 초기부터 최근까지도 계속 '세밀하지 못한 분할'에 대한 문제가 제기되어 왔다. 이 문제는 레이블 맵의 크기를 계속 늘리면서 발생한 문제이기 때문에, 자세한 에지 정보가 있는 원본 영상의 에지 맵을 이용해 레이블 맵을 수정하여 개선할 수 있을 것으로 예상할 수 있었다. 따라서 본 논문은 기존 방법대로 학습 기반의 의미론적 영상 분할을 유지하되, 그 결과인 레이블 맵을 원본 영상의 에지 맵 기반으로 수정하는 후처리 알고리즘을 제안한다. 기존의 방법에 알고리즘의 적용 한 뒤 전후의 정확도를 비교했을 때 평균적으로 약 1.74% 픽셀 정확도와 1.35%의 IoU(Intersection of Union) 정확도가 향상되었으며, 결과를 분석했을 때 성공적으로 본래 목표한 세밀한 분할 기능을 개선했음을 보였다.

차량 내 영상 센서 기반 고속도로 돌발상황 검지 정밀도 평가 (Precision Evaluation of Expressway Incident Detection Based on Dash Cam)

  • 남상기;정연식
    • 한국ITS학회 논문지
    • /
    • 제22권6호
    • /
    • pp.114-123
    • /
    • 2023
  • 컴퓨터 비전(Computer Vision: CV) 기술 발전으로 폐쇄회로 TV(Closed-Circuit television: CCTV)와 같은 영상 센서로 돌발상황을 검지하고 있다. 그러나 현재 이러한 기술은 대부분 고정식 영상 센서를 기반으로 한다. 따라서 고정식 장비의 영상 범위가 닿지 않는 음영지역의 돌발상황 검지에는 한계가 존재해왔다. 최근 엣지 컴퓨팅(Edge-computing) 기술의 발전으로 이동식 영상정보의 실시간 분석이 가능해졌다. 본 연구는 차량 내 설치된 이동식 영상 센서(dashboard camera 혹은 dash cam)에 컴퓨터 비전 기술을 도입하여 고속도로에서 실시간으로 돌발상황 검지 가능성에 대해 평가하는 것이 목적이다. 이를 위해 한국도로공사 순찰차량에 장착된 dash cam에서 수집된 4,388건의 스틸 프레임 데이터 기반으로 학습데이터를 구축하였으며, YOLO(You Only Look Once) 알고리즘을 활용하여 분석하였다. 분석 결과 객체 모두 예측 정밀도가 70% 이상으로 나타났고, 교통사고는 약 85%의 정밀도를 보였다. 또한 mAP(mean Average Precision)의 경우 0.769로 나타났고, 객체별 AP(Average Precision)를 보면 교통사고가 0.904로 가장 높게 나타났고, 낙하물이 0.629로 가장 낮게 나타났다.

다중 기술자를 이용한 잘못된 특징점 정합 제거 (Filtering Feature Mismatches using Multiple Descriptors)

  • 김재영;전희성
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.23-30
    • /
    • 2014
  • 이미지 기술자(descriptor)를 이용한 정합은 최근까지 컴퓨터 비전과 패턴인식 분야에서 사용되고 있는 강력한 정합 방법이다. 그러나 3차원 시점이 변화되거나 밝기가 변화된 이미지, 반복된 패턴이 포함된 이미지 등에서 잘못된 정합들이 발생한다. 본 논문에서는 반복된 패턴이 포함되어 있는 이미지에서 잘못된 정합들이 많이 발생하는 문제점에 대해 기술하고 이를 분석하여 잘못된 정합들을 제거할 수 있는 방법을 제안한다. MDMF(Multiple Descriptors-based Mismatch Filtering) 방법은 각 특징점에 대해 인접한 여러 개의 특징점들의 기술자들을 사용하여 다중 기술자를 생성한 후 이를 활용하여 잘못된 정합들을 제거한다. 실험에서는 크기 변환, 회전 변환, 어파인 변환에 대해 기존 SIFT와 ASIFT의 정합율을 MDMF를 이용해 제거한 정합율과 비교하여 MDMF가 잘못된 정합을 성공적으로 제거할 수 있음을 보였다.

객체 바운딩 박스와 원본 이미지 결합을 이용한 합성 데이터 생성 기법 (Synthetic data generation technique using object bounding box and original image combination)

  • 이주혁;김미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.476-478
    • /
    • 2023
  • 딥러닝은 컴퓨터 비전의 상당한 발전을 기여했지만, 딥러닝 모델을 학습하려면 대규모 데이터 세트가 필요하다. 이를 해결하기 위해 데이터 증강 기술이 주목받고 있다. 본 논문에서는 객체 추출 바운딩 박스와 원본 이미지의 바운딩 박스를 결합하여 합성 데이터 생성기법을 제안한다. 원본 이미지와 동일한 범주의 데이터셋에서 참조 이미지의 객체를 추출한 다음 생성 모델을 사용하여 참조 이미지와 원본 이미지의 특징을 통합하여 새로운 합성 이미지를 만든다. 실험을 통해, 생성 기법을 통한 딥러닝 모델의 성능향상을 보여준다.

컴퓨터비전을 활용한 건설현장 중장비의 단독작업 자동 인식 모델 개발 (Solitary Work Detection of Heavy Equipment Using Computer Vision)

  • 정인수;김진우;지석호;노명일
    • 대한토목학회논문집
    • /
    • 제41권4호
    • /
    • pp.441-447
    • /
    • 2021
  • 건설현장에서는 수많은 중장비와 작업자가 다양한 작업을 동시다발적으로 수행하기 때문에 복잡하고 위험한 상황이 자주 발생한다. 복잡한 현장에서 중장비가 단독으로 작업할 경우 운전자의 시야제한, 판단오류 등으로 인해 안전사고가 발생할 수 있으며, 이에 따라 중장비는 신호수와의 상호작용을 통해 주변 상황에 대한 정보를 수집하면서 작업을 수행해야 한다. 중장비를 자동으로 모니터링하고 위험상황을 탐지하기 위해 많은 컴퓨터비전 기술들이 개발되었지만, 기존의 방법들은 중장비 단독작업 인식에 필요한 중장비와 신호수 간 상호작용을 고려하지 않았다는 한계가 있다. 이러한 한계를 보완하기 위해 본 연구는 중장비-신호수 간의 상호작용을 고려한 컴퓨터비전 기반 중장비의 단독작업 자동 인식 모델을 제안함을 목표로 한다. 개발된 모델을 검증하기 위해 실제 건설현장으로부터 영상 데이터를 수집하여 실험을 수행하였다. 그 결과, 학습된 모델은 중장비와 사람을 83.4 %의 정확도로 인식하였고, 일반 작업자와 신호수를 84.2 %의 정확도로 분류하였으며, 중장비-신호수 간 상호작용 또한 95.1 %의 높은 정확도로 분석하였다. 본 연구결과는 건설현장에서 위험한 상황을 초래할 수 있는 중장비의 단독작업을 사전에 탐지하여 안전사고를 예방할 수 있다.

딥러닝 기반 교재 문항 검출 실험 연구 (A Study on the Deep Learning-Based Textbook Questionnaires Detection Experiment)

  • 김태종;한태인;박지수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.513-520
    • /
    • 2021
  • 최근 학습, 교육 및 훈련으로 일컫는 이러닝 분야에서 교육(education)과 기술(technology)이 접목된 에듀테크(edutech)에 대한 연구가 활발하게 진행되고 있다. 그러나 디지털 기기에서 자동으로 수집이 가능한 학습활동 데이터를 기반으로 학습자 개개인에게 맞춤형 학습을 제공하는 연구는 많으나, 오프라인 학습에서 추출하고 활용해야 할 데이터의 수집 연구는 적다. 이에 본 연구는 데이터 수집 연구를 위해 인공지능 컴퓨터 비전 기술을 이용하여 교재 또는 문제지의 문항 검출 방법을 연구한다. 이는 교재 또는 문제지에 대한 디지털로의 변환작업 없이도 오프라인 학습활동 데이터를 수집·저장·분석하여 지능화 교육 서비스와 연계를 통해 오프라인 학습에서도 학습자의 개인 맞춤형 학습 서비스 제공한다.

브레이크패드 검사 시스템 구축에 관한 연구 (A study on inspection system for brake pad)

  • 김태은
    • 한국전자통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.403-408
    • /
    • 2013
  • 본 연구는 자동차 브레이크 패드 생산 공정에서 컨베어벨트 실려가는 차종별 패드의 유형을 자동 판별하고 표면의 균열을 검사하는 시스템을 개발한다. 브레이크 패드는 여러 혼합제로 고열, 고압 성형하여 만든다. 패드생성과정에서 패드 표면의 균열 및 손상이 발생한다. 본 연구에서는 불량품을 검출하는데 적합한 시스템 구축하고 응용소프프웨어 개발을 한다. 패드 표면의 균열이나 손상 부위는 인공조명을 비출 때 그림자를 생성하게 되며 이를 컴퓨터 비전 기술을 활용하여 검출한다.