• 제목/요약/키워드: 컴퓨터 비전 기술

검색결과 404건 처리시간 0.024초

실제 물체를 이용한 모바일 비전 기술 기반의 실감형 갤러그의 설계 및 구현 (Design and Implementation of Mobile Vision-based Augmented Galaga using Real Objects)

  • 박안진;양종열;정기철
    • 한국게임학회 논문지
    • /
    • 제8권2호
    • /
    • pp.85-96
    • /
    • 2008
  • 최근 실감형 게임 (augmented game) 이라는 새로운 게임 장르에 대한 연구가 다양하게 시도되고 있으며 실감형 게임이란 사용자가 실제 환경을 돌아다니며 컴퓨터에 의해 만들어진 가상의 적 또는 물체를 이용하여 진행하는 게임이다. 실감형 게임은 게이머에게 새로운 즐거움을 제공할 수 있지만 비싼 가격의 'backpack' 시스템을 이용하기 때문에 일반 게이머에게 저렴한 가격에 게임을 제공하치가 어렵다. 이를 위해 모바일 기기의 카메라를 이용한 실감형 게임들이 다양하게 제안되고 있지만, 가상의 적을 실제 공간에 접목하기 위해 대부분 색상 마커나 패턴 마커를 이용하기 때문에 마커가 미리 설치 되어 있는 장소에서만 게임이 가능한 단점을 가지고 있다. 본 논문에서는 흥미도가 높고 가격 부담없는 게임을 제공하기 위해 기존의 갤러그를 실감형 게임에 접목한 모바일 기기에서의 실감형 갤러그를 소개한다. 실감형 갤러그는 모바일 화면상에서 실제 환경에 가상의 적을 접목하기 위해 실제 환경에 있는 물체를 그대로 이용하여, 크기분변의 특징변환(SIFT)와 유클리디언 거리(Euclidean distance)를 이용하여 물체를 인식한다. 가상의 적은 이식된 특정 물체의 주위에 임의로 출현하며, 게임흥미도를 높이기 위해 여러 개의 특정 물체를 이용하고, 게이머는 가상의 적이 출현하는 특정 물체에 모바일 기기를 직접 움직여 공격한다. 결론적으로 실감형 갤러그는 모바일 카메라에 의해 입력받은 실제 환경 과 모바일 기기에 의해 자동으로 생성원 가상의 적 사이의 상호작용 (interaction) 을 제공하는 새로운 게임 패러다임(paradigm) 을 통하여 게이머에게 가격 부담없는 새로운 즐거움을 제공할 것이다.

  • PDF

두 영상검색 시스템의 협력적 이용을 통한 재순위화 (Re-ranking the Results from Two Image Retrieval System in Cooperative Manner)

  • 황중원;김현우;김준모
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.7-15
    • /
    • 2014
  • 영상검색은 컴퓨터 비전과 데이터 마이닝 분야의 주요한 주제 중 하나이다. 현재 상용화된 영상 검색 시스템이 놀라운 성능을 보여주고 있음에도 불구하고, 폭발적으로 증가하는 웹상의 영상정보를 효율적으로 검색하기 위하여, 영상 검색 기술의 성능향상이 꾸준히 요구되고 있다. 재순위화는, 이런 요구를 만족시키기 위한 방법 중 하나로서, 영상 검색 시스템이 도출한 초기 결과를, 독자적인 알고리즘을 통해 연관도를 한 번 더 계산하고, 그에 따라 검색 결과의 성능을 향상시키는 방법이다. 지금까지 제안된 많은 재순위화 알고리즘이, 영상 검색 시스템이 영상의 시각적 정보를 사용하지 않는다는 가정하에 개발되어 왔지만, 현재 Google 과 Baidu 등 많은 상업적 영상 검색 시스템이 영상의 시각적 패턴에 대한 정보를 사용하기 시작함에 따라 이러한 가정이 어긋나고 있다. 또한, 영상 검색 시스템들이 독자적인 환경에서 개발되었기 때문에, 다수의 영상 검색 시스템의 협력으로 성능을 향상시킬 수 있을 것이라 예측되는 상황에도 불구하고, 이에 대한 연구가 부족했다. 본 논문에서는 이 두 가지 문제를 해결하기 위하여, 두 영상 검색 시스템이 사용하는 시각적 특징을 바탕으로, 두 시스템의 상보적인 정보를 이용하는 방법에 대하여 제안한다. 성능에 대한 평가는 가상 모형에서 이루어졌으며, 제안된 방법을 통하여 성능향상이 가능하다는 것을 보여준다.

뉴럴네트워크를 이용한 축구경기 공격패턴 자동분류에 관한 연구 (Automatic Classification Technique of Offence Patterns using Neural Networks in Soccer Game)

  • 김현숙;윤호섭;황종선;양영규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.727-730
    • /
    • 2001
  • 멀티미디어 환경의 급속한 발전에 의해 영상처리 기술은 인간의 인체와 관련하여 얼굴인식, 제스처 인식에 관한 응용과 더불어 스포츠 관련분야로 깊숙히 정착하고 있다. 그러나 입력영상으로부터 움직이고 있는 선수들의 동작을 추출 및 추적하는 일은 컴퓨터비전 연구의 난 문제 중의 하나로 알려져 있다. 이러한 축구경기의 TV 중계에 있어서 하이라이트 장면의 자동추출(자동색인)은 그 경기의 가장 집약적인 표현이며, 축구경기 전체를 한 눈에 파악할 수 있도록 해주는 요약(summary)이자 intensive actions이고 경기의 진수이다. 따라서 축구경기와 같이 비교적 기 시간(대체로 1시간 30분) 동안 다수의 선수(양 팀 합해서 22명)들이 서로 복잡하게 뒤얽히면서 진행하는 경기의 하이라이트 장면을 효과적으로 포착하여 표현해 줄 수 있다면 TV를 통해서 경기를 관람하는 시청자들에게는 경기의 진행상황을 한 눈에 효과적으로 파악할 수 있게 해주어 흥미진진한 경기관람을 할 수 있게 해주고, 경기의 진행자들(감독, 코치, 선수 등)에게는 고차원적이고 과학적인 정보를 효과적으로 제공함으로써 한층 진보된 경기기법을 개발하고 과학적인 경기전략을 세울 수 있게 해준다. 본 논문은 이상과 같이 팀 스포츠(Team Spots)의 일종인 축구경기 하이라이트 장면의 자동색인을 위해 뉴럴네트워크 기법을 이용하여 그룹 포메이션(Group Formation) 중의 공격패턴 자동분류 기법을 개발하고 이를 검증하였다. 본 연구에서는 축구경기장 내의 빈번하게 변화하는 장면들을 자동으로 분할하여 대표 프레임을 선정하고, 대표 프레임 상에서 선수들의 위치정보와 공의 위치정보 등을 기초로 하여 경기 중에 이루어지는 선수들의 그룹 포메이션을 추적하여 그룹행동(group behavior)을 분석하고, 뉴럴네트워크의 BP(Back-Propagation) 알고리즘을 사용하여 축구경기 공격패턴을 자동으로 인식 및 분류함으로써 축구경기 하이라이트 장면의 자동추출을 위한 기반을 마련하였다. 본 연구의 실험에는 '98 프랑스 월드컵 축구경기의 다양한 공격패턴에 대한 비디오 영상에서 각각 좌측공격 60개, 우측공격 74개, 중앙공격 72개, 코너킥 39개, 프리킥 52개의 총 297개의 데이터를 추출하여 사용하였다. 실험과는 좌측공격 91.7%, 우측공격 100%, 중앙공격 87.5%, 코너킥 97.4%, 프리킥 75%로서 매우 양호한 인식율을 보였다.

  • PDF

플랫폼 분류 기준 고찰 : 감각의 입·출력 (Classification standard of Communication Tool)

  • 김효은
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.189-190
    • /
    • 2018
  • 정보콘텐츠는 문자, 이미지, 음성에 플로우로 나타나는 인간 체험 방식 및 컴퓨터와 인간 사이의 언어까지 들여다 볼 수 있는 개념과 구조를 요구한다. 빌렘 플루서의 독창적인 학문인 코무니콜로기는 인간 인식의 경계를 재고하게 하면서, 경계를 재구성하는 지평을 열어 준다. 이를 통해 인간 소통의 근본 요소인 감각의 입출력을 도출할 수 있었으며, 이는 소통 도구를 분류하고 재구성하는 기준이 된다. 인간을 기준으로 외부 자극을 받아들이는 경계는 감각으로 볼 수 있으며, 소통이 이루어지는 방향은 입출력으로 표현할 수 있다. 콘텐츠를 향유한다는 것은 인간 소통의 경계인 감각이 방향을 통해 작동하는 것으로 볼 수 있다. 감각의 입출력을 소통 도구에 적용해 보면, 책은 시각의 입력으로, 텔레비전은 시청각의 입력으로, 데스크탑은 시청각의 입력과 촉각(손가락)의 출력으로, 모바일은 신청각의 입력과 촉각(손가락, 다리)의 출력으로 볼 수 있다. 기존의 다양한 플랫폼과 콘텐츠, 아직 드러나지 않은 플랫폼도 일관된 기준을 통해 좌표를 정해 줄 수 있다. 이를 통해 공학에서 접근할 수 없는 콘텐츠 기획과 전망이 가능하다.

  • PDF

Landsat 8 기반 SPARCS 데이터셋을 이용한 U-Net 구름탐지 (U-Net Cloud Detection for the SPARCS Cloud Dataset from Landsat 8 Images)

  • 강종구;김근아;정예민;김서연;윤유정;조수빈;이양원
    • 대한원격탐사학회지
    • /
    • 제37권5_1호
    • /
    • pp.1149-1161
    • /
    • 2021
  • 컴퓨터 비전 기술이 위성영상에 적용되면서, 최근 들어 딥러닝 영상인식을 이용한 구름 탐지가 관심을 끌고 있다. 본연구에서는 SPARCS (Spatial Procedures for Automated Removal of Cloud and Shadow) Cloud Dataset과 영상자료증대 기법을 활용하여 U-Net 구름탐지 모델링을 수행하고, 10폴드 교차검증을 통해 객관적인 정확도 평가를 수행하였다. 512×512 화소로 구성된 1800장의 학습자료에 대한 암맹평가 결과, Accuracy 0.821, Precision 0.847, Recall 0.821, F1-score 0.831, IoU (Intersection over Union) 0.723의 비교적 높은 정확도를 나타냈다. 그러나 구름그림자 중 14.5%, 구름 중 19.7% 정도가 땅으로 잘못 예측되기도 했는데, 이는 학습자료의 양과 질을 보다 더 향상시킴으로써 개선 가능할 것으로 보인다. 또한 최근 각광받고 있는 DeepLab V3+ 모델이나 NAS(Neural Architecture Search) 최적화 기법을 통해 차세대중형위성 1, 2, 4호 등의 구름탐지에 활용 가능할 것으로 기대한다.

k-Nearest Neighbor와 Convolutional Neural Network에 의한 제재목 표면 옹이 종류의 화상 분류 (Visual Classification of Wood Knots Using k-Nearest Neighbor and Convolutional Neural Network)

  • Kim, Hyunbin;Kim, Mingyu;Park, Yonggun;Yang, Sang-Yun;Chung, Hyunwoo;Kwon, Ohkyung;Yeo, Hwanmyeong
    • Journal of the Korean Wood Science and Technology
    • /
    • 제47권2호
    • /
    • pp.229-238
    • /
    • 2019
  • 목재의 결점은 생장과정에서 또는 가공 중에 다양한 형태로 발생한다. 따라서 목재를 이용하기 위해서는 목재의 결점을 정확하게 분류하여 용도에 맞는 목재 품질을 객관적으로 평가할 필요가 있다. 하지만 사람에 의한 등급구분과 수종구분은 주관적 판단에 의해 차이가 발생할 수 있기 때문에 목재 품질의 객관적 평가 및 목재 생산의 고속화를 위해서는 컴퓨터 비전을 활용한 화상분석 자동화가 필요하다. 본 연구에서는 SIFT+k-NN 모델과 CNN 모델을 통해 옹이의 종류를 자동으로 구분하는 모델을 구현하고 그 정확성을 분석해보고자 하였다. 이를 위하여 다섯 가지 국산 침엽수종으로부터 다양한 형태의 옹이 이미지 1,172개를 획득하여 학습 및 검증에 사용하였다. SIFT+k-NN 모델의 경우, SIFT 기술을 이용하여 옹이 이미지에서 특성을 추출한 뒤, k-NN을 이용하여 분류를 진행하였으며, 최대 60.53%의 정확도로 분류가 가능하였다. 이 때 k-index는 17이었다. CNN 모델의 경우, 8층의 convolution layer와 3층의 hidden layer로 구성되어있는 모델을 사용하였으며, 정확도의 최대값은 1205 epoch에서 88.09%로 나타나 SIFT+k-NN 모델보다 높은 결과를 보였다. 또한 옹이의 종류별 이미지 개수 차이가 큰 경우, SIFT+k-NN 모델은 비율이 높은 옹이 종류로 편향되어 학습되는 결과를 보였지만, CNN 모델은 이미지 개수의 차이에도 편향이 심하지 않아 옹이 분류에 있어 더 좋은 성능을 보였다. 본 연구 결과를 통해 CNN 모델을 이용한 목재 옹이의 분류는 실용가능성에 있어 충분한 정확도를 보이는 것으로 판단된다.

인공지능 스토리텔링(AI+ST) 학습 효과에 관한 사례연구 (A Case Study on the Effect of the Artificial Intelligence Storytelling(AI+ST) Learning Method)

  • 여현덕;강혜경
    • 정보교육학회논문지
    • /
    • 제24권5호
    • /
    • pp.495-509
    • /
    • 2020
  • 본 연구는 인공지능(이하 AI)이 모든 영역에 전일적으로 확산되는 시점을 맞아 비전공자들도 AI를 효과적으로 학습하는 방안을 탐색하기 위한 하나의 시론적 연구이다. AI 교육을 수학, 통계, 컴퓨터공학 전공 학생들뿐만 아니라 인문·사회과학 등 다른 전공자들도 쉽게 접근할 수 있도록 하기 위한 학습법을 탐색하고자 하였다. 마침 '설명 가능한 AI(XAI: eXplainable AI)'의 필요성과 MIT AI 연구소의 Patrick Winston의 '지각 있는 기계(AI)를 위한 스토리텔링의 중요성[33]'이 두드러진 상황에서 AI 스토리텔링 학습모델 연구의 의의를 찾을 수 있겠다. 이를 위해 본 연구는 우선 대구 소재 A 대학교의 학생들을 대상으로 그 가능성을 테스트하였다. 먼저 AI 스토리텔링(AI+ST) 학습법[30]의 교육목표, AI 교육내용의 체계와 학습방법론, 새로운 AI 도구의 소개 및 활용에 대해 살펴보고, 1) AI+ST 학습법이 알고리즘 중심의 학습법을 보완할 수 있는지, 2) AI+ST 학습법이 학생들에게도 효과가 있는지, 그리하여 AI 이해력, 흥미도, 응용력 배양에 도움이 되었는지에 관한 연구 질문을 중심으로 학습자들의 결과물을 비교 분석하였다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.

반려동물용 자동 사료급식기의 비용효율적 사료 중량 예측을 위한 딥러닝 방법 (A Deep Learning Method for Cost-Effective Feed Weight Prediction of Automatic Feeder for Companion Animals)

  • 김회정;전예진;이승현;권오병
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.263-278
    • /
    • 2022
  • 최근 IoT 기술의 발달로 외출 중에도 반려동물에 급여하도록 자동 사료급식기가 유통되고 있다. 그러나 자동급식에서 중요한 중량을 측정하는 저울 방식은 쉽게 고장이 나고, 3D카메라 방식은 비용이 든다는 단점이 있으며, 2D카메라 방식은 중량 측정의 정확도가 떨어진다. 특히 사료가 복합된 경우 중량 측정 문제는 더욱 어려워질 수 있다. 따라서 본 연구의 목적은 2D카메라를 사용하면서도 중량을 정확하게 추정할 수 있는 딥러닝 접근법을 제안하는 것이다. 이를 위해 다양한 합성곱 신경망을 이용하였으며, 그중 ResNet101 기반 모델이 3.06 gram의 평균 절대 오차와 3.40%의 평균 절대비 오차를 기록하며 가장 우수한 성능을 보였다. 본 연구의 결과로 사료와 같이 규격화된 물체의 중량을 확보가 용이한 2D 이미지를 통해서만 예측할 필요가 있을 경우 유용한 정보로 활용될 수 있다.

사례분석을 통한 객체검출 기술의 건설현장 적용 방안에 관한 연구 (A Study on the Application of Object Detection Method in Construction Site through Real Case Analysis)

  • 이기석;강성원;신윤석
    • 한국재난정보학회 논문집
    • /
    • 제18권2호
    • /
    • pp.269-279
    • /
    • 2022
  • 연구목적: 본 연구의 목적은 건설현장의 재해 예방을 위해 딥러닝기반의 개인보호구 검출 모델을 개발하고, 실제 건설현장에 적용하여 분석하는 것이다. 연구방법: 본 연구의 수행 방법은 실제 환경의 데이터를 구축하고, 개발된 개인보호구 검출 모델을 적용하였다. 개인보호구 검출 모델은 크게 근로자 검출 및 개인보호구 착용 분류 모델로 구성되어 있다. 근로자 검출 모델은 딥러닝 기반의 알고리즘을 실제 현장에서 획득한 데이터셋을 구축하여 학습 및 근로자를 검출하였고, 개인보호구 착용 분류 모델은 앞단에서 추출된 근로자 검출영역에서 학습된 개인보호구 검출 알고리즘을 적용하였다. 구축된 모델의 검증을 위해 건설현장 3곳에서 획득된 데이터를 통해 실험결과를 도출하였다. 연구결과: 데이터베이스 12,000장을 구축하여 정상검출 9,460장(78.8%), 오검출 1,468(12.2%), 미검출 1,072장(8.9%)으로 나타났으며 주요 원인은 영상에서의 객체 크기, 객체간 중첩(Occulusion), 객체 잘림, 그림자에 의한 오검출로 분류되었다. 결론: 개인보호구 검출모델은 현장 상황마다 다른 검출률을 확인할 수 있었고, 본 연구의 결과가 차후 현장적용을 위한 연구에 활용될 수 있을 것으로 여겨진다.