• 제목/요약/키워드: 컴퓨터 비전 기술

검색결과 407건 처리시간 0.028초

전역 실루엣 및 지역 광류 특징을 이용한 사람의 동작 인식 (Human Action Recognition using Global Silhouette and Local Optical Flow Features)

  • 김현철;나문수;김희권;남승우;이재호;김회율
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.154-157
    • /
    • 2011
  • 인간의 동작 인식은 가상 현실 시스템 및 게임 등에 적용할 수 있는 컴퓨터 비전 분야의 요소 기술 중 하나로써, 최근까지 그 연구과 활발히 진행되고 있다. 본 논문에서는 빠르고 정확한 동작 인식을 위해, 실루엣과 모션 특징이 결합된 방법을 제안한다. 제안하는 방법은 전역 특징을 이용한 후보 동작 선정 및 지역 특징을 이용한 검증 2 단계로 구성된다. 전역 특징은 Motion History Image의 Hu 모멘트를 이용해 계산되며, 후보 동작의 선정은 이들의 통계치를 이용해 결정한다. 한정된 후보 동작들 중 입력 동작을 정확히 인식하기 위해, 공간 및 방향성 비닝 기법으로 추출된 광류와 실루엣 특징을 지역 특징으로 이용한다. 최종 인식 결과는 Hu 모멘트 통계치와의 유사도 및 지역 특징의 학습을 통해 생성된 Support Vector Machine의 결과를 고려하여 결정된다. 제안하는 방법의 성능을 평가하기 위해, 실세계에서 사용 빈도가 높으며 동작의 변화가 큰 13 개의 제스처를 선정하여 데이터 셋을 구성하였다. 실험 결과 제안하는 방법의 연산 시간은 50 ms, 인식 정확도는 95%임을 확인하였다.

  • PDF

MRF 모델과 분할 영상을 이용한 영상정합에 관한 연구 (A Study on the Stereo Image Matching using MRF model and segmented image)

  • 변영기;한동엽;김용일
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.511-516
    • /
    • 2004
  • 수치표고모델, 정사영상과 같은 공간영상정보를 구축하기 위해서는 입체영상을 이동한 영상정합(image matching)의 과정이 필수적이며, 단영상 또는 스테레오 영상을 이용하여 대상물의 3차원 정보를 재구성하고 복원하는 기술은 사진측량 및 컴퓨터 비전 분야의 주요 연구 중의 하나이다. 본 연구에서는 화소값의 유사성과 상호관계성을 고려하는 MRF 모델을 이용하여 영상정합을 수행하였다. MRF 모델은 공간분석이나 물리적 현상의 전후관계(contextural dependencies)의 분석을 위한 확률이론의 한 분야로 다양한 공간정보를 통합할 수 있는 방법을 제공한다. 본 연구에서는 기준영상의 화소에 시차를 할당하는 접근 방법으로 확률모델의 일종인 마르코프 랜덤필드(MRF)모델에 기반한 영상정합기법을 제안하였고, 공간내 화소의 상호관계를 고려해주므로 대상물의 경계부분에서의 매칭 정확도를 향상시켰다. 영상정합문제에서의 MRF 기본가정은 영상 내 특정화소의 시차는 그 주위화소의 시차에 의한 부분정보에 따라 결정이 가능하다는 것이다. 깁스분포(gibbs distribution)를 사용하여 사후(posteriori) 확률값을 유도해내고, 이를 최대사후확률(MAP: Maximum a Posteriori)추정법을 이용하여 에너지함수를 생성하였다. 생성된 에너지함수의 최적화(Optimization)를 위하여 본 연구에서는 전역최적화기법인 multiway cut 기법을 사용하여 영상정합에 있어 에너지함수를 최소로 하는 이미지화소에 대한 시차레이블을 구하여 영상정합을 수행하였다.

  • PDF

씨앗 용어 피드백 관련 검색에 근거한 온톨로지 구축 (An Ontology Construction using Seed Term Feedback Relevance)

  • 이인근;황도삼;권순학
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.81-88
    • /
    • 2006
  • 컴퓨터를 활용한 지식과 정보의 고도 처리를 위해 온톨로지를 구축하고 활용하려는 요구가 강해지고 있다. 이런 요구에 부흥하여 온톨로지의 구축 방법에 대한 많은 연구가 이루어지고 있다 그러나 현재까지의 온톨로지 구축 이론과 온톨로지 개발 도구가 실제 구현 목적과 사례에 따라 제한적인 부분에서 개발되어 사용되고 있다. 그러므로 구축하고자 하는 분야의 온톨로지에 맞는 적절한 구축 프로세스와 도구가 필요하다. 분야 온톨로지(domain ontology)를 구축함에 있어 특정 분야의 전문가 또는 비전문가가 언어자원으로부터 지식을 개념화(conceptualization), 형식화(formalization)하여 온톨로지를 구축할 수 있도록 분야 관련 언어자원에 근거하여 온톨로지를 구축할 수 있는 온톨로지 구축 프로세스(OntoProcessl))를 제안한다. 그리고, 다수의 온톨로지 구축자가 동시에 같은 분야의 온톨로지를 구축할 경우, 개념화 과정에서 서로 다른 구축자가 동일한 개념을 중복 정의하거나, 형식화 과정에서 형식언어 이해 부족으로 인한 구축 능률 저하 문제가 발생할 수 있다. 이를 위해 메타 온톨로지(meta ontology)를 이용하여 다중 온톨로지를 구축할 때 발생하는 문제를 해결하는 다중 온톨로지 구축 프로세스를 제안한다. 현재 이 프로세스에 근거하여 온톨로지 구축 시스템(OntoCS2))을 개발하였고 국가 IT 온톨로지 인프라 기술 개발 프로젝트에서 IT분야 온톨로지의 개발에 활용되고 있다.

  • PDF

2D 도면 인식을 통한 부재 물량 산출 자동화 기술 개발 (Development of Automation Technology for Structural Members Quantity Calculation through 2D Drawing Recognition)

  • 선우효빈;최고훈;허석재
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2022년도 봄 학술논문 발표대회
    • /
    • pp.227-228
    • /
    • 2022
  • In order to achieve the goal of cost management, which is one of the three major management goals of building production, this paper introduces an approximate cost estimating automation technology in the design stage as the importance of predicting construction costs increases. BIM is used for accurate estimating, and the quantity of structural members and finishing materials is calculated by creating a 3D model of the actual building. However, only 2D basic design drawings are provided when making an estimating. Therefore, for accurate quantity calculation, digitization of 2D drawings is required. Therefore, this research calculates the quantity of concrete structural members by calculating the area for the recognition area through 2D drawing recognition technology incorporating computer vision. It is judged that the development technology of this research can be used as an important decision-making tool when predicting the construction cost in the design stage. In addition, it is expected that 3D modeling automation and 3D structural analysis will be possible through the digitization of 2D drawings.

  • PDF

컴퓨터 비전 기술을 이용한 건설 작업자 보호구 검출 정확도 분석 (Accuracy Analysis of Construction Worker's Protective Equipment Detection Using Computer Vision Technology)

  • 강성원;이기석;유위성;신윤석;이명도
    • 한국건축시공학회지
    • /
    • 제23권1호
    • /
    • pp.81-92
    • /
    • 2023
  • According to the 2020 industrial accident reports of the Ministry of Employment and Labor, the number of fatal accidents in the construction industry over the past 5 years has been higher than in other industries. Of these more than 50% of fatal accidents are initially caused by fall accidents. The central government is intensively managing falling/jamming protection device and the use of personal protective equipment to eradicate the inappropriate factors disrupting safety at construction sites. In addition, although efforts have been made to prevent safety accidents with the proposal of the Special Act on Construction Safety, fatalities on construction sites are constantly occurring. Therefore, this study developed a model that automatically detects the wearing state of the worker's safety helmet and belt using computer vision technology. In considerations of conditions occurring at construction sites, we suggest an optimization method, which has been verified in terms of the accuracy and operation speed of the proposed model. As a result, it is possible to improve the efficiency of inspection and patrol by construction site managers, which is expected to contribute to reinforcing competency of safety management.

모바일 장치기반의 바이오 객체 이미지 매칭 시스템 설계 및 구현 (The design and implementation of Object-based bioimage matching on a Mobile Device)

  • 박찬일;문승진
    • 인터넷정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.1-10
    • /
    • 2019
  • 객체기반 이미지 매칭 알고리즘 기술은 이미지 프로세싱 및 컴퓨터 비전 분야에서 광범위하게 사용되어 왔다. 이러한 이미지 매칭 알고리즘 기반의 수 많은 응용 프로그램은 객체인식, 3D 모델링, 비디오 추적 및 바이오 정보학 분야에서 개발되어 왔다. 이미지 매칭 알고리즘의 좋은 예는 Scale invariant Feature Transform(SIFT) 이다. 하지만 SIFT 알고리즘 기술을 이용한 많은 응용 프로그램은 클라이언트-서버 구조가 아닌 하나의 시스템으로 운영되어 왔다. 본 논문은 모바일 플랫폼 기반에서 SIFT 알고리즘 기술을 이용하여 클라이언트-서버 구조로 이미지 매칭 시스템을 구현하였다. 제안된 시스템은 바이오 이미지 객체를 매칭하고 식별하여 사용자에게 유용한 정보를 제공한다. 또한 본 논문의 주요 방법론적 기여는 모바일 장치에 유비쿼터스 인터넷 연결을 활용하여 편리한 사용자 인터페이스와 객체간의 상호작용적인 묘사, 분할, 표현, 매칭 및 바이오 이미지를 검색한다. 본 논문은 이러한 기술과 함께 바이오 정보학에 대한 의미론적 이미지 검색을 수행하며 응용 프로그램에서 객체 이미지의 다른 점을 추출하여 신뢰할 수 있는 이미지 매칭을 수행하는 예를 제시해주었다.

AlphaPose를 활용한 LSTM(Long Short-Term Memory) 기반 이상행동인식 (LSTM(Long Short-Term Memory)-Based Abnormal Behavior Recognition Using AlphaPose)

  • 배현재;장규진;김영훈;김진평
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권5호
    • /
    • pp.187-194
    • /
    • 2021
  • 사람의 행동인식(Action Recognition)은 사람의 관절 움직임에 따라 어떤 행동을 하는지 인식하는 것이다. 이를 위해서 영상처리에 활용되는 컴퓨터 비전 태스크를 활용하였다. 사람의 행동인식은 딥러닝과 CCTV를 결합한 안전사고 대응서비스로서 안전관리 현장 내에서도 적용될 수 있다. 기존연구는 딥러닝을 활용하여 사람의 관절 키포인트 추출을 통한 행동인식 연구가 상대적으로 부족한 상태이다. 또한 안전관리 현장에서 작업자를 지속적이고 체계적으로 관리하기 어려운 문제점도 있었다. 본 논문에서는 이러한 문제점들을 해결하기 위해 관절 키포인트와 관절 움직임 정보만을 이용하여 위험 행동을 인식하는 방법을 제안하고자 한다. 자세추정방법(Pose Estimation)의 하나인 AlphaPose를 활용하여 신체 부위의 관절 키포인트를 추출하였다. 추출된 관절 키포인트를 LSTM(Long Short-Term Memory) 모델에 순차적으로 입력하여 연속적인 데이터로 학습을 하였다. 행동인식 정확률을 확인한 결과 "누워있기(Lying Down)" 행동인식 결과의 정확도가 높음을 확인할 수 있었다.

대조적 학습을 활용한 주요 프레임 검출 방법 (Key Frame Detection Using Contrastive Learning)

  • 박경태;김원준;이용;장래영;최명석
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.897-905
    • /
    • 2022
  • 비디오 영상 내 주요 프레임(Key Frame) 검출은 컴퓨터 비전 분야에서 꾸준히 연구되고 있는 분야 중 하나이다. 최근 심층학습(Deep Learning) 기술의 발전으로 비디오 영상에서의 주요 프레임 검출 성능이 향상 되었으나, 다양한 종류의 영상 콘텐츠 및 복잡한 배경으로 인해 여전히 효과적인 학습이 어려운 문제점이 있다. 본 논문에서는 대조적 학습(Contrastive Learning)과 메모리 뱅크(Memory Bank)를 통해 영상의 주요 프레임을 검출하는 새로운 방법을 제안한다. 제안하는 방법은 입력 프레임과 같은 영상 내 이웃하는 프레임 간 차이와 다른 영상 내 프레임과의 차이를 기반으로 특징 추출 신경망을 학습한다. 이와 같은 대조적 학습을 통해 메모리 뱅크에 주요 프레임을 저장 및 갱신하여 영상의 중복성을 효과적으로 제거한다. 비디오 영상 데이터셋에서의 실험 결과를 통해 제안하는 방법의 성능을 검증하였다.

스케치를 이용한 웹 환경에서의 3차원 모델 검색 (Web-based 3D Object Retrieval from User-drawn Sketch Query)

  • 송종헌;주재호;윤상민
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.838-846
    • /
    • 2014
  • 터치기반 스마트 기기의 발달에 따라, 사용자가 펜/손가락을 이용하여 그린 스케치를 기반으로 다양한 멀티미디어 검색 기술은 컴퓨터 비전, 컴퓨터 그래픽스, 패턴인식, HCI 분야에서 많은 각광을 받고 있다. 하지만, 기존의 텍스트 정보를 기반으로 한 검색 시스템은 사용자가 원하는 멀티미디어 데이터를 정확히 검색하는데 한계가 있다. 따라서, 멀티미디어 자체가 가지고 있는 정보를 이용하여 검색할 수 있는 내용 기반 멀티미디어 검색에 관한 연구가 필요하게 되었다. 본 논문에서는 Hybrid Edge Descriptor(HED)를 사용한 웹 환경에서의 사용자가 스케치로부터 3차원 모델을 검색할 수 있는 시스템을 제안한다. 3차원 모델로부터 다양한 방향으로 투영된 suggestive contour 영상 및 사용자가 그린 스케치 영상으로부터 전역/지역 히스토그램 분석을 이용한 HED 검색자를 통해 회전 및 이동에 강인한 3차원 모델 검색 시스템을 제안한다.

데이터 수집방법에 따른 딥러닝 기반 산림수종 자동분류 정확도 변화에 관한 연구 (A Study on the Performance of Deep learning-based Automatic Classification of Forest Plants: A Comparison of Data Collection Methods)

  • 김보미;우희성;박주원
    • 한국산림과학회지
    • /
    • 제109권1호
    • /
    • pp.23-30
    • /
    • 2020
  • 최근 급변하는 컴퓨터 기술의 발전을 통해 컴퓨터 비전과 머신러닝을 이용한 사물인식 기법이 다양한 학문 분야에서 사용되고 있다. 국내의 연구 사례를 보면 주로 대면적 산림을 분석하기 위한 이미지 학습 및 객체인식 기법이 사용되는 반면 개체목 단위의 수종 분류 및 특징을 학습하는 연구는 아직 미미한 실정이다. 이에 본 연구는 한국의 침엽수 5종을 대상으로 이미지 학습을 통한 자동분류 연구의 가능성을 분석해 보았다. 데이터 형태에 따른 분류 결과의 차이를 분석하기 위하여 산림전문가가 직접 촬영한 영상(D1)과 웹크롤링을 이용한 영상(D2)을 사용하여 수종 분류를 실시하였다. 그 결과 D1과 D2의 분류 정확도에 유의미한 차이가 있는 것으로 나타났으며, D1은 D2보다 높은 분류 정확도를 나타냈다. 또한, D2의 분류 정확도를 높이기 위해서는 검열되지 않은 영상 데이터의 노이즈를 줄이기 위한 추가 데이터 필터링 기법이 필요한 것으로 사료된다.