• 제목/요약/키워드: 시각객체

검색결과 494건 처리시간 0.031초

도메인 확장성을 지원하는 계층적 시각동사 인식 방법 (A Domain-Extensible Hierarchical Approach to Recognize Visual Verbs)

  • 문진영;권용진;강규창;박종열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1439-1441
    • /
    • 2015
  • 본 연구는 비디오 이해를 위해 비디오에 등장하는 주요 객체들의 행동이나 상태를 시각 동사라고 명명하고, 도메인 확장성 있는 계층적 시각 동사의 인식을 위해 온톨로지와 규칙을 기반으로 도메인 독립적인 시각 동사를 계층적으로 인식하는 방법과 특정 도메인에 관련된 시각 동사를 도메인 독립적 시각 동사를 기반으로 확장하여 인식하는 방법을 제안하고, CCTV 감시 비디오에서 인식 시뮬레이션 결과를 보여준다.

병렬 객체지향 프로그래밍을 위한 시각 환경의 설계 및 구현 (Design and Implementation of Visual Environment for Parallel Object-Oriented Programming)

  • 최숙영
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.485-496
    • /
    • 1999
  • 병렬 프로그래밍은 프로세스간의 통신과 동기화 문제, 병렬 시스템의 구성 형태등을 고려해야 하기 때문에 순차 프로그래밍에 ? 많은 노력을 필요로 한다. 효율적인 병렬 프로그램을 작성하기 위해서는 사용자와 컴파일러간의 상호 지원이 이루어져야 한다. 이러한 관점에서 본 연구는 선행 연구로써 병렬 객체지향 표기언어 POOSL을 개발하였다. 그러나, 사용자 입장에서 볼 때 병렬 프로그램을 작성하기 위해 POOSL의 문법 구조를 염두에 두고 텍스트 중심의 프로그램을 작성한다면 여전히 부담스러운 작업이 될 것이다. 사용자에게 보다 편리함을 제공하기 위해서는 텍스트보다는 시각적인 프로그래밍 환경이 더욱 효율적이고 바람직할 것이다. 따라서, 본 논문에서는 POOSL을 기초로 하여 사용자가 좀더 쉽고, 편리하게 병렬 프로그래밍 할 수 있는 시각 환경으로써 VEPO(Visual Environment for Parallel Object-Oriented Programing)를 제안하고 있다. 본 논문의 목적은 사용자가 병렬 프로그램을 작성하는데 있어 문제에 내재된 병렬성을 객체지향 개념에 입각하여 시각적으로 자연스럽게 표현하도록 하고, 병렬 프로그램 개발에 관련된 과정들을 하나의 환경을 통합시킴으로써 편리한 프로그램 환경을 제공하는 것이다. 본 연구에서 제안하고 있는 VEPO는 병렬 프로그램을 개발하는데 필요한 기본적인 단계들로써 프로그램 기술 단계, 실행 단계, 실행 과정의 시각화등을 지원하고 있으며, 시각 프로그래밍의 장점을 충분히 살릴 수 있도록 여러 개념들이 지원되고 있다. 특히, 병렬 프로그램에서 복잡하고 까다로운 통신과 동기화에 관련된 코드 등은 번역 과정에서 여러 개념들이 생성되도록, 함으로써 사용자로 하여금 병렬 프로그램을 작성하는데 따르는 부담감을 줄 일 수 있도록 한다. 본 시스템은 PC를 호스트로 연결한 트랜스퓨터들로 구성된 병렬 컴퓨터 MC-3에서 구현되었다. VEPO 그래픽 사용자 인터페이스는 Visual C++로 구현되었고, VEPO에서 작성된 시각 프로그램은 Inmos C 코드로 번역되어 MC-3에서 수행된다.

  • PDF

언명을 기반으로 한 멀티미디어 객체의 시공간 동기화 모델

  • 성해경
    • 한국게임학회지
    • /
    • 제6권1호
    • /
    • pp.55-57
    • /
    • 2009
  • 멀티미디어 정보 표현에 있어서 서로 다른 미디어간의 동기화를 효과적으로 처리하는 것이 아주 중요하다. 멀티미디어 특성이 적용된 게임 개발에 있어서 각각의 시각 객체들이 시간 경과에 따라 공간 영역에서 동시에 움직여야 하므로 게임에서 필요한 멀티미디어적인 게임 요소들을 게임 운용상에 적절히 배치시키기 위해서는 게임 장면을 통한 시간과 공간 개념의 동기화가 필요하고 게임 객체 자신이 가지고 있는 시공간 특성이 논리적으로 설계되어 게임을 운용시켜야 한다. 따라서 멀티미디어 시스템에서 혼합된 형태의 미디어로 구성된 데이터의 표현을 위해서는 객체가 나타내는 상대적인 위치와 상대적인 시간을 나타내 주는 공간 합성과 시간 합성을 명시할 수 있는 정형화된 표현 연구가 요구된다. 간(刊)기존 연구들은 대부분 시간적 동기화와 공간적 동기화 각각에 대한 표현에 많이 치우쳐 있으므로 시간과 공간이 통합된 미디어들의 동기화 표현에 대한 연구가 필요하다. 시공간이 통합되지 않는 기존의 멀티미디어 표현법을 게임 개발에 적용할 때에는 게임에 사용되는 미디어 객체간의 원활한 동기화 표현이 쉽지 않다. 이러한 문제를 해결하기 위하여 게임 시나리오 스케치에서 나타난 게임 객체들의 시공간 개념이 적절히 표현될 수 있는 정형적 연구가 필요하다. 간(刊)본 논문에서는 시간 개념과 공간 개념이 통합된 형태의 시공간 동기화를 표현하기 위하여 명세 단계에서 멀티미디어 데이터가 시간 및 공간 개념을 적절히 변형하여 표현될 수 있도록 시간 및 공간 동기화가 통합된 새로운 표현법을 제안한다. 이를 위하여 게임 요소들의 시간적, 공간적 동기화를 표현하기 위한 방법을 언명으로 정의하고 시공간 관계성에 대한 확장을 제시한다. 간(刊)본 논문이 제안하는 언명 기반 멀티미디어 객체의 시공간 동기화 모델(an Assertion-based Multimedia objects Spatio-TEmporal Synchronization model : AMSTES)는 시간과 공간 모두에 적용되는 게임 객체들의 시공간 동기화 표현 방법과 이를 이용하여 실제 실행 가능한 코드 생성을 위한 시공간 공식을 제공한다.

  • PDF

360° 스트리밍 영상에서의 객체 인식 연구 (Object Recognition in 360° Streaming Video)

  • 윤정록;전성국;김회민;김운용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.317-318
    • /
    • 2019
  • 가상/증강현실로 대표되는 공간정보 기반 실감형 콘텐츠에 대한 관심이 증대되면서 객체인식 등의 지능형 공간인지 기술에 대한 연구가 활발히 진행되고 있다. 특히 HMD등의 영상 시각화 장치의 발달 및 5G 통신기술의 출현으로 인해 실시간 대용량 영상정보의 송, 수신 및 가시화 처리 기술의 기반이 구축됨에 따라, $360^{\circ}$ 스트리밍 영상정보 처리와 같은 고자유도 콘텐츠를 위한 관련 연구의 필요성이 증대되고 있다. 하지만 지능형 영상정보 처리의 대표적 연구인 딥 러닝(Deep Learning) 기반 객체 인식 기술의 경우 대부분 일반적인 평면 영상(Planar Image)에 대한 처리를 다루고 있고, 파노라마 영상(Panorama Image) 특히, $360^{\circ}$ 스트리밍 영상 처리를 위한 연구는 미비한 상황이다. 본 논문에서는 딥 러닝을 이용하여 $360^{\circ}$ 스트리밍 영상에서의 객체인식 연구 방법에 대해 서술한다. 이를 위해 $360^{\circ}$ 카메라 영상에서 딥 러닝을 위한 학습 데이터를 획득하고, 실시간 객체 인식이 가능한 YOLO(You Only Look Once)기법을 이용하여 학습을 한다. 실험 결과에서는 학습 데이터를 이용하여 $360^{\circ}$영상에서 객체 인식 결과와, 학습 횟수에 따른 객체 인식에 대한 결과를 보여준다.

  • PDF

객체 지향 개념을 이용한 시소러스 구축기 및 시각화 브라우져의 구현 (Implementation of Thesaurus Constructor and Visual Browser Based on Object-Oriented Paradigm)

  • 김기현;최재훈;한종진;양재동;금창섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.336-338
    • /
    • 1998
  • 시소러스는 구축 방법에 따라 매뉴얼 시소러스와 통계적 시소러스로 구분된다. 매뉴얼 시소러스는 정확한 의미 표현이 가능하지만 구축과정에 많은 비용이 소요되며, 통계적 시소러스는 자동으로 구축될 수는 있지만 개념간 의미 표현력이 부족하여 만족할 만한 검색 성능 향상을 기대할 수 없다. 따라서, 본 논문에서는 메뉴얼 시소러스에 객체 지향 개념을 적용하여 구축 비용을 감소시킬 수 있는 시소러스 구축기와 데이터 추상화 기법을 이용하여 선별적으로 개념들 간의 관계를 쉽게 참조할 수 있는 시소러스 시각화 브라우져를 구현하였다. 이 시스템은 시소러스 구축 과정에서 한 사람 이상의 전문가에게 일관된 관점을 제공하며 사용자에게는 높은 정확률의 검색 질의를 구성할 수 있도록 지원한다.

영상의 주파수-명도 특성을 이용한 관심 영역 탐지에 관한 연구 (A Study on Detecting Salient Region using Frequency-Luminance of image)

  • 유태훈;이종용;김진수;이상훈
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2012년도 춘계학술논문집 2부
    • /
    • pp.486-489
    • /
    • 2012
  • 본 논문에서는 인간의 주의시각(Human Visual Attention)에 기반하여 영상에서 가장 유용하다고 생각되는 관심 영역(Salient Region)을 새로운 방식으로 탐지해내고 관심-객체를 검출하는 방법을 제안한다. 제안하는 시스템은 인간의 주의시각 특성인 주파수와 명도, 색상 특징을 이용하는데, 먼저 주파수-명도 정보를 이용한 특징 지도(Feature map)와 색상 정보를 이용한 특징 지도를 각각 생성 한 후 영상의 특징 점(Saliency Point)을 추출한다. 이렇게 생성된 특징 지도와 특징 점을 이용하여 집중 윈도우의 위치와 크기를 결정하고 집중 윈도우 내에 특징 지도를 결합하여 관심 영역을 탐지하고 해당하는 영역에 대해 관심-객체를 추출한다.

  • PDF

손영역 획득과 손동작 인식에 의한 제스처 기반 사용자 인터페이스의 구현 (Gesture-based User-Interface Through Hand-region Detection and Hand-movement Recognition)

  • 고일주;배영래;최형일
    • 인지과학
    • /
    • 제8권4호
    • /
    • pp.35-53
    • /
    • 1997
  • 본 논문은 컴퓨터 시각을 이용하여 제스처를 인식함으로써 사용자에게 보다 편리한 인터페이스를 제공하는 것을 목표로 한다. 제안하는 제스처 인식 방법은 손영역을 획득하는 손영역 획득 모듈?손영역을 인식하는 인식 모듈로 나누어 수행한다. 손영역 획득 모듈에서는 손색상 모델?손색상 결정함수를 정의하여 칼라영상의 영역 분리를 수행하였고, 칼만필터를 이용하여 손색상 모델을 갱신하고 탐색영역을 제한하여 영역 추적을 용이하게 하였다. 영역 추적은 전 시점의 손영역 정보를 이용하여 현 시점의 손영역을 획득한다. 인식 모듈에서는 정적인 제스처를 표현하는 객체 프레임?행동 프레임, 그리고 동적인 제스처를 표현하는 스키마를 정의한다. 그리고 획득된 손영역?정합을 수행함으로써 제스처를 인식한다. 실험 결갬灌?제안하는 제스처 기반 인터페이스를 적용한 삼목(Tic-Tac-Toe) 게임 프로그램을 구현하였다. 사용자는 제스처를 이용하여 컴퓨터와 게임을 진행한다. 제안하는 시스템은 다른 종류의 게임 프로그램이나 마우스의 역할을 수행하는 윈도우 시스템의 제어, 그리고 가상 현실 시스템에 적용될 수 있다.

  • PDF

ART2 알고리즘을 이용한 애견 영상에서의 백내장 추출 (Cataract Extraction of Pet Image by Using ART2)

  • 최명준;김민석;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.500-502
    • /
    • 2015
  • 본 논문에서는 애견 안구 영상에서 백내장을 추출하고 분석하는 방법을 제안한다. 제안된 방법은 애견 안구 영상에 퍼지 스트레칭 기법을 적용하여 픽셀의 상한 값과 하한 값을 조정한다. 퍼지 스트레칭 기법이 적용된 영상에 ART2 기법을 적용하여 양자화를 수행한다. 양자화된 정보를 이용하여 영상을 이진화한다. 이진화된 영상에서 침식과 팽창 기법을 적용하여 영상의 픽셀 크기를 확대 또는 축소하여 타원 형태를 가진 객체 중에서 전체 영상 크기의 1/5보다 적은 객체를 잡음으로 간주하여 제거한다. 잡음이 제거된 영상에서 8방향 윤곽선 추적 기법을 적용하여 백내장 영역을 추출한다. 추출된 백내장 영역을 히스토그램으로 시각화 한다. 제안된 방법의 성능을 확인하기 위해서 히스토그램으로 시각화하여 분석한 결과, 제안된 방법이 백내장 추출에 효과적인 것을 확인할 수 있었다.

  • PDF

공감각을 이용한 시각장애인 보조 기술 (Assistive Technology of Bling People Using Synesthesia)

  • 신광성;이현창;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.145-148
    • /
    • 2011
  • 본 논문은 사용자에게 유연하고 추상적인 데이터를 전달하여 사용자 스스로가 물체를 인지하고 '느낄' 수 있도록 공감각 현상에 대한 연구결과를 응용하다. 또한, 오픈소스(ReacTable)를 사용하여 일종의 TAG 역할을 하는 특징적 그림을 명세코드화한 후 이를 실제 숫자나 문자 혹은 객체 인식에 응용하여 시각적인 정보 없이 객체를 인식하고 사용할 수 있는 일상적인 생활이 가능하도록 하였다. 덧붙여 이동성과 휴대성을 고려함과 동시에 저렴하고 이용가능성이 많은 ZigBee 무선 영상통신 기술을 통하여 처리하고자 하는 영상을 실내의 서버나 휴대용단말기에 전송하는 방법을 사용하였다.

  • PDF

실시간 영상처리를 이용한 시각장애인용 보행 보조기구 (Walking Assistive for the Visually Impaired using Real-Time Image Processing)

  • 권혁민;고석환;이경형;이우재;박해준;정영석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.457-458
    • /
    • 2023
  • 본 논문에서는 실시간 영상처리 라이브러리인 OpenCV와 YOLO를 활용하여 사용자가 횡단보도 보행 시 안전을 제공해 주는 시스템을 개발하였다. 객체 인식 알고리즘인 YOLOv4-tiny를 이용하여 Ubuntu 환경에서 구현하였다. 데이터 셋은 인도 보행 영상 데이터 셋을 이용하였고 하드웨어는 Jetson Nano를 이용하여 구현하였다. 신호등의 색에 따른 보행 가능 여부를 카메라를 이용하여 전방의 장애물을 음성신호를 이용하여 사용자에게 전달한다. 제안된 시스템은 횡단보도와 신호등, 자동차와 같은 도로 위의 객체들로 설계된 알고리즘을 이용해 다양한 곳에서 사용이 가능하여 활용도가 높을 것으로 예상된다.

  • PDF