• 제목/요약/키워드: 장면 이해

검색결과 121건 처리시간 0.044초

단안 카메라 깊이 추정기를 이용한 미지 물체의 자세 추정 (Unseen Object Pose Estimation using a Monocular Depth Estimator)

  • 송성호;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.637-640
    • /
    • 2022
  • 3차원 물체의 탐지와 자세 추정은 실내외 환경에서 장면 이해, 로봇의 물체 조작 작업, 자율 주행, 증강 현실 등과 같은 다양한 응용 분야들에서 공통적으로 요구되는 매우 중요한 시각 인식 기술이다. 깊이 지도를 요구하는 기존 연구들과는 달리, 본 논문에서는 RGB 컬러 영상만을 이용해 미지의 물체들, 즉 3차원 CAD 모델을 가지고 있지 않은 새로운 물체들을 탐지해내고, 이들의 자세를 추정해낼 수 있는 새로운 신경망 모델을 제안한다. 제안 모델에서는 최근 빠른 속도로 발전하고 있는 깊이 추정 기술을 이용함으로써, 깊이 측정 센서 없이도 물체 자세 추정에 필요한 깊이 지도를 컬러 영상에서 구해낼 수 있다. 본 논문에서는 벤치마크 데이터 집합을 이용한 실험을 통해, 제안 모델의 유용성을 평가한다.

불똥 입자의 이류과 삭제를 효율적으로 학습 표현하는 인공신경망 (An Artificial Neural Network for Efficiently Learning and Representation the Advection and Remove of Fire-Flake Particles)

  • 김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.345-348
    • /
    • 2022
  • 본 논문에서는 유체 시뮬레이션(Fluid simulation)중 화염에서 표현되는 불똥 입자(Fire-flake particle)의 생성, 움직임과 삭제를 효율적으로 학습하고 표현할 수 있는 인공지능 기법에 대해 소개한다. 유체 시뮬레이션을 계산하기 위해서는 일반적으로 수치해석학과 같은 학문의 이해가 필요하며 불똥이나 거품과 같은 유체의 2차 효과(Secondary effect)는 기반유체(Underlying fluids)를 통해 추출되기 때문에 복잡하고 계산양이 많아진다. 이러한 문제를 완화하고자 본 논문에서는 인공신경망을 이용한 분류 모델 학습을 통해 격자 내에서 표현되어야 하는 불똥 입자의 생성을 학습하고, 다항 회귀 모델 학습을 통해 불똥 입자의 움직임을 예측한다. 또한, 불똥 입자가 삭제되어야하는 상태를 네트워크 학습을 통해 얻어내며, 수명(Lifespan) 임계값 조절하여 다양한 장면에서 불똥을 제어할 수 있다. 결과적으로 화염의 움직임을 기반으로 불똥의 움직임을 복잡한 수학식이나 디자이너에게 의존하지 않고 인공지능 학습을 통해 쉽게 제어하고 예측하는 결과를 보여준다.

  • PDF

치료적 매체를 이용한 게슈탈트 심리치료에 나타난 중요사건 및 매체와의 상호작용과정 (Client-identified Significant Events and Interactional Process in Gestalt Therapy Using the Therapeutic Media)

  • 이정숙
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.472-491
    • /
    • 2020
  • 본 연구의 목적은 치료적 매체를 이용한 게슈탈트 심리치료에서 내담자가 지각한 중요사건과 이 중요사건 내에서 매체와의 상호작용과정을 살펴보는 데에 있다. 연구의 목적을 위해 4명의 연구 참가자를 목적표집 하였다. 이들로부터 치료적 매체를 이용한 게슈탈트 심리치료의 회기 중에 가장 중요했던 장면을 선정하도록 한 뒤에 이 장면에서 매체와의 상호작용에 대해 회기녹음 전사본과 인터뷰를 통해 자료를 수집했다. 자료 분석과 분석적 절차는 종합적 과정분석(comprehensive process analysis)에 따랐다. 그 결과 내담자가 경험한 중요사건은 총 74개의 대화쌍으로 구성되었다. 이들이 경험한 중요사건은 매체를 통해 미해결 감정과 접촉하고 이를 표현하면서 자기 이해가 깊어진 것이었다. 내담자가 지목한 중요사건 내에서 매체와의 상호작용과정은 매체의 이용 양상, 내담자의 경험, 매체와의 상호작용에 따라 분석했다. 분석한 결과 매체와의 상호작용은 총 5개의 주요주제가 드러났다. 5개의 주요주제는 허용, 발견, 인정, 수용, 조망이다. 끝으로 연구 결과에 대해 논의하고, 의의와 한계를 밝히고 추후 연구를 위해 제언하였다.

영웅서사구조 중심으로 하는 판타지영화의 시각화 연구 (Visualization research based on hero tale stories in a fantasy movie)

  • 한명희
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권2호
    • /
    • pp.185-194
    • /
    • 2010
  • 디지털 콘텐츠 산업은 전반적으로 이미 원 소스 멀티 유즈 시대에 접어들고 있다. 원작 소설 성공으로 영화로 재탄생되는가하면, 영화의 성공을 통하여 원작인 소설이 다시금 주목받는 경우가 생겨나며, 소설과 영화가 동시에 공개되는 경우도 있다. 본 논문은 게르만신화 서사구조를 갖고 있는 판타지 영화를 조셉 캠밸(J. Campbell)의 영웅서사구조 12단계 분류를 적용하여 소설의 서사구조를 시각화한 영화장면을 비교 분석하였다. 소설의 서사구조를 각색, 시각화 하는 경우 원작의 분위기, 스케일, 내용을 관객이 이해할 수 있는 충분한 시각적인 설명이 필요하며 적합한 이펙트를 사용했을 때 관객의 감정이입을 유도할 수 있다. 원작을 각색하여 시각화 하는 경우 원작 스케일과 작가의 메시지를 시각화하는 과정에 있어서 기초자료로 활용될 수 있을 것이며 사전에 관객 호응도를 단계별로 검토하여 시각적 기법(특수효과, 장면전환)에 적용할 수 있을 것이다.

게르만신화의 서사구조를 바탕으로 한 영화의 시각화 -반지의 제왕, 해리포터, 나니아 연대기를 중심으로- (The Visualization of films for the stand on narrative of Germanic Mythology -Focused on "The Road of the Ring", "Harry Potter", and "The Chronicles Of Narnia"-)

  • 백광호;한명희;김미진
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1129-1136
    • /
    • 2009
  • 디지털 콘텐츠 산업은 전반적으로 이미 원 소스 멀티 유즈의 시대에 접어들고 있다. 원작 소설의 성공으로 영화로 재탄생되는가하면, 영화의 성공을 통하여 원작인 소설이 다시금 주목받는 경우가 생겨나며, 소설과 영화가 동시에 공개되는 경우도 있다. 본 논문은 게르만신화의 서사구조를 갖고 있는 판타지 영화를 조셉켐밸(J.Campbell)의 영웅서사 구조 12단계 분류를 적용하여 소설의 서사구조를 시각화한 영화장면을 비교분석하였다. 소설의 서사구조를 각색, 시각화 하는 경우 원작의 분위기, 스케일, 내용을 관객이 이해할 수 있는 충분한 시각적인 설명이 필요하며 적합한 이펙트를 사용했을 때 관객의 감정이입을 유도할 수 있다. 원작을 각색하여 시각화 하는 경우 원작의 스케일과 작가의 메시지를 시각화하는 과정에서 있어 기초자료로 활용될 수 있을 것이며 사전에 관객의 호응도를 단계별로 검토하여 적절한 시각적 기법(특수효과, 장면전화 등)을 적용할 수 있을 것이다.

  • PDF

한국어판 아동용 간편 5요인 성격질문지(K-BFQC-SF) 타당화 연구 (Validation of Korean short version of the Big Five Questionnaire for children)

  • 김복환;김지현
    • 초등상담연구
    • /
    • 제11권3호
    • /
    • pp.371-390
    • /
    • 2012
  • 본 연구는 아동의 5요인 성격 특성을 측정하기 위해 Big Five Questionnaire for Children(BFQ-C; Barbaranelli, Caprara. Rabasca, & Pastoreli, 2003)에 기초하여 학교장면에서 간편하게 활용할 수 있는 한국어판 아동용 간편 5요인 성격질문지(K-BFQC-SF)를 구성하고, 이 질문지에 대한 신뢰도 및 타당도를 검증하는 것이었다. 이를 위해 영문 BFQ-C 65문항을 번안하여 초등학교 5, 6학년 278명을 대상으로 탐색적 요인분석을 실시하고, 일부 문항의 제거 과정을 거쳐 성격 5요인의 구성 개념을 포괄할 수 있는 15문항의 간편형 5요인 성격 질문지를 구성하였다. 축약된 15문항은 확인적 요인분석을 통해 구인타당도를 검증하였다. 한국어판 아동용 간편 5요인 성격질문지의 준거타당도를 알아보기 위해 초등학교 5, 6학년 252명을 대상으로 우울, 학업성적, 진로성숙도와의 상관분석을 수행하였다. 그 결과 15문항의 간편형 척도와 준거변인들간의 관계는 기존에 보고된 연구 결과와 유사한 수준을 보였다. 마지막으로 아동의 자기보고와 성인관찰자인 교사의 평정자료가 서로 일치하는지 알아보기 위해 상관분석을 실시한 결과 양호한 수준을 보였다. 한국어판 아동용 간편 5요인 성격질문지는 학교장면에서 학생들의 성격특성을 이해하는데 유용하게 활용될 수 있다는 점에서 의의가 있다.

  • PDF

Utilizing Context of Object Regions for Robust Visual Tracking

  • Janghoon Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.79-86
    • /
    • 2024
  • 본 논문에서는 단일 영역 정보만을 활용하는 기존의 방법론을 개선하기 위해, 물체의 맥락영역에 대한 정보를 함께 물체 추적에 활용하는 새로운 기법을 제시한다. 기존의 방법론들은 모든 후보 영역들을 독립적으로 처리하는 구조로, 비슷한 외양의 영역들이 등장하는 경우 이를 성공적으로 구분하지 못하는 문제점을 보여주었다. 이는 주어진 장면 내에 등장하는 모든 후보 물체 영역들에 대한 맥락 정보를 고려하지 못하여 생기는 문제이다. 제안하는 방법론에서는 비슷한 외양의 영역들 간의 특징점 정보 교환을 보조하고 이들 간의 구별성을 높이는 것을 목표로 하였다. 이를 구현하기 위해 MLP-믹서 (MLP-Mixer) 모델을 활용하여 맥락영역 간의 정보 교환을 모델링하는 모듈을 제시하였다. 이를 통해 구현된 특징점 채널별, 영역간의 상호작용 연산은 영역의 개별 특징점 표현에 대해 장면 맥락 정보가 내장될 수 있도록 보조한다. 제안한 방법론의 성능을 평가하기 위해 대규모 물체 추적 데이터셋인 LaSOT을 사용하였고, 성능 평가 결과 제안한 알고리즘은 AUC 지표 기준 0.560의 높은 성능과 함께 65fps의 실시간 속도로 동작함을 확인하였다.

객관적인 화질 평가 방법에 관한 연구 : 동적 폭, 노이즈, 해상도, 색재현성, 선호도 (Objective Image Quality Measurement Model : Focus on Dynamic Range, Noise, Resolution, Color Reproduction, and Preference)

  • 박형주;하동환
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.87-95
    • /
    • 2012
  • 본 연구는 객관적인 화질 평가 요소들과 선호도를 기반으로 한 주관적 화질 평가 모형을 구축하여 감상자들의 화질에 대한 선호도를 객관적 요소들로 분석할 수 있도록 하였다. 즉 제조사들이 이해하기 쉬운 객관적 화질 평가 요소들을 선정하고, 이와 같은 요소들을 질문하는 문항을 기반으로 하여 사진의 품질을 평가하는 방식으로 주관적 화질 평가 모형을 구축하였다. 또한 화질 평가에 사용되는 실제 사진을 일반인들이 주로 촬영하는 장면인 인물사진으로 선택하여 실험결과의 일반화와 타당성을 추구하였다. 본 실험의 주관적 화질 평가 모형을 통하여 감상자들이 선호하는 화질을 평가하고 그 결과가 최종적인 사진의 선호도에 어떠한 상관관계를 갖으며 영향을 미치는지 분석하였다. 이와 같은 상관관계 분석을 통하여 감상자가 선호하는 화질에 대해 파악하고 화질을 향상시키는 요소를 분석할 수 있었다. 그 결과 선호도와 가장 상관관계가 높은 변수는 색재현력, 다이내믹 레인지, 노이즈, 해상도 순이었으며, 인물 사진 자극의 특성상 색재현력과 선호도가 가장 높은 수준의 상관관계를 보였다. 이러한 결과는 단순 수치화된 객관적 화질 평가 요소들을 언어로 확장시켜, 선호도에 기반을 둔 주관적 화질 평가 모형을 제시함으로써 일반 사용자와 제조사 모두가 쉽게 이해할 수 있는 새로운 방식의 접근이라고 할 수 있다.

디지털 텔레비전 수신환경에서의 실시간 비디오 인덱싱과 비선형적 비디오 브라우징 (Real-Time Video Indexing and Non-Linear Video Browsing for DTV Receivers)

  • 윤경로;전성배
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.79-87
    • /
    • 2002
  • 지난 10여년간의 디지털 비디오와 관련 멀티미디어처리 기술의 빠른 발전은 비디오 내용의 이해에 기반한 키프레임 기반의 내용요약과 같은 여러 가지의 비선형적 비디오 브라우징 방법들을 가능하게 하였다. 그러나 스토리보드나 목차와 같은 키프레임 기반의 사용자 인터페이스들은 텔레비전 환경에 익숙한 대다수의 일반 사용자들에게는 여전히 사용하기 어렵다는 단점이 있으며, 이러한 사용자 인터페이스의 구성 또한 실시간 처리를 지원하지 않고 있어 서비스 제공자를 배제한 일반 방송 환경에서 사용하기 어렵다는 단점을 가지고 있다. 본 논문에서는 이러한 단점들을 극복하며 동시에 사용자들이 사용하기 편리한 비선형적 비디오 브라우징 기술들을 제안하며, 이를 지원하기 위한 실시간 비디오 인덱싱 기술을 제안하고 있다. 즉 구조기반의 건너뛰기와 요약보기 기능은 실시간 비디오 인덱싱 기술에 기반하여, 사용자들이 기존의 비디오 레코더의 리모콘과 같은 간단한 사용으로 원하는 장면을 쉽게 찾아갈 수 있도록 하여 주며, 간단한 요약 기능을 제공하여 짧은 시간에 전체의 내용을 이해할 수 있도록 하여 준다.

영화 스크립트 내 감정 정보를 이용한 시각화 (Visualization using Emotion Information in Movie Script)

  • 김진수
    • 한국융합학회논문지
    • /
    • 제9권11호
    • /
    • pp.69-74
    • /
    • 2018
  • 인터넷 기술과 다양한 정보 기술의 융합을 통해 광대한 정보를 수집 및 가공하여 사용자 취향에 맞는 다양한 지식을 서로 주고받을 수 있게 되었다. 특히, 영화 미디어 속에 내포된 감정 변화의 흐름을 통해 사용자의 취향과 연결된 밀접한 콘텐츠를 선호하는 경향이 있다. 사용자는 스크립트에 나타난 정보를 바탕으로 전체적인 감정의 흐름이나 특정한 등장인물, 또는 특정한 장면에서의 감정의 흐름을 보다 빠르게 이해하기 위해 시각화하고자 한다. 본 논문에서는 영화 웹페이지로부터 정제되지 않은 데이터를 획득한 후, 정제 과정을 거쳐 표준화된 스크립트 형식으로 변환한다. 정제된 데이터를 XML 문서로 변환하여 다양한 정보를 쉽게 획득한 후, 감정 예측 시스템에 각 문단을 입력하여 다양한 감정을 예측한다. 예측된 감정들의 흐름과 스크립트에 포함된 정보량을 혼합하여 사용자가 필요로 하는 다양한 감정의 전체적 또는 특정 부분에서 캐릭터들 간의 감정 상태의 변화를 시각화를 통해 쉽게 이해할 수 있는 시스템을 제안한다.