• 제목/요약/키워드: visual frame

검색결과 419건 처리시간 0.026초

GRNN 알고리즘을 이용한 비선형적 움직임 벡터 추정 및 프레임 보간연구 (A Study on Frame Interpolation and Nonlinear Moving Vector Estimation Using GRNN)

  • 이승주;방민석;윤기방;김기두
    • 전기전자학회논문지
    • /
    • 제17권4호
    • /
    • pp.459-468
    • /
    • 2013
  • 본 논문에서는 비선형적 움직임에 대하여 시각적 화질 향상에 목적을 둔 프레임 보간 기법을 제안한다. 그러므로 블록 현상과 영상의 중첩을 감소시키고자 블록 크기를 128x128부터 1x1까지 순차적으로 전역탐색을 실시하여 최소 오차값이 가장 작은 블록이 포함된 프레임을 선택하고, 비선형적인 움직임 벡터를 GRNN(General Regression Neural Network) 알고리즘을 이용하여 재 추정함으로써 프레임을 보간하는 알고리즘을 제안한다. 이러한 알고리즘의 성능 분석을 위해 프레임 반복, 단방향 움직임 보상, 양방향 움직임 보상의 기법들과 비교한다. 객체의 움직임이 크거나 카메라 초점의 이동과 줌인(zoom-in), 줌아웃(zoom-out) 효과가 들어간 대상 영상에 대하여 주관적 화질면에서 성능이 향상됨을 보인다.

화면간 영상 변화량을 고려한 H.264/AVC 비트율 제어 방법 (A Bitrate Control considering Interframe Variance of Image for H.264/AVC)

  • 손남례;이귀상
    • 정보처리학회논문지B
    • /
    • 제13B권3호
    • /
    • pp.245-254
    • /
    • 2006
  • H.264/AVC 표준은 기존의 부호화 기법보다 뛰어난 압축성능 때문에 비디오 데이터의 압축과 전송에 널리 응용될 것으로 전망된다. 그러나 H.264/AVC 표준도 기존의 비디오 압축표준과 마찬가지로 가변길이부호화방식을 따르기 때문에, 동영상을 부호화할 때 발생하는 데이터 량은 시간의 흐름에 따라 큰 폭으로 변할 수 있다. 이 때문에 PSTN이나 ISDN 망과 같이 대역폭이 고정된 네트워크를 통해 비디오 스트림을 전송하고자 할 경우에는 부호기로부터 출력되는 비트량을 제어할 필요가 있다. 본 논문에서는 전송율이 고정된 비디오 전송채널 환경에서 H.264/AVC 부호화 기법으로 압축된 영상 데이터를 전송할 때 필요한 새로운 비트율 제어방식을 제안한다. 제안하는 비트율 제어방식은 우선 화면간 영상 변화량 따른 프레임당 목표비트량과 MAD간의 관계를 선형회귀분석기법을 이용하여 분석한 다음, 이를 기반으로 프레임 단위로 효율적인 비트율 제어 방법을 제안한다. 실험결과 화면간 움직임이 많은 영상의 경우 기존의 비트율 제어 방법이 채널 전송에 부적합할 정도로 비트량을 초과하지만, 제안한 방법은 채널 전송에 적합하게 효율적으로 부호화한다. 또한 프레임 스킵 방법은 기존의 비트율 제어 방법에 비하여 제안한 방법이 평균 $1{\sim}15%$ 감소하였다.

자동차 부품 카시트 프레임 검사를 위한 머신비전 개발 (Development of a machine vision system for automotive part car seat frame inspection)

  • 넬슨 안드레이;장봉춘
    • 한국산학기술학회논문지
    • /
    • 제12권4호
    • /
    • pp.1559-1564
    • /
    • 2011
  • 본 논문에서는 생산 현장에서 작업자가 육안으로 하고 있는 자동차 부품 카시트 프레임의 전수(全數) 검사를 위한 머신 비전 시스템의 개발에 관한 연구를 다룬다. 이러한 제안된 머신비전 검사시스템은 생산 현장에서 날로 증가하는 품질 향상에 대한 요구와 수요를 충족시키기 위해 설계되었다. 이 컴퓨터 기반의 검사시스템은 실시간으로 제품의 다양한 결함들에 대한 품질 검사를 할 수 있도록 설계되었다. 본 연구의 검사방법에 사용된 소프트웨어는 NI-LabVIEW가 사용하였으며, LabVIEW Vision 이미지 함수를 사용하여 검사 프로그램을 개발하였다. 개발된 검사 알고리즘은 생산 부품의 실시간 검사에 적용 될 수 있으며, 검사 영역과 설정 값을 비전 시스템 운용자가 설정할 수있도록 프로그램이 만들어져 검증되었다. 제안된 검사시스템은 카시트 프레임 검사를 성공적으로 수행하였다.

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

동영상 컨텐츠의 메타데이타에 기반한 효율적인 브라우징 기법 (Efficient Browsing Method based on Metadata of Video Contents)

  • 천수덕;신정훈;이상준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.513-518
    • /
    • 2010
  • 정보기술은 통신 및 멀티미디어 기술의 발전에 힘입어 빠르게 발전하고 있으며, 이에 따른 디지털 콘텐츠에 대한 수요가 증가하였다. 디지털 콘텐츠 중 비디오 콘텐츠는 VOD, NOD, 디지털 도서관, IPTV, UCC 등 다양한 응용 분야에서 점점 확산되고 있다. 비디오 데이터는 순차적인 특성이 있으며, 시간과 공간정보가 결합한 3차원 데이터로서 계산 비용이 많이 드는 작업이기 때문에 검색이나 브라우징이 어렵다. 본 논문에서는 비디오 데이터를 구조화하는 동영상 내용 편집 도구(ATVC: Authoring Tool for Video Contents)를 제안한다. 동영상 내용 편집 도구는 비주얼 리듬을 이용하여 비디오 데이터에서 대표 프레임을 추출한 다음 XML을 이용한 태그 및 키워드 정보를 대표 프레임에 삽입하는 도구(Tool)이다. 비주얼 리듬은 3차원의 시공간적인 정보를 2차원으로 매핑한 정보로 IDCT과정 없이 픽셀 정보를 얻을 수 있어 처리속도가 빠르며 컷, 와이프, 디졸브 등의 편집 효과를 효과적으로 구분할 수 있다. 그리고 XML 데이터에는 태그 및 키워드 정보와 함께 대표 프레임의 정보까지 저장되므로 효율적인 브라우징을 제공할 수 있다.

동적 재구성이 가능한 Qis Visualization Spreadsheet (Dynamic Reconfiguration of Qis Visualization Spreadsheet)

  • 지승현;권영희;윤길중
    • 전자공학회논문지CI
    • /
    • 제42권5호
    • /
    • pp.79-86
    • /
    • 2005
  • Qis 이미지 스프래드쉬트(Qis Image Spreadsheet) 환경은 다차원 멀티미디어 데이터집합(multi-dimensional multimedia datasets)의 조직적인 비쥬얼라이제이션(visualization)을 수행하는데 매우 효과적이다. Qis는 실시간에 재구성 가능한 셀(cell)단위 스트래드쉬트이며 각 셀은 프레임스택 (framestack)으로 구성된다. 이러한 동적 재구성으로 인하여, Qis는 많은 양의 멀티미디어 데이터들을 집약적으로 압축하고 3차원 자료구조로 빠르게 구성할 수 있을 뿐 아니라 효과적으로 관리할 수 있다. 다차원 멀티미디어데이타 응용실험을 통해서도, Qis가 각 프레임 (frame)의 빠른 랜더링(rendering), 2D 및 3D그래픽 디스플레이, 다차원 데이터집합의 분석 등을 수행할 수 있는 상호작용이 우수한 비쥬얼 툴(interactive visual browsing tool)임을 입증하였다.

스크린 X 영상 투영 방식의 특징 연구 (Research on the Image Projection of Platform Screen X)

  • 선심이;정진헌
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.503-508
    • /
    • 2017
  • 스크린 X가 프리미엄 대형 영화(Premium Large-Format, 이하PLF)의 플랫폼 중 하나이다. 스크린 X은 관람관안에 중앙 스크린과 좌우 양쪽 스크린을 연결해서 세 면 스크린을 구성한 시술이다. 이 새로운 나온 PLF 플랫폼은 관람자에게 파노라마 비주얼을 제공할 수 있다. 다만 영상 콘텐츠를 촬영했을 때 스크린 2 개 더 있기 때문에 콘텐츠 화면을 더 추가적인 제작해야 된다. 스크린 X는 제일 명확히 특징이 270도 범위로 콘텐츠를 시청할 수 있는 것이다. 시청자가 일반 영화 스크린 화면의 프레임 워크를 넘어선 경험을 갖도록 하여 시청자가 시청 경험에 대한 특정 장면을 가장 직접적으로 볼 수 있다. 그래서 스크린 X는 3D 안경을 착용하지 않아도 시청자에게 몰입 효과를 줄 수 있는 의미가 있다. 이 특징 연구 결과에 따라 스크린 X에 맞은 콘텐츠 사양 및 제작 방식을 연구하며, 시각효과를 극대화한 콘텐츠에 대한 연구를 목표로 한다. 그리고 향후 스크린 X 영상 콘텐츠 관련 연구자와 산업계 종사자들에게 향후 도움이 될 수 있는 연구 논문으로 사료 될 것을 기대한다.

신뢰성있는 웨이블릿 비디오 전송을 위한 패킷화 기법 (Packetizing Scheme for Reliable Transmission of Wavelet Video Stream)

  • 이주경;강진미;김충길;정기동
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.553-560
    • /
    • 2003
  • 웨이블릿 변환(Wavelet Transform)된 비디오는 주파수와 해상도가 다근 부대역으로 분해되므로 전송 오류가 발생한 패킷의 위치에 따라 복원된 프레임 간 화질 편차가 크게 된다. 복원된 프레임의 화질 변화가 클수록 사용자가 느끼는 비디오의 화질은 떨어진다. 특히, 움직임 예측을 이용한 웨이블릿 비디오의 경우, 특정 부대역에서 발생한 오류는 같은 프레임의 다른 부대역 뿐 아니라 이후 프레임의 화질에도 지속적인 영향을 미치게 된다. 본 논문에서는 웨이블릿 기반 비디오를 네트워크로 전송하기 위해 패킷화론 수행할 때, 오류발생 패킷의 위치에 관계없이 일정한 화질을 유지하며 오류 은닉이 쉬운 블록기반 패킷화 기법인 BDP(Block based Dispersive Packetization)를 제안한다. 본 논문은 MRME(Multi-Resolution Motion Estimation)글 적용하여 압축된 비디오와 무선 네트워크에서의 오류 발생 모델을 이용하여 성능평가를 수행하였다. 실험결과 제안된 기법은 프레임을 일정한 블록으로 분할하여 순차적으로 패킷화하는 BP나 픽셀단위로 분산하는 DP기법에 비해 주ㆍ객관적인 성능 모두 뛰어남을 알 수 있었다.

과학적 창의성과 시각예술적 창의성: 창의적 성취 사례의 영역보편성 및 영역특정성 (Scientific Creativity and Visual Artistic Creativity: The Domain-universality and Domain-specificity on Creative Accomplishment)

  • 강정하;최인수
    • 영재교육연구
    • /
    • 제18권2호
    • /
    • pp.201-237
    • /
    • 2008
  • 본 연구는 과학 및 시각예술 영역의 창의적 성취사례를 통해 두 영역의 영역보편성과 영역특정성에 대해 살펴보는 데 그 목적을 두었다. 연구를 위해 각각의 영역에서 세계적인 성취를 이룬 한국의 창의적 인물들(과학자: 10인, 시각예술가: 9인)에 대한 인터뷰를 실시하였고, 이로부터 수집한 질적 자료를 토대로 창의적 성취에서 영역보편적으로 드러나는 특성과 영역특정적으로 드러나는 특성을 요약, 기술하였다. 자료분석에는 본 연구의 근간이 되는 총괄적이고 체계적인 개념틀 '지식진화시스템(Knowledge-Evolving Systems: KES)'을 사용하였다. 분석 결과를 보면, 실재시스템에서 두 영역의 성취는 공통적으로 요동, 탐색, 산물을 통해 드러났다. 반면, 과학은 전문지식, 어려운 과제, 세계 최초의 객관적인 지식이 주요한 요인으로, 예술에서는 일상적인 지식, 다양한 주제, 새로운 변화에 대한 인간의 감성 전달이 주된 요인으로 드러났다. 개인시스템에서 두 영역은 모두 분명한 목표를 향한 집중과 독자적인 노력을 보편적으로 요구하였다. 반면 과학은 창조의지, 확산적 및 분석적 사고, 직관 및 통찰, 그리고 도전이 대표적인 요인으로, 시각예술은 즐거움, 민감성, 통합적 사고, 완벽성, 그리고 자유로움이 주요한 요인으로 산출되었다. 마지막으로 사회시스템에서 두 영역의 성취는 전문가의 승인에 의해 결정되었다. 그리고 과학자들의 성취에는 인간네트워크, 기관의 지원, 생존경쟁과 운이 큰 영향을 미쳤고, 시대적 요구와 민족성이 발전의 토대가 되었다. 반면, 시각예술가들은 주변의 반대와 부적인 예술문화 풍토로 인해 고독한 삶을 살아왔다.

시각적 측면에서 랜드마크 요소의 최적입지선정 분석방법에 관한 연구 (A Study on Optimal Location Selection and Analytic Method of Landmark Element in terms of Visual Perception)

  • 김석태
    • 한국산학기술학회논문지
    • /
    • 제16권9호
    • /
    • pp.6360-6367
    • /
    • 2015
  • 랜드마크와 같이 시각적 인지가 용이해야 하는 요소의 입지 선택은 공간설계과정에서 많이 등장하는 화두이다. 최근에는 이러한 시각적 요소의 가시성을 평가하기 위해서 컴퓨터를 활용한 그래프 분석기술이 많이 적용되고 있으나, 분석의 틀이 평면적이고 시점과 대상점의 설정이 고정적이어서, 실질적인 분석결과를 얻는데 한계가 컸다. 이에 본 연구에서는 3차원 환경에서 동적 시점에 대한 분석이 가능한 비지향성 다차원 가시도 분석(MDVC-N) 분석방법론을 제시하였으며, 3차원 컴퓨터그래픽기술을 이용하여 분석어플리케이션을 구축하고, 시점과 대상점을 설정하는 스크립트 구조를 설계하였다. 여기에 고저차를 갖는 지형에 다양한 높이의 건물이 배치되어 있는 복합화된 대지를 예시모델로 적용하여 분석방법론을 검증하고 입지별 대안의 시각적 특성을 파악하였다. 연구를 통하여 다음과 같은 결론을 얻을 수 있었다. 1) 6개의 대안을 설정하여 정량적인 가시도를 측정할 수 있었다. 2) 3차원 그래프로 재현하여 직관적인 분석이 가능하였다. 3)공간구문론의 국부통합도를 공간이용행태 변수로 보정한 결과를 산출함으로서 분석의 적용성을 향상시켰다.