• 제목/요약/키워드: Communications media

검색결과 983건 처리시간 0.034초

인물 기반 사진 색인을 위한 인물 특징 값 개발에 관한 연구 (Exploiting Person-identity Features for Person-based Photo Indexing)

  • 양승지;서경석;노용만;김상균
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.15-27
    • /
    • 2006
  • 본 논문에서는 일련의 디지털 사진들을 특정한 인물에 기반하여 브라우징 하는 것을 돕기 위한 인물 기반 사진 색인 방법을 제안한다. 기존의 인물 기반 영상 색인의 경우, 얼굴 특징값만을 인물 특정값으로 이용하였다. 이에 반하여, 제안하는 방법의 주 된 목적은 얼굴의 주변 정보인 상황 및 옷 정보를 얼굴 정보와 함께 조합하여 색인 과정에 활용함으로써 인물 기반 사진 색인 의 성능을 높이는 것이다 얼굴 특정값과 옷 특징값을 효과적으로 조합하기 위해, 인물을 상황 별로 클러스터링하는 방법이 함께 제안된다 본 논문에서 제안하는 방법의 효용성을 검증하기 위해 1120 장의 사진 데이터베이스를 활용하여 실험을 수행하였다. 실험 결과에서, 기존의 방법에서처럼 얼굴 특정값만을 이용하여 색인을 수행한 경우 약 70%의 평균 성능을 보였으며, 제안 된 방법을 이용하여 색인을 수행한 경우 약 92%의 평균 성능을 보여 제안된 방법이 인물 별 사진 색인에 효과적임을 확인할 수 있었다.

고주파 성분을 이용한 깊이맵의 보간 (Depth Map Interpolation Using High Frequency Components)

  • 장성은;김성열;김만배
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.459-470
    • /
    • 2012
  • 본 논문은 영상 보간법을 이용하여 저해상도 깊이맵을 고해상도 깊이맵으로 변환하는 방법을 제안한다. 현재의 카메라 센서는 고해상도 색상 영상을 제공하는데 반해, 깊이 측정 장치는 저해상도의 깊이맵을 주로 제공한다. 본 논문은 기존의 양선형 보간법, 고등차수 보간법, 양측 보간법을 바탕으로 깊이맵에서 추출한 고주파 성분을 적용하여 깊이맵의 선명도를 증가한다. 이를 위해, 제안 방법은 고주파 성분 추출 단계, 고주파 성분 적용 단계, 및 영상 보간 단계를 거친다. 실험에서는 다양한 깊이맵 데이터에 제안 방법을 적용하였는데, 성능검증 방법으로 선명도(sharpness degree)와 블러 메트릭 (blur metric)의 두 객관적 측정을 통해서 제안 방법이 기존 방법에 비해 선명도가 약 2배 정도 증가했음을 보여준다. 또한 블러 메트릭은 평균 14%가 감소되었다.

HEVC에서의 적응적 움직임 벡터 해상도를 이용한 움직임 추정 및 부호화 기법 (Motion Estimation and Coding Technique using Adaptive Motion Vector Resolution in HEVC)

  • 임성원;이주옥;문주희
    • 방송공학회논문지
    • /
    • 제17권6호
    • /
    • pp.1029-1039
    • /
    • 2012
  • 본 논문에서는, 인터 예측시 움직임 벡터의 해상도를 나타내는 1비트 플래그를 두어 적응적으로 1/4 해상도의 움직임 벡터와 1/8 해상도의 움직임 벡터를 선택하고 부호화하는 방법을 제안한다. 현재 HEVC에서는 1/4 해상도의 움직임 벡터만을 이용하여 부호화하는데, 영상 신호의 변화가 복잡한 영역에서 1/4 해상도의 움직임 벡터만으로는 충분한 효율을 얻어내지 못한다. 따라서 본 논문에서는 PU마다 해상도 플래그를 1비트 추가하여 적응적으로 움직임 벡터의 해상도를 결정할 수 있도록 한다. 제안한 방법의 실험 결과로서, 인코더의 복잡도는 30%~33% 증가하고 디코더의 복잡도는 1%~5% 증가하였지만, 휘도신호의 압축효율은 최대 5.3% 좋아졌으며, 색차신호의 압축효율은 최대 7.9% 좋아졌다.

웹사이트 이미지의 의미작용에 관한 연구 -명품 브랜드 웹사이트의 인트로 페이지를 중심으로- (A Study on Significations of the Web site's Images -concentrated on the Web site of the Supreme Brands-)

  • 박영원;박상혁
    • 조형예술학연구
    • /
    • 제8권
    • /
    • pp.129-159
    • /
    • 2005
  • Web sites have become one of most important factor for sales products as well as advertising communications in these days. So numerous web sites have been developed for corporations and brands. It is not easy to getting more attention as a prominent web site expression among various types of numerous web sites. Due to the voluminous expansion of visual communications and the change of the media. new advertising creative must be needed for serving to differentiate the message, inviting audiences to participate more positively in Web site communications. This thesis aims at reviewing images and semiotics for analyzing web sites. And this thesis is about the significations of web sites for some of supreme brands. Chapter I describes the aim of this thesis about the signification of web sites, especially concentrate on the intro-pages of worldwide supreme brands. such as Chanel, Louis Vuitton, Yves Saint Laurent, Prada, and Burberry. And Chapter II introduces the general concept of Image and Semiotics. Chapter III deals with the signification of the web sites with introducing semiotic methods such as the theory of R. Barthes. Chapter IV discusses the signification of Images of web sites as an advertising creative talking into consideration of semiotic theories. And this thesis analyze almost all visual images and verbal message by the theory of R. Barthes. In this matrix, a. particular image of web site can be analyzed into its basic structure of pictorial and word elements , i. e., into the representations the viewer uses and identifies. It's my belief that one of aesthetic engineering approaches such as Semantic Differential Method and semiotic approaches such as the Interpretant Matrix for advertising design images provide basic methods which is about defining the process of constructing and coding the advertising images as well as analyzing and decoding advertising expressions. So I suggest these kinds of studies on the images of web sites as well as advertising design images.

  • PDF

MPEG-U part2 참조 소프트웨어 설계 및 구현 (Implementation of MPEG-U part2 Reference Software)

  • 한국희;백아람;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.202-205
    • /
    • 2012
  • 최근 멀티미디어 분야에서 다양한 입/출력 장치들이 개발됨에 따라 입/출력 장치와 사용자 사이의 향상된 상호작용(AUI : Advanced User Interaction)을 위한 방법들이 연구되고 있다. AUI에서 정의되는 데이터는 입/출력 장치와 다양한 객체(비디오, 오디오, 2D 그래픽 객체, 애니메이션 등)로 표현되는 Scene Description 사이에서 서로 정보를 주고받기 위한 매체이다. 따라서 다양한 입/출력 장치와 사용자 사이의 향상된 상호작용을 위해서는 AUI 데이터 형식이 공통적으로 정의되어야한다. 이를 위해 ISO/IEC JTC1/SC29/WG11 Moving Picture Experts Group(MPEG)에서는 XML(Extensible Markup Language) 문서로 AUI 데이터 포맷을 표준화하기 위한 MPEG-U 프로젝트를 진행 중이다. 본 논문에서는 MPEG-U의 표준을 소개하고, 이의 타당성을 검증하기 위해서 MPEG-U 참조 소프트웨어를 설계하였다. MPEG-U 참조 소프트웨어는 크게 UID(User Interaction Device)의 데이터를 처리하는 사용자 인터페이스 입/출력부와 XML 문서를 처리하는 MPEG-U XML 생성/해석부로 구성된다. 사용자 인터페이스 입력부에서는 사용자의 손동작을 인식하여 AUI 파라미터로 저장하고, 이 파라미터를 MPEG-U XML 생성부에서 MPEG-U 표준 XML 스키마 구조로 서술하여 표준화된 AUI 데이터 포맷을 생성한다. 다시 표준화된 XML 문서를 읽어 MPEG-U XML 해석부에서 파라미터를 얻고, 사용자 인터페이스 출력부에서 GUI(Graphic User Interface)에서 그래픽 객체로 표현한다. 본 연구에서는 MPEG-U 참조 소프트웨어로 MPEG-U의 용용 예를 제시하고, 구현된 소프트웨어가 표준에 적합한지를 보였다.

  • PDF

운동 및 근접 모델을 이용하는 관심맵의 향상 (Enhancement of Saliency Map Using Motion and Affinity Model)

  • 길종인;최창열;김만배
    • 방송공학회논문지
    • /
    • 제20권4호
    • /
    • pp.557-567
    • /
    • 2015
  • 정지영상에서 공간 관심맵을 생성하는 다양한 방법들이 소개되어 왔고, 최근에는 동영상의 운동정보를 활용하는 운동 관심맵 예측 기법이 활발히 연구되고 있다. 운동 관심맵은 운동정보 및 영역분할을 활용하고 있지만, 일반적인 영상에서는 만족스러운 데이터를 얻는 것은 어려움이 존재한다. 또한 우수한 관심맵을 얻기 위해서는 객체 운동, 카메라 운동 등의 운동유형 정보가 필요하기 때문에 다양한 자연영상을 대상으로 적용하면 성능 저하가 발생한다. 본 논문에서는 상기 언급한 문제점들을 극복할 수 있는 운동기반 관심맵 생성 방법을 제안한다. 공간 관심맵에 운동 정보를 결합하고, 운동 복잡도를 활용한다. 또한 근접 모델을 이용하여 주변 픽셀들의 관심도를 유사하게 함으로써, 동일 객체 또는 배경 영역이 유사한 값을 가지도록 한다. 실험에서는 다양한 동영상 데이터에 제안 방법을 적용하여 성능 검증을 수행하였다. 공간 관심도의 개선 여부를 증명하기 위해서 공간 관심맵 방법과의 객관적 성능 평가를 통해서 제안 방법이 공간 관심맵보다 운동 픽셀의 경우에 평균적으로 관심도 값이 +38 정도 향상되는 것을 보여준다. 또한 참조 데이터가 있는 4개의 동영상을 대상으로 얻은 ROC는 만족스러운 결과를 보여준다.

3D 변환을 위한 윈도우영상에서 사각 이미지 영역 검출 (Detecting Rectangular Image Regions in a Window Image for 3D Conversion)

  • 길종인;이준석;김만배
    • 방송공학회논문지
    • /
    • 제18권6호
    • /
    • pp.795-807
    • /
    • 2013
  • 최근 2D 영상을 3D로 변환하는 2D-to-3D 변환기술에 대한 관심이 높아지고 있다. 지금까지는 영화나 애니메이션 등의 자연영상을 3D변환하는 것에 초점이 맞추어져 있었다. 그러나 텍스트, 이미지, 로고, 아이콘등이 혼재 되어 있는 윈도우영상의 경우, 이러한 3D변환기술을 적용하는데 어려움이 있다. 특히 텍스트는 동일한 깊이를 얻지 못하면 깨짐, 흔들림 등의 문제가 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 먼저 자연영상과 윈도우영상의 분류를 수행하고 윈도우영상일 경우에 텍스트나 배경을 제외하고 이미지 영역만을 검출하는 방법을 제안한다. 검출된 영역에 대해서 3D변환을 각자 수행하고 나머지 영역은 변환하지 않음으로써 상기 문제점을 해결할 수 있다. 실험에서는 10,000장 이상의 실험영상을 테스트하였다. 실험결과로는 윈도우영상의 검출률이 97%을 얻었고, 윈도우영상의 영상영역의 검출률은 87%이다.

영상 적응형 무손실 이미지 압축 (Image-adaptive lossless image compression)

  • 오현종;원종우;장의선
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.61-64
    • /
    • 2003
  • 무손실 이미지 압축은 (Lossless Image Compression)은 손실이미지 압축(Lossy Image Compression)에 비해, 압축률(compression ratio)은 떨어지지만, 반면 원이미지와 복원이미지가 완전히 일치하므로, 원인이미지의 품질을 그대로 유지학 수 있다. 따라서, 이미지의 품질(Quality)과 압축효율(compression ratio)은 서로 상반된 관계에 있으며, 지금도 좀 더 놀은 압축효과를 얻으려는 여러 무손실 압축 방법이 발표되고 있다. 무손실 이미지 압축은 이미지의 정확성과 정밀성이 요구되는, 의료영양분야에서 가장 널리 쓰이고 있으며, 그밖에, 원본이미지를 기본으로 다른 이미지프로세싱이 필요한 경우, 압축 복원을 반복적으로 수행할 필요가 있을 때, 기타 사진 예술분야, 원격 영상 등 정밀성이 요구되는 분양에서 쓰이고 있다. [7]. 무손실 이미지 압축의 가장 대표적인 CALIC[3]과 JPEG_LS[2]를 들 수 있다. CALIC은 비교적 높은 압축률을 나타내지만, 3-PASS의 과정을 거치는 복잡도가 지적되고 있다. 반면 JPEG-LS는 압축률은 CALIC에 미치지 못하지만 빠른 코딩/디코딩 속도를 보인다. 본 논문에서는 여거 가지의 예측 모드를 두어, 블록단위별로 주변 CONTEXT에 따라, 최상의 예측 모드를 판단하여, 이를 적용, 픽셀의 여러 값을 최소화하였다. 그 후 적응산술 부호기(Adaptive arithmetc coder)를 이용하여, 인코딩을 하였다. 이때 최대 에러값은 64를 넘지 않게 했으며, 또한 8*8블록별로 에러의 최대값을 측정하여 그 값을 $0\~7$까지의 8개의 대표값으로 양자화하는 방법을 통하여 그에 따라 8개의 보호화 심볼 모델중 알맞은 모델에 적용하였다. 이를 통해, 그 소화값의 확률 구간을 대폭 넓힘으로써, 에러 이미지가 가지고 있는 엔트로피에 좀 근접하게 코딩을 할 수 있게 되었다. 이 방법은 실제로 Arithmetic Coder를 이용하는 다른 압축 방법에 그리고 적용할 수 있다. 실험 결과 압축효율은 JPEG-LS보다 약 $5\%$의 압축 성능 개선이 있었으며, CALIC과는 대등한 압축률을 보이며, 부호화/복호화 속도는 CALIC보다 우수한 것으로 나타났다.

  • PDF

단안 카메라를 이용한 입체영상 생성 (Generating a Stereoscopic Image from a Monoscopic Camera)

  • 이동우;이관욱;김만배
    • 방송공학회논문지
    • /
    • 제17권1호
    • /
    • pp.17-25
    • /
    • 2012
  • 본 논문에서는 단안 카메라를 이용하여 획득한 여러 장의 영상으로부터 입체영상을 제작하는 방법을 제안한다. 수평으로 이동하며 촬영한 N 장의 프레임 영상중에서 최적의 좌우 입체영상을 먼저 선택한다. 이를 위해 영상의 에지를 추출한 후 에지의 방향을 이용하여 두 영상의 에지각의 차이인 회전각을 구한다. 또한 영상 투영을 통해 두 영상의 상관관계를 구한 후, 이를 이용하여 이동벡터를 얻는다. 다음으로 최적의 입체영상 두 장을 선택한 후, 회전각 및 이동벡터를 이용하여 선택된 좌우영상을 보정한다. 총 32장의 실험영상데이터에 제안방법을 적용하였고, 입체영상의 품질을 검증하기 위해서 주관적 시각적 피로도 평가를 수행하였다. 피로도 측면에서는 84 %의 안정적인 입체감을 전달하는 것을 증명하였다.

저지연 영상 통신을 위한 화면 비트율 제어 기법 (Frame Bit-rate Control Method for Low Delay Video Communication)

  • 김은희;박민철;문주희;권재철
    • 방송공학회논문지
    • /
    • 제12권6호
    • /
    • pp.574-584
    • /
    • 2007
  • 멀티미디어 통신, 영상전화 등 실시간 멀티미디어 서비스가 대중화됨에 따라 동영상 데이터의 저지연 및 고품질 전송에 대한 요구가 중요해지고 있다. 동영상 압축 기술 중에서 비트율 제어 기법은 압축된 데이터의 효율적인 전송과 재생된 영상의 화질을 결정하는데 중요한 역할을 한다. 본 논문은 기존의 VBR과 CBR 부호화 방식을 결합하여 모든 화면의 비트발생량을 제한된 범위내로 제어하는 기술을 제안하여 모든 화면에 대해 부분적 장면 전환 검출을 수행하고 완벽한 VBR 전송이 보장되지 않는 환경에서 저지연 전송 및 고품질의 영상이 유지되게 하며 또한 순간 데이터 처리 속도의 부담도 완화할 수 있게 한다. 실험 결과, 제안한 알고리즘은 실시간 응용에 있어서 기존 TMN8알고리즘에 비해 더욱 효율적인 비트율 제어를 제공한다는 것을 볼 수 있다.