• 제목/요약/키워드: 미디어 내 이미지

검색결과 148건 처리시간 0.027초

McMaster Dataset을 위한 색상 보간 알고리듬 (Color Filter Array Interpolation Algorithm for McMaster Dataset)

  • 박범준;이경준;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.121-124
    • /
    • 2015
  • 본 논문은 Multiscale Gradients (MSG)를 기반으로 한 Color Filter Array Interpolation을 배경으로 Kodak Dataset보다 실제 디지털 카메라로 촬영한 이미지에 가까운 McMaster Dataset에서 개선된 성능을 내는 알고리듬을 제안한다. MSG는 녹색 채널 보간, 녹색 채널 갱신, 빨간색, 파란색 채널 보간의 과정을 거친다. 이때 높은 스펙트럼 상관관계, 낮은 색채도, 낮은 색 경사도를 가진 Kodak Dataset과 달리 자연 이미지에서는 녹색 채널 갱신 과정의 추정방법을 사용하면 화질 및 Color Peak Signal to Noise Ratio (CPSNR)이 저하되는 것을 확인하였다. 이러한 실험결과를 바탕으로 개선된 필터와 색상 보간 과정을 통해 기존의 알고리듬에 비해 향상된 성능을 보여주는 알고리듬을 제안한다.

  • PDF

픽셀, 채널간 불필요한 상호연관 정보를 제거하는 초해상화 딥러닝 기법 (Development of Technique in Super Resolution domain that eliminates unnecessary Correlation information between Pixels & Channels.)

  • 강정흠;배성호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.656-659
    • /
    • 2020
  • 초해상화 딥러닝 기법은 학습 시 수렴하기까지 최소 수백 번의 에폭을 필요로 하며 오랜 시간이 걸린다. 최근, 영상 인식용 딥러닝 모델에서는 학습 수렴 속도를 향상시키기 위해 픽셀, 채널간 불필요한 상호연관 정보를 제거하는 Deconvolution 기술이 제안되었다. 본 논문에서는 최초로 Deconvolution 기술을 초해상화 딥러닝 방법에 적용하여 학습 수렴 속도 증가를 시도했다. 영상 인식 딥러닝 기법과 다르게 초해상화 딥러닝 기법은 이미지 특성 추출 부분과 이미지 복원 부분의 정보를 보존하는 것이 중요하기 때문에, EDSR을 Baseline 모델로 사용하여 양쪽 끝의 레이어는 기존의 Convolution 연산을 그대로 유지하고, 중간 레이어의 ResBlock 내의 Convolution 연산만 Deconvolution 연산으로 바꿔서 구성하였다. 초해상화 벤치마크 데이터셋을 사용한 실험 결과, 수렴속도가 빨라지지 않는 결과를 도출했다. 본 논문에서는 Deconvolution 기술이 Baseline 모델의 성능을 개선하지 못하는 이유를 초해상화 분야에서 기본적으로 적용되는 Residual Learning 기법 때문으로 분석했다.

  • PDF

SRCNN 을 이용한 HEVC 화면 내 예측 부호화 (HEVC Intra prediction using SRCNN)

  • 김남욱;강정원;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.110-112
    • /
    • 2017
  • 본 논문에서는 최신의 비디오 코덱 표준인 HEVC(High Efficiency Video Coding)의 화면 내 예측 부호화의 성능 향상을 위하여 SRCNN(Super Resolution Convolutional Neural Networks)을 이용하는 방법을 제안한다. SRCNN 은 비교적 최신 기술인 CNN(Convolutional Neural Network)을 사용하여 이미지를 추가적인 데이터 없이 보간 하여 해상도를 증가시키는 기술이다. HEVC 에서는 화면 내 예측의 잔차신호를 부호화 하기 위해 많은 비트를 소모하는데, 본 논문에서는 이 잔차신호들의 해상도를 낮추어 부호화 되는 비트를 줄이며, 복호화기에서 SRCNN 을 이용하여 원래의 해상도로 복원을 수행하여 압축성능을 향상 시키는 방법에 대하여 제안한다. 제안하는 기술은 HM 16.6 에 구현하였으며, CNN 트레이닝에 Caffe 라이브러리를 사용하였다.

  • PDF

4S-Van 카메라 데이터를 이용한 비디오 지리정보 서비스 (Video Geographical Information Services using 4S-Van Camera Data)

  • 김성수;김경호;이종훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1811-1814
    • /
    • 2002
  • 본 논문에서는 3차원 데이터베이스와 4S-Van 에서 획득된 GPS 관련 데이터를 이용하여 사용자에게 비디오내의 지리 객체들의 정보를 제공해 줄 수 있는 미디어 GIS 시스템 구조로 제안한다. 비디오내의 지리객체에 대한 지리정보 서비스를 위해 실세계 비디오와 3차원 그래픽 세계를 매핑할 수 있는 가상 세계 매핑(VWM; Virtual World Mapping) 이라는 새로운 상호 운용적인 지리데이터 서비스 개념을 소개한다. 제안한 기법은 임의의 비디오 프레임에 대한 3차원 가상공간을 재구성하여 지리정보 및 소성정보를 쉽게 검색해 낼 수 있다. 또한, 2차원, 3차원, 미디어 데이터간의 상호연계 및 운용기능을 제공함으로써 기존의 지리정보시스템 분야의 새로운 패러다임을 제시한다. 가상 세계 매핑기법은 기존의 비디오에서 얻어진 이미지에 대한 별도의 이미지 프로세싱 과정 없이 지리정보를 서비스 할 수 있다는 장점을 가진다. 제안된 방법을 이용하여 비디오 영상을 스트리밍하면서 클라이언트가 지리 정보서비스 받을 수 있는 GeoVideo 서버 및 웹을 통해 서비스를 제공하는 GeoVideo 클라이언트 시스템을 구현하였다.

  • PDF

XAI 기반의 공공시설물 건전도 안전검사 평가시스템 연구 (XAI based public facility safety evaluation system research)

  • 박예슬;경선재;김민준;오찬미;이재성;이재환;이현승;이철희;문현준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.705-708
    • /
    • 2020
  • 공공시설에 대한 안전점검은 공공시설의 노후화에 따라 정기적인 검사의 필요성이 요구되고 있다. 기존의 안전점검 방식은 대부분 육안으로 점검하는 것에 의존하는데 이는 점검자의 숙련도에 따라 결과의 품질이 달라지게 된다. 본 논문에서는 XAI 기반의 공공시설물 건전도 안전검사 평가시스템을 제안하며, 이는 점검자의 숙련도와 무관하게 항상 같은 결과를 도출해 내며 XAI 를 통해 사용자에게 안전점검에 대한 결과를 제시해준다. 공공시설물 중 터널 시설물의 안전검사 평가시스템을 기반으로 하는 연구를 진행하였으며 이는 수정없이 교량 시설물 등 다른 공공시설물에 적용이 가능하다. 본 논문은 5 가지로 구분된다. 1) 터널 이미지와 균열에 마스크를 적용한 이미지 두 가지의 데이터 셋을 448x448 로 생성한다. 2) UNet 과 Resnet152 의 두 모델을 적용한 혼합 모델을 이용하여 생성한 데이터 셋을 훈련시킨다. 3) 훈련된 혼합 모델에서 생성된 분할 이미지에 대해 노이즈 제거 과정을 진행한다. 4) 노이즈 제거가 끝난 이미지에 스켈레톤화(Skeletonization)를 적용시켜 균열 이미지의 뼈대를 구한다. 뼈대 이미지 기반으로 균열의 길이, 두께, 위치등의 정보를 얻는다. 5) XAI 부분에서는 뼈대 이미지의 정보를 토대로 균열의 위치, 두께, 길이 등에 대해 계산을 진행한 후 사용자에게 제시해준다.

  • PDF

사용자 친화적인 시각 비밀 분산 방법 (User Friendly Visual Secret Sharing Scheme)

  • 윤은준;이길제;유기영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권5호
    • /
    • pp.472-476
    • /
    • 2008
  • 본 논문에서는 이진 이미지 기반의 간단하고 사용자 친화적인 (n,n) 시각 비밀 분산 방법을 제안한다. 제안한 방법은 간단한 XOR 연산과 NOT 연산만을 이용하여 사용자 친화적인 이미지들 내에 숨기고자 하는 비밀 이미지 정보를 분산해서 숨기는 기법으로, 효율적인 숨김(em-bedding)과 복원(reconstruction) 알고리즘 제공, 비밀 이미지의 손실없는 완벽한 복원 기능 제공, 사용자 친화적인 의미있는 이미지들을 공유함으로써 자신이 속해있는 그룹을 쉽게 구분할 수 있는 기능 제공, 그리고 기존의 방법과 달리 원본 커버 이미지와 같은 크기의 비밀 이미지를 공유할 수 있는 등의 시각 비밀 분산 방법이 갖추어야하는 많은 장점들을 가진다.

제품검색광고 내 제품 이미지 위치와 판매 단위 유형이 광고효과에 미치는 영향에 대한 연구 (The Effects of Product Image Locations and Product Type on Responses to Search Engine Advertising)

  • 이성미
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.397-404
    • /
    • 2021
  • 본 연구는 관여도가 상대적으로 낮은 기능적 가치를 추구하는 제품의 검색광고를 평가할 때, 제품 이미지의 위치와 판매단위유형 간의 일치성에 따라 광고효과가 달라질 수 있다고 보았다. 이에 본 연구의 목적은 제품검색광고에 나타나는 제품 이미지의 위치(왼쪽 vs. 오른쪽)와 판매단위(낱개 vs. 묶음)가 광고태도, 브랜드태도, 그리고 구매의향에 미치는 영향을 탐색하는데 있다. 연구가설을 검증하기 위해 144명의 참가자를 대상으로 2×2 요인설계로 실험을 진행하였는데 독립 변인으로서 제품검색광고 내 제품 이미지의 위치, 제품 판매단위 두 가지 변인을 설정하였고, 종속변인으로 광고태도, 브랜드 태도, 구매의향을 측정하였다. 본 연구 결과는 제품 이미지의 위치와 판매단위의 상호작용 효과가 브랜드 태도, 구매의향에 미치는 것으로 나타났는데 묶음 단위의 제품 광고에서 오른쪽에 제품 이미지가 위치할 때 브랜드 태도와 구매의향이 높아졌다. 본 논문의 결과를 기반으로 학문적 시사점과 향후 쇼핑 플랫폼, 온라인 스토어 등에 관심있는 실무자에게 유용한 시사점을 제공하여 후속연구에 대한 방향성을 제시하고 있다.

모폴로지를 이용한 문서 영상내의 특징영역 추출

  • 이상협;이경무
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1996년도 학술대회
    • /
    • pp.67-75
    • /
    • 1996
  • 컴퓨터를 이용한 문서정보의 처리를 위해서는 기본적으로 문서영상내의 각 특징영역을 분리하는 것이 필수적이다. 본 논문에서는 노이즈가 존재하는 non-manhattan layout 이치 문서영상내의 halftone 이미지, 선 및 텍스트 등의 중요한 특징영역들을 자동으로 구분 추출하는 효과적인 알고리즘을 제안한다. 제안한 알고리즘의 기본적인 아이디어는 먼저 처리속도의 고속화를 위하여 원본 영상을 축소시키는 것이 필수적인 바, 축소 시 노이즈의 제거와 동시에 축소된 영상 내에서 원하는 영역의 특징들이 잘 나타나도록 하는 임계치 축소기법을 제안 사용하여 축소영상을 만든 다음, 축소영상에 다양한 모폴로지 필터를 적용함으로써 각 알고리즘의 성능을 이용한 노이즈 문서영상을 이용한 시뮬레이션을 통하여 보인다.

  • PDF

AR을 이용한 타투 시뮬레이션 (Tattoo Simulation Using AR)

  • 한채윤;김유진;박태정
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.294-296
    • /
    • 2021
  • 본 논문에서는 타투 한 모습을 AR을 통해 미리 육안으로 확인할 수 있도록 하는 기술적인 방법을 제공함으로써 타투 시술을 실제로 시행하기 전 개인별로 선택을 지원하는 기술을 제안한다. 이러한 목표를 달성하기 위해 Unity Vuforia Engine을 이용하여 서버에서 미리 제공하는 타투 도안 혹은 사용자가 원하는 타투 도안을 AR로 신체에 적용할 수 있도록 지원한다. 제안하는 기술에서는 AR로 인한 시각적인 이질감을 줄이기 위해서 Region Capture를 이용하여 타겟 이미지를 주변 피부와 이질감을 감소시키고 그 위에 타투 AR을 사용자 신체 굴곡에 맞춰 적용하는 방법을 제안한다. 또한 AR로 확인한 타투를 사진이나 동영상으로 촬영하여 앱 내 갤러리에서 확인할 수 있고 앱 내 커뮤니티를 통해 타투에 관심있는 사람이라면 타투에 관한 자유로운 소통을 할 수 있도록 지원하는 온라인 기술을 구현하였다.

  • PDF

버추얼 인플루언서 릴 미켈라의 소셜미디어에 반영된 패션의 의미 (The Meanings of Fashion on the Social Media of Virtual Influencer Lil Miquela)

  • 이세리
    • 디지털융복합연구
    • /
    • 제19권9호
    • /
    • pp.323-333
    • /
    • 2021
  • 2016년 소셜미디어에 등장한 릴 미켈라는 오늘날 점차 주목받는 버추얼 인플루언서들 중 가장 알려진 존재이다. 특히 미켈라는 인스타그램을 통해 많은 패션 브랜드들과 실제적 협업을 이어가면서 사회에 큰 영향을 미치고 있다. 본 연구는 오늘날 버추얼 인플루언서들의 활약이 부각되고 있는 만큼 미켈라의 소셜미디어 사례 탐색을 통해 현대 패션이 지향하는 의미를 도출하고자 하는 목적을 갖는다. 이를 위하여 미켈라의 인스타그램 내 스틸컷 이미지, 비디오 이미지, 미켈라의 설명, 댓글 등을 연구대상으로 삼아 분석하였다. 이상의 분석을 시도한 결과 미켈라의 소셜미디어에 나타난 패션을 표현하는 방식 및 장치는 스토리텔링, 리얼리티, 태그와 하이퍼링크 등 세 가지로 구분이 가능하였다. 또한 경험의 대상, 테크놀로지의 지향, 시대정신의 구현 등의 세 가지 측면에서 패션이 갖는 의미를 도출할 수 있었다. 소셜미디어에서 등장한 이후 점차 더 영역을 확장해가고 있는 미켈라는 패션을 통해 정체성을 구축한 버추얼 패션 인플루언서이며 앞으로 패션에 보다 더 새로운 의미를 부여할 것으로 기대된다.