• 제목/요약/키워드: 미디어 내 이미지

검색결과 148건 처리시간 0.025초

DenseNet 기반의 이미지 압축 (DenseNet based Image Compression)

  • 박운성;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.272-275
    • /
    • 2018
  • 본 논문에서는 기존 신경망 기반의 이미지 압축에 많이 사용되었던 신경망인 ResNet 을 대신하여 더 적은 개수의 파라미터를 사용하여 좋은 성능을 낼 수 있는 신경망 구조인 DenseNet 을 이미지 압축에 사용한다. 이미지 압축을 위해 사용되는 신경망 구조는 일반적으로 오토 인코더 구조인데, 병목 층에서 정보 손실이 상당히 많이 발생한다. 따라서 이미지 압축에서 신경망 내에서의 정보 전달은 상당히 중요하다. 기존의 논문에서는 이를 위해 이전의 정보를 그대로 뒤로 전달해주는 구조인 ResNet 을 사용하여 깊은 층에 대해서도 수렴이 잘 되는 결과를 보여주었다. 그러나 많은 수의 파라미터를 사용하는 단점을 해결하기 위해 본 논문에서는 DenseNet 을 이미지 압축에 사용하였고, 병목 층에서의 정보 손실로 인해 이미지의 고주파수 성분이 사라지는 현상을 해결하기 위해 원래 이미지와 JPEG2000 으로 압축한 이미지와의 차이를 추가 입력으로 넣어주어서 주관적인 화질을 개선하였다.

  • PDF

MPEG-7 컬러 기술자를 활용한 캐릭터 이미지 데이터베이스 검색 (Character image database retrieval using MPEG-7 Color Descriptors)

  • 유광석;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.641-644
    • /
    • 2001
  • 멀티미디어 검색을 위한 MPEG-7 표준화 작업이 완료되어감에 따라, 멀티미디어 특징 기술자를 활용한 다양한 응용들이 나타나고 있다. 본 논문에서는 미키 마우스, 포켓 몬스터 또는 호돌이와 같은 지적 재산 정보인 동시에 고부가가치 대상인 캐릭터 이미지를 대상으로 하여, 캐릭터 이미지 특징을 분석하고, MPEG-7 에서 정의된 컬러 기술들간의 검색 효율을 비교하여, 캐릭터 이미지에 가장 적합한 기술자를 제안한다. 캐릭터 이미지는 자연 이미지와는 달리, 질감(Texture)이나 모양 (Shape)정보에 비해, 주로 컬러 정보에 의존하며,존재하는 컬러의 수가 3-6 개 범위 내에 주로 존재하고, 컬러의 분포가 고르며, 질감 성분이 많지 않은 특징을 갖고 있다. MPEG-7 에 정의된 Dominant Color, Scalable Color, Color Layout 및 Color Structure 4 종류의 기술자를 캐릭터 이미지 특징에 맞는 기술자를 유형별로 분류된 3,834개의 이미지 셋에 적용하여, 검색 성능 평가 지수인 ANMRR(Average Normalized Modified Retrieval Rank) 를 측정하여 가장 효율적인 기술자를 정의한다.

  • PDF

아이코닉 이미지 데이터베이스에서 순위부여를 지원하는 새로운 공간매치 표현기법 (A New Spatial-match Respresentation Scheme supporting Ranking in Iconic Image Database)

  • 김연중;장재우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권6호
    • /
    • pp.752-762
    • /
    • 1999
  • 멀티미디어 정보 검색 응용에 있어서 관련성 있는 멀티미디어 문서를 검색하기 위해 이미지에 대한 내용-본위 검색이 필수적이다. 이를위하여 본 논문에서는 이미지를 몇 개의 인식 가능한 심볼 즉, 아이콘으로 표현하고, 주어진 문서를 대표하는 값으로 받아들여 색인을 한다. 사용자가 이미지에 대한 내용-본위 검색을 요구하면 질의에 있는 이미지를 아이콘으로 변환한후, 접근 깁버을 통하여 원하는 이미지를 검색한다. 이를 위하여 본 논문에서는 방향관계 연산자와 위치관계 연산자를 합성하여 새로운 공간 매치 표현 기법을 제안한다. 제안하는 방법은 이미지 내의 아이콘들간의 관계성을 보다 정확하게 표현하며 순위 부여가 가능한 새로운 공간관계 표현기법이다. 아울러 본 연구에서 제안한 방법을 기존의 9DLT 방법 및 SMR 방법과 검색효율면에서 성능 비교를 수행한다. 마지막으로 성능 실험을 통하여 제안한방버이 기존의 9DLT 및 SMR 방법에 비해 정확률 측면에서 약 0.1 재현율 측면에서 약 0.2만큼 우수함을 보인다.

휘도 변화량 정보를 이용한 HDR 이미지 분할 기법을 통한 지역별 톤 매핑 기법 (Region-wise Tone Mapping Operator for Decomposed High Dynamic Range Image using Luminance Gradient Information)

  • 위승우;박대준;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.211-214
    • /
    • 2016
  • 본 논문에서는 하나의 넓은 동적 영역(High Dynamic Range: HDR)을 갖는 이미지를 Earth Mover's Distance(EMD)값을 이용한 이미지 분할 기법을 적용한 유사 지역 그룹화를 통해, 각 그룹별로 톤 매핑을 수행하는 기법을 제안하고자 한다. 기존의 EMD 값을 통한 이미지 분할 알고리듬은 이미지 내의 같은 그룹으로 분류된 지역에서 휘도(luminance)의 변화가 클 때 후광 현상(halo artifact)이 발생하는 문제점을 보였다. 본 논문에서는 기존의 알고리듬으로 분할된 이미지를 처리할 때 휘도 변화량(gradient)의 정보를 활용하여 후광 현상 제거함으로써 주관적 화질을 향상시켰다.

  • PDF

웨이블릿 혼합 모듈: 웨이블릿 변환을 이용한 네트워크 내 고주파 성분 보존 (Wavelet Mix Module: Preserving High-Frequency in Network using Wavelet Transform)

  • 김민우;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.231-234
    • /
    • 2022
  • 본 논문에서는 '스케치로부터 RGB 이미지로의 변환'을 수행하는 웨이블릿 기반의 네트웍에서 생성된 이미지 품질을 높이기 위해, 네트워크가 저주파수에 편향되어 학습이 되는 것을 완화하고자 Wavelet Mix Module(WMM)을 제안하였다. WMM 은 UNet 구조의 skip-connection 과정에 적용되며, 웨이블릿 변환을 사용하여 인코더 특성으로부터 세부값을 추출하여 디코더 특성으로 전달함으로써 네트워크 내에서 고주파 성분이 보존되도록 한다. WMM 이 적용된 네트워크로부터 생성된 이미지는 정량적 및 정성적인 결과가 개선됨을 실험을 통해 확인하였다.

  • PDF

특이값 분해를 이용한 다양한 이미지 변화에 강인한 정보 은닉 알고리즘 (Robust Algorithm using SVD for Data Hiding in the Color Image against Various Attacks)

  • 이동훈;허준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.28-30
    • /
    • 2011
  • 본 논문에서는 특이값 분해(Singular Value Decomposition)을 이용하여 이미지의 주파수 영역 내에 정보를 은닉하는 방법을 제시한다. 이미지를 주파수 영역으로 변환하기 위하여 블록 단위로 이산 코사인 변환(Discrete Cosine Transform)을 수행한다. 이후 인접한 네 블록의 DC 값들로 구성된 행렬의 특이값을 은닉하고자 하는 정보에 따라 변환한다. 원래의 DC 값은 정보에 따라 변환된 DC 값으로 대체되고 역 이산 코사인 변환(Inverse Discrete Cosine Transform)을 수행하여 정보가 은닉된 이미지를 얻는다. 제안하는 알고리즘의 성능을 분석하기 위해 JPEG(Joint Photographic Coding Experts Group), 선명화(Sharpening), 히스토그램 등화(Histogram Equalization)와 같이 다양한 이미지 변화를 거친 후, 은닉된 정보의 신뢰도를 비교한다.

  • PDF

종단간 인공신경망 기반 이미지 압축 기술의 피쳐 공간 상관관계 분석 (Correlation Analysis of Feature Space Data in End-to-end Image Compression Network)

  • 이주영;정세윤;최진수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.151-154
    • /
    • 2020
  • 뉴럴넷 기술이 발전과 힘께 다양한 분야에서 획기적인 성능 향상이 이루어지고 있다. 이미지 압축 분야에서도 기존의 전통적인 툴 제인 구조의 압축 방식에서 벗어나 종단간(end-to-end) 뉴렬넷 기반의 이미지 압축 기술에 대한 연구가 활발히 이루어지고 있다. 특히 최근 네트워크를 통해 변환된 피쳐 데이터의 엔트로피를 최소화하는 방식에 대한 연구가 활발히 이루어지고 있으며, 이에 기반한 최근의 연구는 VVC 화면 내 코딩 기술보다 우수한 코딩 효율성을 제공하고 있다. 그러나 변환된 피쳐 데이터에 대한 특성 분석은 부족한 실정이며, 이에 본 논문에서는 엔트로피 최소화 기반 종단간 이미지 압축 네트워크의 피쳐 공간 데이터에 대한 공간적 (spatial) 상관관계와 채널간(inter-channel) 상관관계(correlation)를 분석하고, 나아가 최근 제안된 종단간 이미지 압축 네트워크의 문맥 기반 예측 기능을 통해 잔존하는 데이터 중복성이 효과적으로 제거됨을 보인다.

  • PDF

순차주사 CCD 이미지 센서를 위한 개선된 경계적응적 칼라 보간 구조 (Improverd Edge-Adaptive Color Interpolation Scheme for Progressive Scan CCD Image Sensor)

  • 홍훈섭;허봉수;강문기
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2000년도 정기총회 및 학술대회
    • /
    • pp.81-86
    • /
    • 2000
  • 본 논문에서는 순차주사 CCD 이미지 센서를 위한 개선된 경계적응적 칼라 보간 구조를 제안했다. 제안된 경계 표시자(edge indicator) 함수는 채널내 상관관계뿐만 아니라 채널간의 상관관계를 이용하며 국소적으로 나타난 왜곡된 칼라는 칼라 경계 검출법에 기반한 스위칭 알고리즘에 의해 제거됐다. 개선된 경계적응적 칼라 보간 구조는 기존의 접근 방법에 비해 주관적 화질과 객관적 화질 모두 우수한 결과를 실험적으로 보였다.

  • PDF

이미지의 방향분포를 미용한 지문 분류 기법 (A Fingerprint Classification Technique using Directional Image Distribution)

  • 차정희;조형제
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.200-203
    • /
    • 2001
  • 정보 보안의 기수로 떠오른 지문인식 분야는 크게 분류와 인증 단계로 나뉜다. 본 논문은 지문의 분류에 대한 연구결과로, 효율적인 지문 분류를 위해 방향성 이미지로부터 일정 영역내 방향각의 분포도에 대한 분산을 이용한 새로운 지문 분류 알고리즘을 제안한다. 또한 구해진 분산을 토대로 특이점(코아. 델타) 가능 영역을 선정하고 선정된 영역에 대해 의사 특이점을 제거후 지문을 분류하고 마지막으로 실험을 통해 제안된 알고리즘을 검증하고 문제점을 검토해 본다.

  • PDF

이미지 복원을 위한 네트워크 파라미터의 동적 업데이트를 위한 기법

  • 김태현
    • 방송과미디어
    • /
    • 제25권2호
    • /
    • pp.27-35
    • /
    • 2020
  • 최근 많은 연구 결과물에서 빅데이터를 이용하여 학습된 뉴럴 네트워크가 영상 내 노이즈를 제거하는데 매우 효과적임이 입증되었다. 여기에서 한 걸음 더 나아가, 입력으로 주어진 노이즈가 있는 영상의 특징을 분석하여, 사전에 학습된 네트워크의 파라미터를 테스트 타임에 동적으로 업데이트함으로써 주어진 입력 영상을 더욱 잘 처리할 수 있도록 하는 연구들이 시도되고 있다. 본 원고에서는 이와 같이 테스트 타임에 주어지는 입력 영상을 네트워크 학습에 사용하는(self-supervision) 이미지 복원 기법들을 소개한다. 다음으로, 기존의 self-supervision을 이용하는 기법들 대비 학습 효율성과 정확도를 더욱 향상시킬 수 있는 새로운 형태의 네트워크 파라미터 업데이트 기법을 설명하고, 제안하는 기법의 우수성을 다양한 실험 결과를 통해 분석 및 입증한다.