• 제목/요약/키워드: 행렬화 이미지

검색결과 32건 처리시간 0.027초

DCT를 이용한 CNN 모델의 압축방법 (Compression Method for CNN Models Using DCT)

  • 김승환;박은수;굴람 무즈타바;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.553-556
    • /
    • 2020
  • 최근 이미지 인식을 위한 Convolutional Neural Network(CNN) 모델의 경량화에 관한 연구가 활발하게 이루어지고 있다. 그중 양자화는 모델을 구성하는 가중치의 크기를 낮추는 방법이다. 기존의 CNN 모델에서 가장 큰 비중을 하는 Fully Connected Layer(FCL)는 내부적으로 32 Bit의 실수 행렬로 표현된다. 본 논문에서는 미리 학습된 실수 가중치를 더 작은 비트의 정수 행렬로 양자화한다. 양자화된 행렬에 대해서 영상 압축 등에서 사용하는 Discrete Cosine Transform(DCT)을 통해 주파수 영역으로 변환한 후 고주파 영역을 생략하는 손실압축 방법을 제안한다. 실험을 통해 그 과정에서 손실에 따른 정확도의 변화를 나타낸다.

  • PDF

특이값 분해를 이용한 다양한 이미지 변화에 강인한 정보 은닉 알고리즘 (Robust Algorithm using SVD for Data Hiding in the Color Image against Various Attacks)

  • 이동훈;허준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.28-30
    • /
    • 2011
  • 본 논문에서는 특이값 분해(Singular Value Decomposition)을 이용하여 이미지의 주파수 영역 내에 정보를 은닉하는 방법을 제시한다. 이미지를 주파수 영역으로 변환하기 위하여 블록 단위로 이산 코사인 변환(Discrete Cosine Transform)을 수행한다. 이후 인접한 네 블록의 DC 값들로 구성된 행렬의 특이값을 은닉하고자 하는 정보에 따라 변환한다. 원래의 DC 값은 정보에 따라 변환된 DC 값으로 대체되고 역 이산 코사인 변환(Inverse Discrete Cosine Transform)을 수행하여 정보가 은닉된 이미지를 얻는다. 제안하는 알고리즘의 성능을 분석하기 위해 JPEG(Joint Photographic Coding Experts Group), 선명화(Sharpening), 히스토그램 등화(Histogram Equalization)와 같이 다양한 이미지 변화를 거친 후, 은닉된 정보의 신뢰도를 비교한다.

  • PDF

구조화된 측정 행렬에 따른 블록 기반 압축 센싱 기법의 성능 비교 (Performance Comparison of Structured Measurement Matrix for Block-based Compressive Sensing Schemes)

  • 류중선;김진수
    • 한국정보통신학회논문지
    • /
    • 제20권8호
    • /
    • pp.1452-1459
    • /
    • 2016
  • 압축 센싱은 샤논/나이퀴스트 표본화 정리를 만족하는 나이퀴스트 율 보다 더 적은 수의 표본화 주파수로 신호를 획득하더라도 그 신호가 성긴 신호라는 조건 하에 샘플링을 가능하게 하는 신호 처리 기술이다. 일반적으로 측정 예측방식은 작은 블록 크기에서 성능이 좋은 반면에 복원 이미지 품질은 큰 블록으로 복원하는 것이 좋다. 이러한 두 개의 상충하는 속성을 해결하기 위해 압축 센싱은 작은 블록에서 행해지고, 복원은 큰 블록에서 수행하게 되는 구조화된 측정 행렬을 사용하며, 이러한 방법으로 예측과 복원 모두 동시에 개선을 추구한다. 본 논문에서는 구조화된 측정 행렬을 확장함으로써 블록 크기에 따른 다양한 방식이 비교되어진다. 다양한 실험 결과를 통해 $4{\times}4$ 하다마드 행렬을 이용한 구조화된 측정 행렬이 블록 크기가 4의 크기에서 가장 좋은 성능을 보여주었다.

Fast Jacket Transform의 VLSI 아키텍쳐 (VLSI Architecture of Fast Jacket Transform)

  • 유경주;홍선영;이문호;정진균
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.769-772
    • /
    • 2001
  • Waish-Hadamard Transform은 압축, 필터링, 코드 디자인 등 다양한 이미지처리 분야에 응용되어왔다. 이러한 Hadamard Transform을 기본으로 확장한 Jacket Transform은 행렬의 원소에 가중치를 부여함으로써 Weighted Hadamard Matrix라고 한다. Jacket Matrix의 cocyclic한 특성은 암호화, 정보이론, TCM 등 더욱 다양한 응용분야를 가질 수 있고, Space Time Code에서 대역효율, 전력면에서도 효율적인 특성을 나타낸다 [6],[7]. 본 논문에서는 Distributed Arithmetic(DA) 구조를 이용하여 Fast Jacket Transform(FJT)을 구현한다. Distributed Arithmetic은 ROM과 어큐뮬레이터를 이용하고, Jacket Watrix의 행렬을 분할하고 간략화하여 구현함으로써 하드웨어의 복잡도를 줄이고 기존의 시스톨릭한 구조보다 면적의 이득을 얻을 수 있다. 이 방법은 수학적으로 간단할 뿐 만 아니라 행렬의 곱의 형태를 단지 덧셈과 뺄셈의 형태로 나타냄으로써 하드웨어로 쉽게 구현할 수 있다. 이 구조는 입력데이타의 워드길이가 n일 때, O(2n)의 계산 복잡도를 가지므로 기존의 시스톨릭한 구조와 비교하여 더 적은 면적을 필요로 하고 FPGA로의 구현에도 적절하다.

  • PDF

실세계 객체의 디퓨즈 텍스쳐 획득에 관한 연구 (Study on the Diffuse Texture Acquisition of a Real Object)

  • 김강연;이재영;유재덕;이관행
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1222-1227
    • /
    • 2006
  • 본 연구의 목적은 객체의 형상정보(3D mesh)와 색/질감정보(image)를 이용하여 텍스쳐 맵핑된 고품질의 가상모델을 생성하는데 있다. 3 차원 형상정보에 대응하는 이미지 상의 텍스쳐 좌표 관계를 구하기 위해 오브젝트 좌표계와 카메라 좌표계 사이의 변환행렬, 카메라의 초점거리, 카메라 CCD 와 프레임상의 이미지 사이의 aspect ratio 를 파라미터로 하는 3D-2D 정합을 수행한다. 이러한 3D-2D 정합을 효율적으로 수행하기 위하여, 카메라 내부파라미터 검정단계, 신뢰도가 높은 초기해 설정단계, 비선형 최적화(Newton method) 단계로 접근한다. 또한, 색/질감정보로 이용되는 객체의 이미지는 촬영조건에 의해 스펙큘러(specular)나 이미지 픽셀값의 포화상태(saturation) 등의 결점을 포함한다. 영상내의 스펙큘러 좌표와 3D-2D 정합의 결과를 이용하여 촬영 당시의 광원을 추정하고, 근사화된 빛반사도 함수(BRDF)를 이용하여, 텍스쳐의 픽셀값 변조를 통해 이미지 촬영 당시의 광원효과가 제거된 디퓨즈 텍스쳐를 획득한다. 본 연구에서는 퐁(Phong)의 모델을 근사화한 빛 반사도 함수 모델로 사용하였다.

  • PDF

이산코사인변환 기반 이미지 압축 알고리즘에 관한 재구성 (Rebuilding of Image Compression Algorithm Based on the DCT (discrete cosine transform))

  • 남수태;진찬용
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.84-89
    • /
    • 2019
  • JPEG은 가장 널리 사용되는 이미지 압축 표준 기술이다. 본 논문에서는 JPEG 이미지 압축 알고리즘을 소개하고 압축 및 압축 해제의 각 단계를 서술하고자 한다. 이미지 압축은 디지털 이미지를 데이터 압축을 적용하는 과정이다. 이산코사인변환은 시간 도메인에서 주파수 도메인으로 변환하는 기술이다. 먼저, 이미지는 8 by 8 픽셀 블록으로 분할하게 된다. 둘째, 위에서 아래로 왼쪽에서 오른쪽으로 진행하면서 DCT가 각각의 블록에 적용하게 된다. 셋째, 각 블록은 양자화를 통해 압축을 진행한다. 넷째, 이미지를 구성하는 압축된 블록의 행렬은 크게 줄어든 공간에 저장된다. 끝으로, 원하는 경우 이미지는 역이산코사인변환(IDCT)을 사용하는 프로세스인 압축 해제를 통해 재구성하게 된다. 본 연구에서는 이산코사인변환 기법을 이용해 이미지 압축/복원 및 재구성하는 것에 목적을 두고 있다.

텍스쳐 분류 및 검출을 위한 강인한 특징이미지에 관한 연구 (A study on Robust Feature Image for Texture Classification and Detection)

  • 김영섭;안종영;김상범;허강인
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.133-138
    • /
    • 2010
  • 본 논문에서는 이미지에 대한 공간 특성(Spatial properties) 및 통계적 특성(Statistical properties)을 포함한 특징이미지를 구성하고, 지역 분산 크기를 이용한 공분산 행렬을 생성하여 텍스쳐 분류에 이용함으로서 조도(illumination) 및 노이즈(Noise) 그리고 회전(Rotation)에 강인한 텍스쳐 분류 방법을 제안한다. 또한 영역 합계의 빠른 연산을 위해 사용된 중간 이미지 표현인 적분 이미지(Integral Image)를 이용함으로서 텍스쳐 검출 프로세스의 수행 시간을 최소화 하는 방법을 제공한다. 제안한 방법의 성능 평가를 위해 브로다츠(Brodatz) 질감 이미지를 이용하여 잡음 추가 및 히스토그램 명세화 그리고 회전 이미지를 생성하여 실험하였으며, 96% 이상의 성능을 얻을 수 있었다.

과다 분리 및 사전 후처리 기법을 이용한 한글이 포함된 무제약 필기 문자열의 오프라인 인식 (Off-Line Recognition of Unconstrained Handwritten Korean Words using Over-Segementation and Lexicon Driven Post-Processing Techniques)

  • 정선화;김수형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.647-656
    • /
    • 1999
  • 본 논문에서는 오프라인 무제약 필기 한글 단어를 인식하기 위한 시스템을 제안한다. 제안된 단어 인식 시스템은 크게 다석가지 모듈-문자 분리,조합행렬생성, 특징 추출, 문자인식, 사전 후처리 -로 구성되어 있다. 문자 분리 모듈은 입력된 단어 영상을 하나의 문자보다 더 작은 이미지 조각으로 과다 분리하며 , 조합 행렬 생성모듈에서는 동적 프로그래밍 기법을 이용하여 분리된 이미지 조각들로부터 사전상의 모든 단어들과 대응되는 가능한 모든 조합을 생성한다. 문자인식모듈은 각 그룹에 대하여 일괄적으로 얻어진 특징과 유니그램을 이용하여 문자인식을 수행한다. 마지막으로 사전 후처리 모듈에서는 각 그룹에 대한 문자인식 결과와 단어 사전을 사용하여 입력단어에 대한 최종 인식 결과를 도출한다. 본 문에서 제안한 방법은 문자 분리, 문자 인식 및 후처리를 상호 보완적으로 결합함으로써 한글이 포함된 무제약 필기 문자열을 효과적으로 인식할 수 있다. 제안된 시스템의 성능을 평가하기 위하여 실제 우편 봉투 상에 쓰여진 필기 한글 단어 200개를 대상으로 실험을 하였다. 실험 결과 200개의 단어중 172개의 단어를 정인식하여 86%의 정확도를 얻을 수 있었으며 나머지 28개의 오인식된 단어들을 분석한 결과 대부분의 오류는 문자 인식기의 낮은 신뢰도 때문임을 알 수 있었다. 또한, 하나의 단어를 인식하기 위하여 약 2초가 소요되었다.

고성능 HEVC 복호기를 위한 효율적인 32×32 역변환기 설계 (The Efficient 32×32 Inverse Transform Design for High Performance HEVC Decoder)

  • 한금희;류광기
    • 한국정보통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.953-958
    • /
    • 2013
  • 본 논문에서는 고성능 HEVC 복호기를 위한 효율적인 $32{\times}32$ 역변환기 하드웨어 구조를 제안한다. HEVC는 4k, 8k 이미지와 같이 기존의 이미지코덱에 비해 훨씬 더 큰 크기의 이미지를 처리할 수 있는 새로운 영상 압축 표준이다. 큰 이미지의 데이터를 효과적으로 처리하기 위해 다양한 새 블록 구조를 채택하였으며, 이 블록들은 $4{\times}4$, $8{\times}8$, $16{\times}16$, $32{\times}32$으로 구성되었다. 이 논문에서는 $32{\times}32$ 역변환기의 효과적인 구조를 제안하며, 역변환기의 구조는 $32{\times}32$ 행렬을 $16{\times}16$ 행렬로 재구성하고 쉬프트와 덧셈기로 구성된 곱셈기를 사용하여 연산을 단순화 하였으며 멀티 사이클 패스를 구현하여 낮은 주파수에서도 동작이 가능하도록 설계하였다. 또한 HEVC 코덱의 다양한 크기의 변환이나 순방향 변환 블록에 쉽게 적용할 수 있다.

인공지능(AI) 모델을 사용한 차나무 잎의 병해 분류 (Tea Leaf Disease Classification Using Artificial Intelligence (AI) Models)

  • 피우미 사우미야 쿠마라테나;조영열
    • 생물환경조절학회지
    • /
    • 제33권1호
    • /
    • pp.1-11
    • /
    • 2024
  • 이 연구에서는 Inception V3, SqueezeNet(local), VGG-16, Painters 및 DeepLoc의 다섯 가지 인공지능(AI) 모델을 사용하여 차나무 잎의 병해를 분류하였다. 여덟 가지 이미지 카테고리를 사용하였는데, healthy, algal leaf spot, anthracnose, bird's eye spot, brown blight, gray blight, red leaf spot, and white spot였다. 이 연구에서 사용한 소프트웨어는 데이터 시각적 프로그래밍을 위한 파이썬 라이브러리로 작동하는 Orange3였다. 이는 데이터를 시각적으로 조작하여 분석하기 위한 워크플로를 생성하는 인터페이스를 통해 작동되었다. 각 AI 모델의 정확도로 최적의 AI 모델을 선택하였다. 모든 모델은 Adam 최적화, ReLU 활성화 함수, 은닉 레이어에 100개의 뉴런, 신경망의 최대 반복 횟수가 200회, 그리고 0.0001 정규화를 사용하여 훈련되었다. Orange3 기능을 확장하기 위해 새로운 이미지 분석 Add-on을 설치하였다. 훈련 모델에서는 이미지 가져오기(import image), 이미지 임베딩(image embedding), 신경망(neural network), 테스트 및 점수(test and score), 혼동 행렬(confusion matrix) 위젯이 사용되었으며, 예측에는 이미지 가져오기(import image), 이미지 임베딩(image embedding), 예측(prediction) 및 이미지 뷰어(image viewer) 위젯이 사용되었다. 다섯 AI 모델[Inception V3, SqueezeNet(로컬), VGG-16, Painters 및 DeepLoc]의 신경망 정밀도는 각각 0.807, 0.901, 0.780, 0.800 및 0.771이었다. 결론적으로 SqueezeNet(local) 모델이 차나무 잎 이미지를 사용하여 차병해 탐색을 위한 최적 AI 모델로 선택되었으며, 정확도와 혼동 행렬을 통해 뛰어난 성능을 보였다.