통합 검색 | Korea Science

신경망 이미지 부호화 모델과 초해상화 모델의 합동훈련 (Joint Training of Neural Image Compression and Super Resolution Model)

조현동;김영웅;차준영;김동현;임성창;김휘용
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.1191-1194
- /
- 2022
인터넷의 발전으로 수많은 이미지와 비디오를 손쉽게 이용할 수 있게 되었다. 이미지와 비디오 데이터의 양이 기하급수적으로 증가함에 따라, JPEG, HEVC, VVC 등 이미지와 비디오를 효율적으로 저장하기 위한 부호화 기술들이 등장했다. 최근에는 인공신경망을 활용한 학습 기반 모델이 발전함에 따라, 이를 활용한 이미지 및 비디오 압축 기술에 관한 연구가 빠르게 진행되고 있다. NNIC (Neural Network based Image Coding)는 이러한 학습 가능한 인공신경망 기반 이미지 부호화 기술을 의미한다. 본 논문에서는 NNIC 모델과 인공신경망 기반의 초해상화(Super Resolution) 모델을 합동훈련하여 기존 NNIC 모델보다 더 높은 성능을 보일 수 있는 방법을 제시한다. 먼저 NNIC 인코더(Encoder)에 이미지를 입력하기 전 다운 스케일링(Down Scaling)으로 쌍삼차보간법을 사용하여 이미지의 화소를 줄인 후 부호화(Encoding)한다. NNIC 디코더(Decoder)를 통해 부호화된 이미지를 복호화(Decoding)하고 업 스케일링으로 초해상화를 통해 복호화된 이미지를 원본 이미지로 복원한다. 이때 NNIC 모델과 초해상화 모델을 합동훈련한다. 결과적으로 낮은 비트량에서 더 높은 성능을 볼 수 있는 가능성을 보았다. 또한 합동훈련을 함으로써 전체 성능의 향상을 보아 학습 시간을 늘리고, 압축 잡음을 위한 초해상화 모델을 사용한다면 기존의 NNIC 보다 나은 성능을 보일 수 있는 가능성을 시사한다.
PDF

MSER을 이용한 문서 이미지 이진화 기법 (Document Image Binarization Technique using MSER)

유영중
- 한국정보통신학회논문지
- /
- 제18권8호
- /
- pp.1941-1947
- /
- 2014
문서 이미지의 이진화는 문서 인식의 이전 단계에서 주로 사용되며, 이진화의 성공 여부에 따라 문서 인식의 결과에 영향을 미치는 중요한 단계로 볼 수 있다. 지금까지 문서 이미지를 이진화 하기 위한 다양한 기법들이 연구되었지만, 문서 이미지의 상태에 따라 그 결과는 다양하다. 본 논문에서는 객체 추출에 많이 이용되는 MSER(Maximally Stable Extremal Region)을 이용하여 문서 이미지를 이진화하는 기법을 제안한다. 먼저 문서 이미지에서 MSER 객체를 추출한다. 추출된 MSER 객체는 그 자체로 문서 이미지 이진화에 사용되기는 어렵기 때문에 사용하기 적합한 형태로 변경되는 과정을 거친다. 그리고 최종 MSER 객체와 문서 이미지로부터 추출한 대비 이진 이미지를 이용하여 최종 이진 이미지를 계산한다. 실험결과는 본 논문에서 제안한 방법이 문서 이미지의 이진화에 유용함을 보여준다.
https://doi.org/10.6109/jkiice.2014.18.8.1941 인용 PDF KSCI

인체 가슴 부위의 구조물의 3D 표면 모형 재구성 (A Study on 3D Surface Reconstruction for the Breast of Human Body)

이상태;전현진;김기태;최기석;주원균
- 한국감성과학회:학술대회논문집
- /
- 한국감성과학회 2009년도 추계학술대회
- /
- pp.99-102
- /
- 2009
본 연구에서는 실제 기증받은 시체를 이용하여 인체의 각 구조물을 실제 모습 그대로 3D 이미지화하는 과정에 대해 알아보았다. 인체의 구조물을 3D 로 이미지화하는 과정은 다음과 같다. 먼저 시체를 0.2mm 간격으로 절단하여 절단면의 사진을 찍은 후, 각 절단면의 사진에서 각각의 구조물을 구역화하여 색칠을 한 후, 구역화한 이미지에서 외곽선을 추출하여 벡터 이미지를 만든다. 이 외곽선을 1mm 간격으로 쌓아 올린 후 그 표면을 재구성하여 3D 이미지로 변환하는 과정으로 진행되었다. 3D 이미지의 제작은 가슴 부위에 한정하여 이루어졌다. 인체의 해부학적인 모형을 3D 이미지로 시각화함으로써 얻는 효과는 일반인을 대상으로 인체의 내부에 대한 시각적인 호기심을 충족시켜주고 의학 상식을 넓히는데 도움을 줄 수 있을 것 이다. 또한 의대생들을 비롯한 의학 전문가들에게는 생생한 해부학 강의용으로도 활용 가능하다. 향후 Haptic 시스템을 이용한 의료 실습 어플리케이션과 접목될 수도 있을것이고, fMRI 데이터를 비롯한 타 데이터와의 융합을 통해 시각화하여 서비스 할 수도 있다. 이처럼 인체의 3D 모형은 의료분야에서 광범위하게 활용될 수 있는 데이터로써 그 가치를 지닐 것이다.
PDF

특이치 분해와 Fuzzy C-Mean(FCM) 군집화를 이용한 벡터양자화에 기반한 워터마킹 방법 (An Watermarking Method based on Singular Vector Decomposition and Vector Quantization using Fuzzy C-Mean Clustering)

이병희;장우석;강환일
- 한국지능시스템학회:학술대회논문집
- /
- 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
- /
- pp.267-271
- /
- 2007
본 논문은 원본이미지와 은닉이미지의 좋은 압축률과 만족할만한 이미지의 질, 그리고 외부공격에 강인한 이미지은닉의 한 방법으로 특이치 분해와 퍼지 군집화를 이용한 벡터양자화를 이용한 워터마킹 방법을 소개하였다. 실험에서는 은닉된 이미지의 비가시성과 외부공격에 대한 강인성을 증명하였다.
PDF

스케일링-불변 윤곽선 이미지 매칭의 시각화 도구 (Visualization Tool for Scaling-Invariant Boundary Image Matching)

문성우;이상훈;김범수;문양세
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2015년도 춘계학술발표대회
- /
- pp.683-686
- /
- 2015
본 논문에서는 스케일링-불변 윤곽선 이미지 매칭의 시각화 도구를 제안한다. 윤곽선 이미지를 시계열로 나타낼 경우, 시계열 매칭 기술을 활용하여 대용량 윤곽선 이미지 매칭을 보다 빠르게 수행할 수 있다. 이러한 윤곽선 이미지 매칭에서, 스케일링 불변의 지원은 스케일된 유사 이미지를 검색하기 위한 중요한 요소이다. 본 논문에서는 스케일링-불변 윤곽선 이미지 매칭 시스템을 클라이언트-서버 모델을 기반으로 구현한다. 먼저, 클라이언트는 질의 이미지를 시계열로 변환하고, 스케일링 팩터 구간 및 허용치와 함께 서버에 전달하고, 매칭 결과로 반환된 이미지를 차트 형태로 시각화한다. 다음으로 서버는 다차원 인덱스를 활용하여 대용량 윤곽선 시계열 데이터에 대한 빠른 시계열 매칭을 수행한다. 구현 결과, 제안하는 윤곽선 이미지 매칭 시각화 도구는 질의 이미지와 스케일링-불변 결과 이미지를 세 가지의 차트를 통해 직관적으로 비교 및 분석 가능하게 하였다.
https://doi.org/10.3745/PKIPS.y2015m04a.683 인용 PDF

관심 영역을 고려한 색 양자화 방법 (Color Quantization Scheme Considering Interesting Area of Image)

백두원;임헌규;이지수;강정구
- 한국컴퓨터정보학회논문지
- /
- 제12권6호
- /
- pp.161-165
- /
- 2007
색 양자화는 많은 수의 색으로 표현된 이미지를 최대한 유사하게 표현 할 수 있는 더 적은 수의 대표색을 찾는 문제이다. 색 양자화를 할 때, 원본 이미지의 어느 색을 보존시킬지를 결정하는 것은 결과 이미지의 품질과 직결된 중요한 문제이다. 본 연구에서는 일반적으로 이미지는 관심 영역과 비 관심영역으로 구분된다는 점에 착안하여 이미지에서 관심 영역의 색을 더 많이 보존시키는 양자화 방법을 제안한다. 본 연구에서는 이미지의 관심 영역에 대한 정보를 특정 주파수 대역의 범위로 입력받아 해당주파수 대역에 포함되는 부분을 이미지 공간에서 찾는 과정과 찾아낸 영역의 색을 더 많이 보존시켜 대표색을 구하는 과정으로 구성되는 색 양자화 방법을 제시한다. 관심 영역을 찾는 방법의 정확도를 실험을 통해 평가하였으며 본 논문이 제시하는 컬러 양자화 기법의 품질을 다른 방법의 품질과 비교하여 평가하였다.
PDF

문제 해결 과정에서 나타나는 수학적 시각화의 구성 요소 및 활용에 관한 분석 (Analysis on Factors and the Application of Mathematical Visualization in Problem Solving Process)

주홍연;권혁진
- 대한수학교육학회지:학교수학
- /
- 제14권1호
- /
- pp.1-28
- /
- 2012
본 연구는 30명의 고등학교 2학년 학생들을 통해서 수학적 시각화의 구성 요소를 알아보고, 시각화 구성 요소들이 수학 문제 해결 과정에서 어떻게 활용되는지를 알아보는 것이다. 특히, 30명의 학생들 중 시각성 평가가 높은 5명의 학생들에 대해서 질적 사례 연구를 실시하였다. 분석 결과를 보면, 시각화의 구성 요소는 크게 정신적 이미지, 외적 표상, 이미지의 변형 및 조작, 공간 시각화 능력으로 범주화 (Guti$\acute{e}$rrez, 1996) 되었고, 각 요소마다 더 세분화되어져 나타났다. 또한, 수학 문제 해결 과정에서 시각화 요소들은 외적 표상을 생성하기 전에 기본적으로 정신적 이미지를 생성하고 있었고, 정형화된 정신적 이미지의 경우 문제 해결에 대한 학생들의 풍부한 사고를 억제하고 문제에 대한 부적절한 풀이 결과를 이끌어낼 수 있는 부정적인 영향을 주었다. 차원 변화에 의해서 이루어지는 이미지 변형 및 조작을 어려워하는 학생들이 있었으나, 문제 해결 과정에서 답을 추론하기 위한 이미지 탐색 활동과 도출된 답의 정당화를 위해서 이미지 조작 활동을 활용하고 있었다.
PDF

이미지의 색채 감성속성을 이용한 대표감성크기 정량화 알고리즘 (Represented by the Color Image Emotion Emotional Attributes of Size, Quantification Algorithm)

이연란
- 만화애니메이션 연구
- /
- 통권39호
- /
- pp.393-412
- /
- 2015
사람의 이미지를 보고 느끼는 감성인식은 환경, 개인적 성향에 따라 다양하게 변화한다. 그리하여 이미지 감성인식을 숫자로 제어하려는 감성컴퓨터 연구에 집중되고 있다. 그렇지만 기존의 감성컴퓨팅 모형은 숫자화된 객관적이고, 명확한 측정이 미흡한 상황이다. 따라서 이미지 감성인식을 감성컴퓨팅을 통해 정량화하고, 객관적인 평가 방식의 연구가 필요한 상황이다. 이에 본 논문은 이미지 감성인식을 계산 방식에 따라 숫자화한 정량화로 감성크기를 표현했다. 그리하여 이미지 감성인식의 주요한 속성인 색채를 구성인자로 적용한다. 또한 디지털 색채 감성컴퓨팅을 적용하여 계산하는데 연구의 중점을 두었다. 이미지 색채 감성컴퓨팅 연구방식은 감성속성인 색상, 명도, 채도에 중요도에 따른 가중치를 감성점수에 반영한다. 그리고 감성점수를 이미지 감성계산식에 적용하여 쾌정도(X축), 긴장도(Y축)를 숫자 방식으로 계산한다. 거기에 쾌정도(X축), 긴장도(Y축)의 교차하는 위치점을 이미지 감성좌표의 감성점으로 위치한다. 이미지 색채 감성좌표는 러셀의 핵심 효과(Core Affect)를 적용하여 16가지 주요대표감성을 기반으로 한다. 이미지 감성점은 기준의 위치에서 대표감성크기와 감성상관관계를 숫자화하고, 이미지 감성을 정량화한다. 그리하여 이미지 감성인식은 숫자 크기로 비교한다. 감성점수의 대소에 따라 감성이 변화함을 증명한다. 비교 방식은 이미지 감성인식을 16개 대표감성과 연관된 감성의 상위 5위로 구분하고, 집중된 대표감성크기를 비교 분석한다. 향후 감성컴퓨팅 방식이 사람의 감성인식과 더 유사할 수 있도록 감성계산식의 연구가 필요하다.
https://doi.org/10.7230/KOSCAS.2015.39.393 인용 PDF KSCI

대형 이미지 데이터셋 구축을 위한 이미지 이진화 기반 데이터 증강 기법 (Data augmentation technique based on image binarization for constructing large-scale datasets)

이주혁;김미희
- 전기전자학회논문지
- /
- 제27권1호
- /
- pp.59-64
- /
- 2023
딥러닝은 다양한 컴퓨터 비전 문제를 해결할 수 있지만, 대량의 데이터셋이 필요하다. 본 논문에서는 대형 이미지 데이터셋을 구축하기 위해 이미지 이진화 기반 데이터 증강 기법을 제안한다. 이미지 이진화를 사용하여 특성을 추출하고 추출된 나머지 픽셀을 랜덤하게 배치하여 새로운 이미지를 생성한다. 생성된 이미지는 원본 이미지와 유사한 품질을 보여주며, 딥러닝 모델에서도 뛰어난 성능을 보였다.
https://doi.org/10.7471/ikeee.2023.27.1.59 인용 PDF

텍스트 인식률 개선을 위한 한글 및 영어 텍스트 이미지 초해상화 (Korean and English Text Image Super-Resolution for Improving Text Recognition Accuracy)

권준형;조남익
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 추계학술대회
- /
- pp.72-75
- /
- 2022
야외 환경을 카메라로 촬영한 일반 영상에서 텍스트 이미지를 검출하고 인식하는 기술은 로봇 비전, 시각 보조 등의 기반이 되는 기술로 활용될 수 있어 매우 중요한 기술이다. 하지만 저해상도의 텍스트 이미지의 경우 텍스트 이미지에 포함된 노이즈나블러 등이 더 두드러지기 때문에 텍스트 내용을 인식하는 것이 어렵다. 이에 본 논문은 일반 영상에서의 저해상도 한글 및 영어 텍스트에 대한 이미지 초해상화를 통해 텍스트 인식 정확도를 개선하였다. 트랜스포머에 기반한 모델로 한글 및 영어 텍스트에 대한 이미지 초해상화를 수행하였으며, 영어 및 한글 데이터셋에 대해 제안한 초해상화 방법을 적용했을 때 그렇지 않을 때보다 텍스트 인식 성능이 개선되는 것을 확인하였다.
PDF

검색결과 2,387건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)