통합 검색 | Korea Science

이미지 캡션 생성을 위한 심층 신경망 모델 학습과 전이 (Learning and Transferring Deep Neural Network Models for Image Caption Generation)

김동하;김인철
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2016년도 추계학술발표대회
- /
- pp.617-620
- /
- 2016
본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하고, 컨볼루션 신경망 층의 출력을 임베딩 층뿐만 아니라 멀티 모달 층에도 연결함으로써, 캡션 문장 생성을 위한 매 단계마다 이미지의 시각 정보를 이용할 수 있는 연결 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 우수성을 입증하였다.
https://doi.org/10.3745/PKIPS.y2016m10a.617 인용 PDF

심층 컨볼루션 신경망을 사용한 초분광 영상의 공간 분광학적 분류 기법 (HyperConv: spatio-spectral classication of hyperspectral images with deep convolutional neural networks)

고세윤;전구;원중호
- 응용통계연구
- /
- 제29권5호
- /
- pp.859-872
- /
- 2016
초분광 영상 데이터는 픽셀마다 수백 개의 스펙트럼 밴드에 대한 정보가 주어지는 고차원 데이터로, 농업, 식품처리, 광물학, 물리학, 환경학, 지리학 등 광범위한 분야에 활용되고 있다. 그 중 하나는 토지 피복의 분류 문제인데, 이는 자연 재해 예방, 자연 자원 감시, 환경에 대한 정보 수집에 있어서 중요한 문제이다. 하지만 차원의 저주, 시공간적 변동성, 레이블된 데이터의 부족 때문에 토지 피복의 정확한 분류에는 어려움이 따른다. 이 논문에서는 이러한 문제를 해결하기 위해 컨볼루션 신경망에 기반한 새로운 심층 학습 구조를 제안한다. 제안된 구조는 원하는 지점 주변 픽셀의 정보를 컨볼루션 신경망을 통해 처리하고, 그 지점의 스펙트럼 정보를 강조하기 위해 컨볼루션 층의 출력과 스펙트럼 정보를 함께 소프트맥스 분류기의 입력으로 사용한다. 이 구조는 추가적인 특징 추출 과정을 필요로 하지 않고, 그래픽 처리 장치 등을 이용한 병렬화가 간편하다는 점에서 기존 방법들보다 유리하다. 실험 결과, 제안된 구조는 기존에 가장 좋은 성능을 보인 분류기와 비슷하거나 더 좋은 분류 정확도를 보여 좋은 일반화 성능을 보이는 것을 확인할 수 있었다.
https://doi.org/10.5351/KJAS.2016.29.5.859 인용 PDF KSCI

Inter-Layer Kernel Prediction: 프레임 간 Prediction에 기반한 컨볼루션 신경망 가중치 공유 및 모델 압축 방법 (Inter-Layer Kernel Prediction: Weight Sharing and Model Compression of Convolutional Neural Networks Motivated by Inter-frame Prediction)

이강호;배성호
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 추계학술대회
- /
- pp.136-139
- /
- 2020
본 논문에서는 최근 대두되고 있는 심층신경망 압축 연구에서 가중치 공유와 관련하여 심층신경망 모델 압축방법 Inter-Layer Kernel Prediction을 제안한다. 제안 방법은 영상 압축에서 사용되는 프레임 간 prediction 방법을 응용한 컨볼루션 신경망 가중치 공유 및 모델 압축 방법이다. 본 논문은 레이어 간 유사한 kernel들이 존재한다는 것을 발견하고 이를 기반으로 Inter-Layer Kernel Prediction을 사용하여 기존 모델 가중치를 보다 더 적은 비트로 표현하여 저장하는 방법을 제안한다. 제안 방법은 CIFAR10/100으로 학습된 ResNet에서 약 4.1 배의 압축률을 달성했으며 CIFAR10으로 학습된 ResNet110에서는 오히려 기존 Baseline 모델에 비해 0.04%의 성능 향상을 기록했다.
PDF

심층 컨볼루션 신경망을 이용한 번호판 인식 시스템 (License Plate Recognition System using Deep Convolutional Neural Network)

임성훈;박병주;이재흥
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2016년도 춘계학술발표대회
- /
- pp.754-757
- /
- 2016
기존 번호판 인식은 직접 특징 추출 알고리즘을 개발하여 완전 연결 신경망으로 특징을 분류하는 방법이 보편적이다. 본 연구는 전처리 과정에서 번호판 후보군 검출 및 세그먼테이션을 수행하고 특징 추출 없이 미리 학습된 심층 컨볼루션 신경망을 통해 문자를 분류하는 방법을 제안한다. 직접 수집한 2,900장의 번호판 데이터베이스를 이용하여 훈련 집합 및 검증 집합을 구성하였다. 훈련 집합과 검증 집합에 대해 실험한 결과 번호판 후보군 검출률은 97%를 얻을 수 있었고, 이에 대한 인식률은 95%를 얻었다.
https://doi.org/10.3745/PKIPS.y2016m04a.754 인용 PDF

문자 수준 딥 컨볼루션 신경망 기반 추천 모델 (A Recommendation Model based on Character-level Deep Convolution Neural Network)

기가기;정영지
- 한국정보통신학회논문지
- /
- 제23권3호
- /
- pp.237-246
- /
- 2019
추천 시스템의 등급 예측 정확도를 높이기 위해서는, 사용자 항목 등급 데이터뿐만 아니라 주석, 태그 또는 설명과 같은 항목의 보조 정보도 고려해야만 한다. 기존 접근법에서는 단어 단위에서 bag-of-words 모델을 사용하여 보조 정보를 모델링한다. 그러나 이러한 모델은 보조 정보를 효과적으로 활용할 수 없으므로 보조 정보를 제한적으로 이해하게 된다. 한편, 컨볼루션 신경망(CNN)에서는 보조 정보로부터 특징 벡터를 효과적으로 포착하고 추출할 수 있다. 따라서 본 논문에서는 새로운 추천 모델을 위해 딥 CNN을 행렬 분해에 통합시킨 문자 수준의 딥 컨볼루션 신경망 기반 행렬 분해 (Char-DCNN-MF) 방법을 제안한다. Char-DCNN-MF에서는 보조 정보를 더 심층적으로 이해하고 추천 성능을 더욱 향상시킬 수 있다. 실험은 세 가지 다른 실제 데이터 세트에서 수행되었으며 그 결과는 Char-DCNN-MF가 다른 비교 모델보다 유의적으로 뛰어난 성능을 보여주었다.
https://doi.org/10.6109/jkiice.2019.23.3.237 인용 PDF KSCI HTML

균형적인 신체활동을 위한 맞춤형 AI 운동 추천 서비스 (Customized AI Exercise Recommendation Service for the Balanced Physical Activity)

김창민;이우범
- 융합신호처리학회논문지
- /
- 제23권4호
- /
- pp.234-240
- /
- 2022
본 논문은 직종별 근무 환경에 따른 상대적 운동량을 고려한 맞춤형 AI 운동 추천 서비스 방법을 제안한다. 가속도 및 자이로 센서를 활용하여 수집된 데이터를 18가지 일상생활의 신체활동으로 분류한 WISDM 데이터베이스를 기반으로 전신, 하체, 상체의 3가지 활동으로 분류한 후 인식된 활동 지표를 통해 적절한 운동을 추천한다. 본 논문에서 신체활동 분류를 위해서 사용하는 1차원 합성곱 신경망(1D CNN; 1 Dimensional Convolutional Neural Network) 모델은 커널 크기가 다른 다수의 1D 컨볼루션(Convolution) 계층을 병렬적으로 연결한 컨볼루션 블록을 사용한다. 컨볼루션 블록은 하나의 입력 데이터에 다층 1D 컨볼루션을 적용함으로써 심층 신경망 모델로 추출할 수 있는 입력 패턴의 세부 지역 특징을 보다 얇은 계층으로도 효과적으로 추출 할 수 있다. 제안한 신경망 모델의 성능 평가를 위해서 기존 순환 신경망(RNN; Recurrent Neural Network) 모델과 비교 실험한 결과 98.4%의 현저한 정확도를 보였다.
https://doi.org/10.23087/jkicsp.2022.23.4.008 인용 PDF KSCI

심층 학습 모델을 이용한 EPS 동작 신호의 인식 (EPS Gesture Signal Recognition using Deep Learning Model)

이유라;김수형;김영철;나인섭
- 스마트미디어저널
- /
- 제5권3호
- /
- pp.35-41
- /
- 2016
본 논문에서는 심층 학습 모델 방법을 이용하여 EPS(Electronic Potential Sensor) 기반의 손동작 신호를 인식하는 시스템을 제안한다. 전기장 기반 센서인 EPS로부터 추출된 신호는 다량의 잡음이 포함되어 있어 이를 제거하는 전처리과정을 거쳐야 한다. 주파수 대역 특징 필터를 이용한 잡음 제거한 후, 신호는 시간에 따른 전압(Voltage) 값만 가지는 1차원적 특징을 지닌다. 2차원 데이터를 입력으로 하여 컨볼루션 연산을 하는 알고리즘에 적합한 형태를 갖추기 위해 신호는 차원 변형을 통해 재구성된다. 재구성된 신호데이터는 여러 계층의 학습 층(layer)을 가지는 심층 학습 기반의 모델을 통해 분류되어 최종 인식된다. 기존 확률 기반 통계적 모델링 알고리즘은 훈련 후 모델을 생성하는 과정에서 초기 파라미터에 결과가 좌우되는 어려움이 있었다. 심층 학습 기반 모델은 학습 층을 쌓아 훈련을 반복하므로 이를 극복할 수 있다. 실험에서, 제안된 심층 학습 기반의 서로 다른 구조를 가지는 컨볼루션 신경망(Convolutional Neural Networks), DBN(Deep Belief Network) 알고리즘과 통계적 모델링 기반의 방법을 이용한 인식 결과의 성능을 비교하였고, 컨볼루션 신경망 알고리즘이 다른 알고리즘에 비해 EPS 동작신호 인식에서 보다 우수한 성능을 나타냄을 보였다.
PDF KSCI

심층 컨볼루션 신경망을 활용한 영상 기반 콘크리트 압축강도 예측 모델 (Image based Concrete Compressive Strength Prediction Model using Deep Convolution Neural Network)

장유진;안용한;유재인;김하영
- 한국건설관리학회논문집
- /
- 제19권4호
- /
- pp.43-51
- /
- 2018
노후화된 아파트의 재고가 폭발적으로 증가하게 될 것으로 예상됨에 따라 콘크리트 시설물의 내구성을 향상시키기 위한 유지관리의 중요성이 증대되고 있다. 콘크리트 압축강도는 콘크리트 시설물의 내구성을 나타내는 대표적인 지표로, 시설물 유지관리를 위한 정밀 안전 진단에 있어서 중요한 항목이다. 그러나 콘크리트 압축강도를 측정하고 유지관리를 판단하는데 있어서 기존의 방법들은 시설물의 안전 문제, 고비용 문제, 낮은 신뢰성 문제 등의 한계점을 가진다. 기존의 콘크리트 시설물의 압축강도 진단 방법을 대체할 수 있는 방안으로, 본 연구는 심층 컨볼루션 신경망 기법을 활용하여 영상을 통해 콘크리트 압축강도를 예측할 수 있는 모델을 제안하였다. 또한 실험실 환경에서 콘크리트 시편 제작을 통해 구축한 콘크리트 압축강도 데이터셋을 적용하여 학습, 검증 및 테스트를 진행하였다. 그 결과 콘크리트 표면 영상으로 콘크리트 압축강도를 학습할 수 있음을 알 수 있었고, 본 연구에서 제안하는 모델의 유효성을 확인하였다.
https://doi.org/10.6106/KJCEM.2018.19.4.043 인용 PDF KSCI

Short-time Fourier transform 소음맵을 이용한 컨볼루션 기반 BSR (Buzz, Squeak, Rattle) 소음 분류 (BSR (Buzz, Squeak, Rattle) noise classification based on convolutional neural network with short-time Fourier transform noise-map)

부석준;문세민;조성배
- 한국음향학회지
- /
- 제37권4호
- /
- pp.256-261
- /
- 2018
차량 내부에는 BSR(Buzz, Squeak, Rattle) 세 가지 유형의 소음이 발생한다. 본 논문에서는 심층 컨볼루션 신경망으로 추출한 소음 특징에 기반하여 자동으로 차량 내부의 BSR 소음을 분류하는 분류기를 제안한다. 차량 내부의 소음은 전처리 단계에서 STFT(Short-time Fourier Transform) 알고리즘을 사용하여 소음 맵으로 표현된다. 생성된 소음 맵 내부에서 실제 소음의 위치를 정확하게 파악하기 어려운 문제에 대처하기 위해서 슬라이딩 윈도우 방법으로 분할하였다. 본 논문에서는 t-SNE(t-Stochastic Neighbor Embedding) 알고리즘을 사용하여 심층 컨볼루션 신경망 내부 파라미터를 시각화하고 정성적인 방식으로 오분류데이터를 분석하였다. 분류된 데이터의 정량적인 분석을 위해 소음의 종류별 유사도를 SSIM(Structural Similarity Index) 수치에 기반하여 정량화하여 리트랙터의 떨림음이 정상주행음과 가장 유사하다는 것을 밝혔다. 제안하는 방법의 분류기는 기타 기계학습 알고리즘 대비 최고 분류 정확도를 달성하였다(99.15%).
https://doi.org/10.7776/ASK.2018.37.4.256 인용 PDF KSCI

이미지 캡션 생성을 위한 심층 신경망 모델의 설계 (Design of a Deep Neural Network Model for Image Caption Generation)

김동하;김인철
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제6권4호
- /
- pp.203-210
- /
- 2017
본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하며, 캡션 문장 생성을 위한 매 순환 단계마다 이미지의 시각 정보를 이용할 수 있도록 컨볼루션 신경망 층의 출력을 순환 신경망 층의 초기 상태뿐만 아니라 멀티 모달 층의 입력에도 연결하는 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험들을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 높은 성능을 확인할 수 있었다.
https://doi.org/10.3745/KTSDE.2017.6.4.203 인용 PDF KSCI

검색결과 26건 처리시간 0.032초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)