Search | Korea Science

Learning and Transferring Deep Neural Network Models for Image Caption Generation (이미지 캡션 생성을 위한 심층 신경망 모델 학습과 전이)

Kim, Dong-Ha;Kim, Incheol
- Proceedings of the Korea Information Processing Society Conference
- /
- 2016.10a
- /
- pp.617-620
- /
- 2016
본 논문에서는 이미지 캡션 생성과 모델 전이에 효과적인 심층 신경망 모델을 제시한다. 본 모델은 멀티 모달 순환 신경망 모델의 하나로서, 이미지로부터 시각 정보를 추출하는 컨볼루션 신경망 층, 각 단어를 저차원의 특징으로 변환하는 임베딩 층, 캡션 문장 구조를 학습하는 순환 신경망 층, 시각 정보와 언어 정보를 결합하는 멀티 모달 층 등 총 5 개의 계층들로 구성된다. 특히 본 모델에서는 시퀀스 패턴 학습과 모델 전이에 우수한 LSTM 유닛을 이용하여 순환 신경망 층을 구성하고, 컨볼루션 신경망 층의 출력을 임베딩 층뿐만 아니라 멀티 모달 층에도 연결함으로써, 캡션 문장 생성을 위한 매 단계마다 이미지의 시각 정보를 이용할 수 있는 연결 구조를 가진다. Flickr8k, Flickr30k, MSCOCO 등의 공개 데이터 집합들을 이용한 다양한 비교 실험을 통해, 캡션의 정확도와 모델 전이의 효과 면에서 본 논문에서 제시한 멀티 모달 순환 신경망 모델의 우수성을 입증하였다.
https://doi.org/10.3745/PKIPS.y2016m10a.617 인용 PDF

Development of integrated data augmentation automation tools for deep learning (딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발)

Jang, Chan-Ho;Lee, Seo-Young;Park, Goo-Man
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- fall
- /
- pp.283-286
- /
- 2021
4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.
PDF

The Combined Effect and Therapeutic Effects of Color (변환학습을 이용한 장면 분류)

Shin, Seong-Yoon;Shin, Kwang-Seong;Nam, Soo-Tai
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2021.05a
- /
- pp.338-339
- /
- 2021
In this paper, we proposed a multiclass image scene classification method based on transform learning. The method using the Residual Network (ResNet) model which pre-trained on the large image dataset ImageNet for image classification. Compared with the image classification method of the CNN model, it can greatly improve the classification accuracy and efficiency
PDF

A Study on the Construction of Image Datasets for Object Detection of Painting Cultural Heritage (회화문화재 객체검출을 위한 학습용 이미지 데이터셋 구축 방안 연구)

Kwon, Do-Hyung;Yu, Jeong-Min
- Proceedings of the Korea Information Processing Society Conference
- /
- 2021.11a
- /
- pp.853-855
- /
- 2021
본 연구는 회화문화재 속에 표현된 다양한 종류의 객체를 검출할 수 있는 딥러닝 모델생성을 위해 필요한 학습용 이미지 데이터셋 구축방안을 제안한다. 먼저 기존 동양화 기반의 회화문화재 이미지 데이터 및 객체 특징 분석을 진행하였고, 이를 바탕으로 Natural image에 Pose transfer 및 Style transfer를 적용한 새로운 방식의 회화문화재 이미지 데이터 생성 방법을 제안한다. 제안한 프레임워크를 통해 기존 문화재 분야에서 가지고 있던 제한된 데이터 구축문제를 극복하고, 검출모델 생성을 위한 대용량의 학습데이터 구축 가능성을 제시하였다.
https://doi.org/10.3745/PKIPS.y2021m11a.853 인용 PDF

Pose Estimation through 3D modeling based on NeRF (NeRF 기반 3차원 모델링을 통한 자세 추정)

Park, Chan;Kim, Hyungju;Moon, Nammee
- Proceedings of the Korea Information Processing Society Conference
- /
- 2022.11a
- /
- pp.600-602
- /
- 2022
2차원 이미지 또는 영상을 통한 자세 추정의 경우, 영상 내에서 발생할 수 있는 탐지 오류, 피사체 잘림, 폐색(Occlusion) 등으로 인해 자세 추정 정확도가 감소할 수 있다. 본 논문에서는 4장 이상의 다양한 각도로 촬영한 이미지를 NeRF(Neural Radiance Fields)를 통해 이미지 합성(Image synthesis)을 진행하여 3차원 모델을 생성한다. 이후 DeepLabCut을 사용하여 관절 좌표와 골격(Skeleton)을 구축한다. 구축한 골격을 인공지능에 학습시킨 뒤 2차원 영상에서의 관절 좌표 인식, 골격 구축, 자세 추정을 진행한다. 2차원 영상 테스트 데이터를 통해, 3차원 모델을 사전 학습한 인공지능 모델과 기존 2차원 이미지를 사용하여 학습한 인공지능 모델의 자세 추정 정확도를 비교한다.
https://doi.org/10.3745/PKIPS.y2022m11a.600 인용 PDF

A Case Study on Instruction Using Robot in Elementary Regular Classes (초등학교 정규교과에서 로봇활용수업 적용 사례 연구)

Park, Jung-Ho;Cho, Hye-Kyung
- Journal of the Korea Society of Computer and Information
- /
- v.16 no.8
- /
- pp.67-76
- /
- 2011
This study is to analyze the effects on using robots in elementary regular classes. The robots and PC-linked applications were developed considering the school subjects' academic goals and the learners' responses were carefully examined while applying the robots in the class. The image profile after the robot application shows positive feedbacks in most of the contents and some significant differences were found in contents such as 'theoretical-practical', 'uncooperative-cooperative'(p<.05). Moreover, the analysis on the learners' image drawings shows that more robot images are formed related to the concrete learning environment. The learners have answered in an interview to evaluate their understanding of Robot based instruction that both direct and indirect robot experience induce positive participations and provide authentic learning experience. During the robot based instruction, the learners cooperate with their group members and recognize the cooperation as a positive activity. It proves that the robot based instruction can lead to a possibility of new education paradigm.
https://doi.org/10.9708/jksci.2011.16.8.067 인용 PDF KSCI

Implementation of a Deep Learning based Realtime Fire Alarm System using a Data Augmentation (데이터 증강 학습 이용한 딥러닝 기반 실시간 화재경보 시스템 구현)

Kim, Chi-young;Lee, Hyeon-Su;Lee, Kwang-yeob
- Journal of IKEEE
- /
- v.26 no.3
- /
- pp.468-474
- /
- 2022
In this paper, we propose a method to implement a real-time fire alarm system using deep learning. The deep learning image dataset for fire alarms acquired 1,500 sheets through the Internet. If various images acquired in a daily environment are learned as they are, there is a disadvantage that the learning accuracy is not high. In this paper, we propose a fire image data expansion method to improve learning accuracy. The data augmentation method learned a total of 2,100 sheets by adding 600 pieces of learning data using brightness control, blurring, and flame photo synthesis. The expanded data using the flame image synthesis method had a great influence on the accuracy improvement. A real-time fire detection system is a system that detects fires by applying deep learning to image data and transmits notifications to users. An app was developed to detect fires by analyzing images in real time using a model custom-learned from the YOLO V4 TINY model suitable for the Edge AI system and to inform users of the results. Approximately 10% accuracy improvement can be obtained compared to conventional methods when using the proposed data.
https://doi.org/10.7471/ikeee.2022.26.3.468 인용 PDF KSCI

A Study on Teaching and Learning in "Principle of Bitmap Image save" of the Concrete Operational Stage Students (구체적 조작기 초등학생의 "비트맵 이미지 저장 원리" 교수-학습에 관한 연구)

Kim, Kyung-Tae;Lee, Jae-In
- 한국정보교육학회:학술대회논문집
- /
- 2006.01a
- /
- pp.57-62
- /
- 2006
현 ICT 교육과정에서는 컴퓨터를 이용한 응용 소프트웨어 및 교수학습 소프트웨어를 익히는 기능 위주의 학습을 추구하고 있다. 이러한 경향은 컴퓨터 교육의 생명인 지식교육에 소홀하고 있다. 또한, 앞으로의 지식 정의화 사회에서는 아이들에게 생각하는 힘 즉 사고력(思考力)을 키우는 것을 필요로 한다. 이 사고력은 문제 해결력에 직접적으로 도움이 된다. 하지만, 기존의 교육방법으로 응용 소프트웨어를 이용하는 것은 사고력 증진에 크게 도움이 되지 않았다. 이에 본 연구에서는 초등학생을 대상으로 지식교육의 핵심인 컴퓨터 구조와 작동원리 중의 하나인 영상 이미지 저장 방범 풍 비트맵 이미지 저장 원리에 관한 학습을 연구하였다.
PDF

Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model (물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발)

Lim, Songwon;Park, Gooman
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2019.11a
- /
- pp.162-164
- /
- 2019
본 논문에서는 물체인식 딥러닝 모델 생성에 필요한 라벨링(Labeling)과정에서 사용자가 다양한 기능을 활용하여 효과적인 학습 데이터를 구성할 수 있는 GUI 프로그램을 구현했다. 프로그램의 인터페이스는 파이썬 기반의 GUI 모듈인 Tkinter 를 활용하여, 실시간으로 이미지 데이터를 수집할 수 있는 크롤링(Crawling)기능과 미리 학습된 Retinanet 을 통해 이미지 데이터를 인식함으로써 자동으로 주석(Annotation) 과정을 수행할 수 있는 기능을 구성했다. 또한, 수집한 이미지 데이터를 다양한 효과와 노이즈, 변형 등으로 Augmentation 기능을 추가함으로써, 사용자가 모델을 학습하기 위한 데이터 전처리 단계를 하나의 GUI 프로그램에서 수행할 수 있도록 했다. 또한 사용자가 직접 학습한 모델을 추정 모델(Inference Model)로 변환하여 프로그램에 입력할 수 있도록 설계한다.
PDF

Camera noise reduction in the low illumination conditions using convolutional network (컨벌루션 네트워크를 이용한 저조도 환경 카메라 잡음 제거)

Park, Gu-Yong;Ahn, Byeong-Yong;Cho, Nam-ik
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2017.06a
- /
- pp.163-165
- /
- 2017
본 논문에서는 카메라 잡음 제거에 딥 러닝 알고리즘을 적용하는 연구를 진행하였다. 합성된 가우시언 잡음에 대하여 좋은 잡음 제거 성능을 보이는 DnCNN(Denoising Convolutional Network)를 이용하여 카메라 잡음을 제거하는 학습과 실험을 진행하였으며, 기준 실험으로는 RGB 색공간의 3채널 모두에 대하여 학습한 신경망(Neural Network)을 사용하였고, 본 논문의 실험에서는 그레이 이미지에 대하여 학습한 신경망을 사용하였다. 신경망의 평가를 위하여 딥 러닝 알고리즘 입력 이미지를 RGB 색공간(RGB Color Space)과 YCbCr 색공간(YCbCr Color Space) 2가지 색공간으로 표현하여 사용하였고, 입력 이미지에 노이즈를 첨가하기 위해 가우시안 노이즈(Gaussian Noise)를 이용하였다. 또한 가우시안 잡음과 다른 성질을 갖는 실제 카메라 잡음에 대해서도 학습과 테스트를 진행하였다.
PDF

Search Result 1,404, Processing Time 0.033 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)