• 제목/요약/키워드: Image Learning

검색결과 3,146건 처리시간 0.028초

An Effective Framework for Contented-Based Image Retrieval with Multi-Instance Learning Techniques

  • Peng, Yu;Wei, Kun-Juan;Zhang, Da-Li
    • Journal of Ubiquitous Convergence Technology
    • /
    • 제1권1호
    • /
    • pp.18-22
    • /
    • 2007
  • Multi-Instance Learning(MIL) performs well to deal with inherently ambiguity of images in multimedia retrieval. In this paper, an effective framework for Contented-Based Image Retrieval(CBIR) with MIL techniques is proposed, the effective mechanism is based on the image segmentation employing improved Mean Shift algorithm, and processes the segmentation results utilizing mathematical morphology, where the goal is to detect the semantic concepts contained in the query. Every sub-image detected is represented as a multiple features vector which is regarded as an instance. Each image is produced to a bag comprised of a flexible number of instances. And we apply a few number of MIL algorithms in this framework to perform the retrieval. Extensive experimental results illustrate the excellent performance in comparison with the existing methods of CBIR with MIL.

  • PDF

Game Sprite Generator Using a Multi Discriminator GAN

  • Hong, Seungjin;Kim, Sookyun;Kang, Shinjin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권8호
    • /
    • pp.4255-4269
    • /
    • 2019
  • This paper proposes an image generation method using a Multi Discriminator Generative Adversarial Net (MDGAN) as a next generation 2D game sprite creation technique. The proposed GAN is an Autoencoder-based model that receives three areas of information-color, shape, and animation, and combines them into new images. This model consists of two encoders that extract color and shape from each image, and a decoder that takes all the values of each encoder and generates an animated image. We also suggest an image processing technique during the learning process to remove the noise of the generated images. The resulting images show that 2D sprites in games can be generated by independently learning the three image attributes of shape, color, and animation. The proposed system can increase the productivity of massive 2D image modification work during the game development process. The experimental results demonstrate that our MDGAN can be used for 2D image sprite generation and modification work with little manual cost.

이미지 딥러닝을 위한 설진 이미지 분석 (Image Analysis of Tongue for Deep Learning)

  • 서진범;이재경;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.50-51
    • /
    • 2021
  • 본 논문에서는 설진 이미지를 이용한 이미지 딥러닝 알고리즘을 설계하기 위해 이미지의 형태와 설진에 대한 사전 연구을 진행한다. 이미지 딥러닝을 하기 위해서는 설진 이미지의 특성을 파악하고 이에 알맞은 라벨을 구성하며, 전처리 과정을 진행해야 한다. 이미지 데이터는 대전대학교에서 수집한 코호트 사진이며, 이를 바탕으로 데이터로부터 연구를 진행 위한 목표를 수립하고자 한다.

  • PDF

미용계열 대학생들의 학습양식, 교수 이미지, 학업성취도의 관계에 관한 연구 (The Study on the Relationship of Learning Style, Professor Image, and Academic Achievement in Cosmetology Majoring College Students)

  • 안현경
    • 패션비즈니스
    • /
    • 제16권5호
    • /
    • pp.178-191
    • /
    • 2012
  • This paper is purposed to study on the relationship of learning style, professor image, academic achievement in cosmetology majoring college students, and to find the effective education methods of them. The research methods are survey with 400 persons & statistics analysis such as frequency, factor, regression analysis, using SPSS V.14. The results are as belows; 1. Learning styles are divided by (1) shirker, (2) participate, (3) stand-alone, (4) dependent, (5) cooperative, (6) competitive, and professor images are divided by (1) professor ability, (2) professor relationship. 2. There is a relationship in learning styles and professor images. Especially cooperative, participate, dependent valued professor ability, shirker devalued it and cooperative, stand-alone, dependent, competitive valued professor relationship, shirker devalued it. 3. There is a relationship on learning styles and the academic achievement. participate, stand-alone, dependent achieve in high glades and shirker, cooperative low ones. 4. There is a no valid relationship with professor images and the students' academic achievement. 5. The conclusion are; there are the relationship of learning style, professor image, academic achievement in cosmetology majoring college students. So shirker need endless motive giving program, participate personal record management system, dependent creative motivating program, participate class attractive factors, stand-alone learner centered program.

Implementation of YOLOv5-based Forest Fire Smoke Monitoring Model with Increased Recognition of Unstructured Objects by Increasing Self-learning data

  • Gun-wo, Do;Minyoung, Kim;Si-woong, Jang
    • International Journal of Advanced Culture Technology
    • /
    • 제10권4호
    • /
    • pp.536-546
    • /
    • 2022
  • A society will lose a lot of something in this field when the forest fire broke out. If a forest fire can be detected in advance, damage caused by the spread of forest fires can be prevented early. So, we studied how to detect forest fires using CCTV currently installed. In this paper, we present a deep learning-based model through efficient image data construction for monitoring forest fire smoke, which is unstructured data, based on the deep learning model YOLOv5. Through this study, we conducted a study to accurately detect forest fire smoke, one of the amorphous objects of various forms, in YOLOv5. In this paper, we introduce a method of self-learning by producing insufficient data on its own to increase accuracy for unstructured object recognition. The method presented in this paper constructs a dataset with a fixed labelling position for images containing objects that can be extracted from the original image, through the original image and a model that learned from it. In addition, by training the deep learning model, the performance(mAP) was improved, and the errors occurred by detecting objects other than the learning object were reduced, compared to the model in which only the original image was learned.

초중고 교육을 위한 딥러닝 기반 암석 분류기 개발 (Development of deep learning-based rock classifier for elementary, middle and high school education)

  • 박진아;용환승
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제15권1호
    • /
    • pp.63-70
    • /
    • 2019
  • 최근 딥 러닝(Deep leaning)을 이용한 이미지 인식 분야의 연구가 활발히 진행되고 있다. 본 연구에서는 육안으로 관찰하여 분류하기 어려운 암석을 이미지만으로 분류하기 위해 딥 러닝 오픈 소스 프레임워크인 Tensorflow 기반의 CNN모델을 사용하여 고등학교 교육과정에서 다루는 암석 18종(화성암 6종, 변성암 6종, 퇴적암 6종)의 이미지를 통해 암석을 분류하는 시스템을 제안한다. 암석의 이미지를 학습시켜 암석을 구별하는 분류기를 개발하여 분류 성능을 확인하였으며 최종적으로 구현한 모바일 어플리케이션을 통해 교실 내 학습 또는 현장체험학습 등에서 학생들의 학습 보조도구로서 사용할 수 있다.

흉부 X-ray 기반 딥 러닝 손실함수 성능 비교·분석 (Comparison and analysis of chest X-ray-based deep learning loss function performance)

  • 서진범;조영복
    • 한국정보통신학회논문지
    • /
    • 제25권8호
    • /
    • pp.1046-1052
    • /
    • 2021
  • 4차 산업의 발전과 고성능의 컴퓨팅 환경 구축으로 다양한 산업분야에서 인공지능이 적용되고 있다. 의료분야에서는 X-Ray, MRI, PET 등의 의료 영상 및 임상 자료를 이용하여 암, COVID-19, 골 연령 측정 등의 딥 러닝 학습이 진행되었다. 또한 스마트 의료기기, IoT 디바이스와 딥 러닝 알고리즘을 적용하여 ICT 의료 융합 기술 등이 연구되고 있다. 이러한 기술 중 의료 영상 기반 딥 러닝 학습은 의료 영상의 바이오마커를 정확히 찾아내고, 최소한의 손실률과 높은 정확도가 필요하다. 따라서 본 논문은 흉부 X-Ray 이미지 기반 딥 러닝 학습 과정에서 손실률을 도출하는 손실 함수 중 영상분류 알고리즘에서 사용되는 Cross-Entropy 함수들의 성능을 비교·분석하고자 한다.

일반화 능력이 향상된 CNN 기반 위조 영상 식별 (CNN-Based Fake Image Identification with Improved Generalization)

  • 이정한;박한훈
    • 한국멀티미디어학회논문지
    • /
    • 제24권12호
    • /
    • pp.1624-1631
    • /
    • 2021
  • With the continued development of image processing technology, we live in a time when it is difficult to visually discriminate processed (or tampered) images from real images. However, as the risk of fake images being misused for crime increases, the importance of image forensic science for identifying fake images is emerging. Currently, various deep learning-based identifiers have been studied, but there are still many problems to be used in real situations. Due to the inherent characteristics of deep learning that strongly relies on given training data, it is very vulnerable to evaluating data that has never been viewed. Therefore, we try to find a way to improve generalization ability of deep learning-based fake image identifiers. First, images with various contents were added to the training dataset to resolve the over-fitting problem that the identifier can only classify real and fake images with specific contents but fails for those with other contents. Next, color spaces other than RGB were exploited. That is, fake image identification was attempted on color spaces not considered when creating fake images, such as HSV and YCbCr. Finally, dropout, which is commonly used for generalization of neural networks, was used. Through experimental results, it has been confirmed that the color space conversion to HSV is the best solution and its combination with the approach of increasing the training dataset significantly can greatly improve the accuracy and generalization ability of deep learning-based identifiers in identifying fake images that have never been seen before.

데이터 수집방법에 따른 딥러닝 기반 산림수종 자동분류 정확도 변화에 관한 연구 (A Study on the Performance of Deep learning-based Automatic Classification of Forest Plants: A Comparison of Data Collection Methods)

  • 김보미;우희성;박주원
    • 한국산림과학회지
    • /
    • 제109권1호
    • /
    • pp.23-30
    • /
    • 2020
  • 최근 급변하는 컴퓨터 기술의 발전을 통해 컴퓨터 비전과 머신러닝을 이용한 사물인식 기법이 다양한 학문 분야에서 사용되고 있다. 국내의 연구 사례를 보면 주로 대면적 산림을 분석하기 위한 이미지 학습 및 객체인식 기법이 사용되는 반면 개체목 단위의 수종 분류 및 특징을 학습하는 연구는 아직 미미한 실정이다. 이에 본 연구는 한국의 침엽수 5종을 대상으로 이미지 학습을 통한 자동분류 연구의 가능성을 분석해 보았다. 데이터 형태에 따른 분류 결과의 차이를 분석하기 위하여 산림전문가가 직접 촬영한 영상(D1)과 웹크롤링을 이용한 영상(D2)을 사용하여 수종 분류를 실시하였다. 그 결과 D1과 D2의 분류 정확도에 유의미한 차이가 있는 것으로 나타났으며, D1은 D2보다 높은 분류 정확도를 나타냈다. 또한, D2의 분류 정확도를 높이기 위해서는 검열되지 않은 영상 데이터의 노이즈를 줄이기 위한 추가 데이터 필터링 기법이 필요한 것으로 사료된다.

딥러닝 기반 OffsetNet 모델을 통한 KOMPSAT 광학 영상 정합 (KOMPSAT Optical Image Registration via Deep-Learning Based OffsetNet Model)

  • 유진우;박채원;정형섭
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1707-1720
    • /
    • 2023
  • 위성 시계열 데이터가 증가함에 따라 원격탐사 자료의 활용도가 높아지고 있다. 시계열 자료를 통한 분석에 있어 영상 간의 상대적인 위치 정확도는 결과에 큰 영향을 미치기 때문에 이를 보정하기 위한 영상 정합 과정은 필수적으로 선행되어야 한다. 최근에는 기존 알고리즘의 성능을 상회하는 딥러닝 기반 영상 정합 연구의 사례가 증가하고 있다. 딥러닝 기반 정합 모델을 학습하기 위해서는 수 많은 영상 쌍이 필요하다. 또한, 기존 딥러닝 모델의 데이터 간의 상관도 map을 제작하고, 이에 추가적인 연산을 적용하여 정합점을 추출는데 이는 비효율적이다. 이러한 문제를 해결하기 위해 본 연구에서는 영상 정합 모델 학습을 위한 데이터 증강 기법을 구축하여 데이터셋을 제작하였고, 이를 오프셋(offset) 양 자체를 예측하는 정합 모델인 OffsetNet에 적용하여 KOMSAT-2, -3, -3A 영상 정합을 수행하였다. 모델 학습 결과, OffsetNet은 평가 데이터에 대해 높은 정확도로 오프셋 양을 예측하였고, 이를 통해 주영상과 부영상을 효과적으로 정합하였다.