• Title/Summary/Keyword: 이미지 학습

Search Result 1,413, Processing Time 0.025 seconds

The Development of Interactive Artificial Intelligence Blocks for Image Classification (이미지 분류를 위한 대화형 인공지능 블록 개발)

  • Park, Youngki;Shin, Youhyun
    • Journal of The Korean Association of Information Education
    • /
    • v.25 no.6
    • /
    • pp.1015-1024
    • /
    • 2021
  • There are various educational programming environments in which students can train artificial intelligence (AI) using block-based programming languages, such as Entry, Machine Learning for Kids, and Teachable Machine. However, these programming environments are designed so that students can train AI through a separate menu, and then use the trained model in the code editor. These approaches have the advantage that students can check the training process more intuitively, but there is also the disadvantage that both the training menu and the code editor must be used. In this paper, we present a novel artificial intelligence block that can perform both AI training and programming in the code editor. While this AI block is presented as a Scratch block, the training process is performed through a Python server. We describe the blocks in detail through the process of training a model to classify a blue pen and a red pen, and a model to classify a dental mask and a KF94 mask. Also, we experimentally show that our approach is not significantly different from Teachable Machine in terms of performance.

A Study on the Image Analysis used by Color Distribution (색상분포에 대한 이미지 분석에 관한 연구)

  • Park, Hyeon-Geun;Lee, Hee-Suk;Jang, Il-Ki;Lee, Sang-Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.01a
    • /
    • pp.69-72
    • /
    • 2012
  • 영상처리 기법을 이용한 이미지 인식에 관한 콘텐츠들은 다양한 알고리즘을 사용하고 있다. 영상처리 기법 중 이미지 인식 기법에는 대표적으로 PCA(Principal Component Analysis)알고리즘이 있으며, 이 알고리즘에 적용된 대표적인 콘텐츠로 얼굴 문자인식이 있다. 이 알고리즘은 정확성을 위하여 학습을 통한 영상의 저장과 인식을 통한 복잡한 알고리즘을 사용한다. 복잡한 알고리즘의 사용으로 간단한 이미지 인식 콘텐츠의 경우 시스템 처리속도에 영향을 줄 수 있다. 따라서 이 논문에서는 색상의 분포를 통하여 그 수치를 이용한 이미지를 분석한 실험을 통하여 간단한 이미지인식 시스템을 위한 알고리즘을 제시하고, 이 알고리즘을 통해서 얻을 수 있는 장 단점을 분석하였다.

  • PDF

Action Recognition Reference Image Captioning (행동 인식 참조 이미지 캡셔닝)

  • Park, Eun-Soo;Kim, Seunghwan;Ryu, Jaesung;Kim, Seondae;Mujtaba, Ghulam;Ryu, Eun-Seok
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.21-24
    • /
    • 2019
  • 본 논문에서 기존의 이미지 캡셔닝의 문제점인 행동 인식 관련한 문제를 해결한다. 이미지 캡셔닝 모델의 학습 데이터의 행동 부분 즉, 동사 부분으로 행동 인식 데이터 셋을 만들었을 경우 많은 클래스, 각 클래스에는 적은 데이터로 구성됨을 보였다. 따라서, 본 논문에서 행동 인식 모델을 추가하고, 임계값을 두어 이미지 캡셔닝의 동사 부분의 정확도가 낮을 경우, 그리고 행동 인식 모델의 정확도가 높을 경우 두 결과물을 교체하는 방식으로 이미지 캡셔닝의 문제점을 해결한다. 본 논문에서 제안하는 모델에 대한 설명과 구현 과정 및 행동 인식에 강인한 이미지 캡셔닝 실험 결과를 보인다.

  • PDF

Face Recognition using Image Super-Resolution (이미지 초해상화를 이용한 얼굴 인식)

  • Park, Junyoung;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.85-87
    • /
    • 2022
  • 최근 CCTV 출입 기록, 휴대폰 보안, 스마트 매장 등에서 얼굴 인식을 통해 개인을 식별하는 기술이 널리 사용되고 있다. 카메라의 각도, 조명, 사람의 움직임 등 얼굴 인식에 많은 외부 환경이 영향을 미치고 있지만 그중에서도 실제 영상에서 얼굴이 차지하는 영역이 작아 저해상도 얼굴 인식에 어려움을 겪고 있다. 이러한 문제점을 해결하고자 본 논문에서는 이미지 해상도가 얼굴 인식에 끼치는 영향을 알아보고 이미지 초해상화를 통해 얼굴 인식 성능을 개선하고자 한다. 쌍선형, 양3차 회선 보간법과 딥러닝 기반의 이미지 초해상화 모델인 RCAN을 이용하여 업스케일링한 데이터셋에 대해 학습한 ArcFace를 통해 얼굴 검증 평가를 진행하였다. 고해상도 이미지는 얼굴 인식 성능을 향상시키며, RCAN을 사용한 이미지 초해상화가 보간법을 사용한 방법보다 더 좋은 성능을 보였다.

  • PDF

Image generation and classification using GAN-based Semi Supervised Learning (GAN기반의 Semi Supervised Learning을 활용한 이미지 생성 및 분류)

  • Doyoon Jung;Gwangmi Choi;NamHo Kim
    • Smart Media Journal
    • /
    • v.13 no.3
    • /
    • pp.27-35
    • /
    • 2024
  • This study deals with a method of combining image generation using Semi Supervised Learning based on GAN (Generative Adversarial Network) and image classification using ResNet50. Through this, a new approach was proposed to obtain more accurate and diverse results by integrating image generation and classification. The generator and discriminator are trained to distinguish generated images from actual images, and image classification is performed using ResNet50. In the experimental results, it was confirmed that the quality of the generated images changes depending on the epoch, and through this, we aim to improve the accuracy of industrial accident prediction. In addition, we would like to present an efficient method to improve the quality of image generation and increase the accuracy of image classification through the combination of GAN and ResNet50.

Design and Implementation of a WEB Based Courseware for Geometric Solids Using VRML (VRML을 이용한 웹 기반 입체도형학습 코스웨어의 설계 및 구현)

  • Kim, Joung-Hwa;Woo, Jong-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.219-222
    • /
    • 2003
  • 웹 코스웨어의 대부분은 2 차원적인 텍스트와 이미지를 이용한 것으로 설계되어 있으나 3 차원의 입체개념 형성이 필요한 입체도형 학습에서는 효과적인 학습이 되기 어렵다. 본 논문은 WWW에서 3차원 가상현실을 적용하여 구현한 웹 코스웨어로 중학생을 위한 입체도형 학습을 주제로 하였다. 2 차원 평면공간에서는 설명하기 어려운 입체도형의 성질을 3 차원의 가상현실의 공간에서 학습자 스스로 다양한 경험을 통해 이를 이해하고 학습의 개별화 요구를 충족시키는데 그 목적이 있다. 이를 위해 학습자가 주도적으로 학습을 조작, 진행해 나갈 수 있는 구성주의 학습이론을 기반으로 웹에서 3 차원 가상공간을 제공하는 스크립트 언어인 VRML2.0 을 이용하여 모델링하여 동적인 학습과 상호작용성을 높일 수 있도록 구현하였다.

  • PDF

Novel Intent Category Discovery using Contrastive Learning (대조학습을 활용한 새로운 의도 카테고리 발견)

  • Seungyeon Seo;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.107-112
    • /
    • 2023
  • 라벨 데이터 수집의 어려움에 따라 라벨이 없는 데이터로 학습하는 준지도학습, 비지도학습에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 그의 일환으로 Novel Intent Category Discovery(NICD) 문제를 제안하고 NICD 연구의 베이스라인이 될 모델을 소개한다. NICD 문제는 라벨이 있는 데이터와 라벨이 없는 데이터의 클래스 셋이 겹치지 않는다는 점에서 기존 준지도학습의 문제들과 차이가 있다. 제안 모델은 RoBERTa를 기반으로 두 개의 분류기를 추가하여 구성되며 라벨이 있는 데이터셋과 라벨이 없는 데이터셋에서 각각 다른 분류기를 사용하여 라벨을 예측한다. 학습방법은 2단계로 먼저 라벨이 있는 데이터셋으로 요인표현을 학습한다. 두 번째 단계에서는 교차 엔트로피, 이항교차 엔트로피, 평균제곱오차, 지도 대조 손실함수를 NICD 문제에 맞게 변형하여 학습에 사용한다. 논문에서 제안된 모델은 라벨이 없는 데이터셋에 대해 이미지 최고성능 모델보다 24.74 더 높은 정확도를 기록했다.

  • PDF

Adaptive Background Subtraction Based on Genetic Evolution of the Global Threshold Vector (전역 임계치 벡터의 유전적 진화에 기반한 적응형 배경차분화)

  • Lim, Yang-Mi
    • Journal of Korea Multimedia Society
    • /
    • v.12 no.10
    • /
    • pp.1418-1426
    • /
    • 2009
  • There has been a lot of interest in an effective method for background subtraction in an effort to separate foreground objects from a predefined background image. Promising results on background subtraction using statistical methods have recently been reported are robust enough to operate in dynamic environments, but generally require very large computational resources and still have difficulty in obtaining clear segmentation of objects. We use a simple running-average method to model a gradually changing background, instead of using a complicated statistical technique. We employ a single global threshold vector, optimized by a genetic algorithm, instead of pixel-by-pixel thresholds. A new fitness function is defined and trained to evaluate segmentation result. The system has been implemented on a PC with a webcam, and experimental results on real images show that the new method outperforms an existing method based on a mixture of Gaussian.

  • PDF

Anomaly Detection of Generative Adversarial Networks considering Quality and Distortion of Images (이미지의 질과 왜곡을 고려한 적대적 생성 신경망과 이를 이용한 비정상 검출)

  • Seo, Tae-Moon;Kang, Min-Guk;Kang, Dong-Joong
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.20 no.3
    • /
    • pp.171-179
    • /
    • 2020
  • Recently, studies have shown that convolution neural networks are achieving the best performance in image classification, object detection, and image generation. Vision based defect inspection which is more economical than other defect inspection, is a very important for a factory automation. Although supervised anomaly detection algorithm has far exceeded the performance of traditional machine learning based method, it is inefficient for real industrial field due to its tedious annotation work, In this paper, we propose ADGAN, a unsupervised anomaly detection architecture using the variational autoencoder and the generative adversarial network which give great results in image generation task, and demonstrate whether the proposed network architecture identifies anomalous images well on MNIST benchmark dataset as well as our own welding defect dataset.

Estimation of Sweet Pepper Crop Fresh Weight with Convolutional Neural Network (합성곱 신경망을 이용한 온실 파프리카의 작물 생체중 추정)

  • Moon, Taewon;Park, Junyoung;Son, Jung Eek
    • Journal of Bio-Environment Control
    • /
    • v.29 no.4
    • /
    • pp.381-387
    • /
    • 2020
  • Various studies have been attempted to estimate and measure the fresh weight of crops. However, no studies have used raw images of sweet peppers to estimate fresh weight. Recently, image processing research using convolution neural network (CNN) that can use raw data is increasing. In this study, the crop fresh weight was estimated by using the images of sweet peppers as inputs of CNN. The experiment was performed in a greenhouse growing sweet pepper (Capsicum annuum L.). The fresh weight, the output of the CNN, was regressed based on the data collected through destructive investigation. The highest coefficient of determination (R2) of the trained CNN was 0.95. The estimated fresh weight showed a very similar trend to the actual measured value.