• 제목/요약/키워드: 이미지 학습

검색결과 1,413건 처리시간 0.045초

드론 식별 시스템을 위한 합성곱 신경망 기반 이미지 분류 모델 성능 비교 (Performance Comparison of CNN-Based Image Classification Models for Drone Identification System)

  • 김영완;조대균;박건우
    • 문화기술의 융합
    • /
    • 제10권4호
    • /
    • pp.639-644
    • /
    • 2024
  • 최근 전장에서의 드론 활용이 정찰뿐만 아니라 화력 지원까지 확장됨에 따라, 드론을 조기에 자동으로 식별하는 기술의 중요성이 더욱 증가하고 있다. 본 연구에서는 드론과 크기 및 외형이 유사한 다른 공중 표적들인 새와 풍선을 구분할 수 있는 효과적인 이미지 분류 모델을 확인하기 위해, 인터넷에서 수집한 3,600장의 이미지 데이터셋을 사용하고, 세 가지 사전 학습된 합성곱 신경망 모델(VGG16, ResNet50, InceptionV3)의 특징 추출기능과 추가 분류기를 결합한 전이 학습 접근 방식을 채택하였다. 즉, 가장 우수한 모델을 확인하기 위해 세 가지 사전 학습된 모델(VGG16, ResNet50, InceptionV3)의 성능을 비교 분석하였으며, 실험 결과 InceptionV3 모델이 99.66%의 최고 정확도를 나타냄을 확인하였다. 본 연구는 기존의 합성곱 신경망 모델과 전이 학습을 활용하여 드론을 식별하는 새로운 시도로써, 드론 식별 기술의 발전에 크게 기여 할 것으로 기대된다.

LSTM을 이용한 한국어 이미지 캡션 생성 (Generate Korean image captions using LSTM)

  • 박성재;차정원
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.82-84
    • /
    • 2017
  • 본 논문에서는 한국어 이미지 캡션을 학습하기 위한 데이터를 작성하고 딥러닝을 통해 예측하는 모델을 제안한다. 한국어 데이터 생성을 위해 MS COCO 영어 캡션을 번역하여 한국어로 변환하고 수정하였다. 이미지 캡션 생성을 위한 모델은 CNN을 이용하여 이미지를 512차원의 자질로 인코딩한다. 인코딩된 자질을 LSTM의 입력으로 사용하여 캡션을 생성하였다. 생성된 한국어 MS COCO 데이터에 대해 어절 단위, 형태소 단위, 의미형태소 단위 실험을 진행하였고 그 중 가장 높은 성능을 보인 형태소 단위 모델을 영어 모델과 비교하여 영어 모델과 비슷한 성능을 얻음을 증명하였다.

  • PDF

이미지 객체 및 메타정보 기반 GPT 활용 SNS 문장 작성 보조 시스템 (GPT-enabled SNS Sentence writing support system Based on Image Object and Meta Information)

  • 이동희;문미경;최봉준
    • 융합신호처리학회논문지
    • /
    • 제24권3호
    • /
    • pp.160-165
    • /
    • 2023
  • 본 연구에서는 SNS와 같이 이미지와 함께 글을 작성하는 활동을 보조하기 위해 YOLO와 GPT를 활용한 SNS 문장 작성 보조 시스템을 제안한다. YOLO 모델을 활용하여 글 작성 시 삽입되는 이미지에서 객체를 추출하고 메타정보인 GPS 정보, 생성 시간 정보도 추출하여 함께 GPT의 프롬프트 값으로 사용한다. YOLO 모델을 사용하기 위해 양식 이미지 데이터로 학습하여 사용했으며 해당 모델의 mAP score는 평균 약 0.25이다. GPT는 '맛집 리뷰' 주제의 1,000개의 블로그 텍스트 데이터를 학습하였으며, 본 연구에서 학습된 모델을 사용하여 이미지에서 추출한 2가지 타입의 키워드로 문장을 생성하였다. 생성된 문장의 실용성을 평가하기 위해 설문을 진행하였으며 설문 결과의 명확한 분석을 위해 폐쇄형 설문을 진행하였다. 삽입한 이미지와 키워드 문장을 제공하여 질문에 대해 3가지 평가 항목을 두어 진행하였다. 설문 결과 이미지의 핵심 키워드 경우 유의미한 문장을 생성한다는 결과를 얻을 수 있었다. 본 연구를 통해서 이미지 기반 문장 생성 시 이미지 키워드와 GPT 학습 내용과의 관계에 따라 결과물의 정확성이 달라진다는 결과를 얻을 수 있었다.

효율적인 이미지 검색 시스템을 위한 자기 감독 딥해싱 모델의 비교 분석 (Comparative Analysis of Self-supervised Deephashing Models for Efficient Image Retrieval System)

  • 김수인;전영진;이상범;김원겸
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.519-524
    • /
    • 2023
  • 해싱 기반 이미지 검색에서는 조작된 이미지의 해시코드가 원본 이미지와 달라 동일한 이미지 검색이 어렵다. 본 논문은 이미지의 질감, 모양, 색상 등 특징 정보로부터 지각적 해시코드를 생성하는 자기 감독 기반 딥해싱 모델을 제안하고 평가한다. 비교 모델은 오토인코더 기반 변분 추론 모델들이며, 인코더는 완전 연결 계층, 합성곱 신경망과 트랜스포머 모듈 등으로 설계된다. 제안된 모델은 기하학적 패턴을 추출하고 이미지 내 위치 관계를 활용하는 SimAM 모듈을 포함하는 변형 추론 모델이다. SimAM은 뉴런과 주변 뉴런의 활성화 값을 이용한 에너지 함수를 통해 객체 또는 로컬 영역이 강조된 잠재 벡터를 학습할 수 있다. 제안 방법은 표현 학습 모델로 고차원 입력 이미지의 저차원 잠재 벡터를 생성할 수 있으며, 잠재 벡터는 구분 가능한 해시코드로 이진화 된다. CIFAR-10, ImageNet, NUS-WIDE 등 공개 데이터셋의 실험 결과로부터 제안 모델은 비교 모델보다 우수하며, 지도학습 기반 딥해싱 모델과 동등한 성능이 분석되었다.

미래 지능형 과학실 활용을 위한 "화학원소기호 이미지 기계학습 AI·SW교육 프로그램" 제안 (Proposal for AI/SW Education of Machine learning based on the chemical element symbol image for the Utilizing Future Intelligent Laboratory)

  • 박민솔;박주본;박유민;조영주
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.629-632
    • /
    • 2020
  • 현대사회는 4차 산업혁명 시대가 도래하면서 초연결, 초지능, 초융합 사회로 변화되고 있다. 최근 교육부는 많은 변화가 요구되고 있는 교육분야, 교육정책 방안으로 SW(소프트웨어)교육에 AI(인공지능) 교육까지 추가되야 한다고 제안하고 2024년까지 첨단 기술을 활용한 지능형 과학실을 구축한다고 밝혔다. 이에 본 논문에서는 정부의 교육정책 방안이 원활하게 진행될 수 있고 융합 교육 분야에서 활용될 수 있는 "미래 지능형 과학실 활용을 위한 화학원소기호 이미지 기계학습 AI·SW교육 프로그램"을 제안하고자 한다.

  • PDF

Noise-tolerant Image Restoration with Similarity-learned Fuzzy Association Memory

  • Park, Choong Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.51-55
    • /
    • 2020
  • 본 논문에서는 이미지 복원에 사용되는 기존의 FAM (Fuzzy Associative Memory)에 유사성 학습을 채택하여 개선된 FAM을 제안한다. 이미지 복원은 노이즈가 존재하는 버전에서 원 이미지에 가깝게 복원하는 것을 의미한다. 얼굴 인식과 같은 중요한 적용 문제에서 이 프로세스는 잡음에 강하고 견고하며 빠르며 확장 가능해야한다. 기존의 FAM 은 강력한 퍼지 제어를 통하여 도메인에 적용 할 수 있지만 실제 응용 프로그램에서는 용량 문제가 있지만 단순한 단일 계층 신경망이다. 유사성 측정은 복구 된 이미지와 원본 이미지 사이의 제곱 평균 오차를 최소화하기 위해 FAM 구조의 연결 강도와 관련이 있다. 제안된 알고리즘의 효과는 실험에서 랜덤 노이즈로 인한 오류 크기가 현저히 낮아지는 것을 확인하였다.

생성적 적대 신경망(GAN)을 활용한 강우예측모델 개발 (Developing radar-based rainfall prediction model with GAN(Generative Adversarial Network))

  • 최수연;손소영;김연주
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.185-185
    • /
    • 2021
  • 기후변화로 인한 돌발 강우 등 이상 기후 현상이 증가함에 따라 정확한 강우예측의 중요성은 더 증가하는 추세이다. 전통적인 강우예측의 경우 기상수치모델 또는 외삽법을 이용한 레이더 기반 강우예측 기법을 이용하며, 최근 머신러닝 기술의 발달에 따라 이를 활용한 레이더 자료기반 강우예측기법이 개발되고 있다. 기존 머신러닝을 이용한 강우예측 모델의 경우 주로 시계열 이미지 예측에 적합한 2차원 순환 신경망 기반 기법(Convolutional Long Short-Term Memory, ConvLSTM) 또는 합성곱 신경망 기반 기법(Convolutional Neural Network(CNN) Encoder-Decoder) 등을 이용한다. 본 연구에서는 생성적 적대 신경망 기반 기법(Generative Adversarial Network, GAN)을 이용해 미래 강우예측을 수행하도록 하였다. GAN 방법론은 이미지를 생성하는 생성자와 이를 실제 이미지와 구분하는 구별자가 경쟁하며 학습되어 현재 이미지 생성 분야에서 높은 성능을 보여주고 있다. 본 연구에서 개발한 GAN 기반 모델은 기상청에서 제공된 2016년~2019년까지의 레이더 이미지 자료를 이용하여 초단기, 단기 강우예측을 수행하도록 학습시키고, 2020년 레이더 이미지 자료를 이용해 단기강우예측을 모의하였다. 또한, 기존 머신러닝 기법을 기반으로 한 모델들의 강우예측결과와 GAN 기반 모델의 강우예측결과를 비교분석한 결과, 본 연구를 통해 개발한 강우예측모델이 단기강우예측에 뛰어난 성능을 보이는 것을 확인할 수 있었다.

  • PDF

가상 휴먼 학습 기반 영상 객체 검출 기법 (Object Detection Based on Virtual Humans Learning)

  • 이종민;조동식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.376-378
    • /
    • 2022
  • 최근, 인공지능 기술을 인공지능 스피커, 인공지능 챗봇, 자율주행 자동차 등 다양한 분야에서 널리 활용하고 있다. 이러한 인공지능 활용 분야 중 영상처리 분야에서는 인공지능을 활용하여 객체를 검출하거나 사물을 인식하는 등 다양한 활용성을 보이고 있다. 예를 들면, CCTV 영상 속 범죄자의 모습을 분석하거나 드론으로 촬영한 영상 속에서 자동차의 개수를 파악하는 등 영상처리 분야에서 인공지능을 활용하는 사례는 점차 늘어가고 있다. 또한, 이러한 영상처리 분야에서 촬영된 이미지를 가지고 카메라의 위치를 파악하고자 하는 시도가 늘고 있다. 이미지 속의 특정한 객체를 기반으로 카메라의 촬영 위치를 분석하려는 것이다. 이를 활용하면 특정 공간 속 사람을 사각지역 없이 촬영할 수 있는 최적의 카메라 개수를 구하거나 CCTV를 설치하기 위한 최적의 위치를 구하는 등 다양한 현실 문제를 해결할 수 있을 것으로 예상이 된다. 본 논문에서는 특정 공간에서 촬영된 이미지를 분석하기 위한 방법으로 가상 휴먼이 합성된 데이터를 활용하는 것을 제시한다. 이를 위해 실제 공간과 가상 휴먼을 합성하여 실제 공간에 사람이 있는 것과 같은 이미지를 획득하도록 하였다. 본 논문에 따르면 공간 분석을 위해 실제 이미지 데이터를 얻는 시간과 비용을 절약할 수 있을 것이며 인공지능 학습을 위한 실제 이미지 데이터를 획득하기 어려운 상황에 대한 해결책을 제시할 수 있다.

  • PDF

이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템 (Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features)

  • 임정우;장윤나;손준영;이승윤;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF

의미분석법에 의한 물리 이미지 측정도구 개발 및 적용 (Development and Application of Measurement Tools for Physics Image Using the Semantic Differential Method)

  • 송영욱;최혁준
    • 한국과학교육학회지
    • /
    • 제37권6호
    • /
    • pp.1051-1061
    • /
    • 2017
  • 이미지는 대상에 대해 자신이 경험한 종합적인 결과이며 의식의 표면에 갖고 있는 심상을 의미한다. 교과에 대한 이미지는 그 교과를 학습하는 데 중요한 영향을 미친다. 학습자들이 갖고 있는 교과에 대한 이미지 분석은 교수 학습의 방향성을 결정하는 좋은 자료가 될 것이다. 이 연구의 목적은 물리 이미지 측정도구를 개발하고 적용하여 교육적 시사점을 논의하는 데 있다. 연구 방법은 의미분석법에 의해 물리 이미지 측정도구를 개발하고, 중등 예비 물리교사에게 적용한다. 연구 대상은 사범대학교 물리교육 전공 1학년 39명, 2학년 31명, 3학년 37명, 4학년 38명이고, 전체 남학생은 82명, 여학생은 63명 총 145명이다. 연구결과 물리 이미지 측정도구는 '관심', '느낌', '범위', '평가', '관점'의 5개 요소, 25문항으로 구성되었다. 개발한 물리 이미지 측정도구를 중등 예비교사들에게 적용한 결과 성별, 학년별에 따라 요소별로 통계적인 유의미한 차이가 나타났다. 물리 이미지의 '관심', '느낌' 요소에서 남학생이 여학생 보다 통계적으로 유의미하게 높게 나타났다. 학년별에서는 물리 이미지의 '범위' 요소에서 2학년이 4학년보다 통계적으로 높은 것으로 나타났다. 끝으로 물리 이미지 측정도구 활용의 유용성 및 물리 이미지 분석에 대한 교육적 시사점을 논의하였다.