• 제목/요약/키워드: 이미지 학습

검색결과 1,414건 처리시간 0.027초

Show, Attend and Tell 모델을 이용한 한국어 캡션 생성 (Korean Image Caption Generator Based on Show, Attend and Tell Model)

  • 김다솔;이계민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.258-261
    • /
    • 2022
  • 최근 딥러닝 기술이 발전하면서 이미지를 설명하는 캡션을 생성하는 모델 또한 발전하였다. 하지만 기존 이미지 캡션 모델은 대다수 영어로 구현되어있어 영어로 캡션을 생성하게 된다. 따라서 한국어 캡션을 생성하기 위해서는 영어 이미지 캡션 결과를 한국어로 번역하는 과정이 필요하다는 문제가 있다. 이에 본 연구에서는 기존의 이미지 캡션 모델을 이용하여 한국어 캡션을 직접 생성하는 모델을 만들고자 한다. 이를 위해 이미지 캡션 모델 중 잘 알려진 Show, Attend and Tell 모델을 이용하였다. 학습에는 MS-COCO 데이터의 한국어 캡션 데이터셋을 이용하였다. 한국어 형태소 분석기를 이용하여 토큰을 만들고 캡션 모델을 재학습하여 한국어 캡션을 생성할 수 있었다. 만들어진 한국어 이미지 캡션 모델은 BLEU 스코어를 사용하여 평가하였다. 이때 BLEU 스코어를 사용하여 생성된 한국어 캡션과 영어 캡션의 성능을 평가함에 있어서 언어의 차이에 인한 결과 차이가 발생할 수 있으므로, 영어 이미지 캡션 생성 모델의 출력을 한국어로 번역하여 같은 언어로 모델을 평가한 후 최종 성능을 비교하였다. 평가 결과 한국어 이미지 캡션 생성 모델이 영어 이미지 캡션 생성 모델을 한국어로 번역한 결과보다 좋은 BLEU 스코어를 갖는 것을 확인할 수 있었다.

  • PDF

A Study on Improving the Accuracy of Medical Images Classification Using Data Augmentation

  • Cheon-Ho Park;Min-Guan Kim;Seung-Zoon Lee;Jeongil Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.167-174
    • /
    • 2023
  • 본 연구는 합성곱 신경망 모델에서 이미지 데이터 증강을 통하여 대장암 진단 모델의 정확도를 개선하고자 하였다. 이미지 데이터 증강은 기초 이미지 조작 방법을 이용하여 뒤집기, 회전, 이동, 밀림, 주밍을 사용하였다. 본 연구에서는 실험설계를 위해 보유하고 있는 5000개의 이미지 데이터에 대해 훈련 데이터와 평가 데이터로 각각 4000개와 1000개로 나누었으며, 훈련 데이터 4000개에 대해 이미지 데이터 증강 기법으로 4000개와 8000개의 이미지를 추가하여 모델을 학습시켰다. 평가 결과는 훈련 데이터 4000개, 8000개, 12000개에 대한 분류 정확도가 각각 85.1%, 87.0%, 90.2%로 나왔으며 이미지 데이터 증강에 따른 개선 효과를 확인하였다.

합성곱 신경망을 이용한 아스팔트 콘크리트 도로포장 표면균열 검출 (Asphalt Concrete Pavement Surface Crack Detection using Convolutional Neural Network)

  • 최윤수;김종호;조현철;이창준
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제23권6호
    • /
    • pp.38-44
    • /
    • 2019
  • 본 연구에서는 아스팔트 콘크리트 도로포장의 표면균열 검출을 위해 합성곱 신경망을 이용하였다. 합성곱 신경망의 학습에 사용되는 표면균열 이미지 데이터의 양에 따른 합성곱 신경망의 성능향상 정도를 평가하였다. 사용된 합성곱 신경망의 구조는 5개의 층으로 구성되어있으며, 3×3 크기의 convolution filter와 2×2 크기의 pooling kernel을 사용하였다. 합성곱 신경망의 학습을 위해서 도로노면 조사 장비를 통해 구축된 국내 도로포장 표면균열 이미지를 활용하였다. 표면균열 이미지 데이터를 학습한 합성곱 신경망 모델의 표면균열 검출 정확도, 정밀도, 재현율, 미검출율, 과검출율을 평가하였다. 가장 많은 양의 데이터를 학습한 합성곱 신경망 모델의 표면균열 검출 정확도, 정밀도, 재현율은 96.6% 이상, 미검출율, 과검출율은 3.4% 이하의 성능을 나타내었다.

초등학생의 특성을 고려한 비트맵이미지 저장원리 수업을 통한 초등정보과학의 교수학습에 관한 연구 (A Study on the Elementary Computer Science Teaching and Learning the Principle of Saving Bitmap Images by Considering Characteristics of Elementary School)

  • 이미영;구정모;한병래
    • 정보교육학회논문지
    • /
    • 제12권4호
    • /
    • pp.405-415
    • /
    • 2008
  • 현재의 초등컴퓨터교육과정은 응용소프트웨어 및 학습용 소프트웨어의 기능을 익히는 측면이 강조되어 왔다. 최근 컴퓨터과학원리 교육을 통한 사고력 교육을 주장하는 측면도 있지만, 그에 따른 문제점, 학생들의 반응 등 다양한 연구 결과가 많지 않다. 이에 본 연구에서는 초등학생에게 컴퓨터 교과 내용학의 컴퓨터 과학 원리를 도입할 수 있는지 그 가능성을 알아보고자 한다. 다양한 컴퓨터과학 원리 가운데, 이진수의 개념, 영상의 표현, 파일 저장을 하나의 주제로 통합한 비트맵이미지 저장원리를 학습주제로 선정하여 연구를 진행하였다. 연구 결과, 초등학생의 특성을 고려하여 수업을 활동 중심으로 진행하고, 학습내용을 초등학생의 수준에 맞춘다면 초등학생들도 내용을 이해할 수 있음을 확인할 수 있었다.

  • PDF

Online Multi-Object Tracking by Learning Discriminative Appearance with Fourier Transform and Partial Least Square Analysis

  • Lee, Seong-Ho;Bae, Seung-Hwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.49-58
    • /
    • 2020
  • 본 연구는 온라인 다중 객체 추적 환경에서 모든 객체의 상태(예. 위치 및 크기) 및 identifications (IDs)를 추적하는 문제를 다룬다. 프레임들 간 검출 결과들을 연관하여 객체들의 궤도를 점진적으로 완성하는 tracking-by-detection 접근법을 기반으로 온라인 다중 객체 추적 문제를 해결하고자 한다. 정확한 온라인 연관을 수행하기 위해 이산 푸리에 변환과 부분 최소 제곱법(partial least square, PLS) 분석을 기반으로 하는 새로운 온라인 외형 학습 방법을 제안한다. 즉, 먼저 주파수 도메인에서 추적에 용이한 객체 특징량을 추출하기 위해 추적 객체에 대한 이미지를 푸리에 이미지로 변환한다. 나아가 객체간의 주파수 특징을 보다 잘 구별할 수 있도록 PLS기반 부분 공간을 학습한다. 제안된 외형 학습을 최신 신뢰도 기반 연관 기법과 결합하였고, 다중 객체 추적평가 분야에서 국제적으로 공인된 MOT 벤치마크 챌린지 데이터 셋에서 최신 다중 객체 추적 알고리즘과 비교평가를 수행하였다.

초등학교 예비교사들의 과학 수업 이미지에 나타난 상호작용 분석 (Analysis of Teacher-Students Interactions in the Image of Science Class by Elementary Preservice Teachers)

  • 전경문
    • 과학교육연구지
    • /
    • 제43권3호
    • /
    • pp.318-328
    • /
    • 2019
  • 본 연구의 목적은 초등학교 예비교사들의 과학 수업 이미지에 나타난 교사와 학생 간 상호작용을 조사하는 것이다. 정서적 지원(분위기, 학생 시각에 대한 관심, 교사 민감도), 수업 조직(교수학습 형식, 행동 조절, 생산성), 학습 지원(피드백의 질, 언어 모델링, 개념 발달)의 3개 영역 총 9개 기준에 의해 긍정적 상호작용과 부정적 상호작용을 분석하였다. 연구 결과 상당수 학생들이 교수학습 형식 또는 개념 발달에 해당하는 긍정적 상호작용을 선호하는 경향이 나타났다. 기피하는 수업의 경우에는 교수학습 형식 또는 학생 시각에 대한 관심 측면의 부정적 상호작용이 많이 나타났으나, 그 외 매우 낮은 빈도를 보인 상호작용 요소들도 있었다. 그리고 여자 예비교사들이 남자에 비해 긍정적인 상호작용을 약간 더 선호하는 것으로 조사되었다. 교사전문성에 대한 함의 및 후속 연구에 대한 제언을 논의하였다.

A Study on Realistic 360 Degree Panorama Webtoon-Metaverse Service

  • Lee, Byong-Kwon;Jung, Doo-Yong
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.147-153
    • /
    • 2022
  • 현재, 다양한 형태의 메타버스 서비스 솔루션(제페토, 로블록스, 샌드박스, 디센트럴랜드)이 제작되고 서비스되고 있다. 메타버스 서비스는 360 파노라마 형태의 월드 기반에 3D 오브젝트를 배치해 구성한 솔루션이 대부분으로 게이미피케이션 형태로 구성된다. 하지만, 메타버스 형태의 웹툰 서비스는 구현 및 연구가 부족한 실정이다. 본 연구는 2D 평면이미지 형태의 웹툰을 3차원 공간에서 구현하는 방법과 실감형 360도 파노라마 웹툰 메타버스 서비스에 관해 연구했다. 연구 및 분석 과정은 웹툰 제작을 위한 기본적인 스토리텔링 및 설계작업, 제작된 이미지를 360도 형태로 변환하기 위한 파노라마 이미지 생성, 메타버스 공간에서 전-방향(all directional)을 보기 위한 360웹툰 콘텐츠 제작과정을 연구했다. 또한, 가상현실 기반의 웹툰을 감상할 수 있도록 쉐이딩 및 메트리얼 작업 방법을 제시했다. 현재 불모지로 여겨지는 웹툰 메타버스 분야에 초석이 될 것으로 생각한다.

Enhanced ACGAN based on Progressive Step Training and Weight Transfer

  • Jinmo Byeon;Inshil Doh;Dana Yang
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.11-20
    • /
    • 2024
  • AI(Artificial Intelligence)의 다양한 모델 중 생성 모델, 특히 GAN(Generative Adversarial Network)은 이미지 처리, 밀도 추정, 스타일 전이 등 다양한 응용 분야에서 성공을 거두었다. 이러한 GAN은 CGAN(Conditional GAN), CycleGAN, BigGAN 등의 방식으로 확장 및 개선되었지만 재난 시뮬레이션, 의료 분야, 도시 계획 등 특정 분야에서는 데이터 부족과 불안정한 학습에 의한 이미지 왜곡 문제로 실제 시스템 적용에 문제가 되고 있다. 본 논문에서는 클래스 항목을 판별하는 ACGAN(Auxiliary Classifier GAN) 구조를 기반으로 기존 PGGAN(Progressive Growing of GAN)의 점진적 학습 방식을 활용한 새로운 점진적 단계의 학습 방법론 PST(Progressive Step Training)를 제안한다. PST 모델은 기존 방법 대비 70.82% 빠른 안정화, 51.3% 낮은 표준 편차, 후반 고해상도의 안정적 손실값 수렴 그리고 94.6% 빠른 손실 감소를 달성한다.