• 제목/요약/키워드: Deep Learning Dataset

검색결과 764건 처리시간 0.027초

미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약 (Automatic Text Summarization based on Selective Copy mechanism against for Addressing OOV)

  • 이태석;선충녕;정영임;강승식
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.58-65
    • /
    • 2019
  • 문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 축약하는 작업을 말한다. 최근 연구에서는 대량의 문서를 딥러닝 기법을 적용하여 요약문 자체를 생성하는 방식으로 발전하고 있다. 생성 요약은 미리 생성된 위드 임베딩 정보를 사용하는데, 전문 용어와 같이 저빈도 핵심 어휘는 입베딩 된 사전에 없는 문제가 발생한다. 인코딩-디코딩 신경망 모델의 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능 저하의 요인이다. 이를 해결하기 위해 본 논문에서는 요약 대상 문서에서 새로 출현한 단어를 복사하여 요약문을 생성하는 방법을 사용한다. 기존의 연구와는 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 방법으로 제안하였다. 학습 데이터는 논문의 초록과 제목을 대상 문서와 정답 요약으로 사용하였다. 제안한 인코딩-디코딩 기반 모델을 통해서 자동 생성 요약을 수행한 결과 단어 제현 기반의 ROUGE-1이 47.01로 나타났으며, 또한 어순 기반의 ROUGE-L이 29.55로 향상되었다.

자동-레이블링 기반 영상 학습데이터 제작 시스템 (An Auto-Labeling based Smart Image Annotation System)

  • 이용;장래영;박민우;이건우;최명석
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.701-715
    • /
    • 2021
  • 최근 딥러닝 기술의 급속한 발전과 함께 학습데이터가 크게 주목을 받고 있다. 일반적으로 딥러닝 방식에서는 모델을 훈련시키기 위해 충분한 학습데이터가 준비되어 있어야 한다. 하지만, 딥러닝 모델 설계 작업과 달리 데이터셋을 제작하는 데 상당한 시간과 노력이 필요하다. 영상 데이터를 주로 다루는 시각지능 분야에서도 학습데이터 제작자들은 전문적인 학습데이터 제작 도구를 사용해 이미지 단위로 레이블링을 수작업으로 하고 있어 여전히 많은 시간과 노력이 필요한 상황이다. 따라서, 다양한 분야에서 필요한 충분한 영상 학습데이터셋을 확보하기 위해 기존의 수작업 방식을 대체할 수 있는 레이블링 기술이 필요하다. 본 논문에서는, 영상 학습데이터셋 동향을 소개하고, 학습데이터 제작 환경에 대해 분석한다 특히, 수작업으로 이루어지는 반복적이고 수고스러운 레이블링 과정을 자동화하여, '확인과 수정'의 단계를 비약적으로 단축시킬 수 있는 '스마트 영상학습데이터 제작 시스템'을 제안한다. 그리고, 실험을 통해 영상 학습데이터 제작 과정에서 이미지에 박스형 및 폴리곤형 객체영역을 지정하여 레이블링하는 데 소요되는 시간을 크게 줄이기 위한 자동레이블링 방식의 효과를 검증한다. 마지막으로, 제안하는 시스템의 실험에서 추가적으로 검증되어야 하는 부분과 함께 이를 개선하기 위한 향후 연구 계획에 대해 논의한다.

밀폐공간 내 감염병 위험도 모니터링을 위한 열화상 온도 스크리닝 시스템 설계 및 구현에 대한 연구 (A Study on the Design and Implementation of a Thermal Imaging Temperature Screening System for Monitoring the Risk of Infectious Diseases in Enclosed Indoor Spaces)

  • 정재영;김유진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권2호
    • /
    • pp.85-92
    • /
    • 2023
  • 코로나바이러스감염증-19와 같은 호흡기 감염병은 주로 밀집/밀폐/밀접 공간인 실내에서 일어난다. 호흡기 감염병 이상징후의 존재 여부는 발열, 기침, 재채기 및 호흡곤란 등의 초기 증상을 통해 판단되고 있으며, 이러한 초기 증상에 대한 상시 모니터링이 요구된다. 열화상 온도 스크리닝 시스템은 개인의 피부 온도 상승의 징후가 있는지 초기에 선별하는 빠르고 쉬운 비접촉 스크리닝 방법을 제공하지만, 측정 타겟, 주변 온도 등의 측정 환경과 피 측정대상과의 측정 거리에 따른 오차로 인해 정확한 온도측정이 어렵다. 그리고 국제표준 IEC 80601-2-59 에서는 내안각(Inner Canthus) 인접한 영역에 대한 안면 열화상 촬영을 권고하고 있다. 본 논문에서는 가시광 카메라 모듈과 열화상 카메라 모듈에 대해서 이미지 일치화 보정을 수행하였으며, 흑체(Blackbody)를 이용해 측정 환경에 대한 열화상 카메라 모듈 온도를 보정하였다. 표준에서 권고하는 측정 타겟을 인식하기 위해 딥러닝 기반 객체 인식 알고리즘과 내안각 인식 모델을 개발하였으며, 100명의 실험자군에 대한 데이터셋을 적용하여 인식 모델 정확도를 도출하였다. 또한 라이다 모듈을 이용한 객체 거리 측정과 선형회귀 보정 모듈을 통해 측정 거리에 따른 오차를 보정하였다. 제안한 모델의 성능 측정을 위해 모터 스테이지, 열화상 온도 스크리닝 시스템, 흑체로 구성된 실험환경을 구축하였으며, 1m에서 3.5m 사이 가변 거리에 따른 온도측정 결과 0.28℃ 이내의 오차 정확도를 확인하였다.

천리안위성 2A호 위성영상을 위한 영상융합기법의 비교평가 (A Comparison of Pan-sharpening Algorithms for GK-2A Satellite Imagery)

  • 이수봉;최재완
    • 한국측량학회지
    • /
    • 제40권4호
    • /
    • pp.275-292
    • /
    • 2022
  • 기후변화 감시에 위성 자료 활용을 위해 GCOS (Global Climate Observing System)는 시공간 해상도, 시간 변화에 따른 안정성, 불확실도 등의 요구사항을 제시하고 있다. 천리안위성 2A호의 경우, 센서의 한계로 인해 산출물들이 공간해상도 조건에 충족하지 못하는 경우가 많다. 따라서 본 연구에서는 영상융합 기법들을 천리안위성 2A호 영상에 적용하여 산출물 생성 시 활용될 수 있는 최적의 기법을 찾고자 한다. 이를 위해 CS (Component Substitution), MRA (Multiresolution Analysis), VO (Variational Optimization), DL (Deep Learning)에 포함되는 총 6가지 영상융합 기법을 활용하였다. DL의 경우 합성적(Synthesis) 특성 기반 방법을 훈련자료 구축에 사용하였다. 합성적 특성 기반 방법의 과정은 PAN (Panchromatic)과 MS (Multispectral) 영상의 공간해상도 차이만큼 두 영상의 해상도를 낮춰 융합 영상을 생성한 후 원본 MS 영상과 비교한다. 합성적 특성 기반 방법은 공간해상도를 저하시킨 PAN 영상과 MS 영상 간 기하 특성이 같아야 사용자가 원하는 수준의 융합 영상을 제작할 수 있다. 하지만, 훈련자료 구축 시 비유사성이 존재하기에 이를 최소화하는 방법으로 무작위 비율을 활용한 PSGAN 모델(PSGAN_RD)을 추가로 활용하였다. 융합 영상의 검증은 일관성(consistency) 및 합성적 특성 기반 정성적, 정량적 분석을 수행하였다. 분석 결과, 영상융합 알고리즘 중 GSA가 공간 유사도를 나타내는 평가지수에서 가장 높은 수치를 보였으며, 분광 유사도를 나타내는 지수들은 PSGAN_RD 모델의 정확도가 가장 높았다. 융합 영상의 공간 및 분광 특성을 모두 고려한다면 PSGAN_RD 모델이 천리안위성 2A호 산출물 제작에 가장 최적일 것으로 판단하였다.

멀티모달 맥락정보 융합에 기초한 다중 물체 목표 시각적 탐색 이동 (Multi-Object Goal Visual Navigation Based on Multimodal Context Fusion)

  • 최정현;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.407-418
    • /
    • 2023
  • MultiOn(Multi-Object Goal Visual Navigation)은 에이전트가 미지의 실내 환경 내 임의의 위치에 놓인 다수의 목표 물체들을 미리 정해준 일정한 순서에 따라 찾아가야 하는 매우 어려운 시각적 탐색 이동 작업이다. MultiOn 작업을 위한 기존의 모델들은 행동 선택을 위해 시각적 외관 지도나 목표 지도와 같은 단일 맥락 지도만을 이용할 뿐, 다양한 멀티모달 맥락정보에 관한 종합적인 관점을 활용할 수 없다는 한계성을 가지고 있다. 이와 같은 한계성을 극복하기 위해, 본 논문에서는 MultiOn 작업을 위한 새로운 심층 신경망 기반의 에이전트 모델인 MCFMO(Multimodal Context Fusion for MultiOn tasks)를 제안한다. 제안 모델에서는 입력 영상의 시각적 외관 특징외에 환경 물체의 의미적 특징, 목표 물체 특징도 함께 포함한 멀티모달 맥락 지도를 행동 선택에 이용한다. 또한, 제안 모델은 점-단위 합성곱 신경망 모듈을 이용하여 3가지 서로 이질적인 맥락 특징들을 효과적으로 융합한다. 이 밖에도 제안 모델은 효율적인 이동 정책 학습을 유도하기 위해, 목표 물체의 관측 여부와 방향, 그리고 거리를 예측하는 보조 작업 학습 모듈을 추가로 채용한다. 본 논문에서는 Habitat-Matterport3D 시뮬레이션 환경과 장면 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 모델의 우수성을 확인하였다.

해안쓰레기 탐지 및 모니터링에 대한 딥러닝 기반 객체 탐지 기술의 적용성 평가: YOLOv8과 RT-DETR을 중심으로 (Applicability Evaluation of Deep Learning-Based Object Detection for Coastal Debris Monitoring: A Comparative Study of YOLOv8 and RT-DETR)

  • 박수호;김흥민;김영민;이인지;박미소;오승열;김탁영;장선웅
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1195-1210
    • /
    • 2023
  • 해안쓰레기는 미관 훼손 및 생태와 보건에 미치는 영향으로 인해 큰 문제로 대두되고 있다. 이를 해결하기 위한 노력의 일환으로 본 연구는 해안쓰레기 탐지와 모니터링을 위한 이미지 데이터셋 구축과 실시간 객체 탐지 분야의 대표적인 모델인 YOLOv8과 RT-DETR의 성능을 비교하였다. 특히 다양한 환경 하에서의 강건성을 평가하기 위해 여러 왜곡 조건에서 성능 변화 실험을 수행하였다. YOLOv8은 mean Average Precision (mAP) 0.927~0.945의 정확도와 65~135 Frames Per Second (FPS)의 탐지 속도를 보인 반면, RT-DETR은 mAP 0.917~0.918의 정확도와 40~53 FPS의 탐지 속도를 보였다. 색상 왜곡에 대해서는 RT-DETR이 더 강건한 성능을 보였으나, 그 외의 조건에서는 YOLOv8이 더 높은 강건성을 보였다. 본 연구의 결과는 실제 해안쓰레기 모니터링 시스템의 모델 선택에 있어 중요한 지침을 제공할 것으로 기대된다.

실시간 영상이미지 분석을 통한 아스팔트 콘크리트 포장의 노면 상태 인식 및 블랙아이스 예방시스템 (Real-time Road Surface Recognition and Black Ice Prevention System for Asphalt Concrete Pavements using Image Analysis)

  • 정회평;송호민;최영철
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제28권1호
    • /
    • pp.82-89
    • /
    • 2024
  • 블랙 아이스는 인지하기가 매우 어렵고 도로 노면의 마찰력이 감소하여 자동차 사고를 유발한다. 도로 노면의 블랙아이스 방지를 위한 다양한 연구가 수행되었으나, 실시간으로 블랙아이스를 식별하고 운전자에게 경고하는 시스템에 대한 연구는 매우 미흡한 실정이다. 본 논문에서는 아스팔트 도로 노면의 상태를 실시간적으로 식별하기 위해 이미지기반 분석 시스템을 개발하였다. 이를 위해 각 아스팔트 도로 노면 이미지에 대해 데이터 세트를 구축한 다음 딥러닝을 통해 노면의 상태를 건조, 젖음, 블랙아이스, 눈 노면 상태로 식별하였다. 또한, 이미지 분석결과와 더불어 도로 노면 상태의 최종판별을 위해 실제 노면에서 측정된 온도와 습도 데이터를 사용하였다. 도로 노면의 특성이 블랙아이스로 판정이 나면, 도로에 설치된 염수 분사장치가 자동으로 작동하도록 하였다. 본 연구에서 개발된 아스팔트 콘크리트 포장에 대한 노면 상태 식별 시스템과 블랙아이스 자동 예방 시스템은 운전자의 안전운행을 보장하고 교통사고 발생률을 낮출 수 있을 것으로 기대된다.

데이터 예측을 위한 텐서플로우 기반 기계학습 알고리즘 비교 연구 (A Comparative Study of Machine Learning Algorithms Based on Tensorflow for Data Prediction)

  • ;장성봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권3호
    • /
    • pp.71-80
    • /
    • 2021
  • 기계학습에서 정확한 데이터 예측을 위해서는 적절한 인공신경망 알고리즘을 선택해야 한다. 이러한 알고리즘에는 심층 신경망 (DNN), 반복 신경망 (RNN), 장단기 기억 (LSTM) 네트워크 및 게이트 반복 단위 (GRU) 신경망등을 들 수 있다. 개발자가 실험을 위해, 하나를 선택해야 하는 경우, 각 알고리즘의 성능에 대한 충분한 정보가 없었기 때문에, 직관에 의존할 수 밖에 없었다. 본 연구에서는 이러한 어려움을 완화하기 위해 실험을 통해 예측 오류(RMSE)와 처리 시간을 비교 평가 하였다. 각 알고리즘은 텐서플로우를 이용하여 구현하였으며, 세금 데이터를 사용하여 학습을 수행 하였다. 학습 된 모델을 사용하여, 세금 예측을 수행 하였으며, 실제값과의 비교를 통해 정확도를 측정 하였다. 또한, 활성화 함수와 다양한 최적화 함수들이 알고리즘에 미치는 영향을 비교 분석 하였다. 실험 결과, GRU 및 LSTM 알고리즘의 경우, RMSE(Root Mean Sqaure Error)는 0.12이고 R2값은 각각 0.78 및 0.75로 다른 알고리즘에 비해 더 낳은 성능을 보여 주었다. 기본 심층 신경망(DNN)의 경우, 처리 시간은 가장 낮지만 예측 오류는 0.163로 성능은 가장 낮게 측정 되었다. 최적화 알고리즘의 경우, 아담(Adam)이 오류 측면에서 최고의 성능을, 처리 시간 측면에서 최악의 성능을 보여 주었다. 본 연구의 연구결과는 데이터 예측을 위한 알고리즘 선택시, 개발자들에게 유용한 정보로 사용될 것으로 예상된다.

CNN-LSTM 기반의 상지 재활운동 실시간 모니터링 시스템 (CNN-LSTM-based Upper Extremity Rehabilitation Exercise Real-time Monitoring System)

  • 김재정;김정현;이솔;서지윤;정도운
    • 융합신호처리학회논문지
    • /
    • 제24권3호
    • /
    • pp.134-139
    • /
    • 2023
  • 재활환자는 수술 치료 후 신속한 사회복귀를 목적으로 신체적 기능 회복을 위하여 통원치료 및 일상에서 재활운동을 수행한다. 병원에서 전문 치료사의 도움으로 운동을 수행하는 것과 달리 일상에서 환자 스스로 재활운동을 수행하는 것은 많은 어려움이 있다. 본 논문에서는 일상에서 환자 스스로 효율적이고 올바른 자세로 재활운동을 수행할 수 있도록 CNN-LSTM 기반의 상지 재활운동 실시간 모니터링 시스템을 제안한다. 제안한 시스템은 EMG, IMU가 탑재된 어깨 착용형 하드웨어를 통해 생체신호를 계측하고 학습을 위한 전처리 과정과 정규화를 진행하여 학습 데이터세트로 사용하였다. 구현된 모델은 특징 검출을 위한 3개 합성곱 레이어 3개의 폴링 레이어, 분류를 위한 2개의 LSTM 레이어로 구성되어 있으며 검증 데이터에 대한 학습 결과 97.44%를 확인할 수 있었다. 이후 Teachable machine과의 비교평가를 진행하였으며 비교평가 결과 구현된 모델은 93.6%, Teachable machine은 94.4%로 두 모델이 유사한 분류 성능을 나타내는 것을 확인하였다.

패치 특징 코어세트 기반의 흉부 X-Ray 영상에서의 병변 유무 감지 (Leision Detection in Chest X-ray Images based on Coreset of Patch Feature)

  • 김현빈;전준철
    • 인터넷정보학회논문지
    • /
    • 제23권3호
    • /
    • pp.35-45
    • /
    • 2022
  • 현대에도 일부 소외된 지역에서는 의료 인력의 부족으로 인해 위·중증 환자에 대한 치료가 지연되는 경우가 많다. 의료 데이터에 대한 분석을 자동화하여 의료 서비스의 접근성 문제 및 의료 인력 부족을 해소하고자 하는 연구가 계속되고 있다. 컴퓨터 비전 기반의 진료 자동화는 훈련 목적에 대한 데이터 수집 및 라벨링 작업에서 많은 비용이 요구된다. 이러한 점은 희귀질환이나 시각적으로 뚜렷하게 정의하기 어려운 병리적 특징 및 기전을 구분하는 작업에서 두드러진다. 이상 탐지는 비지도 학습 전략을 채택함으로써 데이터 수집 비용을 크게 절감할 수 있는 방법으로 주목된다. 본 논문에서는 기존의 이상 탐지 기법들을 기반으로, 흉부 X-RAY 영상에 대해 이상 탐지를 수행하는 방법을 다음과 같이 제안한다. (1) 최적 해상도로 샘플링된 의료 영상의 색상 범위를 정규화한다. (2) 무병변 영상으로부터 패치 단위로 구분된 중간 수준 특징 집합을 추출하여 그 중 높은 표현력을 가진 일부 특징 벡터들을 선정한다. (3) 최근접 이웃 탐색 알고리즘을 기반으로 미리 선정된 무병변(정상) 특징 벡터들과의 차이를 측정한다. 본 논문에서는 PA 방식으로 촬영된 흉부 X-RAY 영상들에 대한 제안 시스템의 이상 탐지 성능을 세부 조건에 따라 상세히 측정하여 제시한다. PadChest 데이터세트로부터 추출한 서브세트에 대해 0.705 분류 AUROC를 보임으로써 의료 영상에 대한 이상 탐지 적용의 효과를 입증하였다. 제안 시스템은 의료 기관의 임상 진단 워크플로우를 개선하는 데에 유용하게 사용될 수 있으며, 의료 서비스 접근성이 낮은 지역에서의 조기 진단을 효율적으로 지원할 수 있다.