• Title/Summary/Keyword: 검출 모델

Search Result 1,734, Processing Time 0.031 seconds

COVID-19 Korean Fake News Detection using Named Entity and User Reproliferation Information (개체명 및 사용자 재확산 정보를 이용한 한국어 COVID-19 가짜 뉴스 검출)

  • Park, Chaewon;Kang, Jiwon;Lee, Daeun;Lee, Munyoung;Han, Jinyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.85-90
    • /
    • 2021
  • 코로나바이러스감염증-19로 인한 팬데믹 상황이 지속되면서 감염증 정보의 불확실성으로 인해 코로나 관련 루머가 온라인상에서 빠르게 전파되고 있다. 이러한 코로나 관련 가짜 뉴스를 사전에 탐지하기 위해, 본 연구에서는 한국어 코로나 가짜 뉴스 데이터셋을 구축하고, 개체명과 사용자 재확산 정보를 이용한 한국어 가짜 뉴스 탐지 모델을 제안한다. 가짜 뉴스 팩트체킹 언론인 서울대팩트체크센터에서 코로나 관련 루머 및 가짜 뉴스에 대한 검증 기사를 수집한 후, 기사로부터 개체명 추출 모델을 통해 주제 키워드를 추출하고, 이를 이용해 유튜브 상의 사용자 재확산 정보를 수집하여 데이터셋을 구성하였다. BERT 기반의 제안 모델을 다양한 비교군과 비교하였고, 특성 조합에 따른 실험을 통해 각 특성 정보(기사 텍스트, 개체명 데이터, 유튜브 데이터)가 가짜 뉴스 탐지 성능에 미치는 영향을 알아보았다.

  • PDF

Abnormal Behavior Detection and Localization Using Aspect Ratio Based on Mask R-CNN (Mask R-CNN 기반 Aspect Ratio를 활용한 이상행동 검출 및 영역화 방법)

  • Lim, Hyunseok;Hu, Xufeng;Gwak, Jeonghwan
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.99-101
    • /
    • 2022
  • 이상 행동을 탐지하는 딥러닝 기반 검지 시스템은 동영상 기반 데이터로부터 움직임을 보이는 객체를 추적하고 그 객체의 행동을 분석하여 정상적인 행동 범위를 벗어나는 패턴을 보이는 영역을 이상으로 탐지한다. 특히 생성적 적대 신경망(GAN)과 광학 흐름 추정(Optical flow estimation) 기법을 활용하여 움직임에 대한 특징 정보를 추출하고 이를 학습하여 행동 패턴에 대한 모델링을 수행한다. 모델 학습 및 테스트에 활용되는 데이터셋의 해상도가 낮거나 이상 행동을 표현하는 특징 정보가 부족할 경우 최종 모델 성능에 부정적 영향을 미치게 되며, 특히 광학 흐름이 표현하는 이동량 측면에서 차이가 크게 나지 않는 이상 객체의 경우 탐지가 정확하게 이뤄지지 않는다. 본 연구에서는 동영상 프레임에서 나타나는 객체의 평균 종횡비를 구하고 정상적인 비율을 벗어나는 객체에 대해서 이상 행동을 취하는 샘플로 처리하는 후처리단 모듈을 제안하여 최종적인 모델 성능을 향상시키는 방법을 고안한다.

  • PDF

A Study on Anomaly Detection Neural Network Model Based On Flow Direction/Velocity Data (유향/유속 데이터 중심의 이상 검출 신경망 모델)

  • Seong-Kil Hyun;Dong-Young Yoo
    • Annual Conference of KIPS
    • /
    • 2023.05a
    • /
    • pp.555-557
    • /
    • 2023
  • 해양의 영향을 많이 받는 우리나라의 지리적 특성상 해양 상황은 산업 및 생업과 밀접한 관계가 있다. OPEN API 를 이용하여 유향/유속, 조위등 해양 환경관련 실시간 시계열 데이터를 수집한 후 2 차원 공간에 표시하여 순환 신경망 모델을 이용하여 학습한다. 학습된 모델을 실제 데이터에 적용하여 파랑을 예측한다. 시계열의 성격이 있고 공간상에 표시할 수 있는 데이터라면 본 논문에서 제시한 체계를 통해 예측할 수 있을 것이라 예상한다.

Comparative Analysis of Object Detection Performance on Edge Devices using SSD-Mobilenet-V2 Model (SSD-Mobilenet-V2 모델을 사용한 Edge Device 에서의 객체검출 성능 비교 및 분석)

  • Seok-Yoon Choi;Joon-Hyuk Choi;Seung-Ho Lim
    • Annual Conference of KIPS
    • /
    • 2023.05a
    • /
    • pp.79-80
    • /
    • 2023
  • CPU 와 GPU 의 성능이 지속적으로 발전함에 따라 객체 인식 인공지능의 정확도와 추론 속도는 점차 향상되고 있으나 이러한 성능을 Edge Device 와 같은 제한된 환경에서 구현하기에 아직 여러 한계점이 존재한다. 본 논문에서는 여러가지 Edge Device 에서 객체 인식을 위한 경량화 된 모델 중 하나인 SSD-Mobilenet-V2 를 활용하여 결과값을 통해 각 Device 간 경향성을 분석하였다. 본 결과를 바탕으로 다양한 환경에서의 객체인식 인공지능 모델의 성능 개선을 위한 연구에 활용할 수 있다.

Detection and classification of Bulky Waste based on YOLOv7 algorithm (YOLOv7 알고리즘 기반 대형폐기물 검출 및 분류)

  • Siung Kim;Junhyeok Go;Jeonghyeon Park;Nammee Moon
    • Annual Conference of KIPS
    • /
    • 2023.11a
    • /
    • pp.1215-1217
    • /
    • 2023
  • 가정에서 대형 폐기물을 배출하고 수거하는 과정에서 폐기물을 수동적으로 분류를 하는 것은 시간이 많이 소요되는 작업이다. 본 논문에서는 YOLOv4, 5, 7 모델을 비교하여 실생활에 사용가능한 대형 폐기물 탐지에 가장 적합한 모델을 찾는다. 이미지 증강 전 결과는 YOLOv7이 가장 좋은 성능을 보였다. 배출자가 촬영하는 각도나 위치, 시간 등의 변수를 고려하고자 증강을 시도하였고 증강 후 탐지 결과도 YOLOv7이 F1-score 93 %, mAP 96.6% 로 다른 모델보다 전체적으로 더 좋은 성능을 보였다.

Image classification using vision transformers with complex positional embeddings (복소수 위치 임베딩을 적용한 비전 트랜스포머 활용 이미지 분류)

  • Han-Young Kim;Yeong-Jun Cho
    • Annual Conference of KIPS
    • /
    • 2024.10a
    • /
    • pp.619-621
    • /
    • 2024
  • 본 연구에서는 Complex Order Position Embedding (COPE)을 Vision Transformer (ViT)에 적용하여 컴퓨터 비전 태스크에서의 효과성을 검증하였다. COPE는 복소수 연산을 활용하여 위치 정보를 인코딩하는 방법으로, 기존에 자연어 처리 분야에서 성공적으로 적용된 바 있다. ImageNet-Tiny 데이터셋을 사용한 실험에서, COPE를 적용한 ViT-Tiny 모델은 기존 모델 대비 1.8%p 높은 34.0%의 정확도를 달성하였다. 이는 파라미터 수의 미미한 증가(약 37,000개)만으로 이루어진 성능 향상이다. 본 연구 결과는COPE가 컴퓨터 비전 분야에서도 효과적임을 입증하며, 특히 객체 검출이나 의미론적 분할과 같이 위치 정보가 중요한 고난도 비전 태스크에서의 잠재적 성능 향상 가능성을 제시한다. 이는 복소수 위치 임베딩의 응용 범위를 확장하고, 트랜스포머 기반 비전 모델의 성능 개선을 위한 새로운 방향을 제시한다는 점에서 의의가 있다.

Development of Tongue Diagnosis System Using ASM and SVM (ASM과 SVM을 이용한 설진 시스템 개발)

  • Park, Jin-Woong;Kang, Sun-Kyung;Kim, Young-Un;Jung, Sung-Tae
    • Journal of the Korea Society of Computer and Information
    • /
    • v.18 no.4
    • /
    • pp.45-55
    • /
    • 2013
  • In this study, we propose a tongue diagnosis system which detects the tongue from face image and divides the tongue area into six areas, and finally generates tongue fur ratio of each area. To detect the tongue area from face image, we use ASM as one of the active shape models. Detected tongue area is divided into six areas and the distribution of tongue coating of six areas is examined by SVM. For SVM, we use a 3-dimensional vector calculated by PCA from a 12-dimensional vector consisting of RGB, HSV, Lab, and Luv. As a result, we stably detected the tongue area using ASM. Furthermore, we recognized that PCA and SVM helped to raise the ratio of tongue coating detection.

Road Detection in the Spaceborne Synthetic Aperture Radar Images (위성 탑재 합성개구 레이더 영상에서의 도로 검출)

  • Chun, Sung-Min;Hong, Ki-Sang
    • Journal of the Korean Institute of Telematics and Electronics S
    • /
    • v.35S no.11
    • /
    • pp.123-132
    • /
    • 1998
  • This paper presents a road detection technique for spaceborne synthetic aperture radar (SAR) images. Roads are important cartographic features. We incorporate an active contour model called snake as a model for the road and define a new external energy for snake which is appropriate for the road. Detecting roads in spaceborne SAR images is very difficult without other information. In this paper, digital maps are utilized to obtain the initial position and shape for snake. Only approximate geodetic location of roads appearing in SAR images can be known through geocoding process and usual digital maps also have location errors. Therefore, there exist large location offsets between the two data. By introducing initial matching procedure, the errors are reduced significantly. Then we initialize the snake's shape using the roads extracted from digital map and minimize the energies of all snake points to detect roads. We outline two problems in detection and propose a method that mitigates them.

  • PDF

A study on the waveform-based end-to-end deep convolutional neural network for weakly supervised sound event detection (약지도 음향 이벤트 검출을 위한 파형 기반의 종단간 심층 콘볼루션 신경망에 대한 연구)

  • Lee, Seokjin;Kim, Minhan;Jeong, Youngho
    • The Journal of the Acoustical Society of Korea
    • /
    • v.39 no.1
    • /
    • pp.24-31
    • /
    • 2020
  • In this paper, the deep convolutional neural network for sound event detection is studied. Especially, the end-to-end neural network, which generates the detection results from the input audio waveform, is studied for weakly supervised problem that includes weakly-labeled and unlabeled dataset. The proposed system is based on the network structure that consists of deeply-stacked 1-dimensional convolutional neural networks, and enhanced by the skip connection and gating mechanism. Additionally, the proposed system is enhanced by the sound event detection and post processings, and the training step using the mean-teacher model is added to deal with the weakly supervised data. The proposed system was evaluated by the Detection and Classification of Acoustic Scenes and Events (DCASE) 2019 Task 4 dataset, and the result shows that the proposed system has F1-scores of 54 % (segment-based) and 32 % (event-based).

Statistical Voice Activity Detection Using Probabilistic Non-Negative Matrix Factorization (확률적 비음수 행렬 인수분해를 사용한 통계적 음성검출기법)

  • Kim, Dong Kook;Shin, Jong Won;Kwon, Kisoo;Kim, Nam Soo
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.41 no.8
    • /
    • pp.851-858
    • /
    • 2016
  • This paper presents a new statistical voice activity detection (VAD) based on the probabilistic interpretation of nonnegative matrix factorization (NMF). The objective function of the NMF using Kullback-Leibler divergence coincides with the negative log likelihood function of the data if the distribution of the data given the basis and encoding matrices is modeled as Poisson distributions. Based on this probabilistic NMF, the VAD is constructed using the likelihood ratio test assuming that speech and noise follow Poisson distributions. Experimental results show that the proposed approach outperformed the conventional Gaussian model-based and NMF-based methods at 0-15 dB signal-to-noise ratio simulation conditions.