• 제목/요약/키워드: detecting accuracy

검색결과 976건 처리시간 0.027초

그래프 임베딩을 활용한 코로나19 가짜뉴스 탐지 연구 - 사회적 참여 네트워크의 이용 여부에 따른 탐지 성능 비교 (A study on the detection of fake news - The Comparison of detection performance according to the use of social engagement networks)

  • 정이태;안현철
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.197-216
    • /
    • 2022
  • 인터넷 및 모바일 기술의 발달과 소셜미디어의 확산으로 인해 다량의 정보들이 온라인 상에서 생성, 유통되고 있다. 이중에는 대중에게 도움이 되는 유익한 정보들도 있지만, 역기능을 하는 이른바 가짜뉴스들도 함께 유통되고 있다. 지난 2020년 코로나19의 전세계적인 확산 이후, 온라인 상에는 이와 관련한 수많은 가짜뉴스들이 유통되었다. 다른 가짜뉴스들과 달리 코로나19와 관련된 가짜뉴스는 사람들의 건강, 나아가 생명까지 위협할 수 있다는 점에서 그 심각성이 매우 크다고 할 수 있다. 때문에 코로나19와 관련한 가짜뉴스를 자동으로 탐지하고, 이를 예방하는 지능형 기술은 사회적 건강도를 제고하는데 매우 의미 있는 연구주제라 할 수 있다. 이러한 배경에서 본 연구에서는 코로나19 관련 가짜뉴스 탐지를 효과적으로 수행하기 위해 그래프 임베딩 방법 중 하나인 Graph2vec을 활용한 방법을 제안한다. 가짜뉴스 탐지에 대한 주류 방법은 뉴스 콘텐츠 기반 즉, 텍스트에 대한 특징 분석으로 진행되었으나 본 연구에서는 사회적 참여 네트워크 내에서의 정보 전달 관계를 추가로 활용함으로써 보다 효과적으로 코로나19와 관련된 가짜뉴스를 탐지할 수 있었으며 성능 측면에서 정확도 향상을 확인할 수 있었다.

GNN을 이용한 웹사이트 Hierarchy 유사도 분석 기반 해외 침해 사이트 분류 모델 연구 (A Study on the Classification Model of Overseas Infringing Websites based on Web Hierarchy Similarity Analysis using GNN)

  • 서주현;유선모;박종화;박진주;이태진
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.47-54
    • /
    • 2023
  • 전 세계적으로 한류 콘텐츠가 유행하며 국내뿐만 아니라 해외에서도 국내 저작물의 저작권 침해 사례가 지속적으로 증가하고 있다. 이에 대응하기 위한 국내 불법 저작물 유통 사이트를 탐지하는 기술에 대한 연구가 활발하게 진행되고 있으며 최근 연구는 국내 불법 저작물 유통 사이트들이 광고 배너를 상당수 포함하고 있는 특징을 활용한 연구가 존재한다. 그러나 해외 불법 저작물 유통 사이트의 경우 광고 배너를 포함하지 않거나 국내 사이트에 비해 적은 양의 광고를 포함하고 있어 국내와 같은 탐지 기술의 적용이 제한적이다. 본 연구에서는 저작물 불법 공유 사이트가 게시물과 저작물의 이미지를 유사한 계층 구조로 포함하는 특징을 이용하여 링크 트리 및 텍스트 유사도 비교 기반의 탐지 기술을 제안한다. 대량의 링크로 작성된 대규모 트리의 정확한 유사도 비교를 위해 GNN(Graph Neural Network)를 활용한다. 본 연구의 실험에서 일반 사이트와 저작물 불법 유통 사이트를 분류에 95% 이상의 높은 정확도를 보였고 해당 알고리즘을 적용하여 불법 유통 사이트의 자동화된 탐지를 통해 신속한 저작권 침해 대응이 가능할 것으로 기대된다.

CodeBERT 모델의 전이 학습 기반 코드 공통 취약점 탐색 (Detecting Common Weakness Enumeration(CWE) Based on the Transfer Learning of CodeBERT Model)

  • 박찬솔;문소영;김영철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권10호
    • /
    • pp.431-436
    • /
    • 2023
  • 소프트웨어 공학 영역에 인공지능의 접목은 큰 화두 중 하나이다. 전 세계적으로 1) 인공지능을 통한 소프트웨어 공학, 2) 소프트웨어 공학을 통한 인공지능 두 가지 방향으로 활발히 연구되고 있다. 그 중 소프트웨어 공학에 인공지능을 접목하여 나쁜 코드 영역을 식별하고 해당 부분을 리팩토링하는 연구가 진행되고 있다. 해당 연구에서 인공지능이 나쁜 코드 요소의 패턴을 잘 학습하기 위해서는 학습하려는 나쁜 코드 요소가 라벨링 된 데이터셋이 필요하다. 문제는 데이터셋이 부족할뿐더러, 자체적으로 수집한 데이터셋의 정확도는 신뢰할 수 없다. 이를 해결하기 위해 코드 데이터 수집 시 전체 코드가 아닌 높은 복잡도를 가진 코드 모듈 영역을 대상으로만 나쁜 코드 데이터를 수집한다. 이후 수집한 데이터셋을 CodeBERT 모델의 전이 학습하여 코드 공통 취약점을 탐색하는 방법을 제안한다. 해당 데이터셋을 통해 CodeBERT 모델이 코드의 공통 취약점 패턴을 더 잘 학습할 수 있다. 이를 통해 전통적인 방법보다 인공지능 모델을 이용해 코드를 분석하고 공통 취약점 패턴을 더 정확하게 식별할 수 있을 것으로 기대한다.

서포트벡터머신 기반 PVDF 센서의 결함 예측 기법 (Fault Detection Technique for PVDF Sensor Based on Support Vector Machine)

  • 김승욱;이상민
    • 한국전자통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.785-796
    • /
    • 2023
  • 본 연구에서는 구조물 건전성 모니터링에 널리 활용되고 있는 PVDF(: Polyvinylidene fluoride) 센서에 나타날 수 있는 결함을 실시간으로 분류 및 예측하기 위한 방법론을 제안하였다. 센서 부착 환경에 따라 나타나는 센서의 결함 유형을 분류하였고, 임팩트 해머를 이용한 충격 시험을 수행하여 결함 유형에 따른 출력 신호를 획득하였다. 결함 유형에 따른 출력 신호간의 차이를 식별하기 위해 이들의 시간영역 통계 특징을 추출하여 데이터 집합을 구축하였다. 머신러닝 기반 분류 알고리즘들 중 센서 결함 유형 감지에 가장 적합한 알고리즘 선정을 위해 구축한 데이터 집합의 학습 및 이에 따른 결과를 분석하였고, 이들 중 SVM(: Support vector machine)이 가장 높은 성능을 보임을 확인하였다. 선정된 SVM 알고리즘의 추가적인 정확도 향상을 위해 하이퍼 파라미터 최적화 작업을 수행하였으며, 결과적으로 92.5%의 정확도로 센서 결함 유형을 분류하였고 이는 타 분류 알고리즘에 비하여 최대 13.95% 높은 정확도를 보였다. 본 연구에서 제안한 센서 결함 예측 기법은 PVDF 센서뿐만 아니라 실시간 구조물 건전성 모니터링을 위한 다양한 센서의 신뢰성을 확보하기 위한 기반 기술로 활용될 수 있을 것으로 사료된다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.

큐싱 공격 탐지를 위한 AutoML 머신러닝 기반 악성 URL 분류 기술 연구 및 서비스 구현 (AutoML Machine Learning-Based for Detecting Qshing Attacks Malicious URL Classification Technology Research and Service Implementation)

  • 김동영;황기성
    • 스마트미디어저널
    • /
    • 제13권6호
    • /
    • pp.9-15
    • /
    • 2024
  • 최근 정부 기관을 사칭한 가짜 QR(Quick Response)코드를 이용하여 개인정보와 금융정보를 탈취하는 QR코드와 스미싱을 결합한 '큐싱(Qshing)' 공격이 증가하는 추세이다. 특히, 이 공격 방식은 사용자가 단지 QR코드를 인식하는 것만으로 스미싱 페이지에 연결되거나 악성 소프트웨어를 다운로드하게 만들어 피해자가 자신이 공격당했는지조차 인지하기 어려운 특징이 있다. 본 논문에서는 머신러닝 알고리즘을 활용해 QR 코드 내 URL의 악성도를 파악하는 분류 기술을 개발하고, 기존의 QR 코드 리더기와 결합하는 방식에 관해 연구를 진행하였다. 이를 위해 QR코드 내 악성 URL 128,587개, 정상 URL 428,102개로부터 프로토콜, 파라미터 등 각종 특징 35개를 추출하여 데이터셋을 구축한 후, AutoML을 이용하여 최적의 알고리즘과 하이퍼파라미터를 도출한 결과, 약 87.37%의 정확도를 보였다. 이후 기존 QR코드 리더기와 학습한 분류 모델의 결합을 설계하여 큐싱 공격에 대응할 수 있는 서비스를 구현하였다. 결론적으로, QR코드 내 악성 URL 분류 모델에 최적화된 알고리즘을 도출하고, 기존 QR코드 리더기에 결합하는 방식이 큐싱 공격의 대응 방안 중 하나임을 확인하였다.

Automated Versus Handheld Breast Ultrasound for Evaluating Axillary Lymph Nodes in Patients With Breast Cancer

  • Sun Mi Kim;Mijung Jang;Bo La Yun;Sung Ui Shin;Jiwon Rim;Eunyoung Kang;Eun-Kyu Kim;Hee-Chul Shin;So Yeon Park;Bohyoung Kim
    • Korean Journal of Radiology
    • /
    • 제25권2호
    • /
    • pp.146-156
    • /
    • 2024
  • Objective: Automated breast ultrasound (ABUS) is a relevant imaging technique for early breast cancer diagnosis and is increasingly being used as a supplementary tool for mammography. This study compared the performance of ABUS and handheld ultrasound (HHUS) in detecting and characterizing the axillary lymph nodes (LNs) in patients with breast cancer. Materials and Methods: We retrospectively reviewed the medical records of women with recently diagnosed early breast cancer (≤ T2) who underwent both ABUS and HHUS examinations for axilla (September 2017-May 2018). ABUS and HHUS findings were compared using pathological outcomes as reference standards. Diagnostic performance in predicting any axillary LN metastasis and heavy nodal-burden metastases (i.e., ≥ 3 LNs) was evaluated. The ABUS-HHUS agreement for visibility and US findings was calculated. Results: The study included 377 women (53.1 ± 11.1 years). Among 385 breast cancers in 377 patients, 101 had axillary LN metastases and 30 had heavy nodal burden metastases. ABUS identified benign-looking or suspicious axillary LNs (average, 1.4 ± 0.8) in 246 axillae (63.9%, 246/385). According to the per-breast analysis, the sensitivity, specificity, positive and negative predictive values, and accuracy of ABUS in predicting axillary LN metastases were 43.6% (44/101), 95.1% (270/284), 75.9% (44/58), 82.6% (270/327), and 81.6% (314/385), respectively. The corresponding results for HHUS were 41.6% (42/101), 95.1% (270/284), 75.0% (42/56), 82.1% (270/329), and 81.0% (312/385), respectively, which were not significantly different from those of ABUS (P ≥ 0.53). The performance results for heavy nodal-burden metastases were 70.0% (21/30), 89.6% (318/355), 36.2% (21/58), 97.3% (318/327), and 88.1% (339/385), respectively, for ABUS and 66.7% (20/30), 89.9% (319/355), 35.7% (20/56), 97.0% (319/329), and 88.1% (339/385), respectively, for HHUS, also not showing significant difference (P ≥ 0.57). The ABUS-HHUS agreement was 95.9% (236/246; Cohen's kappa = 0.883). Conclusion: Although ABUS showed limited sensitivity in diagnosing axillary LN metastasis in early breast cancer, it was still useful as the performance was comparable to that of HHUS.

Development and Validation of 18F-FDG PET/CT-Based Multivariable Clinical Prediction Models for the Identification of Malignancy-Associated Hemophagocytic Lymphohistiocytosis

  • Xu Yang;Xia Lu;Jun Liu;Ying Kan;Wei Wang;Shuxin Zhang;Lei Liu;Jixia Li;Jigang Yang
    • Korean Journal of Radiology
    • /
    • 제23권4호
    • /
    • pp.466-478
    • /
    • 2022
  • Objective: 18F-fluorodeoxyglucose (FDG) PET/CT is often used for detecting malignancy in patients with newly diagnosed hemophagocytic lymphohistiocytosis (HLH), with acceptable sensitivity but relatively low specificity. The aim of this study was to improve the diagnostic ability of 18F-FDG PET/CT in identifying malignancy in patients with HLH by combining 18F-FDG PET/CT and clinical parameters. Materials and Methods: Ninety-seven patients (age ≥ 14 years) with secondary HLH were retrospectively reviewed and divided into the derivation (n = 71) and validation (n = 26) cohorts according to admission time. In the derivation cohort, 22 patients had malignancy-associated HLH (M-HLH) and 49 patients had non-malignancy-associated HLH (NM-HLH). Data on pretreatment 18F-FDG PET/CT and laboratory results were collected. The variables were analyzed using the Mann-Whitney U test or Pearson's chi-square test, and a nomogram for predicting M-HLH was constructed using multivariable binary logistic regression. The predictors were also ranked using decision-tree analysis. The nomogram and decision tree were validated in the validation cohort (10 patients with M-HLH and 16 patients with NM-HLH). Results: The ratio of the maximal standardized uptake value (SUVmax) of the lymph nodes to that of the mediastinum, the ratio of the SUVmax of bone lesions or bone marrow to that of the mediastinum, and age were selected for constructing the model. The nomogram showed good performance in predicting M-HLH in the validation cohort, with an area under the receiver operating characteristic curve of 0.875 (95% confidence interval, 0.686-0.971). At an appropriate cutoff value, the sensitivity and specificity for identifying M-HLH were 90% (9/10) and 68.8% (11/16), respectively. The decision tree integrating the same variables showed 70% (7/10) sensitivity and 93.8% (15/16) specificity for identifying M-HLH. In comparison, visual analysis of 18F-FDG PET/CT images demonstrated 100% (10/10) sensitivity and 12.5% (2/16) specificity. Conclusion: 18F-FDG PET/CT may be a practical technique for identifying M-HLH. The model constructed using 18F-FDG PET/CT features and age was able to detect malignancy with better accuracy than visual analysis of 18F-FDG PET/CT images.

MMORPG 게임의 이탈 유저에 대한 인공지능 기반 조기 탐지 (AI-based early detection to prevent user churn in MMORPG)

  • 이민혁;박선우;이성환;김수인;조윤영;송대섭;이문영;정윤서
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.525-539
    • /
    • 2024
  • Massive multiplayer online role playing game (MMORPG)은 국내 게임에서 큰 비중을 차지하는 게임 장르이다. MMORPG에서 유저 이탈 예측은 중요한 과제 중 하나이다. 인게임 결제가 수익 비중이 높기에 유저 잔존율이 서비스 수명 및 수익과 깊이 연관되기 때문이다. 만약, 특정 유저의 이탈을 사전에 예측할 수 있다면 프로모션을 통해 해당 유저의 잔존을 유도할 수 있을 것이다. 따라서, 이탈 예측 문제에서는 예측의 정확도도 중요하지만 이탈의 징후를 얼마나 빠르게 파악할 수 있는지 또한 중요하다. 본 논문에서는 이탈 징후를 조기에 탐지하기 위하여, 유저별 잔존 확률을 일별로 예측하고 이 예측된 확률 값들을 활용하여 유저 이탈 징후를 조기에 파악하는 방법을 제안한다. 이를 위해, 국내 게임사의 유저 로그 데이터로 여러 모형을 학습하고 유저별 잔존 확률을 구하여 잔존 확률의 변화 패턴에 대한 분석을 통해 이탈 가능성이 높은 유저를 조기에 감지할 수 있는 경험적 규칙을 보인다. 최종적으로, 성능 평가 결과를 통해 기존에 접속일을 기반으로 한 규칙보다 제시한 규칙을 이용할 시 이탈 유저를 조기에 감지할 수 있음을 확인한다. 추가적으로, 유저가 이탈하기 전 시점에 게임 접속 중 유저 이탈을 예측하는 방법과 유저의 게임 스타일에 따른 프로모션 방안을 제시한다.

기계학습(machine learning) 기반 터널 영상유고 자동 감지 시스템 개발을 위한 사전검토 연구 (A preliminary study for development of an automatic incident detection system on CCTV in tunnels based on a machine learning algorithm)

  • 신휴성;김동규;임민진;이규범;오영섭
    • 한국터널지하공간학회 논문집
    • /
    • 제19권1호
    • /
    • pp.95-107
    • /
    • 2017
  • 본 논문에서는 제도적으로 운영 중인 터널내 CCTV들로부터 실시간으로 들어오는 영상들을 최신 딥러닝 알고리즘을 이용, 학습시켜 다양한 조건의 터널환경에서 돌발 상황을 감지하고 그 돌발 상황의 종류들을 분류해 내는 시스템 개발을 위한 사전검토 연구를 수행하였다. 사전검토 연구를 위해, 2개의 도로현장의 교통류 CCTV영상 일부를 이용하여 가용한 전통적인 영상처리기법으로 영상내부로 집입하는 차량을 감지하고, 이동경로를 추적하여 일정 시간간격의 이동 차량의 좌표와 시간정보를 추출하고 학습자료를 구성하였다. 각 차량의 이동정보는 차선변경, 정차 등 6가지의 이벤트 정보와 연계된다. 차량 이동정보와 이벤트로 구성된 학습자료는 레질리언스(resilience) 기계학습 알고리즘을 이용하여 학습하였다. 2개의 은닉층을 설정하고, 각 은닉층의 노드수에 대한 9개의 은닉구조 모델을 설정하여 매개변수 연구를 수행하였다. 본 사전검토의 경우에는 첫 번째, 두 번째 은닉층 노드수가 각각 300개와 150개로 설정된 모델이 합리적으로 가장 추론정확도가 높은 것으로 평가되었다. 이로부터 일반화되기 매우 힘든 복잡한 교통류 상황을 기계학습을 이용하여 어떠한 사전 규칙설정 없이도 교통류의 특징들을 정확히 자동으로 감지할 수 있는 가능성을 보였다. 본 시스템은 시스템의 운용을 통해 지속적으로 교통류 영상과 이벤트 정보가 늘어난다면, 자동으로 그 시스템의 인지능력과 정확도가 자동으로 향상되는 효과도 기대할 수 있다.