• 제목/요약/키워드: Pseudo Labeling

검색결과 27건 처리시간 0.026초

트레이닝 데이터가 제한된 환경에서 N-Gram 사전을 이용한 트위터 스팸 탐지 방법 (A Method for Twitter Spam Detection Using N-Gram Dictionary Under Limited Labeling)

  • 최혁준;박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권9호
    • /
    • pp.445-456
    • /
    • 2017
  • 본 논문에서는 트레이닝 데이터가 제한된 환경에서 n-gram 사전을 이용하여 불건전 정보를 포함하는 스팸 트윗을 탐지하는 방법을 제안한다. 불건전 정보를 포함하는 스팸 트윗은 유사한 단어와 문장을 사용하는 경향이 있다. 이러한 특성을 이용하여 스팸 트윗과 정상 트윗에 대한 n-gram 사전을 구축하고 나이브 베이스 분류기를 적용하여 효과적으로 스팸 트윗을 탐지할 수 있음을 보인다. 반면에, 실시간으로 대용량의 데이터가 유입되는 트위터의 특성은 초기 트레이닝 집합 구성에 매우 큰 비용을 요구 한다. 따라서, 초기 트레이닝 집합이 매우 작거나 존재하지 않는 환경에서 적용할 수 있는 스팸 트윗 탐지 방법이 필요하다. 이를 위해 트위터의 리트윗 기능을 활용하여 의사 라벨을 생성하고 초기 트레이닝 집합의 구성과 n-gram 사전 업데이트에 활용하는 방법을 제안한다. 2016년 12월 1일부터 2016년 12월 7일까지 수집된 한국어 트윗 130만 건을 사용한 다양한 실험 결과는 비교 방법들보다 제안하는 방법의 성능이 우수함을 입증한다.

디지털영상의 저작권보호 라벨링을 위한 Reversible DTCNN(Discrete-Time Cellular Neural Network) 구조 (The Structure of Reversible DTCNN (Discrete-Time Celluar Neural Networks) for Digital Image Copyright Labeling)

  • Lee, Gye-Ho;Han, Seung-jo
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.532-543
    • /
    • 2003
  • 본 논문은 저작권보호를 위해 디지털영상의 라벨링을 위한 reversible DTCNN(discrete-time cellular neural network) 구조를 제안한다. 이러한 저작권보호 라벨링을 위해서 2차원 이진 pseudo 랜덤 영상열에 사용할 수 있는 새로운 reversible DTCNN의 구조와 개념을 설명하고 이에 대한 복잡행위를 보여주기 위해 reversible DTCNN의 서로 다른 방법들의 예시를 들어 설명한다. 또한 서로 다른 2진영상인 원영상과 복사된 영상은 서로 다른 2진 랜덤 영상키를 사용한다. 이 영상키는 원영상을 스크램블하는데 사용된다. 따라서 reversible DTCNN를 다시 역변환시켜서 저작권보호가 라벨링된 영상으로부터 복사된 영상임을 찾아낼 수 있다. 그러나 이러한 동영상을 처리하는 데는 S/W에서는 많은 시간이 소요되므로 고속 DTCNN 칩을 사용하여 실시간에서 동영상이나 비디오영상을 저작권보호를 위한 라벨링에 사용할 수 있으며, 이러한 결과를 컴퓨터에서 시뮬레이션됨을 보인다.

Development of AI-based Smart Agriculture Early Warning System

  • Hyun Sim;Hyunwook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.67-77
    • /
    • 2023
  • 본 연구는 스마트팜 환경에서 진행된 혁신적인 연구로, 딥러닝을 기반으로 한 질병 및 해충 탐지 모델을 개발하고, 이를 지능형 사물인터넷(IoT) 플랫폼에 적용하여 디지털 농업 환경 구현의 새로운 가능성을 탐색하였다. 연구의 핵심은 Pseudo-Labeling, RegNet, EfficientNet 등 최신 ImageNet 모델과 전처리 방식을 통합하여, 복잡한 농업 환경에서 다양한 질병과 해충을 높은 정확도로 탐지하는 것이었다. 이를 위해 앙상블 학습 기법을 적용하여 모델의 정확도와 안정성을 극대화했으며, 평균 정밀도(mAP), 정밀도, 재현율, 정확도, 박스 손실 등의 다양한 성능 지표를 통해 모델을 평가하였다. 또한, SHAP 프레임워크를 활용하여 모델의 예측 기준에 대한 깊은 이해를 도모하였고, 이를 통해 모델의 결정 과정을 보다 투명하게 만들었다. 이러한 분석은 모델이 어떻게 다양한 변수들을 고려하여 질병 및 해충을 탐지하는지에 대한 중요한 통찰력을 제공하였다.

한정된 레이블 데이터를 이용한 효율적인 철도 표면 결함 감지 방법 (An Efficient Detection Method for Rail Surface Defect using Limited Label Data)

  • 한석민
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.83-88
    • /
    • 2024
  • 본 연구에서는 Railroad surface 데이터를 활용하여 Semi-Supervised learning방식으로 railroad surface의 defect를 검출해내는 방안을 제안한다. Resnet50에 ImageNet으로 pretrained된 모델을 이용한다. Label이 없는 데이터에서 무작위로 데이터를 선정, 선정한 데이터에 label을 부여한 뒤 이 데이터로 모델을 학습시킨다. 학습된 모델을 이용하여 나머지 데이터의 결과값을 예측한 후, 그 예측값이 일정한 threshold보다 큰 것을 골라내고, threshold보다 큰 값들을 값이 큰 순서대로 정렬하여, 일정한 크기만큼 training data에 추가한다. 이 때, 각 class에 속할 확률이 높은 쪽으로 pseudo-labeling을 수행한다. 초기에 label이 부여된 데이터 개수에 따른 전체적인 class 분류 성능을 확인하는 실험 또한 진행하였고, 전체 training data대비 10% 미만의 labeled data로 최대 98%의 정확도를 얻는 성능을 보였다.

Efficient hardware implementation and analysis of true random-number generator based on beta source

  • Park, Seongmo;Choi, Byoung Gun;Kang, Taewook;Park, Kyunghwan;Kwon, Youngsu;Kim, Jongbum
    • ETRI Journal
    • /
    • 제42권4호
    • /
    • pp.518-526
    • /
    • 2020
  • This paper presents an efficient hardware random-number generator based on a beta source. The proposed generator counts the values of "0" and "1" and provides a method to distinguish between pseudo-random and true random numbers by comparing them using simple cumulative operations. The random-number generator produces labeled data indicating whether the count value is a pseudo- or true random number according to its bit value based on the generated labeling data. The proposed method is verified using a system based on Verilog RTL coding and LabVIEW for hardware implementation. The generated random numbers were tested according to the NIST SP 800-22 and SP 800-90B standards, and they satisfied the test items specified in the standard. Furthermore, the hardware is efficient and can be used for security, artificial intelligence, and Internet of Things applications in real time.

Characteristics of the Inhibitory Action of Protease Inhibitors on the Glucose-6-phosphate Transporter

  • Choi, Joon-Sig;Shin, Jeong-Sook;Choi, Hong-Sug;Park, Jong-Sang
    • BMB Reports
    • /
    • 제30권2호
    • /
    • pp.157-161
    • /
    • 1997
  • The present paper reports characteristics and specificity of the inhibitory action of $N^{\alpha}-tosyl-L-lysine-chloromethyl\;ketone$ (TLCK) and $N^{\alpha}-tosyl-L-phenylalanine-chloromethyl\;ketone$ (TPCK) on the glucose6-phosphate transporter of rat liver microsomes. The TLCK-induced inhibition was pH dependent. The inhibition constants for TPCK were determined by following pseudo-Lst order reaction mechanism. The inhibition was protected by preincubation with excess amount of glucose-6-phosphate. The results proved that (a) TLCK inactivates the microsomal glucose-6-phosphate transporter, (b) the inhibition results from the modification of sulfhydryl groups of the transporter.

  • PDF

Mediastinal Anaplastic Ependymoma

  • Fauziah, Dyah;Parengkuan, Irene Lingkan;Jiwangga, Dhihintia;Raharjo, Paulus;Basuki, Mudjiani
    • Journal of Chest Surgery
    • /
    • 제54권3호
    • /
    • pp.232-234
    • /
    • 2021
  • Ependymomas arise from ependymal cells and can grow at any site in the central nervous system (CNS), as well as in some locations outside of the CNS. The latter is rare, contributing to the frequent misdiagnoses of such cases. Herein, we present the case of a 54-year-old man with a history of lower limb weakness and numbness. Magnetic resonance imaging revealed an extradural, heterogeneously enhanced solid lesion with a regular and well-defined border in the posterior mediastinum. A post-resection histopathological examination revealed tumor-forming perivascular pseudo-rosettes that showed immunoreactivity against glial fibrillary acidic protein, epithelial membrane antigen, and vimentin, as well as a high Ki-67 labeling index. Based on pathological features, a diagnosis of anaplastic ependymoma was established.

CutMix 알고리즘 기반의 일반화된 밀 머리 검출 모델 (Generalized wheat head Detection Model Based on CutMix Algorithm)

  • 여주원;박원준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.73-75
    • /
    • 2024
  • 본 논문에서는 밀 수확량을 증가시키기 위한 일반화된 검출 모델을 제안한다. 일반화 성능을 높이기 위해 CutMix 알고리즘으로 데이터를 증식시켰고, 라벨링 되지 않은 데이터를 최대한 활용하기 위해 Fast R-CNN 기반 Pseudo labeling을 사용하였다. 학습의 정확성과 효율성을 높이기 위해 사전에 훈련된 EfficientDet 모델로 학습하였으며, OOF를 이용하여 검증하였다. 최신 객체 검출 모델과 IoU(Intersection over Union)를 이용한 성능 평가 결과, 제안된 모델이 가장 높은 성능을 보이는 것을 확인하였다.

  • PDF

Breast Cancer Classification in Ultrasound Images using Semi-supervised method based on Pseudo-labeling

  • Seokmin Han
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제16권1호
    • /
    • pp.124-131
    • /
    • 2024
  • Breast cancer classification using ultrasound, while widely employed, faces challenges due to its relatively low predictive value arising from significant overlap in characteristics between benign and malignant lesions, as well as operator-dependency. To alleviate these challenges and reduce dependency on radiologist interpretation, the implementation of automatic breast cancer classification in ultrasound image can be helpful. To deal with this problem, we propose a semi-supervised deep learning framework for breast cancer classification. In the proposed method, we could achieve reasonable performance utilizing less than 50% of the training data for supervised learning in comparison to when we utilized a 100% labeled dataset for training. Though it requires more modification, this methodology may be able to alleviate the time-consuming annotation burden on radiologists by reducing the number of annotation, contributing to a more efficient and effective breast cancer detection process in ultrasound images.

Intravoxel Incoherent Motion Magnetic Resonance Imaging for Assessing Parotid Gland Tumors: Correlation and Comparison with Arterial Spin Labeling Imaging

  • Gao Ma;Xiao-Quan Xu;Liu-Ning Zhu;Jia-Suo Jiang;Guo-Yi Su;Hao Hu;Shou-Shan Bu;Fei-Yun Wu
    • Korean Journal of Radiology
    • /
    • 제22권2호
    • /
    • pp.243-252
    • /
    • 2021
  • Objective: To compare and correlate the findings of intravoxel incoherent motion (IVIM) magnetic resonance (MR) imaging and arterial spin labeling (ASL) imaging in characterizing parotid gland tumors. Materials and Methods: We retrospectively reviewed 56 patients with parotid gland tumors evaluated by MR imaging. The true diffusion coefficient (D), pseudo-diffusion coefficient (D*), and fraction of perfusion (f) values of IVIM imaging and tumor-to-parotid gland signal intensity ratio (SIR) on ASL imaging were calculated. Spearman rank correlation coefficient, chi-squared, Mann-Whitney U, and Kruskal-Wallis tests with the post-hoc Dunn-Bonferroni method and receiver operating characteristic curve assessments were used for statistical analysis. Results: Malignant parotid gland tumors showed significantly lower D than benign tumors (p = 0.019). Within subgroup analyses, pleomorphic adenomas (PAs) showed significantly higher D than malignant tumors (MTs) and Warthin's tumors (WTs) (p < 0.001). The D* of WTs was significantly higher than that of PAs (p = 0.031). The f and SIR on ASL imaging of WTs were significantly higher than those of MTs and PAs (p < 0.05). Significantly positive correlation was found between SIR on ASL imaging and f (r = 0.446, p = 0.001). In comparison with f, SIR on ASL imaging showed a higher area under curve (0.853 vs. 0.891) in discriminating MTs from WTs, although the difference was not significant (p = 0.720). Conclusion: IVIM and ASL imaging could help differentiate parotid gland tumors. SIR on ASL imaging showed a significantly positive correlation with f. ASL imaging might hold potential to improve the ability to discriminate MTs from WTs.