• 제목/요약/키워드: Misclassification

검색결과 226건 처리시간 0.026초

A Study on the Efficacy of Edge-Based Adversarial Example Detection Model: Across Various Adversarial Algorithms

  • Jaesung Shim;Kyuri Jo
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.31-41
    • /
    • 2024
  • 딥러닝 모델(Deep Learning Model)은 컴퓨터 비전(Computer Vision) 분야의 이미지(Image) 분류 및 객체 탐지와 같은 작업에서 뛰어난 성과를 보이며, 실제 산업 현장에서 다양하게 활용되고 있다. 최근 다양한 알고리즘(Algorithm)의 적대적 예제를 이용하여 딥러닝 모델의 취약성을 지적하며, 강건성 향상 방안을 제시하는 연구들이 활발하게 진행되고 있다. 적대적 예제는 오분류를 유도하기 위해 작은 노이즈(Noise)가 추가된 이미지로서, 딥러닝 모델을 실제 환경에 적용 시 중대한 위협이 될 수 있다. 본 논문에서는 다양한 알고리즘의 적대적 예제를 대상으로 에지 학습 분류 모델의 강건성 및 이를 이용한 적대적 예제 탐지 모델의 성능을 확인하고자 하였다. 강건성 실험 결과, FGSM(Fast Gradient Sign Method) 알고리즘에 대하여 기본 분류 모델이 약 17%의 정확도를 보였으나, 에지(Edge) 학습 모델들은 60~70%대의 정확도를 유지하였고, PGD(projected gradient descent)/DeepFool/CW(Carlini-Wagner) 알고리즘에 대해서는 기본 분류 모델이 0~1%의 정확도를 보였으나, 에지 학습 모델들은 80~90%의 정확도를 유지하였다. 적대적 예제 탐지 실험 결과, FGSM/PGD/DeepFool/CW의 모든 알고리즘에 대해서 91~95%의 높은 탐지율을 확인할 수 있었다. 본 연구를 통하여 다양한 적대적 알고리즘에 대한 방어 가능성을 제시함으로써, 컴퓨터 비전을 활용하는 여러 산업 분야에서 딥러닝 모델의 안전성 및 신뢰성 제고를 기대한다.

CNN 모델과 Transformer 조합을 통한 토지피복 분류 정확도 개선방안 검토 (Assessing Techniques for Advancing Land Cover Classification Accuracy through CNN and Transformer Model Integration)

  • 심우담;이정수
    • 한국지리정보학회지
    • /
    • 제27권1호
    • /
    • pp.115-127
    • /
    • 2024
  • 본 연구는 Transformer 모듈을 기반으로 다양한 구조의 모델을 구성하고, 토지피복 분류를 수행하여 Transformer 모듈의 활용방안 검토를 목적으로 하였다. 토지피복 분류를 위한 딥러닝 모델은 CNN 구조를 가진 Unet 모델을 베이스 모델로 선정하였으며, 모델의 인코더 및 디코더 부분을 Transformer 모듈과 조합하여 총 4가지 딥러닝 모델을 구축하였다. 딥러닝 모델의 학습과정에서 일반화 성능 평가를 위해 같은 학습조건으로 10회 반복하여 학습을 진행하였다. 딥러닝 모델의 분류 정확도 평가결과, 모델의 인코더 및 디코더 구조 모두 Transformer 모듈을 활용한 D모델이 전체 정확도 평균 약 89.4%, Kappa 평균 약 73.2%로 가장 높은 정확도를 보였다. 학습 소요시간 측면에서는 CNN 기반의 모델이 가장 효율적이었으나 Transformer 기반의 모델을 활용할 경우, 분류 정확도가 Kappa 기준 평균 0.5% 개선되었다. 차후, CNN 모델과 Transformer의 결합과정에서 하이퍼파라미터 조절과 이미지 패치사이즈 조절 등 다양한 변수들을 고려하여 모델을 고도화 할 필요가 있다고 판단된다. 토지피복 분류과정에서 모든 모델이 공통적으로 발생한 문제점은 소규모 객체들의 탐지가 어려운 점이었다. 이러한 오분류 현상의 개선을 위해서는 고해상도 입력자료의 활용방안 검토와 함께 지형 정보 및 질감 정보를 포함한 다차원적 데이터 통합이 필요할 것으로 판단된다.

메타분석 방법을 적용한 서울시 대기오염과 조기사망의 상관성 연구 (1991년$\sim$1995년) (A Meta-analysis of Ambient Air Pollution in Relation to Daily Mortality in Seoul, $1991\sim1995$)

  • ;김춘배;지선하;정용;이종태
    • Journal of Preventive Medicine and Public Health
    • /
    • 제32권2호
    • /
    • pp.177-182
    • /
    • 1999
  • 유럽과 미국을 비롯한 선진 산업국가에서 1930년에서 1950대 사이에 발생하였던 일련의 대기오염사건을 경험한 이후, 대기오염과 인체건강영향과의 상관성을 평가하려는 체계적인 연구수행이 있어왔다. 국내에서도 최근 2-3년 동안 단면적 연구 설계에서 벗어나 시계열적 분석방법을 적용한 연구결과들이 발표되었으며, 외국에서의 결과와 유사하게 현재 수준의 대기오염도에서도 인체건강영향 특히 조기사망발생과 유의한 상관성이 있음이 제시되었다. 특히 서울시를 대상으로 한 일련의 연구결과가 대기오염도와 일별사망과에 유의한 상관관계가 있음을 보이고 있어 이에 대한 보다 정밀한 연구수행 필요성이 제기되었다. 따라서 본 연구는 메타분석적 방법론을 적용하여 서울시내의 구별분석 결과를 통합하여 기존의 연구결과와 비교함으로써 대기오염과 인체건강영향의 원인적 상관성을 규명하는 보조적 자료를 제공하기 위하여 수행되었다. 대기오염 자동측정기가 설치된 서울시 내 총 18개 구를 대상으로 대기오염도와 사망과의 상관관계를 추정하는 구별 예측치를 산출하였다. 이렇게 산출된 각 개별 예측치는 전체로서 총괄되는 가중평균 예측치를 계산하기 위하여 사용되었으며 이 때 모수효과 모형 또는 랜덤효과 모형을 적용하여 가중평균 예측치를 산출하였다. 지역별 또는 구별 예측치간의 변이차를 검정하는 동질성 검정의 결과 세 오염물질의 경우 모두 지역간 변이가 큰 것으로 평가되었으며 따라서 랜덤효과 모형의 결과를 최종결과로 선정하여 제시하였다. 랜덤효과 모형의 결과를 보면 총부유분진과 아황산가스의 경우 일별사망과 유의한 상관관계가 있는 것으로 평가되었으나 오존의 경우는 그렇지 않았다. 또한 메타분석 결과가 기존의 연구결과와 비교할 때 유사하게 평가된 점으로 미루어 현재 수준의 대기오염도와 일별사망 또는 인체건강영향과 밀접한 상관관계가 있음을 알 수 있다. 메타분석 방법을 적용하였어도 직접적 개인노출평가가 이루어지지 않았다는 점에서 정보편견의 가능성을 제외할 수 없다. 그러나 이러한 메타분석 방법이 기존의 연구(서울시 전체를 대상으로 하는)에 비하여 정보편견을 어느정도 줄여줄 수 있을 것으로 기대되었으며, 분석결과 기존 연구에서 제시하는 것과 매우 유사함을 알 수 있다. 결론적으로 대기오염 역학 연구에 있어서 이와 같은 메타분석적 방법이 유용하며, 본 연구결과도 기존의 연구에서와 같이 현재 수준의 대기오염도가 인체 건강에 위해한 영향을 미칠 수 있음을 보여 준다는 점에서 향후 보다 강화된 대기오염관리 방안 마련의 필요성을 제기한다고 하겠다. 이를 위하여 대기 오염기준치의 강화뿐 아니라 대기오염에 민감한 인구집단, 즉 어린이나 노약자 등에 대한 각별한 감시와 연구수행이 필요시 된다.

  • PDF

AdaBoost 알고리즘기반 SVM을 이용한 부실 확률분포 기반의 기업신용평가 (Corporate Credit Rating based on Bankruptcy Probability Using AdaBoost Algorithm-based Support Vector Machine)

  • 신택수;홍태호
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.25-41
    • /
    • 2011
  • 최근 몇 년간 SVM(support vector machines)기법은 패턴인식 또는 분류의사결정문제를 위한 분석기법으로서 기존의 데이터마이닝 기법과 비교할 때, 매우 높은 성과를 갖는 것으로 인식되어 왔다. 더 나아나 많은 연구자들은 SVM기법이 1980년대 이후 대표적인 예측 및 분류모형으로 인정받은 인공신경망기법(ANNs : Artificial Neural Networks)에 비해 더 성과가 좋다는 사실을 실증적으로 입증해 왔다(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al., 2005; Kim, 2003). 일반적으로 이와 같이 다양한 데이터마이닝 기법에 의해 분석되는 이진분류 또는 다분류 의사결정문제들은 특히 금융분야 등에 있어서 오분류비용에 민감하며, 이로 인한 오분류의 경제적 손실도 상대적으로 매우 크다고 할 수 있다. 따라서 기업부도예측모형과 같은 이진분류모형의 결과값을, 부도확률에 기초하여 정교하게 계산된 사후확률의 개념으로서 다분류의 신용등급평가의 문제로 변환할 필요가 있다. 그러나, SVM 모형의 결과값은 기본적으로 그와 같은 부도확률분포를 보여주지 않는다. 따라서, 그러한 확률분포를 정교하게 보여줄 방법을 제시할 필요가 있다(Platt, 1999; Drish, 2001). 본 연구는 AdaBoost 알고리즘기반의 SVM 모형을 이용하여, 이진분류모형으로서 IT 기업의 부실예측모형에 적용한 후, 이 SVM 모형의 예측결과를 SVM의 손실함수에 적용하여 계산된 값을 사후부도확률의 정규분포 특성에 따라 이를 구간화하여 IT기업에 대한 다분류 신용등급 평가의 문제로 전환시키는 방법을 제시하였다. 그리고 본 연구에서 제안하는 방법은 이러한 AdaBoost 알고리즘기반 SVM 모형이 각 기업이 고유한 신용위험(부도확률)을 갖고 있다는 조건하에서, 신용등급부여를 위한 부도확률분포 구간을 정교하게 조정함으로써 오분류 문제를 좀 더 줄일 수 있음을 제시하였다.

대구지역 초등학생의 저체중 현황파악 및 관련요인 분석 (Underweight Related Factors in School-Aged Children in Daegu)

  • 윤영희;박경
    • 한국식품영양과학회지
    • /
    • 제42권10호
    • /
    • pp.1592-1599
    • /
    • 2013
  • 본 연구는 학령기아동의 저체중 현황 및 관련요인을 살펴보기 위하여 대구지역 초등학교 5, 6학년을 대상으로 저체중군 86명과 정상체중군 407명의 식습관, 건강상태, 자아체형 인식 및 체중조절의지, 영양소 섭취수준과 출생 시 정보를 수집하여 비교 분석하였다. 그 결과를 요약하면 첫째, 저체중군 비율의 66.3%가 여학생으로 남학생에 비해 유의적으로 높았고, 저체중 자녀를 둔 아버지의 신장은 정상체중군과 비교하여 약 1.8 cm 정도 더 큰 것으로 관찰되었다. 둘째, 저체중군이 정상체중군보다 최근 1년간 병원진료 및 감기증상 빈도가 유의적으로 더 높았고, 특히 저체중군에서 월 1회이상 병원진료를 경험한 비율은 14.5%로, 정상체중군 5.5%에 비해 약 9% 높은 수준을 보였다. 셋째, 저체중 남학생은 본인 체형에 대하여 비교적 정확하게 인식하고 있는 반면, 정상체중 남학생은 본인 체형에 대해 실제 체형보다 왜소하다고 평가하는 비율이 36.6%를 차지하였다. 저체중 여학생의 경우 33.3%는 본인이 마른 체형임에도 불구하고 보통체중 혹은 과체중이라고 응답하는 등 잘못된 체형 인식 수준이 비교적 높은 경향을 보였다. 넷째, 저체중 여학생은 현재 자신의 체중을 그대로 유지하거나 더 줄이려고 노력하는 비율이 31.6%였고, 정상체중 여학생의 35.5%가 정상체중임에도 체중을 더 줄이기 위하여 노력한다고 응답하였다. 다섯째, 한국인 영양섭취기준 대비 영양소 섭취비율을 남녀별 체중군에 따라 비교한 결과, 단백질은 두 체중군 모두 권장량보다 2배 가량 높은 섭취비율을 보였으나 정상체중군이 저체중군에 비해 유의적으로 더 많이 섭취하고 있었으며, 그 차이는 남학생에게서 더 두드러졌다. 반면 식이섬유, 칼슘, 칼륨, 엽산은 두 체중군에서 권장량보다 낮은 섭취수준을 보였다. 여섯째, 출생체중과 현재체중, 현재신장, 현재 Rohrer's index 간의 상관관계를 분석한 결과, 여학생의 출생체중은 현재체중과 현재신장에서 유의적인 양의 상관관계를 보였다. 위에 제시한 것과 같이 본 연구에서는 저체중 아동의 건강상 문제에 대한 가능성, 여학생의 왜곡된 자아체형인식 및 체중조절의지, 그리고 출생 시 체중과 현재 체중과의 연관성을 제시하였다. 따라서 이러한 결과를 토대로 가정과 학교에서 학령기 아동의 저체중 문제를 해소할 수 있는 지속적이고 다각적인 노력이 필요하다.

사용자 관심 이슈 분석을 통한 추천시스템 성능 향상 방안 (Improving Performance of Recommendation Systems Using Topic Modeling)

  • 최성이;현윤진;김남규
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.101-116
    • /
    • 2015
  • 많은 기관들이 데이터에 기반을 둔 의사결정을 수행해 왔으며, 특히 수치자료를 비롯한 정형 데이터가 이러한 목적으로 널리 활용되어 왔다. 하지만 최근에는 스마트기기와 소셜미디어의 발달로 인해 다양한 형태를 가진 방대한 양의 정보가 생성, 공유, 저장되면서, 전통적인 정형 데이터 기반 의사결정으로부터 비정형 빅데이터 기반 의사결정으로 관심의 전환이 이루어지고 있다. 데이터 기반 의사결정의 대표적 분야인 추천시스템 분야에서도 성능 향상을 위해 비정형 데이터를 활용해야 한다는 필요성이 최근 꾸준히 제기되고 있다. 특히 사용자의 성향이나 선호도는 고객의 니즈와 직결되기 때문에, 비정형 데이터 분석을 통해 사용자의 성향을 파악하고 이를 통해 상품 추천 및 구매 예측의 정확도를 향상시키기 위한 노력이 매우 시급하게 이루어질 필요가 있다. 따라서 본 연구에서는 사용자의 성향을 측정하여 재구매 예측 정확도, 특히 카테고리별 재구매 예측 정확도를 높임으로써, 궁극적으로 추천시스템의 성능을 향상시킬 수 있는 방안을 제시한다. 구체적으로는 사용자의 일상적인 인터넷 사용 기록을 분석하여 고객이 조회하는 뉴스 기사의 이슈를 식별하고 다양한 이슈에 대한 고객의 관심을 계량화한 후, 이를 활용하여 고객의 카테고리별 재구매 여부를 예측하는 모델을 제안하고자 한다. 실제 웹 트랜잭션으로부터 도출된 인터넷 뉴스 조회 기록 및 쇼핑몰 구매 기록을 대상으로 실험을 수행한 결과, 고객의 과거 구매이력만을 활용한 카테고리 재구매 예측 모형에 비해 본 연구에서 제안한 모형, 즉 고객의 과거 구매이력과 관심 이슈를 모두 활용한 예측 모형의 정확도가 다소 우수한 것으로 나타났다.