• 제목/요약/키워드: 정보 수집 및 추출

검색결과 752건 처리시간 0.024초

사전 탐지와 예방을 위한 랜섬웨어 특성 추출 및 분류 (Extraction and Taxonomy of Ransomware Features for Proactive Detection and Prevention)

  • 황윤철
    • 산업융합연구
    • /
    • 제21권9호
    • /
    • pp.41-48
    • /
    • 2023
  • 최근 들어 개인, 기업, 국가 등 사회 전반에 랜섬웨어에 의한 피해가 급증하고 있으며 그 규모도 점차 커지고 있다. 랜섬웨어는 사용자 컴퓨터 시스템에 침입하여 사용자의 중요 파일들을 암호화하여 사용자가 해당 파일들을 사용하지 못하게 하고 그 댓가로 금품을 요구하는 악의적인 소프트웨어이다. 랜섬웨어는 기타 다른 악의적인 코드들에 비해 공격기법이 다양하고 정교하여 탐지가 어렵고 피해 규모가 크기 때문에 정확한 탐지와 해결 방법이 필요하다. 정확한 랜섬웨어를 탐지하기 위해서는 랜섬웨어의 특성들로 학습한 탐지 시스템의 추론엔진이 요구된다. 따라서 본 논문에서는 랜섬웨어의 정확한 탐지를 위해 랜섬웨어가 가지는 특성을 추출하여 분류하는 모델을 제안하고 추출된 특성들의 유사성을 계산하여 특성의 차원을 축소한 다음 축소된 특성들을 그룹화하여 랜섬웨어의 특성으로 공격 도구, 유입경로, 설치파일, command and control, 실행파일, 획득권한, 우회기법, 수집정보, 유출기법, 목표 시스템의 상태 변경으로 분류하였다. 분류된 특성을 기존 랜섬웨어에 적용하여 분류의 타당성을 증명하였고, 차후에 이 분류기법을 이용해 학습한 추론엔진을 탐지시스템에 장착하면 새롭게 등장하는 신종과 변종 랜섬웨어도 대부분 탐지할 수 있다.

GIS를 이용한 한국의 기후지역 구분 (A Classification of Climatic Region in Korea Using GIS)

  • 박현욱;문병채
    • 대한지리학회지
    • /
    • 제33권1호
    • /
    • pp.17-40
    • /
    • 1998
  • 기후지역 구분(기후환경 유형화)의 가장 중요한 역할은 기후환경의 실태를 나타내 그 대세를 알기 쉽게 표현하는 귀납적 일반화를 행하기 위한 수단이다. 본 연구는 기후대표성과 그 범위의 체계적인 과학적 설정을 위해 한반도의 기후특성을 잘 반영하고 있는 13개 기후요서(강수일, 강수량, 일기엔트로피, 기온, 신적설, 상대습도 등)를 선정하고, 이에 관해 수집된 자료를 많은 변수 처리와 공간 및 속성자료를 동시에 분석해야 할 필요성으로, GIS 분석기능과 연계하여 다변량해석법의 일종인 주성분분석법, 정보이론에 의한 엔트로피아 정보비 개념을 사용해 기후요소별로 유형화를 시킨 후, 이들을 다시 GIS를 이용 중첩시켜 기후특성에 관한 속성값을 담고 있는 플라곤들을 대상으로 군집분석하여 한국 기후환경에 대한 종합적 유형화를 시도하였다. 이 결과 일기의 평균 정보량인 일기엔트로피와 그 정보비는 일기출현의 특성을 잘 나타내므로 그것을 측도로 하는 기후환경의 지역별 일기 대표성 및 범위의 설정이 가능하였고, 주성분분석법을 응용하여 추출된 기후요소들의 연변화형의 주성분 백터와 진폭계수는 실제의 기후요소들의 분포와 연변화 특징을 잘 나타내, 이를 기초로 하는 한국의 기후환경을 유형화하였으며, 위의 유형화된 결과물을 GIS 지도대수와 통계분석 프로그램인 S-Plus 및 SAS를 연계시켜 분석한 결과 형성된 997개 기후유형과 이 997개 유형에 포함된 109개 변량을 대상으로 군집분석을 하여, 남한의 기후환경을 3구분 즉, 대구분(8), 중구분(26), 소구분(48)으로 유형화시킨 결과를 얻어냈다.

  • PDF

COVID-19 접촉추적과 노출알림 앱사용자의 항의 및 불만요인 탐색 (Key Determinants of Dissatisfaction on COVID-19 Contact Tracing and Exposure Notification Apps)

  • 임병학;홍한국
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.176-183
    • /
    • 2021
  • 디지털 의료기술은 매우 효과적이면서 동시에 개인정보를 보호해야 하는 과제를 앉고 있다. 그러나 오늘날 COVID 19 환경에서 접촉추적과 노출알림 앱의 경우 개인정보보호 조치와 앱의 사용효과 사이에 항상 상충 관계가 있다. 오늘날 많은 국가들이 COVID 19 확산을 방지하기 위해 다양한 형태로 접촉추적과 노출알림 앱을 개발하여 사용하고 있지만 디지탈 감시(디지탈 판옴티콘) 의심을 피하지 못하고 있다. 따라서, 본 연구에서는 우리나라의 '자가격리자 안전보호 앱' 사용자 리뷰을 추출하여 텍스트마이닝 분석을 통해 개인정보 침해 요인 및 불만족 요인을 파악하고자 한다. 텍스트마이닝 분석결과, 우리는 4개 그룹, '주소인식 오류', '이탈경고 오류', '접속 오류', '프로그램 오류'를 도출하였다. '주소인식 오류'와 '이탈경고 오류'는 앱에 의한 감시를 받고 있다는 인식을 강하게 줄 수 있어 개인정보 보호에 대한 투명한 관리 및 개인정보 수집관련 동의절차가 필요하다. 또 나머지 두 그룹은 앱기능 혹은 프로그램 버그오류로 바로 수정이 되지 않는다면, 사용자들의 불만을 극대화시켜 감시자에 대한 항의를 일으킬 수 있다.

빅 데이터 기반의 네트워크 패킷 분석 모델 (The Model of Network Packet Analysis based on Big Data)

  • 최보민;공종환;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.392-399
    • /
    • 2013
  • IT 기술 발달 및 정보화 시대로 인해 우리 사회 전반에 걸쳐 많은 부분이 네트워크에 대한 의존도가 상당히 커지고 있다. 이는 다양한 정보 및 서비스 획득의 용이성을 제공해 주는 이점이 있는 반면에, 네트워크 침입자들로 하여금 더 많은 취약성의 루트를 제공할 수 있는 부정적 효과도 따르고 있다. 이는 네트워크 이용과 함께 증가한 패킷의 다양한 루트를 악용하여 네트워크의 연결된 시스템에 서비스 장애나 마비를 일으키는 악의적인 위협 및 공격 또한 함께 증가하고 있음을 의미하며 이러한 문제에 대한 해결책이 시급히 필요하다. 이에 보안 분야에서는 네트워크 패킷이나 시스템 로그 등을 수집하여 이를 분석하고 이러한 위협에 대응할 수 있는 다양한 보안 솔루션을 개발하고 있으나, 기존의 분석 방식들로는 점차 방대해져가고 있는 보안 데이터들을 처리하는데 데이터 저장 공간 부족 및 이에 따른 성능 저하와 같은 여러 문제점들이 발생하고 있다. 따라서 본 논문에서는 보안 영역 분야에서도 최근 이슈가 되고 있는 빅 데이터 기술을 적용하여 이러한 문제점들을 개선하는 모델을 제안한다. 즉, 대용량 데이터 저장 기술인 NoSQL을 통해 점차 방대해져 가는 패킷데이터를 수집하고, 분산 프로그래밍모델인 맵리듀스 기반의 K-means 클러스터링을 설계하여 네트워크 침입에 대한 특징 및 패턴을 추출 할 수 있는 분석모델을 제안하고 실험을 통하여 이에 대한 우수성을 입증하였다.

다중 플랫폼(위성, 무인기, AIS, HF 레이더)에 기반한 시나리오별 선박탐지 모니터링 (Operational Ship Monitoring Based on Multi-platforms (Satellite, UAV, HF Radar, AIS))

  • 김상완;김동한;이윤경;이임평;이상호;김정훈;김근용;유주형
    • 대한원격탐사학회지
    • /
    • 제36권2_2호
    • /
    • pp.379-399
    • /
    • 2020
  • 불법 선박 탐지는 해양 감시 체계 구축에서 중요한 요소 중 하나이다. 효과적인 해양 감시를 위해서는 광역적이고 지속적인 해상 감시 수단이 요구된다. 본 연구에서는 인공위성 SAR, HF 레이더, 무인기 그리고 AIS 통합 기반의 선박탐지 모니터링을 가능성을 검토하였다. 각 플랫폼별 시·공간 관측 특성을 고려하여 선박감시 시나리오는 HF 레이더 자료와 AIS 자료를 이용한 상시감시 시스템과 인공위성과 무인기를 활용한 이벤트 감시 시스템으로 구성되었다. 상시감시 시스템은 아직까지 HF 레이더 자료의 낮은 공간해상도로 인한 탐지 가능 선박크기 제한 및 정확도의 한계가 있다. 그러나, 인공위성 SAR 자료를 사용한 이벤트 감시 시스템은 추출된 선박 위치와 AIS 자료를 이용한 불법 선박 탐지, 그리고 SAR 영상에서 추출된 선박속도, 이동방향에 대한 정보 또는 HF 레이더 자료를 이용한 선박 트래킹 정보는 무인기 감시체계로의 전환에 주요한 정보로 활용될 수 있다. 시나리오 구성을 위한 실험을 위해 2019년 6월 25일부터 6월 26일까지 2일간 충청남도 서천군 홍원항 서측에 위치한 연도를 중심으로 통합 현장 실험을 수행하였다. 이로부터 KOMPSAT-5 SAR 영상, 무인기 영상, HF 레이더 자료 및 AIS 자료가 성공적으로 수집되었고 각각 개발된 알고리즘을 적용하여 분석되었다. 개발된 선박감시 모니터링 시스템은 다중 플랫폼으로부터 수집된 자료 및 분석 결과의 가시화 뿐만 아니라 추후 상시 및 이벤트 선박감시 시나리오를 구현에 기반이 될 것이다.

이미지 및 코드분석을 활용한 보안관제 지향적 웹사이트 위·변조 탐지 시스템 (Website Falsification Detection System Based on Image and Code Analysis for Enhanced Security Monitoring and Response)

  • 김규일;최상수;박학수;고상준;송중석
    • 정보보호학회논문지
    • /
    • 제24권5호
    • /
    • pp.871-883
    • /
    • 2014
  • 최근 경제적 이윤을 목적으로 한 해킹조직들이 국가 주요 웹사이트 및 포털사이트, 금융 관련 웹사이트 등을 해킹하여 국가적 혼란을 야기 시키거나 해킹한 웹사이트에 악성코드를 설치함으로서 해당 웹사이트를 접속하는 행위만으로도 악성코드에 감염되는 이른바 'Drive by Download' 공격이 빈번하게 발생하고 있는 실정이다. 이러한 웹사이트를 공격목표로 하는 사이버 위협에 대한 대응방안으로 웹사이트 위 변조 탐지 시스템이 주목을 받고 있으며, 국내에서는 국가사이버안전센터(NCSC)를 중심으로 분야별 사이버 보안을 담당하는 부문 보안관제센터에서 해당 시스템을 구축 운영하고 있다. 그러나 기존 위 변조 탐지기술의 대부분은 위 변조 탐지 시간이 오래 걸리고 오탐율 또한 높기 때문에, 신속성 및 정확성이 중요한 보안관제 분야에서는 직접적 활용이 어렵다는 문제점을 안고 있다. 따라서 본 논문은 웹사이트 위 변조 탐지시스템의 오탐률을 최소화하고 실시간 보안관제에 활용하기 위해 이미지 및 코드 분석기반의 웹사이트 위 변조 탐지 시스템을 제안한다. 제안 시스템은 웹크롤러에 의해 비교검증의 대상이 되는 정보만을 수집하고 정규화를 통해 위 변조 판별에 영향을 미치는 이미지 및 코드를 추출하여 유사도를 분석하고 이를 시각화함으로서 보안관제요원의 직관적인 탐지 및 웹사이트 위 변조에 대한 신속성 및 정확성을 향상하는데 목적을 둔다.

GMM(Gaussian Mixture Model)을 적용한 영상처리기법의 연속류도로 사고 자동검지 알고리즘 개발 (Development of the Algofithm for Gaussian Mixture Models based Traffic Accident Auto-Detection in Freeway)

  • 오주택;임재극;여태동
    • 대한교통학회지
    • /
    • 제28권3호
    • /
    • pp.169-183
    • /
    • 2010
  • 영상기반의 교통정보수집시스템은 관리 및 운영상의 한계를 보이고 있는 기존의 루프검지기의 역할을 대체하는 검지기로써의 역할 뿐만 아니라 다양한 교통류의 정보를 제공하고 관리할 수 있으며, 교통사고의 발생전과 후의 순차적인 상황을 정확히 기록하고, 이 자료를 통해 발생된 교통사고의 사고 매커니즘을 객관적이고 명확하게 조명하고 분석하는 것은 교통사고 처리에 있어서 중요한 부분을 차지함으로서, 여러 나라에서 보급 활용되고 있다. 본 논문에서는, 기존 기술들이 연속류 도로의 특성인 속도변화, 교통량 변화, 점유율 변화와 같은 교통류 흐름을 반영하여 1차 예비판단을 실시하였다. 또한, 1차 예비판단된 경우 영상추출 및 처리를 통해 최종 사고판단을 실시하게 된다. 이 때, 도로상의 다양한 환경적 변화로 인해 극복하기 어려운 차량의 객체추출, 객체분리, 추적 등의 정확성을 확보하기 위해서 계산속도와 정확도 측면에서 우수함을 보이고 있는 Adaptive GMM(Gaussian Mixture Model) 기반으로 실시하였으며, 환경적인 요인으로 인해 자주 발생하고 있는 오 검지 상황들을 효과적으로 저감시킬 수 있는 능동적이고 환경적응적인 기법을 통해 사고 최종판단을 실시하였다. 이렇게 구현된 기술의 성능을 평가하고자 중부내륙 실험도로에서 12건의 사고 모의실험을 실시하였으며, 실제 운용되고 있는 장항IC에서의 사고영상을 실시간 온라인으로 입력받아 시험하였다. 결과적으로, 검지율 93.33%, 오검지 6.7%로 높은 신뢰성을 보였다.

기계학습 기반 IDS 보안이벤트 분류 모델의 정확도 및 신속도 향상을 위한 실용적 feature 추출 연구 (A Practical Feature Extraction for Improving Accuracy and Speed of IDS Alerts Classification Models Based on Machine Learning)

  • 신익수;송중석;최장원;권태웅
    • 정보보호학회논문지
    • /
    • 제28권2호
    • /
    • pp.385-395
    • /
    • 2018
  • 인터넷의 성장과 함께 각종 취약점을 악용한 사이버 공격들이 지속적으로 증가하고 있다. 이러한 행위를 탐지하기 위한 방안으로 침입탐지시스템(IDS; Intrusion Detection System)이 널리 사용되고 있지만, IDS에서 발생하는 많은 양의 오탐(정상통신을 공격행위로 잘못 탐지한 보안이벤트)은 여전히 해결되지 않은 문제로 남아있다. IDS 오탐 문제를 해결하기 위한 방법으로 기계학습 알고리즘을 통한 자동분류 연구가 진행되고 있지만 실제 현장 적용을 위해서는 정확도와 데이터 처리속도 향상을 위한 연구가 더 필요하다. 기계학습 기반 분류 모델은 다양한 요인에 의해서 그 성능이 결정된다. 최적의 feature를 선택하는 것은 모델의 분류 성능 및 정확성 향상에 크게 영향을 미치기 때문에 기계학습에서 매우 중요한 부분을 차지한다. 본 논문에서는 보안이벤트 분류 모델의 성능 향상을 위해 기존 연구에서 제안한 기본 feature에 추가로 10종의 신규 feature를 제안한다. 본 논문에서 제안하는 10종의 신규 feature는 실제 보안관제센터 전문 인력의 노하우를 기반으로 고안된 것으로, 모델의 분류 성능을 향상시킬 뿐만 아니라 단일 보안이벤트에서 직접 추출 가능하기 때문에 실시간 모델 구축도 가능하다. 본 논문에서는 실제 네트워크 환경에서 수집된 데이터를 기반으로 제안한 신규 feature들이 분류 모델 성능 향상에 미치는 영향을 검증하였으며, 그 결과, 신규 feature가 모델의 분류 정확도를 향상시키고 오탐지율을 낮춰주는 것을 확인할 수 있었다.

다중 회귀 기반의 음악 감성 분류 기법 (Multiple Regression-Based Music Emotion Classification Technique)

  • 이동현;박정욱;서영석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권6호
    • /
    • pp.239-248
    • /
    • 2018
  • 4차 산업혁명 시대가 도래하면서 기존 IoT에 감성지능이 포함된 신기술들이 연구되고 있다. 그 중 현재까지 다양하게 진행된 음악 서비스 제공을 위한 감성 분석 연구에서는 인공지능, 패턴인식 등을 활용한 사용자의 감성 인식 및 분류 등에만 초점을 맞추고 있는 상황이나, 사용자의 특정 감성에 해당하는 음악들을 어떻게 자동적으로 분류할지에 대한 감성별 음악 분류기법들에 대한 연구는 매우 부족한 상황이다. 본 연구에서는 최근 각광을 받고 있는 사람들의 감성과 관련된 음악관련 서비스를 개발할 시, 음악을 감성 범위에 따라 높은 정확도로 분류할 수 있도록 하는 감성 기반 자동 음악 분류기법을 제안한다. 데이터수집 시 Russell 모델을 바탕으로 설문조사를 하였으며, 음악의 특성으로 평균파장크기(Average amplitude), peak평균(Peak-average), 파장 수(The number of wavelength), 평균파장 길이(Average wavelength), BPM(Beats per minute)을 추출하였다. 해당 데이터들을 바탕으로 회귀 분석을 이용하여 다중회귀식을 도출하였으며, 각 감성에 대한 표준 수치들을 도출하여 새로운 음악 데이터와 해당 각 감성에 대한 표준 수치들과의 거리 비교를 통해 음악의 감성을 분류시키는 작업을 실시하였다. 이를 통해 나온 결과에 회귀분석을 통하여 나온 데이터를 대입하여 해당 데이터와 각 감성들의 비율을 통해 최종적으로 판단된 감성을 추출하였다. 본 연구에서 실험한 감성 일치율의 2가지 방식에 대해서 제안한 기법의 경우 70.94%, 86.21%의 일치율이 나왔고, 설문참가자들의 경우 66.83%, 76.85%의 일치율이 나옴으로써, 연구 기법을 통한 감성의 판단이 설문참가자들의 평균적인 판단보다 4.11%, 9.36%의 향상된 수치를 제공함을 알 수 있었다.

온라인 텍스트 분석을 통해 추정한 기업의 사회적책임 성과가 기업의 단기적 장기적 성과에 미치는 영향 분석 (Investigating the Impact of Corporate Social Responsibility on Firm's Short- and Long-Term Performance with Online Text Analytics)

  • 이희승;진윤선;권오병
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.13-31
    • /
    • 2016
  • 그동안 기업의 사회적 책임(CSR)관련 활동의 결과가 기업 성과에 미치는 단기적 및 장기적 영향에 대한 다양한 연구가 진행되었지만 그 결과는 일관되지 못한데 그 주된 원인은 기업의 사회적책임이라고 하는 개념의 불일치였다. 따라서 본 연구는 온라인 뉴스와 같은 비정형 공개 데이터로부터 기업의 사회적책임에 관련한 키워드를 텍스트 마이닝 기법을 사용하여 추출하고 그 개념에 대한 통계치와 기업 성과와의 관계성을 이해하려고 했다. 이를 위해 개념과 관련한 키워드는 뉴욕타임즈와 구글 스칼러에서 CSR이라고 하는 단어로 검색한 비정형 데이터로부터 인식하였다. 그런 다음 점검 대상이 되는 기업에 대한 글이 실려 있는 온라인 문서를 수집하여 기업의 사회적 책임과 기업 단기적 및 장기적 성과 사이의 인과관계를 분석하였다. 그 결과, 기업의 사회적 책임에 대한 전문적인 평가 보고서의 도움 없이도 본 연구에서 개발한 기업의 사회적 책임 인덱스만으로 기업의 단기적 성과에는 영향이 없지만 장기적 성과와는 통계적으로 유의하게 정비례관계가 있는 것이 밝혀졌다. 본 연구는 빅데이터 분석을 통해 효율적이고 의미 있는 기업의 사회적 책임 평가 방법을 개발한 첫 번째 시도라는 의미가 있다.