• 제목/요약/키워드: 클러스터링 문제

검색결과 429건 처리시간 0.022초

경계범주 자동탐색에 의한 확장된 학습체계 구성방법 (Construction Scheme of Training Data using Automated Exploring of Boundary Categories)

  • 최윤정;지정규;박승수
    • 정보처리학회논문지B
    • /
    • 제16B권6호
    • /
    • pp.479-488
    • /
    • 2009
  • 본 논문은 기존의 목표항목만을 위주로 한 학습체계에서 발생하는 오분류 문제의 해결을 위해 기존의 학습체계에 경계항목을 자동으로 탐 색하여 포함시켜 확대시키는 방법을 제안하고 있다. 여러 주제에 걸쳐 다양한 내용을 다루는 복잡한 문서들은 확실히 어느 범주로 분류해야 할 지 판가름하기 어려운 성질인 모호성이 강하다. 이러한 경우 모든 경우들을 정확히 구분할 수 있는 최적의 경계를 찾는 일은 더욱 어려운 일이 다. 복잡하고 불확실성이 높은 데이터들의 특징은 대부분 분류 경계영역에 위치하므로 이러한 분류경계의 데이터들을 새로운 학습 항목으로 인 식시키도록 하는 것이 필요하다. 본 연구에서는 주어진 목표항목 사이의 경계항목을 자동으로 탐색하여 학습체계에 추가하는 학습 체계 확장 알고리즘을 제시하고, 의도적인 학습오류를 발생시킨 후 기존방법과의 비교실험을 수행함으로써 제안방법의 정확성과 안정성을 비교하였다. 실 험결과 경계범주를 포함하여 학습 체계를 확장시켰을 때의 예측력은 기존 0.70에서 0.86으로 약 24% 향상 되었고, 오류를 포함시켰을 때의 예 측력은 기존 0.52에서 0.79로 약 49% 향상되었다.

병렬 컴퓨팅을 이용한 DES 키 탐색 안정성 분석 (Evaluation of DES key search stability using Parallel Computing)

  • 윤준원;최장원;박찬열;공기식
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권1호
    • /
    • pp.65-72
    • /
    • 2013
  • 기상, 바이오, 천문학, 암호학 등 다양한 분야의 대규모 작업을 처리하기 위하여 다수의 계산 자원을 동시에 사용하기 위한 병렬 컴퓨팅 기법들이 제안되어져 왔다. 병렬 컴퓨팅은 여러 프로세서에게 작업을 분담시켜 동시에 계산을 수행하게 함으로써 프로그램의 실행시간을 단축시킬 수 있을 뿐만 아니라 해결할 수 있는 문제의 규모를 확장 시킬 수 있다. 본 논문에서는 실제 암호 알고리즘 분석하기 위하여 병렬 처리 방식을 적용하여 그 효율성을 분석하였다. 암호 알고리즘의 실질적인 안전성 요소인 키의 길이는 전수조사 계산량에 의존한다. 이에 병렬 처리 환경에서 DES 키 탐색 암호 알고리즘의 키 전수조사 작업을 수행하기 위한 세부적인 절차에 대해서 논하였고, 클러스터링 장비에 적용하여 시뮬레이션 수행하였다. 그 결과 컴퓨터의 양에 따라서 계산량의 추이를 실증적으로 예측함으로써 암호 알고리즘의 안전성 강도를 측정할 수 있다.

WSN의 에너지 효율적 운영을 위한 신뢰성이 보장된 IDE-LEACH 프로토콜 (IDE-LEACH Protocol for Trust and Energy Efficient Operation of WSN Environment)

  • 조영복;우성희;이상호
    • 한국통신학회논문지
    • /
    • 제38B권10호
    • /
    • pp.801-807
    • /
    • 2013
  • WSN은 수백에서 수 만개에 달하는 SN들로 구성된다. WSN은 에너지 불균형 문제 해결을 위해 각 라운드마다 클러스터헤드를 새롭게 선택하고, 안전한 통신을 위해 노드 인증방식을 사용하고 있다. 그러나 이런 방법은 각 라운드마다 재-클러스터링을 수행함으로 SN의 오버헤드를 가중시키는 원인이 되고 안전한 통신을 제공하기 위한 인증단계는 빈번히 발생되는 AREQ/AREP 메시지 처리로 노드의 오버헤드를 더욱 가중시키고 있다. 라서 이 논문에서는 WSN 환경에서 에너지 효율적 운영과 신뢰성이 보장된 IDE-LEACH(Identity based Encryption : IDE) 프로토콜을 제안한다. 제안 프로토콜은 기존 LEACH 기반의 프로토콜보다 통신에 평균적으로 20%까지 네트워크 수명을 연장하였고, 통신에 참여하는 모든 노드는 기지국으로부터 인증을 거친 신뢰할 수 있는 노드들로 구성된다.

선형배열 기지국을 위한 위치정보 서버의 최적할당 방식 (An Optimal Allocation Mechanism of Location Servers in A Linear Arrangement of Base Stations)

  • 임경식
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.426-436
    • /
    • 2000
  • 이동 통신환경에서 이동노드들은 기지국(base station)을 통하여 통신하므로, 기지국은 트래픽의 발신지 및 착신지로서 데이터 트래픽, 위치정보 트래픽 등과 같이 처리비용이 다른 이종의 트래픽을 발생한다. 그러데, 하나의 위치 정보 서버는 물리적으로 제한된 용량으르 다지므로 여러 대의 위치정보 서버를 분산시켜 구축할 필요가 있는데, 이때 기지국을 최적으로 클러스터링하고 각 클러스터마다 하나의 위치정보서버를 할당해야 한다. 본 논문에서는 기지국이 선형으로 배열된 이동 통신망에서, 서로간에 다양한 형태의 트래픽을 발생하는 n개의 기지국이 주어졌을 때, 전체 네트워크에 대한 통신비용을 최소화하기 위하여 이들을 m($1{\le}m{\le}n$) 개의 인접한 클러스터(disjoint cluster)로 분리하는 문제를 고려한다. 이를 위하여, 본 논문에서는 주어진 트래픽이 클러스터 내부에서 발생할 때와 클러스트간에 발생할 때의 통신비용 차이를 반영한 상대비용(relative cost) 개념을 도입하여 O($mm^2$)의 동적 프로그래밍(dynamic programming) 알고리즘을 제시한다. 또한 이 알고리즘은 하나의 클러스터에 대한 크기제한과 전체 네트워크에 허락된 총 통신비용이 제악조건으로 주어질 경우, 같은 계산시간 내에 모든 유효한 클러스터를 찾아 낼 수 있음을 보인다.

  • PDF

클러스터링 알고리듬을 이용한 영상 대비 향상 기법 (Image Contrast Enhancement Technique Using Clustering Algorithm)

  • 김남진;김용수
    • 한국지능시스템학회논문지
    • /
    • 제14권3호
    • /
    • pp.310-315
    • /
    • 2004
  • 야간에 비디오카메라로 촬영시 열악한 주위 환경과 영상 전송에 기인하여 다양한 잡음에 의하여 왜곡되고 흐린 저대비 (low contrast)영상을 가질 수 있다. 본 논문에서는 획득한 저대비 영상을 대비 향상시켜주는 기법을 제안한다. MPEG-2는 인간의 시각 특성상 색차(chrominance)신호보다 밝기(luminance)신호에 더 민감하기 때문에 밝기신호와 색차신호를 분리하여 압축한다. 본 논문에서는 밝기신호만을 추출하여, K-means 알고리듬을 사용하여 교차점을 자동으로 선정하는 방법을 사용한다. 이 최적의 교차점을 선정하는 과정은 획득한 영상을 물체와 배경으로 분리하는 두 개의 클래스 문제로 보고 K-means 알고리듬을 적용하였다. 구한 교차점을 사용하여 영상을 양분하고 양분된 영상의 각각에 히스토그램 평활화 방법을 적용하였다. 본 논문에서는 퍼지성 지수(index of fuzziness)를 사용하여 향상의 정도를 측정하였다. 제안된 기법을 저대비 영상에 적용하였으며 그 결과를 히스토그램 평활화 기법의 결과와 비교하였다.

무선 센서 네트워크에서 클러스터 기반의 Top-k 질의 처리 (A Cluster-Based Top-k Query Processing Algorithm in Wireless Sensor Networks)

  • 여명호;성동욱;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.306-313
    • /
    • 2009
  • 센서 네트워크 응용 분야에서 Top-k 질의는 가장 높은 혹은 가장 낮은 k개의 센서에 대한 유용한 정보를 제공한다. Top-k 질의 처리 시 에너지 소모를 줄이기 위한 많은 연구들이 진행되었다. FILA의 경우, 필터를 이용하여 불필요한 결과의 갱신을 제거하였으며, PRIM의 경우, 센싱된 데이타의 우선 순위를 부여하여 센서 데이타의 전송을 최소화하는 방법을 제안한다. 하지만, 같은 데이타 범위(프레임)에 속한 모든 데이타를 수집하기 때문에 데이타의 집중이 발생하면 많은 False Positive 데이타를 전송하는 문제가 발생한다. 본 논문에서는 Top-k 결과의 False Positive 데이타를 효과적으로 제거하기 위한 클러스터 기반의 새로운 Top-k 질의 처리 기법을 제안한다. 질의 처리 과정은 클러스터 레벨과 트리 레벨로 나누어지며, 각 레벨의 네트워크 토폴로지의 특성을 활용하여 False Positive 데이타를 효과적으로 필터링 한다. 성능 평가 결과, 기존 Top-k 질의 처리 기법에 비해 False Positive 데이타의 수가 70% 감소하고, 네트워크 수명이 약 105% 연장된다.

동적 클러스터 알고리즘을 이용한 무선 센서 네트워크에서 안전한 키 분배 방법 (A Secure Key Distribution Scheme on Wireless Sensor Networks Using Dynamic Clustering Algorithms)

  • 최동민;이여진;정일용
    • 한국멀티미디어학회논문지
    • /
    • 제10권2호
    • /
    • pp.236-245
    • /
    • 2007
  • 무선 센서 네트워크는 그 크기가 작고 제한적인 계산 능력과 저장 공간을 가지고 있으며 저용량의 배터리로 이루어진 많은 수의 노드들로 이루어진다. 이러한 조건에 따라 센서 네트워크 환경에서 센서 노드의 에너지 소모를 줄이는 것은 중요한 문제이다. 따라서 센서 노드의 에너지 소모를 줄이기 위해 노드가 전송하는 메시지의 발생 빈도를 줄이는 것이 고려되어야 한다. 또 다른 과제인 네트워크의 보안은 네트워크의 다양한 응용을 고려할 때 중요한 부분을 차지한다. 이에 본 논문에 서는 동적 클러스터 모델에서의 키 분배 방법을 제안한다. 이 방법에서 사용한 동적 클러스터 모델은 무선 센서 네트워크의 수명을 연장시키는데 매우 효과적인 방법이며 또한 제안한 방법은 클러스터를 구성하는 노드들에게 그리드 기반 키 분배방법을 적용하여 기존의 키 분배 방법에 비해 향상된 보안을 제공한다. 또한 기존에 제안된 그리드 기반, 위치 기반 키 분배 방법 및 클러스터 기반 키 분배 방법들과 비교하여 제안 방법의 우수함을 보였다.

  • PDF

연관분석을 이용한 금융 상품 거래 동향의 빅데이터 분석 (Big Data Analysis of Financial Product Transaction Trends Using Associated Analysis)

  • 유재필;신현준
    • 한국융합학회논문지
    • /
    • 제12권12호
    • /
    • pp.49-57
    • /
    • 2021
  • 최근 인공지능, 딥러닝, 빅데이터 등 4차 산업의 핵심 분야에 대한 관심이 커지면서 기존의 의사결정 문제를 전통적인 방법론의 한계점을 최소화하는 과학적 접근 방식이 대두되고 있다. 특히 이런 과학적인 기법들은 주로 금융 상품의 방향성을 예측하는데 사용되는데 본 연구에서는 사회적으로 관심이 높은 아파트 가격의 요인을 자기조직화지도를 통해 분석하고자 한다. 이를 위해 아파트 가격의 실질 가격을 추출하고 아파트 가격에 영향을 주는 총 16개의 입력 변수를 선정한다. 실험 기간은 1986년 1월부터 2021년 6월까지이며 아파트 가격의 상승 및 횡보 구간을 나눠 각 구간 별 변수들의 특징을 살펴본 결과, 상승 구간과 횡보 구간의 입력 변수의 통계적 성향이 뚜렷하게 구분되는 것을 알 수 있었다. 더불어 U1~U3 구간이 N1~N3 구간에 비해서 변수들의 표준편차가 상대적으로 크게 나왔다. 본 연구는 중장기적으로 상승과 하락이라는 큰 주기를 갖고 있는 부동산에 대해서 현재 시점의 현황을 정량적으로 분석한 것에 의미가 있으며 향후 이미지 학습을 통해 미래 방향성을 예측하는 연구에 도움이 되기를 기대한다.

악성코드 분석의 Ground-Truth 향상을 위한 Unified Labeling과 Fine-Grained 검증 (Unified Labeling and Fine-Grained Verification for Improving Ground-Truth of Malware Analysis)

  • 오상진;박래현;권태경
    • 정보보호학회논문지
    • /
    • 제29권3호
    • /
    • pp.549-555
    • /
    • 2019
  • 최근 AV 벤더들의 악성코드 동향 보고서에 따르면 신종, 변종 악성코드의 출현 개수가 기하급수적으로 증가하고 있다. 이에 따라 분석 속도가 떨어지는 수동적 분석방법을 대체하고자 기계학습을 적용하는 악성코드 분석 연구가 활발히 연구되고 있다. 하지만 지도학습기반의 기계학습을 이용할 때 많은 연구에서 AV 벤더가 제공하는 신뢰성이 낮은 악성코드 패밀리명을 레이블로 사용하고 있다. 이와 같이 악성코드 레이블의 낮은 신뢰성 문제를 해결하기 위해 본 논문에서는 새로운 레이블링 기법인 "Unified Labeling"을 소개하고 나아가 Fine-grained 방식의 특징 분석을 통해 악성 행위 유사성을 검증한다. 본 연구의 검증을 위해 다양한 기반의 클러스터링 알고리즘을 이용하여 기존의 레이블링 기법과 비교하였다.

메탄 가스 기반 가스 누출 위험 예측을 위한 다변량 특이치 제거 (Multivariate Outlier Removing for the Risk Prediction of Gas Leakage based Methane Gas)

  • 홍고르출;김미혜
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.23-30
    • /
    • 2020
  • 본 연구에서는, 천연가스(NG) 데이터와 가스 관련 환경 요소 간의 관계를 기계학습 알고리즘을 사용하여 가스 누출 데이터를 직접 측정하지 않고 가스 누출 위험 수준을 예측하였다. 이번 연구는 서버가 제공하는 오픈 데이터인 IoT 기반 원격 제어 피카로(Picarro) 가스 센서 사양을 기반으로 사용했다. 천연 가스는 공기 중으로 누출이 되며, 대기 오염, 환경, 그리고 건강에 큰 문제가 된다. 본 연구에서 제안하는 방법은 천연 가스의 누출 위험 예측을 위한 랜덤 포레스트(Random Forest) 분류 기반 다변량 특이치 제거 방법이다. 비지도 k-평균 클러스터링 후에 실험 데이터 집합은 불균형 데이터이다. 따라서 우리는 제안된 모델이 중간과 높은 위험 수준을 가장 잘 예측할 수 있다는 점에 초점을 맞춘다. 이 경우 각 분류 모델에 대한 수신자 조작 특성(ROC) 곡선, 정확도, 평균 표준 오차(MSE)를 비교했다. 실험 결과로 정확도, 수신자 조작 특성의 곡선 아래 영역(AUC, Area Under the ROC Curve), MSE가 각각 MOL_RF의 경우 99.71%, 99.57%, 및 0.0016의 결과 값을 얻었다.