• 제목/요약/키워드: 클러스터링 문제

검색결과 429건 처리시간 0.024초

API 콜 시퀀스와 Locality Sensitive Hashing을 이용한 악성코드 클러스터링 기법에 관한 연구 (A Study on Malware Clustering Technique Using API Call Sequence and Locality Sensitive Hashing)

  • 고동우;김휘강
    • 정보보호학회논문지
    • /
    • 제27권1호
    • /
    • pp.91-101
    • /
    • 2017
  • API(Application Program Interface) 콜 시퀀스 분석은 분석 대상 프로그램에서 API 콜 정보를 추출한 후 분석하는 기법으로 다른 기법들에 비해 대상의 행위를 특징할 수 있는 장점이 있다. 하지만 기존의 API 콜 시퀀스 분석기법은 동일한 기능을 수행하는 함수를 상이한 함수로 잘못 식별하여 분석을 수행하는 문제점이 존재한다. 본 연구에서는 API 각각을 추상화시키는 방식을 추가하여 기존의 식별 문제를 해결하고 분석 성능을 향상시키고자 한다. 그 후 분석 대상들에서 획득한 추상화된 API 콜 시퀀스에 LSH(Locality Sensitive Hashing) 기법을 적용하여 각 분석 대상들 간의 유사도를 계산하고 유사한 유형끼리 클러스터를 형성하는 과정을 수행하였다. 본 연구는 악성코드 분석 시 악성코드의 유형을 파악하는 데 요긴하게 사용할 수 있으며, 최종적으로는 해당 유형 정보를 기반으로 악성코드 분석의 정확도를 향상시키는 데 기여할 수 있다.

계층적 영상구조에서 통계적 방법에 의한 영상분할 (A Statistical Image Segmentation Method in the Hierarchical Image Structure)

  • 최성진
    • 방송공학회논문지
    • /
    • 제1권2호
    • /
    • pp.165-175
    • /
    • 1996
  • 본 논문에서는 영상분할에 이용되는 대부분의 기존방법들에서의 문제점을 해결하기 위해 입력 영상으로부터 형성된 계층적 피라밋 영상구조를 이용하여 영상을 분할하는 방법을 제안하였다. 제안된 방법은 통계적 방식에 의한 물체검출 및 묘사과정으로 이루어져 있다. 물체검출 방법에서는 계층적 영상구조에서 발생하는 클러스터링의 유효성 문제를 해결하기 위해 통계적 IFSVR 알고리듬과 FSVR 알고리듬을 제안하였고, 이를 이용하여 관심대상 화소를 검출하였다. 물체묘사 방법은 고해상도 레벨로 검출된 최적 물체화소를 투사하고 처리하기 위해 톱다운 추적방식인 반복 알고리듬을 제안하였다. 시뮬레이션을 통하여 2진 영상과 실영상 모두에서 제안된 분할방법을 분석하였고, 그 결과 계층적 피라밋구조에 기초를 둔 접근방법이 영상분할에 대한 유용한 특성을 가지고 있음을 입증하였으며, 병렬처리기에서 처리된다면 각 알고리듬이 n${\times}$n 영상에 대해 0(log n)의 계산량이 요구된다.

  • PDF

지식획득, 추론, 지식정제의 통합적 설계를 위한 규칙모델의 구축 (Rule Models for the Integrated Design of Knowledge Acquisition, Reasoning, and Knowledge Refinement)

  • 이계성
    • 한국정보처리학회논문지
    • /
    • 제3권7호
    • /
    • pp.1781-1791
    • /
    • 1996
  • 전문가시스템의 지식획득, 적합한 추론기구의 설계 및 구현, 지식의 정제 등 다단계 과정으로 이뤄져 있다. 각각을 하나의 연구이슈로 다양한 연구가 진행되어 왔으나 전체를 하나로 연계해 통합적 개발에 관해서는 상대적으로 연구가 활발히 진행되지 못한 실정이다. 지식획득은 전문가에 의해 수행되는 추론과정에서 특징 응용분야의 필요한 지식이 전달되어야 하므로 시식획득과 추론을 서로 밀접한 연관성을 갖는다. 지식의 정제는 추론과정에서 일어나는 문에의 제기와 이의 해결을 통해 지식베이스의 불완전하거나 논리적 모순을 찾아 해결함으로 지식베이스를 보다 완벽하고 정확한 것으로 만드는 것이다. ㅂㄴ 연구에서는 서로 연관된 다단계 과정이 통합적으로 개발될 수 있는 환경의 설저엥 대한 하나의 방안을 제시하려한다. 특히 도메인 모델이 잘 정립되기 어려운 분야에 학습기법을 활용햇 초기 지식 베이스를 구성할 수 있는 점진적 지식획득방법과 이를 통해 만들어진 지식베이스 규칙들을 학습기법의 일종인 개념적 클러스터링 기법을 이용하여 규칙모델을 구축하고 이를 이용해 효율적인 추론이 가능하게 하며, 지식획득 과정에서는 규칙의 오류를 제시할 수 있고 이에 대한 규칙의 수정이나 새로운 규칙이 기존의 지식구조에 합당한지를 결정하는 통합적 설계방안에 대해 연구한다. 지식의 정제는 설명기구와 규칙모델을 활용하여 문제의 원인을 찾고 해결점을 제시해 그에 대한 유효성을 검증합으로 이뤄지게 한다.뤄지게 한다.

  • PDF

시계열 데이터로부터의 경향성 기반 순차패턴 탐색 (Trend-based Sequential Pattern Discovery from Time-Series Data)

  • 오용생;이동하;남도원;이전영
    • 지능정보연구
    • /
    • 제7권1호
    • /
    • pp.27-45
    • /
    • 2001
  • 데이터마이닝에서 시계열 데이터로부터 순차패턴을 발견하는 연구는 사건이나 아이템이 주로 연구되어왔지만, 최근에는 설비의 상태를 알 수 있는 센서와 같은 수치 값의 형태를 가지는 분야에 관심을 가지게 되었다. 그러나 수치 형태의 데이터는 패턴을 만드는 동안 동일한 값을 가지는 경우가 거의 없기 때문에 기존의 사건이나 아이템 등으로 변환될 수 있는 패턴요소의 특징을 만드는 것이 가장 중요하다. 이러한 패턴요소를 발견하는 지금가지 방법은 이동 윈도우와 클러스터링을 사용하는 방법을 적용하였는데, 이러한 방법은 다양한 윈도우의 크기와 클러스터 값을 적용하여 반복적으로 작업을 하며, 찾아진 결과를 해석하는데도 많은 문제가 있다. 본 연구는 수치 값을 가진 데이터를 벡터의 형태로 만들어 패턴요소를 만드는 방법을 제시한다. 이렇게 만들어진 패턴요소는 전체 데이터를 사용하는 것 보다 이해되기 쉽고 보다 빠르게 순차패턴을 찾을 수 있다. 벡터로 변환된 패턴요소는 각도와 크기를 가지는데 우리는 이들 벡터들의 상호 연관성을 정의하고, 이들 연관성을 이용하여 순차패턴을 찾는 방법을 제시한다.

  • PDF

계층형 무선센서네트워크를 위한 분리된 이중화 라우팅 (Separated Dual-layering Routing Scheme (SDRS) for Hierarchical Wireless Sensor Networks)

  • 최해원;김경준;김현성
    • 한국항행학회논문지
    • /
    • 제13권4호
    • /
    • pp.551-558
    • /
    • 2009
  • 에너지 효율성 초점이 맞추어진 대부분의 클러스터링 기법에서 클러스터 내에서 단일의 클러스터를 채용함으로써 클러스터 헤드의 에너지 소비가 급격히 증가 할 수 있다. 최근, 이러한 단점을 개선하기 위해 데이터 병합 기능 헤드와 데이터 전송 기능 헤드로 구분하는 2-계층 클러스터 기법은 클러스터 내에서 클러스터 헤드의 에너지 소비를 분산시켰다. 그러나 이러한 구조는 한 클러스터 내에 존재하는 두 개 헤드 사이에 독립적인 영역구분이 없는 단지 논리적인 영역이므로 많은 메시지 충돌과 전송 지연이 발생한다. 이러한 문제점을 해결하기 위해, 본 논문에서는 노드의 위치정보와 클러스터 반경을 이용해 한 클러스터에 속한 두 계층을 독립적으로 명확히 분할할 수 있는 분리된 2-계층 라우팅기법을 제시한다. 제안하는 스킴에서는 각 계층에 속하는 멤버노드 수에 대한 균등분포를 통해 부하의 분산을 보장한다. 제안한 기법은 기존의 DLS 기법보다 메시지 충돌문제를 50% 개선하였고, 네트워크의 수명도 DLS와 LEACH 등에 비해 약 10% 개선하였다.

  • PDF

전시장에서 유비쿼터스형 고객관계관리를 위한 RFID기반의 분석정보 자동생성 시스템 개발 (Development of RFID-based Automatic Analytical Information Generation System for Ubiquitous CRM in an Exhibit Hall)

  • 김도현;강문석;박찬정
    • 한국멀티미디어학회논문지
    • /
    • 제12권1호
    • /
    • pp.85-96
    • /
    • 2009
  • 시장에서의 경쟁 심화와 소비자의 요구변화로 고객관계관리(CRM)가 기업의 경영전략을 결정하는데 중요한 역할을 하는 추세이다. 또한, 유비쿼터스 환경의 도래로 고객관계관리 분야에서도 새로운 응용이 시도 되고 있다. 고객관계관리를 위한 전통적인 데이터 수집방법은 고객 사생활 침해나 부정확한 데이터 등의 문제를 야기할 수 있어 새로운 방법이 요구되고 있다. 본 논문에서는 RFID 미들웨어로 부터 획득된 데이터를 서버에 저장한 후, 자동으로 분석정보를 생성하는 유비쿼터스형 고객관계관리를 위한 RFID 기반의 분석정보 생성 시스템을 제안한다. 제안하는 시스템을 전시장에 적용하여 시스템으로부터 생성된 분석정보를 기업과 고객에게 제공한다. 본 논문에서 제안하는 시스템의 활용은 고객, 기업, 상품에 대한 유비쿼터스적인 정보제공을 가능하게 하고, 클러스터링, 연관성, 순차성과 같이 보다 정확하게 분석된 정보를 제공하여 기업의 고객관리와 다음 의사결정에 긍정적인 영향을 미친다.

  • PDF

Trie 구조를 이용한 비디오 인덱스 생성 및 검색 (Video Index Generation and Search using Trie Structure)

  • 현기호;김정엽;박상현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.610-617
    • /
    • 2003
  • 비디오 데이타베이스에서 유사도 정합은 비디오 클러스터링과 비디오 라이브러리 등과 같은 많은 새로운 응용분야에서 중요성이 증가하고 있다. 대용량 데이타베이스에서 효과적인 접근을 제공하기 위하여 다양한 공간과 시간에 대한 특징치를 이용한 비디오 인덱싱 분야의 많은 연구노력이 있어왔다. 그러나 대부분의 기존 방법들은 순차적인 정합방법 또는 메모리 기반의 역 파일 기법 등에 의존하므로 대용량 데이타베이스에는 적합하지 않다. 이러한 문제를 해결하기 위하여 본 논문에서는 효과적이고 스케일 조정가능한 인덱싱 기법을 제안하기 위하여, 문자열 정합을 위해 제안된 trio를 인덱스 구조로 이용하였다. 인덱스 구성을 위하여 윈도우 순서 휴리스틱을 이용하여 각 프레임을 기호 시퀀스로 변환하고, 기호 시퀀스의 집합으로부터 디스크 상주 trio를 구성하였다 질의 처리를 위하여 trio 상에서 깊이-우선 검색과 시간 축분할을 실시하였으며, 제안한 방법의 성능을 검증하기 위하여 실제와 합성 데이터 집합에 대한 실험을 수행하였다. 제안한 방법은 지속적으로 순차적 스캔 방법보다 우수한 성능을 보였고, 성능이득은 대용량 비디오 데이타베이스에서도 유지되었다.

온톨로지 학습에 의한 유사 웹 서비스 오퍼레이션 발견 방법 (Discovery Methods of Similar Web Service Operations by Learning Ontologies)

  • 이용주
    • 정보처리학회논문지D
    • /
    • 제18D권2호
    • /
    • pp.133-142
    • /
    • 2011
  • 시맨틱 웹 서비스 기술의 성공을 보장하기 위해서는 품질 좋은 온톨로지의 사용이 필수적이다. 하지만 온톨로지 사용의 중요성에도 불구하고 현재 웹 서비스를 위한 온톨로지는 거의 존재하지 않으며 이들의 구축도 쉬운 일이 아니다. 이러한 문제는 오늘날 웹 서비스의 확산과 발전을 가로막는 큰 저해 요인이 되고 있다. 본 논문에서는 웹 서비스를 개발할 때 자동으로 생성되는 WSDL 문서만 가지고 항목 간 숨어있는 시맨틱 정보를 찾아내어 온톨로지를 자동 구축하고, 이를 이용한 유사 웹 서비스 오퍼레이션 발견 방법을 제안한다. 핵심 내용은 WSDL 입출력 항목들로부터 의미적으로 같은 개념들을 묶고, 각 항목들 간의 계층관계를 형성하여 자동적으로 시맨틱 온톨로지를 구축한다. 그리고 새로운 유사도 측정 방법을 통해 우선순위별 유사 오퍼레이션을 발견하며, 발견된 오퍼레이션들 중 가장 적합한 오퍼레이션을 선택하여 웹 서비스 조합에 직접 활용할 수 있는 웹 서비스 오퍼레이션 검색 시스템을 구현한다.

P2P 클라우드 스토리지에서 비디오 전송을 위한 계층적 오버레이 구조 (A hierarchical overlay structure for video transmission in P2P cloud storage systems)

  • 이경진;김은삼
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.133-139
    • /
    • 2017
  • 기존 서버 기반의 클라우드 시스템에서의 높은 설치 및 유지비용 문제를 해결하기 위해 최근 P2P 클라우드 스토리지에 대한 연구가 진행되었다. 본 논문에서는 비디오 전송을 위한 P2P 클라우드 스토리지 시스템에서 재생 품질을 향상시키는 계층적인 오버레이 구조를 제안한다. 이 구조에서는 현재 접속 중인 피어들의 유사성을 기반으로 피어들을 클러스터링해서 하나의 그룹을 생성한 후 각 그룹 내에서 물리적인 인접성을 고려해서 피어들을 지역별로 서브그룹으로 다시 구성한다. 따라서 특정 비디오에 대한 재생이 요청되면 지역성을 고려해서 소스 피어들을 선택하여 전송 지연 시간을 최소화할 수 있다. 마지막으로 실험을 통해서 본 논문에서 제안하는 지역성을 고려한 계층적 오버레이 구조가 임의로 소스 피어를 선택하는 구조에 비해 성능이 우수한다는 것을 보인다.

SOM과 LVQ에 의한 자음의 분류 (Classification of Consonants by SOM and LVQ)

  • 이채봉;이창영
    • 한국전자통신학회논문지
    • /
    • 제6권1호
    • /
    • pp.34-42
    • /
    • 2011
  • 음성타자기의 구현에 접근하려는 노력의 일환으로서, 우리는 본 논문에서 자음의 분류에 대해 연구한다. 많은 자음들은 시간에 따른 주기적 거동을 보이지 않고 따라서 그들에 대한 푸리에 해석의 타당성에 확신을 갖기 어렵다. 그러므로, 우선 음성 신호로부터 추출되는 MFCC와 LPCC 특징벡터들이 자음에 대해 어느 정도의 의미가 있는지를 파악하기 위하여 LBG 클러스터링을 통한 벡터양자화를 수행한다. VQ의 실험적 결과는 자음에 대한 푸리에 해석의 타당성에 관해 분명한 결론을 내리는 것이 쉽지 않음을 보여주었다. 자음의 분류를 위해 SOM과 LVQ의 두 가지 신경망이 사용되었다. SOM의 결과는 몇 쌍의 자음들이 나뉘어 분류되지 않음을 보여주었다. LVQ에서는 본질적으로 이 문제가 사라지지만 자음의 분류 정확도는 낮은 수준이었다. 이로부터, LVQ에 의한 자음 분류에 있어서는 MFCC 및 다른 특징 벡터들이 함께 사용되어야 함이 사료된다. 하지만 본 연구에서 도입한 MFCC/LVQ의 결합은 기존의 언어모델을 기반으로 하는 음소 분류에 비해 그 결과가 나쁘지 않은 것으로 나타났다. 모든 경우에 LPCC 특징벡터는 MFCC에 비해 그 결과가 좋지 않았다.