• 제목/요약/키워드: 연관규칙 탐사

검색결과 132건 처리시간 0.029초

과탐지를 제어하는 이상행위 탐지 방법 (Anomaly Detection Method Based on The False-Positive Control)

  • 조혁현;정희택;김민수;노봉남
    • 정보보호학회논문지
    • /
    • 제13권4호
    • /
    • pp.151-159
    • /
    • 2003
  • 인터넷이 일반화되면서, 컴퓨터 시스템을 침입으로부터 효과적이면서 종합적으로 보호하기 위해 침입 탐지 시스템이 필요하게 되었다. 본 연구에서는 이상행위 탐지 기법을 이용한 침입 탐지 시스템을 구축할 때, 수행하는 정상행위 프로파일링 과정에서 발생하는 자기설명모순이 존재함을 제시하고 이를 제어할 수 있는 침입 탐지 방안을 제안하였다. 또한, 연관규칙을 적용한 프로파일링 과정의 결과는, 많은 정상행위 패턴이 생성될 수 있기 때문에, 이를 위해 군집화를 통한 효과적인 적용방안을 제시한다. 마지막으로, 사용자의 행위 패턴에 대해 군집화된 정상행위 패턴 데이터베이스로부터 이상행위 여부를 판단할 수 있는 유사도 함수를 제안하였다.

단백질 모티프간 연관성 탐사 (Exploring Association Among Protein Motifs)

  • 이현숙;이도헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.47-50
    • /
    • 2002
  • 단백질 모티프(motif)란 유사한 기능을 가진 여러 단백질 서열에서 공통적으로 발견되는 패턴으로서 단백질의 기능을 예측하는 단서로 활용된다. 현재 Prosite, Pfam 등의 데이터베이스에서 정규식(regular expression), 가중치 행렬(weighted matrix). 은닉 마코프 모델(hidden Markov model)의 형태로 4천여종 이상의 모티프가 등록되어 있다. 하지만, 이러한 데이터베이스는 모티프와 단백질간의 일대일 관계만을 저장하고 있기 때문에, 모티프 간의 연관성을 파악하기는 어렵다. 본 논문에서는 모티프 간의 연관 관계를 연관 규칙의 형태로 발견하는 데이터 마이닝 기법을 제시한다. 아울러 HITS 데이터베이스로부터 입수한 단백질-모티프 데이터베이스에 본 기법을 적용함으로써 상당히 높은 연관성을 갖는 모티프 집단이 실제로 존재한다는 것을 밝힌다.

  • PDF

데이터마이닝의 자동 데이터 규칙 추출 방법론 개발 : 계층적 클러스터링 알고리듬과 러프 셋 이론을 중심으로 (Development of Automatic Rule Extraction Method in Data Mining : An Approach based on Hierarchical Clustering Algorithm and Rough Set Theory)

  • 오승준;박찬웅
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.135-142
    • /
    • 2009
  • 테이터 마이닝은 대용량의 데이터 셋을 분석하기 위하여 새로운 이론, 기법, 분석 툴을 제공하는 전산 지능분야의 새로운 영역중 하나이다. 데이터 마이닝의 주요 기법으로는 연관규칙 탐사, 분류, 클러스터링 등이 있다. 그러나 이들 기법을 기존 연구 방법들처럼 개별적으로 사용하는 것보다는 통합화하여 규칙들을 자동적으로 발견해내는 방법론이 필요하다. 이런 데이터 규칙 추출 방법론은 대량의 데이터들을 분석하여 성공적인 의사결정을 내리는데 도움을 줄 수 있기에 많은 분야에 이용될 수 있다. 본 논문에서는 계층적 클러스터링 알고리듬과 러프셋 이론을 이용하여 대량의 데이터로부터 의미 있는 규칙들을 발견해 내는 자동적인 규칙 추출 방법론을 제안한다. 또한 UCI KDD 아카이브에 포함되어 있는 데이터 셋을 이용하여 제안하는 방법에 대하여 실험을 수행하였으며, 실제 생성된 규칙들을 예시하였다. 이들 자동 생성된 규칙들은 효율적인 의사결정에 도움을 준다.

시간 데이타마이닝 프레임워크 (Temporal Data Mining Framework)

  • 이준욱;이용준;류근호
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.365-380
    • /
    • 2002
  • 시간 데이타마이닝은 기존 데이타마이닝에 시간 개념을 추가하여 "시간값을 가진 대용량 데이타로부터 이전에 잘 알려지지는 않았지만, 묵시적이고 잠재적으로 유용한 시간 지식을 탐사하는 기술"로 정의된다. 시간 지식이란 주기적 패턴, 캘린더 패턴, 경향 등과 같이 시간 의미와 시간 관계를 가진 지식을 말한다. 실세계에서는 환자의 병력, 상품 구매 이력, 웹 로그 등과 같은 다양한 시간 데이타가 존재하며 이로부터 여러 형태의 유용한 시간 지식을 찾아낼 수 있다. 데이타마이닝에 대한 연구가 진행되면서 순차 패턴, 유사 시계열 탐사, 주기적 연관규칙 탐사 등과 같이 시간 지식을 탐사하고자 하는 시간 데이타마이닝에 대한 부분적인 연구가 수행되었다. 그러나 기존 연구는 단순히 데이타의 발생 순서 및 유사한 패턴을 찾아내는데 중점을 두고 있어 데이타가 포함하고 있는 시간 의미와 시간 관계를 탐사하는데 부족하며, 시간 지식의 전체적인 측면보다는 연관 규칙과 같은 일부분만을 다루고 있다는 문제점을 가지고 있다. 따라서 이 논문에서는 시간 데이타마이닝에 대한 체계적인 연구를 위하여 시간 데이타마이닝에 대한 기존 연구 내용과 해결해야 할 문제점을 분석하고 이를 바탕으로 전체적인 프레임워크를 제시하였다. 또한 그 구현 방안 및 적용평가를 수행하였다. 프레임워크에서는 시간 데이타마이닝 모델을 제안하고, 이를 바탕으로 시간 데이타마이닝 질의어와 시간 지식을 탐사할 수 있는 시간 데이타마이닝 시스템을 설계하였다.

사용자의 재생 시간을 이용한 멀티미디어 추천 시스템 (A Multimedia Recommender System Using User Playback Time)

  • 권형준;정동근;홍광석
    • 인터넷정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.111-121
    • /
    • 2009
  • 본 논문에서는 사용자의 재생 시간을 이용한 멀티미디어 추천 시스템을 제안한다. 제안하는 시스템은 사용자에 의해 요청된 멀티미디어 콘텐츠와 그것이 재생된 시간을 기록하고, 기록된 데이터를 가지고 퍼지 연관규칙 탐사 방법을 이용하여 사용자가 관심을 보일 만한 멀티미디어 콘텐츠와 사용자에 의해 재생된 시간에 기반하여 선호 등급을 예측한다. 제안하는 방법은 사용자의 선호 정보를 별도로 입력 받지 않고도 예측된 선호 등급에 따라서 추천 목록에 대한 선호정도를 예측할 수 있으며, 거짓된 선호 정보의 유입을 방지하는 장점이 있다. 유효성 검증을 위해 제안하는 시스템을 구현하고 실험한 결과, 사용자로부터 입력 받은 선호 정보를 포함하지 않은 트랜잭션으로부터 사용자가 높은 선호도를 보일 것이라 예상되는 추천 목록을 선별하여 추천 시스템에 적용할 수 있음을 확인하였다.

  • PDF

DHP 연관 규칙 탐사 알고리즘을 위한 해싱 메커니즘 최적화 (An Optimization of Hashing Mechanism for the DHP Association Rules Mining Algorithm)

  • 이형봉;권기현
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권8호
    • /
    • pp.13-21
    • /
    • 2010
  • DHP 연관 규칙 탐사 알고리즘의 가장 큰 특징은 단계 k-1에서 k 개의 항목으로 구성된 해시 키 조합에 대한 계수를 미리 실시하고, 이를 단계 k에서 후보 빈발 항목 집합을 구성할 때 전지 정보로 활용하여 그 크기를 줄임으로써 성능을 개선한다는 점에 있다. 이 때, 모든 해시 키 조합에 대한 계수를 독립적으로 관리할 수 있다면 가장 이상적이나, 메모리 소요가 너무 많으므로 여러 개의 해시 키 조합들이 계수 공간을 공유하는 직접 해싱 메커니즘을 활용한다. 그러나, 연관 규칙 탐사 알고리즘의 특성상 해시 키 조합의 분포 공간이 불규칙하여 해싱 함수에 일반적인 단순 제산 연산을 사용할 경우 직접 해싱의 효율이 저하된다. 이 논문에서는 단계 3을 위한 길이 3인 해시 키 공간을 연속되는 정수 공간으로 사상하여 직접 해싱의 효율을 극대화시키는 사상 완전 해싱 함수를 제안한다. 42개의 시험 데이터 유형을 대상으로 실험한 결과 제안된 해싱 함수는 기존 방법보다 평균 7.3%, 최대 16.9%의 성능 개선 효과가 있는 것으로 나타났고, 특히 평균 거래 길이, 평균 빈발 항목 집합의 크, 전체 항목의 개수 등이 클수록 성능 개선 정도가 높았다.

연관규칙을 활용한 효율적인 정보통신윤리 교육 방법 연구 (The Study of an Efficient Information and Communication Ethics Education Based on Association Rule)

  • 조명흠;주길홍
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2007년도 하계학술대회
    • /
    • pp.27-32
    • /
    • 2007
  • 인터넷이 발전함에 따라 정보화의 역기능 현상들도 방대해지고 있으며, 그에 대한 피해도 증가하고 있다. 이러한 상황 속에서 정보통신 윤리교육은 학생 개개인의 정보통신 윤리의식 수준과 정보화 역기능의 진단 및 파악 없이 동일한 교육 내용으로 이루어져 있기 때문에 체계화된 정보통신 윤리교육이 이루어지지 않고 있으며, 학생들의 정보통신 윤리의식조차 불명확해지고 있다. 이는 정보화의 역 기능으로 인해 발생되는 문제를 미리 예방할 수 없으며, 그에 대한 대처도 어렵게 하고 있다. 따라서 본 논문에서는 학생들의 정보화 사회의 역기능인 인터넷 중독을 진단하고 하위 중독 범주들 간의 연관 관계를 데이터마이닝 기법으로 탐사하여 개인별 추출 결과에 따른 특성화된 정보 통신 윤리 교육 방법을 설계하고자 한다.

  • PDF

주요 항목 집합을 이용한 문서 클러스터링 및 연관 탐사 기법 (Clustering and Association Rule Mining of Transactions using Large Items)

  • 서성보;김선철;이준욱;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.169-171
    • /
    • 2000
  • 현재 광범위한 웹 문서를 검색하기 위해서 많은 사용자들이 여러 종류의 검색엔진을 사용하고 있다. 하지만 대부분의 사용자는 검색엔진에 의해 검색된 문서의 순서화가 된 긴 리스트의 검색 문서들과 이들이 갖는 낮은 신뢰도에 대해 검색된 문서 중에 자신이 원하는 타당한 문서를 검색하는 불편함이 있어 왔다. 정보 검색에서 문서의 클러스터링은 검색된 결과를 재구성하는 효율적이고 선택적인 방법이다. 이 연구에서는 문서를 트랜잭션 관점에서 해석하여 하나의 클러스터에 대해 유사성을 측정하기 이해 주요항목과 비 주요항목으로 구분하여 각 트랜잭션의 최소 비용 계산을 통해 자동화된 문서 클러스터링 기법을 제안한다. 또한 클러스터링 단계에서 주요 항목간의 연관 규칙을 생성하기 위하여 문서 클러스터링을 위한 디스크 엑세스 동안 키워드간의 연관성을 찾을 수 있는 효율적인 검색 기법을 제시한다.

  • PDF

NEIS시스템 수행평가를 위한 데이터마이닝 기술을 적용한 루브릭 자동제작 프로그램 설계 및 구현 (Design And Implementation Of The Automatic Rubric Generation System For The NEIS Based Performance Assessment Using Data Mining Technology)

  • 권형규;조미헌;이은정
    • 정보교육학회논문지
    • /
    • 제9권1호
    • /
    • pp.113-124
    • /
    • 2005
  • 본 연구는 학습자 특성을 고려한 교사의 수행평가기준 선택 및 개발을 돕기 위한 툴의 설계 및 개발을 목적으로 한다. 본 연구에서는 데이터마이닝의 분류 및 연관규칙 탐사 기법을 적용하여 교사의 선택 경향과 학생의 특성에 따른 수행평가 유형을 분석하였으며, 이를 통하여 기존 루브릭의 활용 및 신규개발에 대한 적용 방안을 제공하였다. 학습자의 환경, 관심 및 능력을 고려한 수행평가기준의 개발 및 활용은 데이터마이닝의 "분류"를 통한 학습자 중심의 루브릭 적용으로 가능하다. 또한 교사의 학습영역별로 축적된 루브릭 선택 성향을 연관규칙을 통해 추출하여 교수자의 루브릭 선택을 지원함으로써 수행평가에 소요되는 노력과 시간을 경감시키는 효과가 있다. 수행평가나 루브릭 간의 연관성과 학생의 특성 및 성취도에 따라 수행평가를 분류하는 본 프로그램은 교육행정 정보시스템(National Education Information System; NEIS)의 수행평가 요소와 연계하여 교수자의 루브릭 선택, 변경 및 생성을 지원한다.

  • PDF

데이터베이스 시스템에서 연관 규칙 탐사 기법을 이용한 비정상 행위 탐지 (Anomaly Intrusion Detection based on Association Rule Mining in a Database System)

  • 박정호;오상현;이원석
    • 정보처리학회논문지C
    • /
    • 제9C권6호
    • /
    • pp.831-840
    • /
    • 2002
  • 컴퓨터와 통신 기술의 발달고 사용자에게 많은 정보가 편리하게 제공되는 반면, 컴퓨터 침입 및 범죄로 인한 피해가 증가하고 있다. 특히, 고객 개인 정보, 기업 기밀과 같은 주요 정보가 저장되어 있는 데이터베이스의 보안을 위해서 데이터베이스 관리 시스템의 기본적인 보안 기능 및 기존의 오용 탐지 모델이 사용되고 있다. 하지만, 다양한 시스템 침입 유형에 대한 분석 격과에 따르면 외부 침입자에 의한 시스템 파괴보다는 내부 사용자에 의한 기밀 정보 유출과 같은 권한 오용 행위에 의한 손실이 더 큰 문제가 되고 있다. 따라서, 효과적으로 데이터베이스 보안을 유지하기 위해서 사용자의 비정상 행위 판정 기술에 대한 연구가 필요하다. 본 논문에서는, 연관 규칙 마이닝 방법을 이용하여 데이터베이스 로그로부터 사용자 정상 행위 프로파일을 생성하는 방법을 제안한다. 이를 위해서 데이터베이스 로그를 의미적인 패턴 트리로 구조화하여 생성된 정상 행위 프로파일을 온라인에서 발생된 해당 사용자의 트랜잭션과 비교하여 온라인 데이터베이스 작업에 대한 비정상 행위 여부를 탐지할 수 있다. 다양한 실험을 통해 제시된 알고리즘의 효용성을 분석하고 결과를 제시하였다