• Title/Summary/Keyword: 지식기반 데이터 마이닝

검색결과 129건 처리시간 0.027초

규칙베이스 기반의 일반화를 확장한 공간 데이터 마이닝 시스템 (A Spatial Data Mining System Extending Generalization based on Rulebase)

  • 최성민;김응모
    • 한국정보처리학회논문지
    • /
    • 제5권11호
    • /
    • pp.2786-2796
    • /
    • 1998
  • 대용량의 공간(spatial) 데이터베이스에서 사용자에게 관심있고 일반화된 지식을 추출하는 것은 지형 정보 시스템이나 지식 베이스 시스템의 개발에 중요한 기법중의 하나이다. 본 논문은 공간 데이터 마이닝에 널리 사용되는 일반화(generalization) 방법을 확장한 공간 데이터 마이닝 모듈에 공간 데이터를 추론할 수 있도록 구축된 규칙베이스(rulebase)를 통합한 공간데이터 마이닝 시스템을 제안한다. 이를 위한 전위기로서 공간 데이터 우선(spatial data dominated)과 비공간 데이터 우선(nonspatial data dominated) 마이닝을 병합한 방식과 다중 주제도(multiple thematic map)가 주어졌을 때의 공간 지식을 추출해 낼 수 있는 방식을 제안한다. 또한 후위기로서 공간 객체들간의 위상 관계(topological relationship)를 추론하기 위한 공간 규칙 베이스를 구축한다.

  • PDF

이진 표현을 이용한 효율적인 연관 규칙 탐사 알고리즘 (An Efficient Algorithm for Mining Association Rules using a Binary Representation)

  • 김원영;최원길;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.375-378
    • /
    • 2008
  • 오늘날 지식을 기반으로 하는 고도의 정보사회로 나아가는 시점에서 우리는 대량의 데이터 속에서 필요한 지식을 찾아내는 것에 초점을 모으게 되었다. 따라서 대량의 데이터 속에서 필요한 지식을 자동으로 찾아내는 데이터 마이닝에 대한 연구가 활발히 진행되고 있다. 데이터 마이닝은 대용량의 데이터를 대상으로 하기 때문에 정확도뿐만이 아니라 소요시간도 중요하기 때문에 성능 향상을 위한 알고리즘들이 많이 개발되었다. 데이터 마이닝의 성능을 향상시키기 위해서 가장 좋은 방법이 데이터베이스의 스캔의 횟수를 줄이는 것이다. 본 논문에서는 연관 규칙 탐사에서 빈발 항목 집합을 찾아내는 부분을 이진 표현을 이용하여 좀 더 성능을 향상시킬 수 있는 알고리즘을 제안한다.

데이터집합 특성에 기반한 데이터 마이닝 전처리 대수 연산자 (Dataset Property - based Algebraic Operators for Data Mining Preprocessing)

  • 김효숙;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1709-1712
    • /
    • 2002
  • 지식 탐사 연구의 핵심이 되어온 데이터 마이닝은 축적 데이터로부터 쉽게 추출되지 않는 데이터 상호관계나 일정 패턴과 같은 유용한 내재 정보 추출을 주된 목적으로 수행된다. 그러나, 데이터 마이닝은 대용량의 데이터 처리로 인해 빈번한 메모리 공간 제약과 처리 속도 저하 등의 한계성을 드러낸다. 이를 극복하기 위해 많은 마이닝 알고리즘 개발과 기존 알고리즘 개선 방법이 제시되어 왔으나 여전히 궁극적인 해결방안은 대두되지 않고 있다. 따라서, 만약 데이터 전처리 과정을 통해 마이닝 목적에 적합한 부분 데이터집합 추출 및 가공이 선행된다면 보다 효율적인 데이터 마이닝 작업을 유도할 수 있을 것이다. 본 논문은 효과적 데이터 전처리를 위한 필수 기본 연산 기능들을 주어진 데이터집합의 트랜잭션 및 데이터 특성에 기초하여 관계형 대수 형태로 의미를 정립하고, 적용 사례에 의한 상세 설명 및 실제 구현된 온라인 데이터 전처리 시스템을 제안한다.

  • PDF

데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF

멀티미디어 데이터의 다차원 연관규칙 마이닝 (Multi-Dimensional Association Rule Mining in Multimedia Data)

  • 김진옥;황대준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.233-236
    • /
    • 2001
  • 멀티미디어 데이터의 증가와 마이닝 기술의 발전으로 인해 멀티미디어 마이닝에 대한 관심이 증가하고 있다. 본 논문에서는 특성국지화를 이용한 내용기반의 정보검색 기술과 다차원 데이터큐브 구축기술을 통해 멀티미디어 데이터에서 연관규칙을 찾아내는 멀티미디어 데이터마이닝 시스템 프로토타입을 제안한다. 특히 멀티미디어 데이터의 칼라, 질감 등 거시적인 이미지 성분 대신 이미지의 영역성과 유사성을 이용한 특성국지화방법을 이용하여 이미지를 분할함으로써 방대한 데이타에서 효과적인 내용기반의 정의 검색을 시행하고 검색한 벡터를 메타데이타로 한 데이스베이스를 구축한다. 그리고 데이터베이스에서 데이터간 연관규칙을 찾아내어 지식을 마이닝하는데 효과적인 다차원 데이터큐브를 구축하고 여기에 연관규칙 검색 알고리즘을 적용한다.

  • PDF

데이터 마이닝에서의 상식 기반 후처리 기법 (Common-Sense Knowledge based Post-Processing Technique in Data Mining)

  • 이인기;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.25-28
    • /
    • 2011
  • 새로운 지식과 패턴을 발견하고자 하는 데이터 마이닝 알고리즘들은 큰 수의 규칙들을 생성하는 문제점을 가지고 있다. 최근 들어 이러한 문제를 해결하기 위한 방법으로 다양한 유용성(Interestingness) 연구들이 데이터 마이닝의 후처리 단계에서 진행되고 있다. 그러나 이러한 접근방법들 역시 지식을 습득하기 위한 과정에서 병목현상을 보여줌으로써 수많은 상식수준의 규칙을 정제하지 못하고 있다. 본 연구에서는 이러한 문제점을 해결하기 위한 방안으로 상식을 기반으로 하는 Common-Sense 척도를 정의하고 구현한다. 규칙이 얼마나 상식에 가까운지를 시맨틱 차원교체 기법을 이용한 유사도 분석을 통해 측정한다.

빅 데이터기반 마이닝 마인즈 헬스케어 프레임워크

  • ;;;허태호;방재훈;강동욱;;;;이승룡
    • 정보와 통신
    • /
    • 제32권11호
    • /
    • pp.12-20
    • /
    • 2015
  • 최근 의학 기술이 눈부시게 발전함에 따라 사람들은 수명이 연장되고 삶의 질 향상에 많은 관심을 가지게 되었다. 더욱이 혁신적인 디지털 기술 발전과 함께 다양한 웨어러블 기기와 수많은 헬스케어 어플리케이션이 출시되고 있으며, 이들은 어떻게 하면 개인의 성향이나 체질에 잘 맞는 맞춤형 (개인화) 서비스를 제공할 수 있을 것인가에 관심을 두고 진화하고 있다. 따라서 IoT 환경의 일상생활에서 입력되는 센서 데이터의 수집, 처리, 가공 기술, 일상 행위 및 라이프 스타일 인지, 지식 획득 및 관리 기술, 개인화 추천서비스 제공, 프라이버시 및 보안을 통합적으로 지원할 수 있는 프레임워크 개발에 대한 요구가 증대되고 있다. 이에 본 고에서는 저자가 개발중인 개인 맞춤 건강 및 웰니스 서비스를 제공하는 마이닝 마인즈 프레임워크를 소개한다. 마이닝 마인즈는 현존하는 최신 기술의 집약체로 개인화, 큐레이션, 빅 데이터 처리, 클라우드 컴퓨팅의 활용, 다양한 센서 정보의 수집과 분석, 진화형 지식의 생성과 관리, UI/UX를 통한 습관화 유도 등 다양한 요소를 포함한다. 그리고 건강 및 웰니스 프레임워크 요구사항 분석을 통해 마이닝 마인즈가 이러한 요구를 충족시킬 수 있으며, 개발된 프로토타입을 통해 개인화 서비스의 발전 가능성을 입증하고 향후 나아가야 할 방향을 제시한다.

온톨로지 기반에서 연관 마이닝 방법을 이용한 지식 추론 알고리즘 연구 (A Study of a Knowledge Inference Algorithm using an Association Mining Method based on Ontologies)

  • 황현숙;이준연
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1566-1574
    • /
    • 2008
  • 정보 검색에 대한 연구는 방대한 데이터에서 원하는 검색 정보를 제공할 뿐 만 아니라 개인의 취향에 따른 맞춤 검색 및 추론된 지식을 제공하는 데 초점을 두고 있다. 본 논문의 목적은 데이터를 개념화하여 분류 및 정의할 수 있는 온톨로지 구조를 기반으로 숨어있는 지식을 발견하여 개인 맞춤 검색을 제공하는 추론 알고리즘에 대해 연구하는 것이다. 현재의 검색에서는 방대한 데이터에서 너무 많은 검색 결과를 제공 하거나 검색 결과를 제공하지 못하는 경우도 발생하고 여다. 이러한 정보 검색의 단점을 보완하기 위해 OWL 온톨로지 제약조건과 연관 마이닝 방법으로 추론된 연관 지식을 SWRL 추론 언어로 표현하여 Jess 엔진을 통한 새로운 지식을 발견하여 효율적인 검색을 지원하는 알고리즘을 제안한다. 식당, 주유소, 제과점 등의 도메인에 따른 개인별 선호 온톨로지를 구축하고, 주유소 개인 선호 데이터를 예제로 하여 연관 및 온톨리지 기반에서 정보를 검색할 때, 연관 및 추론 정보를 제공함을 보여준다.

  • PDF

헬스 빅데이터 플랫폼에서 이기종 라이프로그 마이닝 모델 (Heterogeneous Lifelog Mining Model in Health Big-data Platform)

  • 강지수;정경용
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.75-80
    • /
    • 2018
  • 본 논문에서는 헬스 빅데이터 플랫폼에서 이기종 라이프로그 마이닝 모델을 제안한다. 이는 사용자의 라이프 로그를 실시간으로 수집하고 헬스케어 서비스를 제공하기 위한 온톨로지 기반의 마이닝 모델이다. 제안하는 방법은 이기종 라이프 로그 데이터를 분산처리하고, 클라우드 컴퓨팅 환경에서 실시간으로 처리한다. 이를 이기종 온톨로지를 기반으로 구성한 환경에 적합하도록 상위 온톨로지 방식으로 지식베이스를 재구성한다. 재구성한 지식베이스는 Jena 4.0 추론엔진을 이용해 추론 규칙들을 생성하고, 규칙 기반 추론 방법으로 실시간 헬스 서비스를 제공한다. 라이프로그 마이닝을 숨겨진 관계에 대한 분석과 시계열적 생체신호에 대한 예측모델을 구성한다. 이는 관계나 추론규칙에서 포함되지 않은 음의 상관관계나 양의 상관관계를 탐색하여 사용자의 생체신호에 대한 변화를 감지하고 예방 의료 서비스를 현실화하는 실시간 헬스케어 서비스가 가능하다. 성능 평가는 제안한 이기종 라이프로그 마이닝 모델 방법이 정확도에서 0.734, 재현율에서 0.752로 다른 모델에 비해 우수하게 나타난다.