• 제목/요약/키워드: 지식기반 데이터 마이닝

검색결과 128건 처리시간 0.027초

인간 지식을 이용한 경험적 의사결정트리의 설계 (Design of Heuristic Decision Tree (HDT) Using Human Knowledge)

  • 윤태복;이지형
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.525-531
    • /
    • 2009
  • 데이터 마이닝(Data Mining)은 수집된 데이터로 부터 감춰진 패턴을 찾는 작업이다. 여기에서 수집된 데이터는 예측 및 추천을 위한 기반 정보로 중요한 역할을 하며, 분석 결과의 성능을 향상시키기 위해 잘못된(Missing value) 데이터를 선별하는 과정을 필요로 한다. 수집한 데이터에서 의도하지 못한 데이터를 선별하기 위한 기존의 방법은 주로 통계적이거나 단순 거리(Distance)에 기반을 둔 방법을 이용하였다. 하지만 환경 및 데이터의 특성을 고려하지 못하여, 의미 있는 데이터도 함께 분석에서 제외 될 수 있는 문제점을 가지고 있다. 본 논문은 인간의 경험적 지식을 수집된 데이터와 비교하여 가중치로 변환하고, 의사결정트리(Decision Tree)의 생성에 이용한다. 생성된 트리는 인간의 지식이 반영되어 기존의 분석 방법보다 신뢰성이 높다고 할 수 있으며, 실험을 통하여 제안하는 방법의 유효성을 확인하였다.

텍스트 마이닝 기반의 데이터 분석 웹 애플리케이션 (Data Analysis Web Application Based on Text Mining)

  • 길완제;김재웅;박구락;이윤열
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.103-104
    • /
    • 2021
  • 본 논문에서는 텍스트 마이닝 기반의 토픽 모델링 웹 애플리케이션 모델을 제안한다. 웹크롤링 기법을 활용하여 키워드를 입력하면 요약된 논문 정보를 파일로 저장할 수 있고 또한 키워드 빈도 분석과 토픽 모델링 등을 통해 연구 동향을 손쉽게 확인해볼 수 있는 웹 애플리케이션을 설계하고 구현하는 것을 목표로 한다. 제안 모델인 웹 애플리케이션을 통해 프로그래밍 언어와 데이터 분석 기법에 대한 지식이 부족하더라도 논문 수집과 저장, 텍스트 분석을 경험해볼 수 있다. 또한, 이러한 웹 시스템 개발은 기존의 html, css, java script와 같은 언어에 의존하지 않고 파이썬 라이브러리를 활용하였기 때문에 파이썬을 기반으로 데이터 분석과 머신러닝 교육을 수행할 경우 프로젝트 기반 수업 교육 과정으로 채택이 가능할 것으로 기대된다.

  • PDF

공간데이타 마이닝을 위한 효율적인 그리드 셀 기반 공간 클러스터링 알고리즘 (An Efficient Grid Cell Based Spatial Clustering Algorithm for Spatial Data Mining)

  • 문상호;이동규;서영덕
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.567-576
    • /
    • 2003
  • 대용량의 공간데이터베이스로부터 암시적이고 유용한 지식을 자동적으로 추출하는 공간데이터 마이닝은 데이타 양이 급격히 증가하면서 필요성이 더욱 증대되고 있다. 공간데이터 마이닝에서 데이타를 분석하여 유사한 그룹으로 분류하는 공간 클러스터링은 매우 중요한 분야이다. 기존 연구에서 공간 클러스터링을 위한 여러 가지 알고리즘들이 제시되었지만, 다음과 같은 문제점들이 있다. 먼저 클러스터링을 위하여 객체들 간의 거리론 기반으로 하므로 데이타 양이 많아질수록 계산 비용이 커진다. 또한, 메모리 상주 데이타를 대상으로 하므로 대용량의 데이타인 경우에 효율이 떨어진다. 본 논문에서는 공간데이터 마이닝을 위하여 그리드 셀을 기반으로 한 효율적인 공간 클러스터링 방법을 제시한다. 이 클러스터링에서는 기존 공간 클러스터링 기법들의 문제점을 해결하는데 중점을 둔다. 세부적으로 공간 클러스터링의 효율성을 높이기 위하여 클러스터링시에 발생하는 비용(계산량)을 감소시키는 것이다. 이를 위해서 공간지역성을 보장하는 대표적인 공간분할 방법인 그리드 셀을 기반으로 한 공간 클러스터링 기법을 제시한다.

개념계층과 속성감축에 기반한 효율적 데이터마이닝 (Efficient Data mining Based on Concept hierachy and Attribute Reduction)

  • 김정호;정홍
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.39-41
    • /
    • 1999
  • 데이터베이스에서의 지식발견은 데이터베이스로부터 관심있는 지식을 발견하고 고수준의 언어로 지식을 표현하는 학습형태로서 여러 가지 기법들이 있으나, 단 하나의 기법의 적용으로는 각기 한계성 때문에 유용한 지식의 발견이 불충분하므로 이들의 특징을 잘 통합하고 발전시킨 새로운 기법이 필요하다. 본 논문에서는 데이터베이스의 일반화를 위한 개념계층의 상승방법과 불필요 속성의 감축 방법을 통합 적용함으로써 유용하고 간략한 최소 결정규칙을 자동적으로 생성하는 효율적 데이터 마이닝 방법을 제안한다.

  • PDF

육군 정보공유체계에 사회관계망 분석을 적용하기 위한방안: 사례 연구 (Approaches to Applying Social Network Analysis to the Army's Information Sharing System: A Case Study)

  • 박건우
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.597-603
    • /
    • 2023
  • 군사 작전의 패러다임은 정보기술의 발전으로 플랫폼 중심전에서 네트워크 중심전, 그리고 정보 중심전으로 진화해왔다. 최근 몇 년간 빅 데이터, 인공지능, 사물인터넷(IoT)과 같은 첨단 기술의 발전으로 인해 군사 작전은 인공지능 기반의 지식 중심전(KCW)으로 진화하고 있다. 이에 따라 군은 신뢰성 있는 C4I (Command, Control, Communication, Computer, Intelligence) 시스템 구축을 위해 첨단 정보통신기술(ICT)의 통합에 큰 비중을 두고 있다. 본 연구는 C4I 시스템의 전투 능력 향상, 네트워크 기반 환경에서의 최적 활용, 정보 흐름의 효율적인 부하분산, 원활한 의사소통, 지식공유의 효과적인 구현 등을 분석하고 평가하기 위해 데이터 마이닝 기법을 적용할 필요성을 강조한다. 데이터 마이닝은 현대 빅 데이터 분석의 핵심 기술로, 본 연구는 데이터 마이닝을 활용하여 실제 사례를 분석하고 군의 지휘 통제체계의 효율성을 극대화하는 실용적인 전략을 제안하였다. 연구 결과는 C4I 시스템의 성능을 더 깊게 이해하고 현대 군사 작전에 지식 중심전을 강화하는 데 유용한 통찰을 제공할 것으로 기대한다.

데이터 스트림에서 개방 데이터 마이닝 기반의 빈발항목 탐색 (Finding Frequent Itemsets based on Open Data Mining in Data Streams)

  • 장중혁;이원석
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.447-458
    • /
    • 2003
  • 기존의 데이터 마이닝 방법들은 기본적으로 지식 발견의 대상이 되는 데이터 집합이 마이닝 작업 시작 이전에 명확히 정의되는 것으로 가정하며 이러한 가정은 고정적으로 정의된 특정 데이터 집합에 내재된 정보 추출이 데이터 마이닝의 목적이 될 때 유효하다. 또한, 기존의 데이터 마이닝 방법들은 대용량의 데이터 집합에 대한 마이닝 결과를 얻는데 있어서 상당한 처리 시간을 요구한다. 따라서, 새로운 트랜잭션 데이터가 지속적으로 추가되는 데이터 스트림에서 추가된 트랜잭션의 정보들을 포함하는 최신의 마이닝 결과를 최대한 빠른 시간 안에 얻기를 기대하는 실시간 처리 환경에서는 기존의 데이터 마이닝 방법을 적용하는 것이 거의 불가능하다. 이러한 목적에 부합하기 위해서 본 논문에서는 새로운 데이터 마이닝 개념인 개방 데이터 마이닝을 제안한다. 개방 데이터 마이닝에서는 새로운 트랜잭션이 발생함에 따라 이전에 발생한 트랜잭션들에 대한 마이닝 결과가 새롭게 갱신되며 따라서 확장된 전체 트랜잭션 집합에 대한 마이닝 결과를 빠르게 얻을 수 있다. 이러한 방법을 효과적으로 구현하기 위해서는 새롭게 출현한 항목에 대한 지연추가와 이전 데이터 집합에 출현한 항목들 중에서 중요하지 않는 항목에 대한 전지작업이 병행되어야 한다. 논문에서 제안하는 알고리즘은 알고리즘의 특성을 파악하기 위한 일련의 다양한 실험을 통해서 검증된다.

컨텍스트 인식 기반 상품 추천 시스템의 설계 (A Design of Recommendation System based on Context-Awareness)

  • 이송희;이근호;김정범;김태윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.52-54
    • /
    • 2002
  • 추천 시스템은 방문 고객 개개인의 취향이나 구매이력 등을 분석하여 고객이 필요로 하는 상품 또는 컨텐츠 정보의 서비스를 제공한다. 기존의 추천 시스템은 온라인에 초점을 맞추어 설계되었는데 본 논문에서는 무선 인터넷 서비스를 기반으로 무선 단말기(e.g. PDA, Cell Phone 등)를 통해 오프라인에서도 추천정보를 제공하는 시스템을 제안한다. 사용자에게 제공이 되는 추천 정보는 상품이나, 컨텐츠 또는 이벤트 정보이며 제안된 시스템에서는 데이터 마이닝 기법을 통해 데이터를 분류, 측정 및 예측하고 지식 기반방법과 collaborative filtering 방법을 혼합하여 양쪽의 장점만을 취하여 기존의 한정된 상품에 대한 정보와 침상에서만 제공이 되는 서비스를 오프라인까지 통합한 추천 시스템을 제안한다.

  • PDF

마이크로 블로그기반의 공간 지식 추출 기법연구 (A Technique for Extracting GeoSemantic Knowledge from Micro-blog)

  • 하수욱;남광우;류근호
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.129-136
    • /
    • 2012
  • 최근 ISO/TC211, OGC, INSPIRE 등 국제기구들을 중심으로 시맨틱 기술을 활용한 공간정보의 공유 노력이 진행되고 있다. 또한 스마트폰의 대중화와 소셜 네트워킹 서비스의 활성화로 인해 온라인 소셜 커뮤니티에서 이슈를 추출하기 위한 연구들이 이루어지고 있다. 그러나 응용 수준에서 가용한 공간정보 온톨로지는 부족한 실정이며, 소셜 네트워크 서비스에서의 공간정보 추출 역시 텍스트 마이닝을 통한 지오코딩 부분에 집중되어 있다. 따라서 소셜 미디어 정보에서 공간 현상을 추출하여 시맨틱 공간 지식으로 변환하기 위한 방법은 매우 유용하게 활용될 수 있다. 또한 공간 현상을 단순한 빈발 키워드가 아닌 연관 이슈의 형태로 사용자에게 제공함으로써 공간상에 발생하는 이슈에 대한 이해도를 향상 시킬 수 있을 것이다. 따라서 본 논문에서는 소셜 미디어 서비스의 하나인 마이크로 블로그를 기반으로 데이터를 수집하여 데이터 마이닝 기술을 접목하여 연관 이슈를 추출하고, 이를 시공간 지식으로 변환하기 위한 공간 이슈 온톨로지 모델을 제안하였다. 이를 통해 향후 관련 시스템의 개발을 위한 참조모델 및 공간 온톨로지 구축을 위한 모델로써 유용하게 사용될 수 있을 것으로 기대된다.

다중 에이전트 기반 지식 탐사 및 문제 해결 프레임워크 (Multi-Agent Knowledge Discovery and Problem Solving Framework)

  • 강성희;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.101-103
    • /
    • 1999
  • Decentralized 정보는 여러 도메인에 대한 heterogeneous한 독립적인 정보가 자율적으로 존재하며 이들 정보간의 관계성의 고려한 전체에 대한 global view가 존재하지 않기 때문에 inter-domain에 대한 마이닝을 수행하는데 어려움이 있다. 본 연구에서는 intra-domain knowledge discovery, intra 및 inter-domain problem solving method라는 접근방법으로, decentralized 데이터 환경에서 문제 해결에 필요한 정보 추출을 위한 데이터 tailoring과 분산 데이터에 대한 목표-지향 데이터마이닝(goal-oriented data-mining)을 통해 문제 해결을 위해 필요한 지식을 생성하고 이들 간의 관련 정보를 탐색하여 문제를 해결하는 프레임워크를 제안한다. 특히, 생성된 지식간의 협동 문제 처리를 멀티 에이전트 패러다임을 이용하기로 한다. 제안 프레임워크는 산재되어 있는 데이터들로부터 문제 해결에 유용한 지식 차원의 정보를 추출해내고 생성된 지식을 바탕으로 각 도메인 정보에 대한 개별적인 사용뿐 만 아니라 서로 cooperation을 통한 문제 해결을 지원함으로써, 개방된 분산 환경하에 decentralized 되어 있는 여러 도메인 정보를 보다 효율적으로 활용할 수 있는 새로운 형태의 문제 해결 방법이라고 할 수 있다.

  • PDF

u-SilverCare에서의 USN 미들웨어 기반 센서 데이터 마이닝 (USN middleware based Sensor Datamining in u-SilverCare Service)

  • 허병문;이준욱;채덕진;정재두;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.429-432
    • /
    • 2006
  • 기존의 u-HealthCare 서비스는 환자에 대해서 일정한 공간에서의 센서의 on/off 타입에 대한 모니터링/환자관리의 서비스를 제공하였다. 이러한 환경하에서의 주된 서비스는 현재 환자의 상태에 대한 수동적인 형태이다. 이러한 문제점들을 해결하기 위해 센서 데이터에 대한 연속센서 데이터마이닝 기법을 이용한다. USN의 응용서비스인 u-HealthCare 서비스는 센서데이터로부터 생체정보 및 위치정보를 이용하여 환자/보호자/관련 의료진에게 필요한 정보를 제공한다. 이것은 환자에 대한 관리/모니터링뿐만 아니라 환자의 상태에 따른 센싱(sensing)된 데이터를 이용한 패턴(pattern), 예측-(prediction), 이상치(outlier)를 분석함으로써 보다 나은 서비스를 제공할 수 있다. 본 논문에서는 센서 데이터에 대해 새로운 연속 센서데이터 마이닝 기법을 적용하여 질의를 통해 지식을 추출하고 보다 지능화된 서비스를 제공할 수 있는 응용서비스 기법을 제안한다.

  • PDF