• 제목/요약/키워드: 지식기반 데이터 마이닝

검색결과 128건 처리시간 0.026초

DEA 와 SVM 을 통합한 IT 벤처기업의 효율성 평가

  • 홍태호;박지영
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.800-806
    • /
    • 2007
  • IT 벤처기업은 자본 대비 높은 수익성을 가지므로 지식기반 산업환경에서 많은 투자자들의 집중적인 관심을 받고 있다. 이러한 IT 벤처기업의 효율성을 평가하기 위한 방안으로, DEA 와 데이터마이닝 기법을 통합하는 방안을 제시하였다. 국내 코스닥 상장 기업 가운데 IT 에 주력하고 있는 벤처기업들을 대상으로 본 연구에서 제시한 효율성 평가방법을 적용 하였다. 대표적인 비모수적 분석기법인 Data Envelopment Analysis(DEA)를 이용하여 연구대상 기업들을 효율기업 및 비효율기업으로 구분한 후, DEA 의 효율성을 설명하는 모형을 logit 을 이용하여 구축하였다. DEA 는 기업의 상대적인 효율성을 측정하는 데에서 우수하지만, 효율성 정도를 설명하는 모형의 구축에는 한계가 있다. 이를 보완한 DEA 의 결과를 logit 과 통합한 효율성 모형에 대해서 데이터 마이닝 기법인 logit, 판별분석, Support Vector Machine(SVM) 등을 적용하여 IT 벤처기업의 효율성을 사전에 예측하여 평가 및 투자에 활용할 수 있는 방안을 제시하였다.

  • PDF

데이터마이닝을 이용한 축류팬 성능예측 시스템 (Performance Prediction System For Axial Fan using Data Mining)

  • 김명일;이승민;김연호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.1047-1050
    • /
    • 2010
  • 축류팬(axial fan)은 냉장고, 에어컨 등 가전제품 뿐 아니라, 자동차, 중장비 등에 가장 널리 사용되는 팬의 형태로 제품의 성능과 소음에 많은 영향을 미치는 요소이다. 그러나 설계, 목업(mock-up)개발, 풍동실험 등의 시간과 비용적인 면에서 비효율적인 방법을 통해 개발이 이루어지고 있다. 따라서 범용으로 사용가능한 팬 설계 프로그램과 설계 인자의 입력만으로도 성능을 예측하여 개발에 소요되는 시간과 비용을 줄일 수 있는 시스템의 개발이 필요하다. 본 연구에서는 슈퍼컴퓨터를 활용하여 축류팬 형상변수의 변화에 대한 성능과 소음을 미리 해석한 후 그 결과를 지식형 데이터베이스로 저장하고, 팬 자동설계 시스템과 결합한다. 즉, 축류팬 설계 변수를 입력하면 팬의 형상을 CAD 파일로 자동 생성할 뿐 아니라, 지식형 데이터베이스을 기반으로 하는 데이터 마이닝 기법을 이용하여 해당 모델의 성능과 소음을 예측한다.

데이터 스트림 시스템에서 이상 이벤트에 대한 연관 규칙 마이닝 (Mining Association Rule for the Abnormal Event in Data Stream Systems)

  • 김대인;박준;황부현
    • 정보처리학회논문지D
    • /
    • 제14D권5호
    • /
    • pp.483-490
    • /
    • 2007
  • 최근에 데이터 스트림을 분석하여 잠재되어 있는 지식을 발견하기 위한 마이닝 방법에 대한 연구가 진행되고 있다. 그러나 대부분의 지지도 기반의 마이닝 방법들은 일정 주기 동안에 미리 정의된 지지도 이상의 발생 빈도를 갖는 이벤트만을 고려함으로써 발생 빈도에 비하여 중요도가 높은 이벤트를 간과하는 문제점을 가지고 있다. 본 논문에서는 이상 이벤트에 대한 연관 규칙을 탐사할 수 있는 SM-AF 방법을 제안한다. SM-AF 방법은 이상 이벤트가 감지된 윈도우만 고려하여 연관 정보를 탐사함으로써 자주 발생하지 않더라도 중요도가 높은 이벤트에 대한 연관 정보를 탐사할 수 있다. 또한 SM-AF 방법은 이상 이벤트에 대한 의미 있는 희소 항목 집합과 주기적인 이벤트 집합도 탐사한다. 그리고 다양한 실험을 통하여 SM-AF 방법이 기존의 연관 규칙 방법들에 비하여 우수함을 확인하였다.

MATLAB 기반 다중마커 데이터 분석시스템 개발 (Development of MATLAB-Based Multi-Marker Data Analysis System)

  • 김승일;최광원;조상연;김종대;김유섭;박찬영;송혜정;신규성;경민선;김영목;박형기;이은영;이명선;김종원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.180-183
    • /
    • 2011
  • 본 논문에서는 진단 검사 의학 분야에서 통계적 지식이나 도구사용능력이 부족한 임상의학자들을 위해 개발된 통계적 데이터 분석 시스템을 소개한다. 개발된 시스템은 질병진단에 필요한 다중 바이오마커 데이터를 Luminex장비를 통하여 측정한 후, 분석이 용이한 형태로 변환하는 시각화 기술과 데이터에 내재된 패턴을 찾아내어 유용한 지식을 생성하는 데이터 마이닝 기술을 포함한다. 주요 모듈로는 마커선택, 데이터 시각화, 마커 평가 모듈로 구성되며 MATLAB을 기반으로 개발되었다.

데이터 스트림 환경에서 효율적인 빈발 항목 집합 탐사 기법 (A Method for Frequent Itemsets Mining from Data Stream)

  • 서복일;김재인;황부현
    • 정보처리학회논문지D
    • /
    • 제19D권2호
    • /
    • pp.139-146
    • /
    • 2012
  • 데이터 마이닝은 다양한 분야에서 축적된 데이터로부터 필요한 지식을 탐사하기 위하여 널리 이용되고 있다. 연관규칙을 탐사하기 위하여 이벤트의 빈발 횟수에 기반을 둔 많은 방법들이 존재하지만, 이들은 이벤트가 연속적으로 발생하는 스트림 환경에는 적합하지 않다. 또한 실시간으로 연관규칙을 탐사해야 하는 스트림 환경에 적용하기에는 많은 비용이 든다. 이 논문에서는 스트림 환경에서 연관규칙을 탐사하기 위한 새로운 방법을 제안한다. 제안하는 방법은 데이터 스트림에서 목적 이벤트의 발생 간격에 따른 가변 윈도우로부터 이벤트의 존재 유무에 근거한 COBJ(Count object) 계산법을 이용하여 데이터 항목을 추출한다. 추출된 데이터는 FPMDSTN(Frequent Pattern Mining over Data Stream using Terminal Node) 알고리즘을 통해 실시간으로 연관규칙을 탐사한다. 실험 결과를 통해 제안하는 방법이 기존의 방법에 비해 스트림 환경에 효율적임을 보인다.

인터넷을 이용한 육상물류중개시스템 개발에 관한 연구

  • 박남규;최형림;송근곤;박영재;손형수
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.335-345
    • /
    • 1999
  • 오늘날 날로 증가하는 물류비는 개별 기업은 물론 국가 전체의 수출 경쟁력을 약화시키는 주요 원인으로 지적되고 있다. 그러나 그동안 우리나라에서는 물류비 절감을 위한 종합적이고 체계적인 대책이 이루어지지 못하였다. 특히 본 논문의 연구대상인 육상물류의 경우 그 비중이 전체 화물 운송의 60% 이상을 차지함에도 불구하고 심각한 교통체증 및 물류기반 시설의 미비 등으로 인하여 물류비가 계속 증가하는 양상을 보여 왔다. 따라서 본 논문에서는 우리나라 육상물류시스템이 안고 있는 문제점의 해결을 위한 방안들 중의 하나로 정보기술의 활용에 관한 내용을 다루고 있다. 즉 영세한 기업들도 누구나 손쉽게 이용할 수 있도록 인터넷을 이용한 육상물류중개시스템의 개발에 관한 내용을 소개하고 있다. 육상물류중개시스템은 복합화물주선업체인 (주) 대형물류와 함께 개발한 시스템으로 인터넷을 통하여 화주의 화물 운송의뢰를 접수받아 이를 여러 운송업체에게 제공해 주는 역할을 수행하게 된다. 특히 육상물류중개시스템은 화물의 운송과 관련하여 발생하는 다양한 정보들을 데이터베이스에 저장하여 두었다가 세관을 비롯한 터미널에 대한 각종 신고업무에 이용할 수 있으며, 이밖에도 교통정보 및 화물 위치정보 등 다양한 서비스를 제공해 줄 수 있다. 따라서 운송업체의 공차율을 줄이고 화주에게는 자신의 화물에 대한 정보를 실 시간으로 전달해 줄 수 있다는 장점이 있다. 또한 이러한 육상물류중개시스템은 현재 개발중인 통합데이터베이스를 기반으로한 항만물류원스톱서비스 시스템과 연계되어 차후에는 물류원스톱시스템으로 발전할 수 있을 것이다.용되어져 왔다. 그러나 MCRDR 이론이 적용된 전문가시스템들의 경우 MCRDR이론을 기본으로한 개발 툴로서 개발된 시스템들이 아니고 해당분야에서 MCRDR이론을 적용한 엔진을 직접 설계 구현하여 온 것이 사실이다. KEE(Knowledge Engineer for Experts) 시스템은 최근 개발된 MCRDR기반 전문가시스템 개발 툴로서 본 논문에서는 이러한 분야별 전문가시스템 개발을 지양하고 MCRDR 이론을 기반으로 한 범용성 있는 전문가시스템 개발 툴의 개발에 관한 연구를 소개한다.-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이터 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 도메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이터 마이닝 접근을 제시하였다는데 있다.osed algorithm are faster and lower than the existing LMS according to increasing the step-size parameter $\mu$ in the experimentally computed. learning curve. Also we find that convergence speed of proposed algorithm is increased by (B+1) time proportional to B which

  • PDF

Generalized $\alpha$ chain rule에 기반한 Group Item Recommendation (Group Item Recommendation based on Generalized a Chain Rule)

  • 염선희;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.241-243
    • /
    • 2001
  • 데이터 마이닝을 통해 우리는 숨겨진 지식, 예상되지 않았던 경향 그리고 새로운 법칙들을 방대한 데이터에서 이끌어내고자 한다. 본 논문에서 우리는 사용자들의 구매 트랜잭션을 시간에 따라 분석하여 동시에 구매되는 상품을 미리 예측하는 알고리즘을 제안하고자 한다. 기존의 방법들에서는 구매된 상품간의 시간차를 고려하지 않은 방법만을 제안해 왔다. 따라서 서로 연관되지 않은 상품군이 예측될 확률이 높았다. 본 논문에서 제안하고 있는 $\alpha$ chain rube에서는 일정 시간동안의 사용자들이 상품을 구매한 후 다음 상품을 구매할 때까지의 시간을 고려한다. 따라서 좀더 정확히 동시에 구매될 상품군을 예측할 수 있다. 본 논문은 제안하고 있는 $\alpha$ chain rule을 계산해 내는 알고리즘에 대해 주로 논의하겠다.

  • PDF

이동 객체 데이터베이스에서 빈발 시퀀스 패턴 탐색 (Discovery of Frequent Sequence Pattern in Moving Object Databases)

  • ;이범주;류근호
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.179-186
    • /
    • 2008
  • 위치 기반 장치의 발전과, GIS 기능의 확장 그리고 위치 정보기술들의 정확성과 가용성이 증가함에 따라서 위치 기반 서비스들의 새로운 영역에 대한 새로운 가능성이 나타나게 되었다. 데이터의 시간과 공간 형태에 따라서 정의되는 Relationship에 기인하여 시공간 데이터 마이닝 영역에서 공간에 대한 지식 검색이 증가할 경우 매우 큰 문제에 직면한다. 이 논문에서는 모바일 환경에서 시공간 패턴 마이닝을 위한 알고리즘들을 제안한다. 이동 패턴들은 All_MOP와 Max_MOP 두 개의 알고리즘을 활용하여 생성된다. 이 알고리즘들은 먼저 모든 빈발 패턴들을 탐사한 후 오직 최대의 빈발 패턴만을 탐사한다. 아울러, 제안한 기법과 기존의 DFS_MINE 기법의 수행 시간 비교를 통하여 제안한 기법이 수행시간에서 다소 우수한 것을 나타낸다. 이러한 제안접근법은 관광 서비스, 교통 서비스 등과 같은 위치 기반 서비스 등에 활용할 수 있다.

구간데이터분석을 위한 형식개념분석기반의 분류 (A FCA-based Classification Approach for Analysis of Interval Data)

  • 황석형;김응희
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.19-30
    • /
    • 2012
  • 다양한 정보기기와 소셜네트워크시스템, 그리고, 클라우드컴퓨팅환경 등과 같은 인터넷기반의 인프라를 토대로 분산화되고 공유가능한 데이터가 폭발적으로 증가하고 있다. 최근에는 데이터에 내재되어 있는 유용한 정보와 지식을 추출하고 분석 및 분류하기 위한 데이터분석 및 마이닝기법으로서, 이진데이터 또는 다치데이터에 관한 형식개념분석기법에 관한 연구가 활발하게 진행되어 다양한 분야에서 성공적으로 활용되고 있다. 그러나, 각 속성들이 구간값을 갖는 형태로 이루어진 구간데이터의 분석에 대한 형식개념분석에 관한 연구는 많이 수행되지 못하였다. 본 논문에서는, 구간데이터를 분석하기 위하여 형식개념분석기법을 기반으로 하는 새로운 분류기법을 제안한다. 또한, 구간데이터의 이진화, 개념추출 및 개념계층구조 구축 등, 본 논문에서 제안한 새로운 분류기법을 지원하기 위한 도구(iFCA)의 구축에 관하여 소개하고, 마지막으로, 몇가지 실세계의 데이터를 대상으로 한 실험결과를 토대로, 본 논문에서 제안하는 분류기법의 유용성에 대해서 설명한다.

최적 경로 서비스 지원을 위한 이동 객체의 이동 패턴 탐사 알고리즘 (Moving Pattern Mining Algorithm of Moving Object for Support of Optimal Path Service)

  • 고현;김광종;이연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.413-416
    • /
    • 2006
  • 최근 위치 측위 기술의 발달 및 GPS 기술의 상용화로 인해 무선 통신 기기의 보급이 증가하면서 다양한 위치 기반 서비스 개발을 위한 노력이 활발히 진행되고 있다. 사용자들의 특성에 맞게 개인화되고 세분화된 위치 기반 서비스를 제공하기 위해서는 방대한 이동 객체의 위치 이동 데이터로부터 의미있는 지식인 유용한 패턴을 추출하기 위한 시간 패턴 탐사가 필요하다. 기존의 시간 패턴 탐사 기법들 중 일부는 이동 객체의 시간에 따른 공간 속성들의 변화를 충분히 고려하지 못하거나 또는 시공간 속성을 동시에 고려한 패턴 탐사는 가능하나 전체 이동 패턴들 중 추출하고자 하는 패턴에 반드시 포함되어야 하는 공간 정보에 대한 제약이 없어 특정 지점들 사이의 최적 이동 경로 탐색 문제나 단위기간 동안 이동 객체가 순회해야 지점들에 대한 스케줄링 경로 예측 문제 등에 적용하기 어렵다. 따라서 본 논문에서는 이동 객체의 위치 이력 데이터들에 대한 시공간 속성들을 고려하여 다양한 이동 패턴들 중 객체의 최적 이동 경로에 해당하는 패턴을 탐색하기 위한 새로운 시간 패턴 마이닝 알고리즘을 제안한다. 제안된 알고리즘은 특정한 지점들 사이를 이동한 객체의 위치 데이터들 중 객체가 가장 빈번하게 이동한 경로를 탐색하여 최적 경로를 결정하는 알고리즘으로, 공간 추상 계층의 각 계층별 영역 내 포함여부를 고려한 위치 일반화를 수행하여 보다 효과적으로 이동 패턴을 탐색할 수 있다.

  • PDF