• Title/Summary/Keyword: 데이터 선별

Search Result 570, Processing Time 0.024 seconds

A Study of Data Mining Techniques for CEP (CEP를 위한 데이터 마이닝 기법 연구)

  • Kang, Donghyun;Hwang, Buhyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1116-1117
    • /
    • 2012
  • 최근에 이슈가 되고 있는 빅 데이터 처리 방법중의 하나로 CEP가 있다. 그러나 CEP는 사전에 정의된 질의에 해당되는 이벤트만을 선별하여 패턴 매칭 등의 기능을 수행하므로, 새로이 발견되는 이벤트를 찾는데 제약이 있다. 또한 실시간으로 생산되는 빅 데이터에 기초한 다양한 패턴 탐사에 한계를 노출하고 있다. 이 논문에서는, CEP 환경에서 빅 데이터 사이에 존재하는 다양한 이벤트와 패턴 탐사를 위한 실시간 데이터 마이닝 기법을 제안한다. 제안 방법은 CEP 엔진을 위한 고급의 패턴 매칭을 개발하고, CEP를 위한 실시간 데이터 마이닝 기법을 개발한다. 마지막으로, 기존의 CQL을 확장하여 개발한다. 이라한 방법을 통하여 기존의 CEP의 기능적인 한계를 극복할 수 있다.

Designing a Platform Model for Building MyData Ecosystem (마이데이터 생태계 구축을 위한 플랫폼 모델 설계)

  • Kang, Nam-Gyu;Choi, Hee-Seok;Lee, Hye-Jin;Han, Sang-Jun;Lee, Seok-Hyoung
    • Journal of Internet Computing and Services
    • /
    • v.22 no.2
    • /
    • pp.123-131
    • /
    • 2021
  • The Fourth Industrial Revolution was triggered by data-driven digital technologies such as AI and big data. There is a rapid movement to expand the scope of data utilization to the privacy area, which was considered only a protected area. Through the revision of the Data 3 Act, laws and systems were established that allow personal information to be freely transferred and utilized under their consent. But, it will be necessary to support the platform that encompasses the entire process from collecting personal information to managing and utilizing it. In this paper, we propose a platform model that can be applied to building mydata ecosystem using personal information. It describes the six essential functional requirements for building MyData platforms and the procedures and methods for implementing them. The six proposed essential features describe consent, sharing/downloading/ receipt of data, data collection and utilization, user authentication, API gateway, and platform services. We also illustrate the case of applying the MyData platform model to real-world, underprivileged mobility support services.

Web 로그분석과 e-CRM

  • 이성백
    • Proceedings of the CALSEC Conference
    • /
    • 2001.02a
    • /
    • pp.129-147
    • /
    • 2001
  • eCRM은 온라인 상에서 수집한 고객 데이터를 저장 및 분석하여 가치 있는 고객을 선별하고 회사의 역량을 가치 있는 고객을 획득, 유지하는 일에 투자하는 프로세스를 말합니다. 기존의 CRM과 목적은 같으나 채널이 오프라인에서 온라인으로 진화하였다는 점이 다릅니다. 채널이 온라인으로 진화하였다는 점이 의미하는 바는 무엇일까요?(중략)

  • PDF

A Short-Term Vehicle Speed Prediction using Bayesian Network Based Selective Data Learning (선별적 데이터 학습 기반의 베이지안 네트워크를 이용한 단기차량속도 예측)

  • Park, Seong-ho;Yu, Young-jung;Moon, Sang-ho;Kim, Young-ho
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.19 no.12
    • /
    • pp.2779-2784
    • /
    • 2015
  • The prediction of the accurate traffic information can provide an optimal route from the place of departure to a destination, therefore, this makes it possible to obtain a saving of time and money. To predict traffic information, we use a Bayesian network method based on probability model in this paper. Existing researches predicting the traffic information based on a Bayesian network generally used to study the data for all time. In this paper, however, only data corresponding to same time and day of the week to predict selectively will be used for learning. In fact, the experiment was carried out for 14 links zone in Seoul, also, the accuracy of the prediction results of the two different methods should be tested with MAPE (Mean Absolute Percentage Error) which is commonly used. In view of MAPE, experimental results show that the proposed method may calculate traffic prediction value with a higher accuracy than the method used to learn the data for all time zones.

Linking Bibliographic Data and Public Library Service Data Using Bibliographic Framework (서지프레임워크를 활용한 공공도서관 서지데이터와 서비스 데이터의 연계)

  • Park, Zi-young
    • Journal of the Korean Society for information Management
    • /
    • v.33 no.1
    • /
    • pp.293-316
    • /
    • 2016
  • This study aims to improve bibliographic data of public libraries by linking service data, which are produced out of library service programs. Service data collected from the seven award-winning public libraries were selected and analyzed. A Bibliographic Framework is used for linking bibliographic data and service data. Interfaces are also suggested for the two-way data linking. The results can be used to obtain 1) selective and value-added bibliographic data, 2) bibliographic data updated continuously throughout the lifecycle, 3) structured service data for preservation and sharing, and 4) bibliographic data linked to the additional external linked data.

Linguistic Features Discrimination for Social Issue Risk Classification (사회적 이슈 리스크 유형 분류를 위한 어휘 자질 선별)

  • Oh, Hyo-Jung;Yun, Bo-Hyun;Kim, Chan-Young
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.11
    • /
    • pp.541-548
    • /
    • 2016
  • The use of social media is already essential as a source of information for listening user's various opinions and monitoring. We define social 'risks' that issues effect negative influences for public opinion in social media. This paper aims to discriminate various linguistic features and reveal their effects for building an automatic classification model of social risks. Expecially we adopt a word embedding technique for representation of linguistic clues in risk sentences. As a preliminary experiment to analyze characteristics of individual features, we revise errors in automatic linguistic analysis. At the result, the most important feature is NE (Named Entity) information and the best condition is when combine basic linguistic features. word embedding, and word clusters within core predicates. Experimental results under the real situation in social bigdata - including linguistic analysis errors - show 92.08% and 85.84% in precision respectively for frequent risk categories set and full test set.

User Popularity based Cache Replacement Algorithm for Multimedia Streaming in Proxy Server (멀티미디어 스트리밍을 위한 프록시 서버에서의 사용자 선호도 기반 캐쉬 교환 알고리즘)

  • 이준표;박성한
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.412-414
    • /
    • 2004
  • 대용량의 멀티미디어 데이터들을 다수의 시용자가 동시에 요구할 경우 접속이 끊기거나 데이터의 손실과 같은 접속 성능이 현저하게 저하되는 문제가 발생할 수 있다. 이는 대부분의 사용자들의 요청을 원거리의 Central Server가 단독으로 처리하기 때문에 발생하는 문제이다. 띠라서 Central Sever의 Load 감소와 초기 지연시간 및 비디오 패킷의 손실의 문제점을 해결하기 위해 프록시 서버를 사용자의 근거리에 위치시키는 방법을 이용한다. 대용랑의 멀티미디어 데이터들을 복잡한 인터넷의 중간경로를 거치지 않고 다수의 사용자들에게 직접 전달함으로써 데이터의 손실을 방지함과 동시에 보다 안정적이고 빠른 속도로 제공하는 것이 가능하다. 특징적으로 프록시 서버는 Central Server에 비해 비교적 제한된 용랑을 가지고 있다. 따라서 본 논문에서는 사용자의 선호도를 기반으로 하여 앞으로 요구학 것이라고 예측되는 비디오 데이터들만을 선별적으로 저장하도록 하는 알고리즘을 제안한다. 시뮬레이션을 통해 제안하는 캐쉬 교환 알고리즘을 기존의 알고리즘과 비교, 관찰한 결과 상대적으로 높은 Hit rate가 나타남을 확인하였다.

  • PDF

FFT server system for Remote Monitoring System (원격 모니터링을 위한 FFT서버 시스템)

  • 송근영;박세현;이정환
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2003.10a
    • /
    • pp.192-195
    • /
    • 2003
  • 본 논문에서는 FFT(Fast Fourier Transform)를 수행하며 이를 원격지에 전송할 수 있는 원격 모니터링 시스템을 위한 FFT서버 시스템 구축에 대하여 기술하고자 한다. 실시간으로 얻어지는 데이터를 동시에 FFT분석을 하여 이를 원격지에 전송할 수 있다. 그리고 방대한 양의 데이터의 처리와 전송과정에서 발생하는 시간적, 자원적 손실을 줄일 수 있도록 데이터를 선별하여 분석한다. 제안된 시스템은 실시간 계측 데이터에서 의미있는 데이터를 추출하고, FFT를 통해 1차 처리 후 네트워크를 통해 이를 목적지에 전달한다. 이로 인해 네트워크 자원의 보다 효율적인 사용과 감시 대상의 다양한 각도에서의 분석에 도움이 될 것으로 기대한다.

  • PDF

Table Clustering Using Inter-schema Association (스키마간 연관성을 이용한 테이블 군집화 기법)

  • 조순이;이도헌
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.85-87
    • /
    • 2001
  • 업무 데이터 분석을 통한 종합적인 의사결정을 지원할 수 있도록 데이터웨어하우스, OLAP, 데이터마이닝을 적용하려는 기업의 요구가 많아졌다. 그래서 기초 데이터의 이해, 선별, 수집, 가공, 정제가 매우 중요한 과정이나 테이블명 및 속성명이 표준화되어있지 않고 코드나 시스템 카탈로그와 같은 기본 데이터는 부정확하고 부족하다. 본 논문에서는 거의 스키마 정보에만 의존하여 테이블의 의미적 연관성에 근거한 유사한 특성을 가진 집단끼리 분류하는 대략적인 군집분석 방법을 제안한다. 질의 수행시 사용자가 설정한 임계 거리에 ㄸ라 관련된 군집만 검색함으로써 신속한 응답시간을 보장하고, 분석시점에서 다양한 질의에 유연하게 대처할 수 있다는 장점이 있다. 또한 실제 데이터에 본 연구를 적용하여 산출한 군집결과와 사람이 매뉴얼하게 그룹핑한 군집결과와 비교한다.

  • PDF