• 제목/요약/키워드: 데이터결합

검색결과 2,382건 처리시간 0.033초

모빌리티 빅데이터 가상결합 분석방법론 연구 (Development of Virtual Fusion Methodology for Analysis Via Mobility Bigdata)

  • 조범철;권기훈;안덕배
    • 한국빅데이터학회지
    • /
    • 제7권2호
    • /
    • pp.75-90
    • /
    • 2022
  • 코로나19 팬데믹에 따른 경제사회 환경 변화와 빅데이터 기술의 발달로 교통분석에 대한 요구가 다양화되고 있다. 특히 데이터 3법 개정에 따라 이종 데이터 간 가명정보 결합이 가능해져 다각적인 분석이 가능해졌다. 그러나 개인정보보호 강화로 모빌리티 빅데이터의 결합분석에는 데이터 협력, 비용대비 효과 등에 한계가 있어 새로운 분석방법론이 필요하다. 본 연구에서 제시하는 "모빌리티 빅데이터 가상결합 방법론"은 법제상의 제약 해소 및 다각적인 교통분석을 위한 것으로, 모바일 통신 기지국 데이터, 교통카드 데이터 등 다양한 모빌리티 관련 빅데이터를 간접적으로 결합하여 상세 분석을 수행하기 위한 방법론이다. 가상결합은 모바일 데이터를 바탕으로 특정 인원의 시간대별 위치를 파악할 수 있는 MCGM(Mobility Comprehensive Genetic Map)을 생성하여 패턴을 분석하고, 이를 교통카드데이터 등 교통관련 빅데이터와 결합시켜 분석하는 방법론으로 본 연구에서는 청주, 수도권 대상으로 가상결합 분석을 수행하여 활용가능성을 검증하였다.

빅데이터 활용에 영향을 미치는 개인정보 규제요인과 데이터 결합요인의 탐색 (An Exploration on Personal Information Regulation Factors and Data Combination Factors Affecting Big Data Utilization)

  • 김상광;김선경
    • 정보보호학회논문지
    • /
    • 제30권2호
    • /
    • pp.287-304
    • /
    • 2020
  • 그동안 데이터 개방, 기술수용이론 등 빅데이터 활용의 영향요인에 대한 법·정책적 연구는 다수 있었으나, 제약선 역할을 하는 개인정보 규제요인 또는 데이터 결합요인이 빅데이터 활용에 미치는 영향에 대한 실증연구는 거의 없었다. 이에 본 연구는 델파이 분석(Delphi Analysis)을 통해 빅데이터 활성화에 부정적(-) 관계를 보이는 개인정보 규제요인과 긍정적(+) 효과를 보이는 데이터 결합요인이 무엇으로 구성되는지 요인의 우선순위를 시론적으로 탐색하였다. 델파이 분석결과, 개인정보 규제요인은 가명정보 등 활용제도 도입, 개인정보 비식별화 근거 명확성, 데이터 결합규정 명확성, 개인정보 정의 명확성, 개인정보 동의 용이성, 개인정보 감독기구 통합, 개인정보 법률간 정합성, 법령위반시 적정 처벌강도, EU GDPR 비교시 적정 과징금 순으로 상위요인이 조사되었다. 다음으로 데이터 결합요인은 결합 비식별성, 결합데이터 표준화, 결합 책임성, 결합기관 유형, 경합경험, 결합 기술가치 순으로 조사되었다. 이러한 연구결과는 빅데이터 활성화를 위해 개인정보 규제와 데이터 결합정책 설계 시 어느 구성요인을 우선적으로 제도개선 해야 하는지 시사점을 제공한다.

입력자료 판별에 의한 데이터 마이닝의 성능개선 (Performance Improvement of data Mining by Input Data Discrimination)

  • 이재식;이진천
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.293-303
    • /
    • 2000
  • 데이터 마이닝의 수행 예측 오차를 줄이기 위한 방법으로 하나의 문제를 여러 기법들을 결합하여 해결하고 있다. 본 연구에서는 새로운 결합 모델을 제시하고 이를 통해 예측 오차를 감소시킬 수 있는 가능성을 제시한다. 제시된 결합모델의 성능을 검증하기 위해서 국내 자동차보험 회사의 고객데이터를 바탕으로 고객이탈 예측문제를 다루었다. 결합모델의 예측결과를 의사결정나무, 사례기반추론 그리고 인공신경망 중 하나의 기법만을 사용하여 예측한 결과와 비교 평가하였다. 평가 결과, 결합 모델의 예측 적중률이 개별 기법의 예측 적중률보다 우수했다.

  • PDF

EfficientNet 모델과 전이학습을 이용한 상품 이미지와 텍스트 데이터의 결합 (Combination of product image and text data" using EfficientNet model and transfer learning)

  • 임수빈;김범윤;김선재;한정우;유동영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.334-335
    • /
    • 2023
  • 본 논문에서는 이미지 데이터와 각종 텍스트 기반의 데이터를 적절히 결합하여 유용한 데이터를 만들어 내는 방법을 제안한다. 그 사례로 편의점 상품 이미지와 편의점 프로모션 데이터, 사용자 위치정보 데이터를 적절히 결합하여 사용자가 편의점 상품 전면 이미지를 제공했을 때, 해당 상품이 어떤 편의점 브랜드에서 어떤 프로모션을 진행하고 있는지, 그리고 현재 위치에서 가까운 점포가 어디인지를 사용자에게 제공하는 시스템을 구현한다. 이미지를 어떤 데이터와 결합하는지에 따라 다양한 요구사항에 대응할 수 있다.

개인정보 규제요인과 빅데이터 활용간의 관계에서 가명정보 결합의 매개효과 및 조절효과 (The Mediating Effect and Moderating Effect of Pseudonymized Information Combination in the Relationship Between Regulation Factors of Personal Information and Big Data Utilization)

  • 김상광
    • 정보화정책
    • /
    • 제27권3호
    • /
    • pp.82-111
    • /
    • 2020
  • 최근 빅데이터 활용의 영향요인으로 개인정보 규제요인과 가명정보 결합이 핵심 정책수단으로 등장하고 있다. 본 연구는 개인정보 규제요인과 빅데이터 활용의 관계에서 제3의 변수로서 가명정보 결합의 매개효과 및 조절효과를 실증분석하였다. 분석결과, 첫째, 개인정보 규제요인 중 개인정보 정의, 개인정보 동의, 법령위반 처벌강도 요인이, 그리고 가명정보 결합요인 중 결합 비식별성, 결합 가명정보 표준화, 결합 책임성이 빅데이터의 활용에 정(+)의 유의한 관계를 보였다. 둘째, 가명정보 결합 요인 중 결합 비식별성, 결합 가명정보 표준화, 결합 책임성이 개인정보 규제요인과 빅데이터 활용과의 관계에서 정(+)의 매개효과를 보였다. 셋째, 개인정보 규제요인과 빅데이터 활용과의 관계에서 가명정보 결합기관 유형인 자유형, 중개형, 지정형의 순서에 따라 조절효과가 다를 것이라는 가설은 기각되었다. 이상의 분석결과를 기반으로 개인정보 보호와 빅데이터 활용이 조화를 이루는 '착한규제'의 정책대안을 제시하였다.

DBMS와 결합된 데이터스트림관리시스템을 위한 성능 평가 도구 개발 (Development of the Performance Benchmark Tool for Data Stream Management Systems Combined with DBMS)

  • 김경배
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권8호
    • /
    • pp.1-11
    • /
    • 2010
  • 데이터스트림 관리시스템(DSMS)의 많은 응용분야에서는 단순한 실시간 스트림 데이터의 효율적인 처리뿐만 아니라 기존의 DBMS와 결합하여 데이터마이닝이나 데이터웨어하우징 같은 고급 서비스를 사용자에게 제공하는 것을 요구하고 있다. 본 논문에서는 고급 서비스를 위하여 DSMS와 DBMS를 결합한 시스템의 성능평가를 위한 도구를 개발하였다. 기존 연구 개발된 대표적인 DSMS와 DBMS를 결합하여 네트워크 모니터링 스트림 데이터를 기반으로 통합된 시스템의 성능평가를 수행하였다. 통합된 시스템의 평가를 위하여 JAVA로 통합 시스템 성능 평가 툴을 개발하였으며, 개발 된 툴을 이용하여 DSMS(STREAM, Coral8)와 DBMS(MySQL, Oracle10g)를 결합한 시스템의 성능평가를 수행하였다

당뇨병의 예측을 위한 분류기 앙상블의 BKS 결합 (BKS Fusion of Classifier Ensemble for Prediction of Diabetes)

  • 박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.265-267
    • /
    • 2004
  • 경제 여건의 향상 및 생활양식의 변화로 최근 우리나라에서도 당뇨병 환자가 늘어남에 따라 당뇨병의 예측 및 치료가 중요한 관심사가 되고 있다. 본 논문은 1993년과 1995년 두 차례에 걸쳐 경기도 연천 지역 주민들의 여러 가지 신체 지수 등을 조사한 데이터를 대상으로, 1차 년도의 데이터로부터 동일한 환자가 2차 년도에 정상상태를 유지하는지 흑은 당뇨병으로 진행이 되는지를 예측하는 문제를 다룬다. 혈당량, 허리둘레 등의 수치가 당뇨병의 발병에 영향을 끼치는 것은 알려진 사실이므로, 현재의 데이터로부터 앞으로의 발병 가능성을 예측하는 것이 가능하며, 이는 환자에게 보다 정확한 정보를 알려줄 수 있으므로 의미가 있는 일이다. 예측을 위해 본 논문에서는 분류기를 사용하며, 예측율을 높이기 위해 여러 분류기를 BKS로 결합하였다. BKS (behavior knowledge space) 결합 방법은 분류기간의 독립 가정이 필요 없으며, 데이터 크기가 크고 전형적인 경우에 좋은 결과를 낼 수 있는 방법이다. BKS 결합 방법을 통해 실험을 해본 결과 단일 분류기로 실험을 한 결과보다 향상된 성능을 얻을 수 있었으며, 투표 결합 방법과 비교하여 더 좋은 성능을 보였다.

  • PDF

효율적인 침입탐지를 위한 네트워크 정보와 시스템 콜 정보융합 방법개발 (Data Fusion of Network and System Call Data For Efficient Intrusion Detection)

  • 문규원;김은주;류정우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.208-210
    • /
    • 2004
  • 최근 인터넷, 인트라넷과 같은 통신 기술 발전에 따라 거의 모든 시스템이 서로 연결되었고, 사용자들은 손쉽게 정보를 공유할 수 있게 되었다. 따라서 시스템 침입을 통한 데이터의 변형과 인증 받지 않은 접근과 같은 컴퓨터 범죄가 급속도로 증가하고 있다. 그러므로 이러한 컴퓨터 범죄를 막기 위한 침입 탐지 기술 개발은 매우 중요하다. 전통적인 침입 탐지 모델은 단지 네트워크 패킷 데이터만을 사용하고 있으며. 침입탐지 시스템의 성능을 높이기 위해 서로 다른 분류 알고리즘을 결합하는 방법을 사용해왔다. 그러나 이러한 모델은 일반적으로 성능향상에 있어서 제한적이다. 본 논문에서는 침입탐지 시스템의 성능을 개선하기 위해 네트워크 데이터와 시스템 콜 데이터를 융합하는 방법을 제안하였으며. 데이터 융합 모델로서 Multi-Layer Perceptron (MLP)를 사용하였다. 그리고 DARPA 에서 생성한 네트워크 데이터와 본 논문에서 가상으로 생성한 시스템 콜 데이터를 함께 결합하여 모델을 생성 한 뒤 실험을 수행하였다. 본 논문에서의 실험결과로. 단순히 네트워크 데이터만을 사용한 모델에 비해 시스템 콜 데이터를 함께 결합한 모델이 훨씬 더 놓은 인식률을 보인다는 것을 확인할 수 있다

  • PDF

하이퍼큐브구조 시스템에서 향상된 병렬 결합 알고리즘의성능 분석 (Performance Analysis of an Advanced Paralled Join Algorithm on Hypercube System)

  • 원영선;조석봉;이규옥;좌용권;홍만표
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권6호
    • /
    • pp.683-692
    • /
    • 1999
  • 관계형 데이터베이스 시스템에서 결합 연산자는 데이터베이스 질의를 구성하는 연산자들 중 가장 많은 처리시간을 요구한다. 따라서 이러한 결합연산자를 효율적으로 처리하기 위해 많은 병렬 알고리즘들이 소개되었다. 그 중 하이브리드 해쉬 결합 알고리즘은 가장 우수한 것으로 알려져왔다. 그러나 이 알고리즘은 여러 노드로 데이터를 분할하는 과정에서 데이터의 편중 문제가 발생하며, 이는 전체 시스템의 성능을 크게 저하시키게된다. 본 논문에서는 이러한 데이터 편중문제를 해결한 변형된 하이퍼퀵 정렬을 이용한 병렬 결합 알고리즘을 non-equijoin을 위한 알고리즘으로 확장하였다. 또한 T805로 연결된 하이퍼큐브 구조 시스템에서 시뮬레이션하여 얻은 결과를 수치 계산적 비용모델의 결과와 비교를 통해 변형된 하이퍼 퀵 정렬을 이용한 병렬 결합 알고리즘의 성능을 분석하고 , 비용모델의 타당성을 입증하였다.

데이터 결합이 웹 문서 검색성능에 미치는 영향 연구 (A Study on the Effect of Data Fusion on the Retrieval Effectiveness of Web Documents)

  • 박옥화;정영미
    • 정보관리연구
    • /
    • 제38권1호
    • /
    • pp.1-19
    • /
    • 2007
  • 이 연구에서는 최근 검색성능을 향상시키기 위한 전략으로 사용되는 데이터 결합기법을 웹 문서 검색에 적용하고, 실험을 통해 문서표현 방법의 결합이 검색성능에 미치는 영향을 분석하였다. 문서 표현 방법으로는 내용기반 표현, 링크기반 표현,URL 등을 선정하고, 단일 표현 방법에 의한 검색결과와 표현방법의 결합을 통한 검색결과를 비교하였다. 분석결과 다른 문서표현 방법의 결합이 웹 문서의 검색성능을 향상시키지는 못하는 것으로 나타났다.