• 제목/요약/키워드: 이용데이터

검색결과 31,755건 처리시간 0.06초

유비쿼터스 데이터베이스를 위한 이미지 데이터 처리 기법 (Image Data Processing for Ubiquitous Database)

  • 서동운;최진영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.81-84
    • /
    • 2006
  • 유비쿼터스 컴퓨팅 환경으로 발전하면서 문자열 위주의 획일적 형태에서 음성, 이미지 등 다양한 형태의 데이터들을 처리하게 되었으며, 또한 빠르고 정확하게 처리되기를 요구하고 있다. 현재 데이터 처리 중심부에 있는 Database는 대부분이 Relation DB 위주로 되어 있어 Datafile 에 데이터를 저장하고 있어 대용량의 이미지 데이터 처리에 적합하지가 않다. 본 논문에서는 이러한 단점을 보강하기 위해 Relation DB 하에서 대용량의 이미지 데이터 처리를 가능하게 하는 기법을 제시한다. 이렇게 함으로써 이미지 데이터를 Upload, Download 시 따른 응답 속도를 보장 할 수 있도록 LRU 알고리즘 기반으로 제안을 하였다. 본 논문에서 제안된 기법은 시뮬레이션을 통해 (1)기존 RDB(Relational Database)의 BLOB(Binary Large Object)필드를 이용한 이미지 데이터 처리 방식, (2)별도의 저장 공간에 이미지 데이터를 입/출하는 방식, (3)별도의 저장 공간에 이미지 데이터를 입/출력할 때 LRU(least Recently Used)알고리즘을 이용하는 방식에 대하여 성능 평가를 하였다. 그 결과 (3)별도의 저장 공간에 LRU(least Recently Used)알고리즘을 이용하여 입/출력하는 방식이 (1)기존의 RDB(Relational Database)형태에 BLOB(binary large object)필드를 이용한 것 보다 성능이 높음을 확인하였다.

  • PDF

다차원 FCM을 이용한 웹 로그 데이터의 유사 패턴 분석 (Similarity Pattern Analysis of Web Log Data using Multidimensional FCM)

  • 김미라;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.190-192
    • /
    • 2002
  • 데이터 마이닝(Data Mining)이란 저장된 많은 양의 자료로부터 통계적 수학적 분석방법을 이용하여 다양한 가치 있는 정보를 찾아내는 일련의 과정이다. 데이터 클러스터링은 이러한 데이터 마이닝을 위한 하나의 중요한 기법이다. 본 논문에서는 Fuzzy C-Means 알고리즘을 이용하여 웹 사용자들의 행위가 기록되어 있는 웹 로그 데이터를 데이터 클러스터링 하는 방법에 관하여 연구하고자 한다. Fuzzv C-Means 클러스터링 알고리즘은 각 데이터와 각 클러스터 중심과의 거리를 고려한 유사도 측정에 기초한 목적 함수의 최적화 방식을 사용한다. 웹 로그 데이터의 여러 필드 중에서 사용자 IP, 시간, 웹 페이지 필드를 WLDF(Web Log Data for FCM)으로 가공한 후, 다차원 Fuzzy C-Means 클러스터링을 한다. 그리고 이를 이용하여 샘플 데이터와 임의의 데이터간의 유사 패턴 분석을 하고자 한다.

  • PDF

XML기반의 가상 스키마를 이용한 정보 통합 검색시스템 설계 (Design of Virtual Schema using Information Integeration Search System based on XML)

  • 문석재;정계동;국윤규;최영근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2004
  • XML을 기반으로 한 시스템간의 통합하는 과정에서 발생하는 데이터 정의 이질성 문제, 데이터 표현의 이질성 문제, 유사표준의 중복 개발 등이 야기되므로, 이에 대한 대비책이 필요하다. 따라서 분산된 이 기종 시스템들마다 각기 구조화된 데이터베이스틀 통합하는 과정에 발생하는 시스템간의 불일치 문제를 해결할 수 있는 방법이 메타데이터를 이용하는 것이다. 본 논문에서는 이질적이면서도 분산되어 있는 정보 저장소로부터 메타데이터틀 수집하고. 이를 통합된 메타데이터 베이스로 구축하여, 분산된 데이터베이스에 대한 검색정보 및 데이터 트랜잭션을 할 수 있도록 제안한다. 정보 통합 방법으로는 메타데이터를 기반으로 한 가상 스키마를 이용한다. 스키마 이질성과 데이터 이질성 해결하기 위한 방법으로 메타데이터 가상 스키마를 설계하였다. 메타데이터 가상 스키마 기반으로 한 정보 통합은 XML 뷰어 어인 XDR을 기반으로 한다. 이는 XMVS 템플릿으로 분해하여, 통합 처리 할 수 있는 XML기반의 가상 스키마를 이용한 정보 통합 검색시스템을 설계 제안한다.

  • PDF

클라우드 스토리지 환경에서의 CCTV 데이터 중복제거 수행 기술 연구 (Study on CCTV Data De-duplication in Cloud Storage Environments)

  • 김원빈;이임영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.172-173
    • /
    • 2018
  • CCTV 기술은 실시간으로 영상을 수집하여 저장소에 보관하는 기술을 의미한다. 이러한 환경에서 데이터 저장소의 가용성은 매우 중요하다. 데이터가 축적될수록 스토리지 공간의 확장은 매우 중요해지며, 이를 위해 최근에는 클라우드 스토리지를 이용하여 저장 공간을 비교적 수월하게 확장하고 이용할 수 있는 환경이 제시되고 있다. 하지만 이러한 환경에서도 데이터의 지속된 저장은 저장 공간의 추가 이용을 위한 비용의 증가로 직결되기 때문에 데이터를 효율적으로 저장하기 위한 방안의 논의되었다. 데이터 중복제거 기술은 이러한 기술 중 하나로 데이터의 중복된 저장을 방지하여 스토리지 공간을 보다 효율적으로 이용할 수 있도록 하는 기술이다. 하지만 CCTV 환경에 클라우드 스토리지와 데이터 중복제거 기술을 적용하면서 추가적인 보안 이슈가 발생하였다. 따라서 본 연구에서는 이러한 문제를 해결하기 위한 연구를 수행하며, 이를 통해 보다 효율적인 데이터 저장을 수행하는 동시에 안전하게 데이터를 보관하는 방법을 제안한다.

영화 메타데이터의 증가에 따른 콘텐츠 기반 추천 시스템 성능 향상 (Performance Improvement of a Contents-based Recommendation System by Increasing Movie Metadata)

  • 서진경;최다정;백주련
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.23-26
    • /
    • 2022
  • OTT 서비스의 이용자가 폭발적으로 증가하고 있는 지금, 사용자에게 맞춤형 상품을 추천하는 것은 해당 서비스에서 중요한 사안이다. 본 논문에서는 콘텐츠 기반 추천 시스템의 모델을 제안하고, 영화 데이터를 추가 해가며 예측력을 높일 최종적인 모델을 채택하고자 한다. 이를 위해 GroupLens와 Kaggle에서 영화 데이터를 수집하고 총 1111개의 영화, 943명의 사용자에게서 나온 71026개의 영화 평가 데이터를 이용하였다. 모델 평가 결과, 장르와 키워드만을 이용한 추천 시스템 모델의 RMSE는 1.3076, 단계적으로 데이터를 추가해 최종적으로 장르, 키워드, 배우, 감독, 나라, 제작사를 이용한 추천 시스템 모델의 RMSE는 1.1870으로 모든 데이터를 추가한 모델의 예측력이 더 높았다. 이에 따라 장르, 키워드, 배우, 감독, 나라, 제작사를 이용해 구현한 모델을 최종적인 모델로 채택, 무작위로 추출한 한 명의 사용자에 대한 영화 추천 리스트를 뽑아낸다.

  • PDF

퍼지집합을 이용한 실수값 속성 사이에 존재하는 연관규칙의 발견 (Finding Association Rules among Real-valued Items using Fuzzy Sets)

  • 이지형;이광형
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1996년도 추계학술대회 학술발표 논문집
    • /
    • pp.115-118
    • /
    • 1996
  • 연관규칙(Association Rule)은 데이터 베이스에 존재하는 속성들 사이의 관계를 기술하는 것으로, 간단하면서도 사용자에게 많은 정보를 줄 수 있다. 그러나, 지금까지는 이진 데이터베이스에 존재하는 연관규칙의 발견에 대해서 주로 연구되어 왔으며, 실수값 속성을 갖는 데이터에 관한 연구는 미비하였다. 본 논문에서는 퍼지집합을 이용하여 실수값 사이에 존재하는 연관규칙을 기술하고, 그것을 찾아내는 방법을 제시한다. 제시하는 방법은 사용자에 의해서 정의된 언어항을 이용하여, 실수값 속성을 가진 데이터를 이진 데이터로 재구성한다. 그리고 재구성된 이진 데이터에 기존의 연관규칙 발견 방법을 이용하여 연관규칙을 찾아내고, 찾아진 연관규칙을 정의된 언어항을 이용하여 다시 기술한다.

  • PDF

디지털 데이터 방송 환경에서 동기화 데이터 서비스를 위한 전송 시스템 설계 (Transmission system design for synchronized data service on digital data broadcasting environment)

  • 이용주;박민식;최지훈;최진수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.201-204
    • /
    • 2003
  • 본 논문에서는 디지털 데이터 방송에서 동기화 데이터 서비스를 제공하기 위한 전송 시스템과 이를 이용한 동기화 데이터 서비스 방법을 제안한다. 데이터 방송을 통해 전송되는 부가 데이터는 그 특징에 따라 비동기, 동기, 동기화 데이터로 구분된다. 이들 중 동기화 데이터는 사용자의 선택에 의해 데이터 방송 수신기에서 재생되는 비동기 데이터와는 달리 비디오 또는 오디오의 특정 장면에 통기되어 재생될 수 있는 데이터고서, 데이터를 전송하는 단계에서 데이터가 재생되어야 하는 시전의 시간 정보인 재생시각이 함께 전송되는 특징이 있다. 동기화 데이터의 이와 같은 특징으로 인해 현재 대부분의 데이터 방송에 사용되고 있는 비동기 데이터 서비스를 위한 전송 시스템은 동기화 데이터의 전송에는 부적합하며, 동기화 데이터 서비스를 위해서는 새로운 전송 시스템에 대한 연구가 필요하다. 본 논문에서는 데이터 방송을 동해 동기화 데이터 서비스를 제공하기 위해 기존의 비동기 데이터 전송 시스템에 MPEG-2 오디오/비디오 TS(Transport Stream)를 출력하는 장치와 동기화 데이터를 다중화 하는 장치를 추가한 새로운 동기화 데이터 전송 시스템과 이를 이용한 동기화 데이터 서비스 방법을 제안한다

  • PDF

클라우드 모니터링 시스템의 성능 향상을 위한 딥러닝을 이용한 시계열 데이터 예측 연구 (Deep Learning-based Time Series Data Prediction Research for Performance Enhancement in Cloud Monitoring Systems)

  • 김동완;홍두표;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.342-344
    • /
    • 2023
  • 클라우드 시장의 성장과 마이크로 서비스 접근식이 제기됨에 따라 IT인프라를 관리하기 위한 연구가 최근 활발히 이루어지고 있다. 하지만 고도화 및 분산된 환경에서 관찰 가능성 응용을 확보하기 어렵다는 문제점을 가지고 있다. 따라서 본 연구에서는 모니터링 시스템을 통한 데이터 분석 중 수집한 데이터의 분석이 난해하다는 문제를 해결하기 위한 방법을 제안한다. 제안된 방법은 NAB 데이터셋을 대상으로 STUMPY를 이용하여 데이터를 시각화하고, CNN을 이용하여 분류 작업을 수행한다. 분류를 수행한 데이터셋은 이상치 데이터와 이상 전조 데이터, 정상 데이터셋으로 분류하여 데이터셋을 구성한다. 구성한 학습 데이터셋에 대해 훈련을 마친 딥러닝 모델은 부하 테스트 환경에서 수집한 데이터에 대한 그래프 패턴을 분석하여 이상치 데이터와 이상 전조 데이터를 탐지한다.

가상 트랜잭션을 이용한 시계열 데이터의 데이터 마이닝 (Data Mining Time Series Data With Virtual Transaction)

  • 김민수;김철환;김응모
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.251-258
    • /
    • 2002
  • 대용량의 데이터들로부터 사용자가 인하는 데이터를 찾기 위하여 많은 데이터 마이닝 기술들이 연구되어 실제 응용프로그램에서 많이 적용되고 있다. 이러한 데이터 마이닝 기술들은 시계열 데이터를 이용하는 경우보다 트랜잭션 데이터를 이용하여 유용한 정보를 찾는 경우에 초점이 맞춰져 있다. 본 논문에서는 시계열 데이터를 트랜잭션 데이터로 변환하는 접근방법을 소개한다. 가상 트랜잭션은 서로 상대적으로 근접한 시간에 발생하는 이벤트의 집합이라고 정의하며, 가상 트랜잭션 생성기는 가상 트랜잭션을 생성시 시간윈도우와 이벤트 윈도우 방법을 사용한다. 본 논문의 접근 방법을 사용하여 기존의 트랜잭션 데이터를 이용하는 많은 데이터 마이닝 알고리즘들을 수정 없이 시계열 데이터에 적용하여 유용한 정보를 찾을 수 있다.

HDFS에서 적응형 캐시 관리 기법 (Adaptive Cache Management Scheme in HDFS)

  • 최형락;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.461-462
    • /
    • 2019
  • 스마트팩토리는 정보통신기술(ICT)를 이용한 공정의 모든 데이터를 수집, 분석하여 제어하고 있다. 기존보다 방대한 양의 데이터를 처리하기 위해 기업들은 하둡을 이용한다. 다양한 크기의 데이터가 나타나는 환경에서 HDFS을 효율적으로 관리하기 위한 적응형 캐시 관리 기법을 제안한다. 제안하는 기법은 데이터 노드의 로컬 디스크의 공간 이용 효율성을 높이고 평균 데이터 크기를 분석하여 데이터 노드 확장시 적합한 블록 크기를 적용할 수 있게 관리한다. 성능 평가를 통해 제안하는 기법의 데이터 노드에서 로컬 디스크 효율 향상과 읽기와 쓰기 속도의 속도에 효과를 보인다.

  • PDF