• Title/Summary/Keyword: 데이터 검증

Search Result 7,261, Processing Time 0.036 seconds

Web Usage Patterns Validation Based on Expert Belief Using Statistical Reasoning (통계적 추론을 이용한 전문가 Belief기반의 Web Usage 패턴 검증)

  • Ko, Se-Jin;Ahn, Kye-Sun;Jeong, Jun;Lee, Phill-Kyu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.148-150
    • /
    • 2001
  • 발견된 Web Usage 패턴들은 분석하는 전문가에게는 불필요하고 흥미롭지 못해 의사결정에 도움이 못되는 경우가 많다. 따라서 발견된 패턴에 대한 도메인 전문가의 사전 Belief에 기반한 패턴 검증 과정이 필요하다. 발견된 패턴의 유용성 여부는 패턴의 Unexpectedness를 측정함으로써 결정할 수 있다. 본 논문에서는 패턴의 Unexpectedness를 전문가의 Belief에 기반하여 검증하기 위한 새로운 방법론 제안한다. 발견된 패턴과 전문가 Belief를 매칭 알고리즘을 이용하여 패턴을 4가지(완전일치, 조건부 일치, 결과부 일치, 완전 불일치)로 분류하는 1차 검증과 1차 검증 결과의 4가지 분류데이터를 통계적 추론 방법인 Dempster-chafer에 적용한 2차 검증으로 나뉜다. 1차 검증 과정은 패턴의 분류 용이성을 부여하나 패턴의 Unexpectedness에 대한 신뢰성을 제공하지 못한다. 이 문제점을 2차 검증 과정을 통해 해결한다.

  • PDF

Threatening privacy by identifying appliances and the pattern of the usage from electric signal data (스마트 기기 환경에서 전력 신호 분석을 통한 프라이버시 침해 위협)

  • Cho, Jae yeon;Yoon, Ji Won
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.25 no.5
    • /
    • pp.1001-1009
    • /
    • 2015
  • In Smart Grid, smart meter sends our electric signal data to the main server of power supply in real-time. However, the more efficient the management of power loads become, the more likely the user's pattern of usage leaks. This paper points out the threat of privacy and the need of security measures in smart device environment by showing that it's possible to identify the appliances and the specific usage patterns of users from the smart meter's data. Learning algorithm PCA is used to reduce the dimension of the feature space and k-NN Classifier to infer appliances and states of them. Accuracy is validated with 10-fold Cross Validation.

Comparative study for height accuracy of Full waveform LiDAR data (Full waveform LiDAR의 높이 정확도 비교 분석)

  • Ryu, Joong-Hi;Lee, Jae-Hwan;Koh, Seung-Bum;Kim, Back-Seok;Seo, Hae-Soo
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.29 no.3
    • /
    • pp.257-263
    • /
    • 2011
  • There are many previous researches such as verification of accuracy, application, and change detection of discrete return LiDAR data, but no researches for full waveform LiDAR data. In this study, we selected the forest area and urban area as case study areas and compared the height accuracy of full waveform LiDAR data with field surveying data. As a result, we got an RMSE of 3.lcm in urban area, 4.7cm in forest area, and it is verified that height accuracy of full waveform LiDAR is high. We think that it is very usefull in aerial photogrammetry.

Alternative Splicing Pattern Analysis from RNA-Seq data (RNA-Seq 데이터를 이용한 선택 스플라이싱 유형 분석)

  • Kong, Jin-Hwa;Lee, Jong-Keun;Lee, Un-Joo;Yoon, Jee-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.37-40
    • /
    • 2011
  • 선택 스플라이싱 (alternative splicing)은 mRNA (messenger RNA)의 전구체인 pre-mRNA가 mRNA로 전사될 때 pre-mRNA의 엑손 영역들 (exons)이 여러 가지 유형 (pattern)으로 다시 연결되는 과정을 말한다. 선택 스플라이싱에 의해 하나의 유전자로부터 서로 다른 mRNA가 만들어 지고 서로 다른 이소형의 단백질 (protein isoforms)이 생성된다. 현재까지 알려진 선택 스플라이싱의 유형은 약 7가지 종류가 있으며, 유전자의 돌연변이 및 질병과 밀접한 연관성을 가지고 있는 것으로 알려져 있다. 본 연구에서는 차세대 시퀀싱 (Next Generation Sequencing : NGS) 기술로 생성된 RNA-Seq 데이터로부터 각 유전자 영역에 대한 선택 스플라이싱 유형을 분류/추출하는 새로운 알고리즘을 제안한다. 제안된 알고리즘에서는 RNA-Seq 데이터를 DNA 시퀀스와 mRNA 트랜스크립트 시퀀스에 동시 매핑하고, 각 엑손 영역에 정렬된 RNA-Seq 데이터의 커버리지 정보 및 엑손의 접합 (junction) 정보를 이용하여 발현된 트랜스크립트 (transcript)의 종류와 양을 측정한다. 알고리즘의 유효성을 보이기 위하여 시뮬레이션 데이터를 이용한 인간 유전자 영역에서의 선택 스플라이싱 유형 추출 실험을 수행하였으며, 검증된 선택 스플라이싱 DB와 비교, 검증하였다.

A design of CAVLC(Context-Adaptive Variable Length Coding) for H.264 (H.264 CAVLC(Context-Adaptive Variable Length Coding)설계)

  • Lee, Yong-Ju;Suh, Ki-Bum
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2008.10a
    • /
    • pp.108-111
    • /
    • 2008
  • In this paper, we propose an advanced hardware architecture for the CAVLC entropy encoder engine for real time Full HD video compression. Since there are 384 data coefficients which are sum of 376 AC coefficient and 8 DC coefficient per one macroblock, 384 coefficient have to be processed per one macroblock in worst case for real time processing. We propose an novel architecture which includes parallel architecture and pipeline processing, and reduction "0" in AC/DC coefficient table. To verify the proposed architecture, we develop the reference C for CAVLC and verified the designed circuit with the test vector from reference C code.

  • PDF

The Efficient Memory Mapping of FPGA Implementation for Real-Time 2-D Discrete Wavelet Transform (실시간 이차원 웨이블릿 변환의 FPGA 구현을 위한 효율적인 메모리 사상)

  • 김왕현;서영호;김종현;김동욱
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.8B
    • /
    • pp.1119-1128
    • /
    • 2001
  • 본 논문에서는 이차원(2-D) 이산 웨이블릿 면환(Discrete Wavelet Transform, DWT)을 이용한 연상압축기를 FPGA 칩에서 실시간으로 동작 가능하도록 하는 효율적인 메모리 스케줄링 방법(E$^2$M$^2$)을 제안하였다. S/W적으로 위의 메모리 사상 방법을 검증한 후, 실제로 상용화된 SFRAM을 선정하여 메모리 제어기를 구현하였다. 본 논문에서는 Mallet-tree를 이용한 2-D DWT 영상압축 칩을 구현할 경우를 가정하였다. 이 알고리즘은 연산 과정에서 많은 데이터를 정장하여야 하는데, FPGA는 많은 데이터를 저장할 수 있는 메모리가 내장되어 있지 않으므로 외부 메모리를 사용하여야 한다. 외부메모리는 열(row)에 대해서만 연속(burst) 읽기, 쓰기 동작이 가능하기 때문에 Mallet-tree 알고리즘의 데이터 입출력을 그대로 적용할 경우 실시간 동작을 수행하는 DWT 압축 칩을 구현할 수 없다. 본 논문에서는 데이터 쓰기를 수행할 경우에는 메모리 셀(cell)의 수직 방향을 저장시키고 읽기를 수행할 때는 수평으로 데이터의 연속 읽기를 수행함으로써 필터가 항상 수평 방향에 위치하게 하는 방법을 제안하였다. 입방법을 C-언어로 DWT 커넬(Kernel)과 메모리의 에뮬레이터(emulator)를 구현하여 실험한 결과, Mallat-tree 이론을 그대로 적용시켰을 때와 동일한 필터링을 수행할 수 있음을 검증하였다. 또한, 상용화된 SDRAM의 메모리 제어기를 H/W로 구현하여 시뮬레이션 함으로써 본 논문에서 제안한 방법이 실제적인 하드웨어로 실시간 동작을 할 수 있음을 보였다.

  • PDF

An OCC-based Concurrency Control Method to Minimize Transaction Abort Rate in Wireless Broadcast Environments (무선 브로드캐스트 환경에서 트랜잭션 철회율을 최소화하기 위한 낙관적 동시성 제어 기법)

  • Suh Jong-Hyun;Jung Sungwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.202-204
    • /
    • 2005
  • 브로드캐스트 기법은 서버에서 사용자로의 하향 대역폭을 최대한 활용하고 사용자의 수와 무관하게 데이터를 배포할 수 있기 때문에 이동 컴퓨팅 환경에서의 주요한 방식으로 쓰이고 있다. 브로드캐스트 기법에서도 기존 컴퓨팅 환경처럼 여러 트랜잭션이 같은 데이터 항목을 동시에 사용하는 경우가 발생할 수 있다. 하지만 브로드캐스트 환경에서는 모바일 클라이언트의 제한된 자원과 제한된 상향 대역폭 등의 이유로 기존의 동시성 제어 기법을 그대로 사용할 수 없다. 이러한 이유로 무선 브로드캐스트 환경을 위한 동시성 제어 기법들이 많이 연구되어 왔다. 이 논문에서는 트랜잭션들의 접근 패턴이 편향될 경우 발생하게 되는 반복적인 재실행을 문제점으로 인식하고, 동시성 제어 기법에 기반을 둔 기법을 제안한다. 동일한 데이터 항목에 대한 갱신을 수행하는 트랜잭션이 많을수록 트랜잭션이 재실행될 확률은 높아지고 성능은 저하되는데, 이는 검증을 요청하는 트랜잭션들 중 가장 먼저 서버에 도착한 트랜잭션만이 경쟁에서 살아남고 나머지는 재실행되며 경쟁을 다시하기 때문이다. 제안하는 기법에서는 브로드캐스트 사이클이 끝날 때까지 완료 여부의 결정을 유보하면서 검증을 요청한 트랜잭션들의 조합을 구성해 후보 해 리스트를 유지한다. 마지막으로 갱신되는 데이터 항목의 수와 데이터 항목의 갱신 선호도를 기준으로 최적의 해를 선택해 트랜잭션들을 완료하고 데이터베이스에 값을 반영함으로써 트랜잭션의 철회율을 최소화하고 트랜잭션의 완료율을 높일 수 있다.

  • PDF

Medical bigdata-based Extended Artificial Intelligence Integration Platform (의료 빅데이터기반 확장 인공지능 통합플랫폼)

  • Lee, Chung-sub;Kim, Ji-Eon;Noh, Si-Hyeong;Kim, Tae-Hoon;Lee, Yun Oh;Yu, Yeong-Ju;Chun, JungBum;Jeong, Chang-Won
    • Annual Conference of KIPS
    • /
    • 2020.11a
    • /
    • pp.45-46
    • /
    • 2020
  • 최근 의료데이터의 표준화를 기반으로 다양한 임상연구가 국내외에서 활발하게 진행되고 있다. 그러나 대부분 개발기술이 임상현장에 적용되지 못하는 이유는 상이한 인프라로 인한 일관성있는 결가를 도출하지 못하는 문제점과 부족한 진단지표와 기준 그리고 충분하지 못한 기술적·임상적 검증이 문제가 되고 있다. 본 논문에서는 이러한 문제점을 해결하기위한 새로운 통합 플랫폼을 제안하고자 한다. 이를 위해서 임상데이터는 OHDSI의 OMOP-CDM으로 표준화되어야 하며, 이외에 의료영상 정보를 포함한다. 제안한 플랫폼은 표준화된 데이터를 통해 지속적인 자가 학습을 수행하며, 질환별 진단에 필요한 개발 도구와 분석 소프트웨어 도구를 통해 다양한 타겟 질환연구를 지원한다. 제안한 플랫폼은 질환에 대한 비침습적 진단을 위해 의료영상을 기반으로 데이터표준화을 기반으로하며, 이를통해 인공지능 기술을 개발하고 병원 정보시스템과 연계하여 임상현장에 실증을 통해 검증하고자 한다.

Resident Friendly River Management : Using the DT Technology (주민 친화적 하천관리 방향 : DT기술의 활용)

  • Lee, Sangeun;Lee, Jongso;Lee, Yookyung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.10-10
    • /
    • 2020
  • 하천은 최근 주민에게 휴식과 레저의 기회를 제공하고 지역활기 창출의 자원으로 가치가 부상함에 따라 하천공간의 관리와 운영이 한층 더 중요해 졌다. 즉 하천공간의 개발과 보전은 지역의 문화관광과 복지 등의 지역 정책과 함께 하천이용의 수요를 고려하여 신중하게 운영해야 한다. 이에 본 연구에서는 하천공간의 체계적인 관리를 위해 통신 빅데이터를 활용하여 이용객 수를 추정하고 검증 한 뒤, 이용도 지표를 산정하였으며, 하천공간의 상세 유형화 방안을 마련하고 유형별 특성분석 등을 실시하고자 하였다. 현장표본조사를 통한 검증결과 통신 빅데이터는 하천공간에서의 이용객 수 추정에 활용 가능성을 보였으며, 이용도 지표 산정결과를 통해 친구지구를 이용객들이 어떻게 활용하는지 판단할 수 있었다. 또한 상세 유형화 방안을 마련하고 적용한 결과 이용객들이 하천공간을 근린의 성격과 거점의 성격으로 이용하고 있는지 판단할 수 있었다. 본 연구의 결과를 종합할 때, 친수지구 조성 및 관리를 위한 자료 활용방안을 제시할 수 있었으며, 국가하천 점용허가 시 통신 빅데이터 활용방안을 마련할 수 있었다. 통신 빅데이터는 친수지구 이용도 조사에 크게 유용한 방법을 제공하며, 하천계획, 유지·보수 등 관련 실무활용 및 정책수립에 큰 도움이 될 것으로 판단된다.

  • PDF

Design and Implementation of Contents-based Customized movie recommendation system using meta weight learning (메타 가중치 학습을 활용한 내용 기반의 맞춤형 영화 추천시스템 설계 및 구현)

  • An, Hyeon Woo;You, Hea Woon;Kim, Dea Yeol
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.587-590
    • /
    • 2020
  • 최근, 디지털 콘텐츠 산업이 폭발적으로 성장됨에 따라 고객 유치를 위한 개인화 추천 기술들이 많은 주목을 받고 있다. 개인화 추천 방식들을 큰 갈래로 나누어 본다면 협업 필터링 기술과 내용 기반 기술로 나눌 수 있다. 협업 필터링의 경우 개인화 추천에는 적합하지만 사용자 평가 데이터의 양이 방대해야 하며 초기에 평가자가 없는 콘텐츠에 대해 추천할 수 없는 초기 평가자 문제가 존재한다. 따라서 매일 방대한 양의 콘텐츠가 편입되는 분야에서 사용하기에 큰 결점이 될 수 있다. 본 논문에서는 영화들의 정보가 담긴 데이터 셋과 사용자 평가 데이터, 그리고 사용자의 선호 기준을 의미하는 메타 가중치를 활용한 내용 기반의 맞춤형 영화 추천 시스템을 제안한다. 논문에서는 먼저, 영화를 고를 때 일반적으로 중요시 보는 속성들을 활용하여 영화의 특징 벡터를 구성하고, 이를 사용자 평가와 결합하여 개인의 선호에 대한 특징 벡터를 구성하는 방법을 제안하며, 구성된 데이터와 코사인 유사도, 메타 가중치를 활용하여 사용자 선호와 유사한 영화들을 도출하는 방법을 제안한다. 또한, 평가데이터를 활용하여 구현된 추천시스템의 검증 프로세스를 구성하고, 검증 프로세스를 활용한 손실 함수를 설계하여 적합한 메타 가중치를 학습하는 방법을 제시한다. 본 논문에서 제안하는 시스템은 다수의 속성을 조합하여 활용하므로 추천 결과가 과도하게 특수화 되지 않을 수 있으며, 메타 가중치라는 요소를 통해 더욱 개인화 된 추천을 제공할 수 있다.

  • PDF