• Title/Summary/Keyword: 데이터 특성

Search Result 10,076, Processing Time 0.05 seconds

Extraction of Data Quality Characteristics from Dirty Data (데이터 오류에서 추출한 데이터 품질 특성)

  • 김수경;최병주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.549-551
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제표준인 ISO/IEC 9126은 소프트웨어 품질 및 특성 및 측정 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 데이터 오류 형태를 분류하고, 이를 기반으로 데이트 품질 특성 및 부특성을 분류한다. 데이터 품질 특성 분류는 ISO/IEC 9126에 정의한 소프트웨어 품질 특성을 데이터 오류 형태에 대응시켜 추출한다. 본 논문에서 제시하는 데이트 품질특성 분류는 지식 공학(knowledge engineering)시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

A Study on Water Management of Integrated Watershed Management Using Data Analysis (데이터 분석을 통한 통합물관리 유역관리방안 연구)

  • Jo, Bu Geon;Jung, Woo Suk;Kim, Young Do
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.80-80
    • /
    • 2020
  • 최근 국내·외에서 빅 데이터에 관한 관심이 높아지고 있으며 수자원 분야에서도 빅데이터 활용의 중요성이 강조되어 왔다. 물관리를 위해서는 기본적으로 물관련 기초데이터가 충분해야 하며, 최근 선진국에서 효과적인 통합물관리를 위해서 빅데이터를 활용한 유역관리 방안이 시도되고 있는 실정이다. 일본의 경우 물환경 데이터와 사회과학 데이터를 활용한 유역특성 파악한다. 다양한 방법의 유역특성을 분석하여 유역관리계획을 마련한다. 국내에서의 물환경 관리계획은 부하량을 기반으로한 수립으로 데이터의 다양상이 부족한 부분이 있다. 하천은 각기 다른 특성을 가지고 있다. 낙동강 유역은 22개의 중권역으로 이루어져 있으며 각 중권역은 다양한 문제점과 특성을 가지고 있다. 따라서 유역의 특성에 따른 유역관리방안이 필요하다고 판단된다. 본 연구에서는 데이터 분석을 활용하여 유역의 종합적 분석을 통해 유역을 진단하고자 한다. 또한 물관련 지표들을 활용하여 유역을 평가하고 시각화 그래프를 통해 유역의 기초자료들의 특성을 나타내고 결과를 통해 데이터 분석을 기반으로 한 유역특성을 분석하여 맞춤형 유역관리방안을 모색하고자 한다.

  • PDF

Establishing Data Quality Metric from Dirty Data (오류 데이터로부터의 데이터 품질 메트릭의 정립)

  • 김수경;최병주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.409-411
    • /
    • 2000
  • 소프트웨어 제품의 품질을 보증하는 일은 매우 중요하며, 국제 표준인 ISO/IEC9126은 소프트웨어 품질 특성 및 측적 메트릭 표준을 제공하고 있다. 이때 ISO/IEC 9126에서는 소프트웨어를 프로그램, 절차, 규칙 및 관련문서로 한정하고 있기 때문에 데이터의 품질에는 적용할 수 없다. 본 논문에서는 데이터 품질 평가 및 제어를 위하여 오류 데이터 형태를 분류하고, 이를 기반으로 데이터 품질 특성을 추출한다. 추출된 데이터 품질 특성을 측정하기 위해, 오류 데이터를 품질 속성으로 하는 데이터 품질 특성을 추출한다. 본 논문에서 제시하는 데이터 품질 메트릭은 지식 공학(knowledge engineering) 시스템이 최종 사용자에게 제공하는 데이터나 지식의 품질 측정 및 제어에 기준이 된다.

  • PDF

A Region Based Similar Image Retrieval using Histogram Comparison (히스토그램 비교법을 이용한 영역기반 유사 이미지 검색)

  • 임동혁;김창룡;정진완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.130-132
    • /
    • 2000
  • 주요 멀티미디어 자료인 이미지는 데이터 특성을 표현하기가 어렵고, 특성추출에서 얻은 데이터가 너무 고차원적이라 이를 저차원의 처리가능한 데이터로 변환하는 과정에서 많은 손실이 있다. 이미지의 특성값을 전체 이미지의 평균값으로 변경하여 저차원 데이터를 얻는 기존의 이미지 전체 특성추출기법이나 고정된 블록의 평균값으로 변경하여 저차원 데이터를 얻는 이미지 블록 특성추출기법은 유사 이미지의 검색이 부정확하다는 단점이 있다. 본 논문에서는 이미지를 가변적인 영역으로 나누어 특성값을 얻고, 히스토그램을 이용하여 효율적으로 유사 이미지를 찾는 영역기반 유사 이미지 검색기법을 제안하고 이를 구현하였다.

  • PDF

A study on Watershed Water Quality Management Plans Based on Big Data Analysis (빅데이터를 활용한 유역수질관리방안)

  • Jo, Bu Geon;Jung, Woo Suk;Kim, Young Do
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.90-90
    • /
    • 2021
  • 물 관리를 위해서는 물 관련 정보 혹은 데이터가 있어야 하며, 최근 효과적인 물관리를 위해서 스마트 물관리 혹은 빅데이터를 활용한 물관리가 자주 언급되고 있는 실정으로 물 관리에서도 일찍부터 빅데이터 활용의 중요성이 강조되어 왔으며, 유역관리는 본질적으로 다양한 정보의 수집 가공 처리를 필요로 하기 때문에 필수적으로 빅데이터 기술이 필요한 분야라 할 수 있다. 국내 물 환경관리는 대권역, 중권역 물환경관리계획, 수질오염총량제와 같이 오염원과 부하량을 기반으로 하여 목표수질의 달성여부를 통하여 유역을 관리하고 있다. 수질오염총량관리제도는 수질관리의 효율성, 각 행정 주체들의 책임성을 강화하여 목표수질을 달성하고자하는 제도로 환경과 개발을 고려한 국내에서의 핵심적 유역관리 제도이다. 이와 함께 각각의 특성을 가진 유역에서 유역특성을 반영할수 있는 유역관리방안이 필요하며 따라서 다양한 정보들의 활용하여 특성을 분석하는 빅데이터를 적용하여 유역의 특성을 반영한 유역관리방안을 연구하고자 한다. 수질, 기상, 수리, 수생태등 각 기관에서 제공하는 데이터를 융복합적으로 확보하여 유역 여건에 맞는 실현가능한 현실적인 물관리 대책이 필요하다. 이에 빅데이터 구축 및 데이터 분석을 적용하여 유역의 다양한 정보들을 활용하여 유역의 특성을 반영한 실효성 있는 유역에서의 수질관리방안의 마련하고자 한다.

  • PDF

A study on the Human Network Visualization on Mobile Phone for Characteristics of Relational Data (관계망 데이터 특성을 이용한 모바일 인맥 네트워크의 시각화에 관한 연구)

  • Jeong, Gye-Oun;Lee, Kyung-Won
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02b
    • /
    • pp.424-431
    • /
    • 2007
  • 본 연구는 관계망 시각화에 이용되는 데이터의 특성을 분석하고 그에 맞는 시각화 요소를 추출하여 시각화하는 것에 관한 연구이다. 사회 관계망 시각화는 점과 선을 기초 요소로 하여 점은 사회적 요소(actor), 선은 관계(relation)를 의미한다, 점과 선은 시각화에 사용되는 데이터의 특성에 따라 다양한 형태를 갖게 된다. 이 논문에서는 관계망 시각화에 사용되는 데이터의 특성을 데이터의 형태, 관계, 상태에 따라 분류하고, 각각의 특성에 맞는 관계망 시각화의 형태를 추출하고, 그에 따른 시각화 요소를 추출하였다. 이를 바탕으로 모바일 커뮤니케이션을 통해 형성되는 인맥 네트워크를 시각화함으로써, 인맥 네트워크 구성원 간의 친밀도를 효과적으로 파악할 수 있는 방법에 대해 제시하였다. 또한, 시각화의 결과를 이용하여 휴대전화로 인맥 네트워크를 유지, 관리하기 위한 서비스를 제안하였다. 이러한 연구는 데이터의 특성에 맞는 시각화의 요소를 추출하고, 데이터의 형태, 관계, 상태를 직관적으로 제공함으로써 사용자로 하여금 자신의 인맥 네트워크 구성원들의 친밀도와 관계 형태, 상태를 파악하여 자신의 인맥을 유지, 관리하고 보수할 수 있도록 한다.

  • PDF

Quality Characteristics of Public Open Data (공공개방데이터 품질 특성에 관한 연구)

  • Park, Go-Eun;Kim, Chang-Jae
    • Journal of Digital Convergence
    • /
    • v.13 no.10
    • /
    • pp.135-146
    • /
    • 2015
  • Public data open is one of the important tasks of Korea Government 3.0. By making open data available to the private sector, the goal is to create jobs, increase innovation and improve quality of life. Public data open is a policy that emphasized its importance worldwide. Open data should have adequate quality in order to achieve the object of the public. However, there are open data's quality problems due to the lack of data quality management and standardization. The purpose of this study is to derive data characteristics of public open data from existing researches. In addition, the model was modified and verified through a survey targeting the experts on public open data. The study indicates that public open data's quality characteristics as publicity, usability, reliability, suitability. This study is significant in that it suggests quality characteristics to improve the data quality and promote utilization of the open data.

A Data Migration Method Based on Characteristics of Data for Hierarchical Storage System (계층적 스토리지 시스템에서 데이터 특성을 이용한 데이터 이동기법)

  • Lee, Joo-Woon;Kim, Shin-Woo;Lee, Young-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.1675-1678
    • /
    • 2005
  • 최근에는 대량의 데이터를 저장 및 관리하기 위해서 3차 저장장치를 이용한 계층적 스토리지 시스템을 이용하고 있다. 이러한 계층적 스토리지 시스템에서는 모든 데이터에 같은 방식으로 저장장치들 간의 데이터를 이동하고 있는데, 이는 시스템에서의 데이터 이동이 빈번하게 일어나는 원인이 된다. 이러한 문제를 해결하기 위해서, 본 논문에서는 계층적 스토리지 시스템에서의 데이터 특성을 이용한 데이터 이동 기법을 제안한다. 이를 위해서 데이터를 일반 데이터, QoS 데이터 그리고 아카이브 데이터로 분류하고 각 데이터 타입에 따른 데이터 이동을 관리한다. 성능평가를 통해 데이터 특성을 고려한 데이터 이동 방법과 기존의 이동 방법을 비교 분석하여, 본 논문에서 제안한 이동 방법의 우수함을 보인다.

  • PDF

Application of Data Mining Technique in Characterizing the Scholastic Aptitude of the Students (데이터 마이닝 기법을 이용한 학습 능력 분석 시스템 개발)

  • 김범은;김덕희;원유집
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.144-146
    • /
    • 1999
  • 데이터 마이닝은 대량의 데이터로부터 데이터 내에 존재하는 관계, 패턴, 규칙 등을 찾아내고 모형화 함으로서 유용한 지식을 추출하는 방법이다. 데이터 마이닝을 이용한 이 시스템은 데이터를 비슷한 특성을 가지는 집단으로 분류하여 집단의 특성을 찾아내고 데이터 항목간의 연관성을 유출해 내어 학생들의 적절한 학습지도 영역을 찾아내는데 목적이 있다. 본 논문에서는 개발한 시스템에서 수학 학습 능력에 대한 특성을 도출해 내는 방법을 알아보고, 어떻게 기존의 학원의 역할을 대신할 수 있는지 검증한다.

  • PDF

An Analysis on the Data Distribution of Construction Equipment Operations - A Case on Muck Hauling System - (건설 장비 운영 데이터 분포 특성에 관한 연구 - 버력 처리 시스템을 중심으로 -)

  • Seo, Hyeong Beom;Jung, Won Ji;Kim, Kyoungmin;Kim, Kyong Ju
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.26 no.4D
    • /
    • pp.661-670
    • /
    • 2006
  • The utilization of simulation has been limited in planning construction process because it is difficult to collect data and build a model using simulation method. This study collects construction operation data and analyzes the characteristics of its distribution. Through the statistical analysis on the empirical data, this study identifies Beta distribution functions is one of the most proper in duplicating the characteristics of construction equipment operation data into a computer simulation. The information obtained in this study can support preparing input data for another simulation.