• 제목/요약/키워드: 데이터품질관리

검색결과 855건 처리시간 0.044초

SOA 기반 서비스 사이의 오류 데이터 정제 서비스 개발 (Developing dirty data cleansing service between SOA-based services)

  • 지은미;최병주;이정원
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.829-840
    • /
    • 2007
  • 현재까지 오류 데이터를 정제하는 기법은 여러 소스로부터 대량의 데이터를 통합하여 데이터베이스에 저장되어 있는 데이터의 품질을 관리함으로써 의미 있는 정보를 추출하기 위함이었다. 급변하는 비즈니스 환경과 무한경쟁 사회에서 지속적으로 생존하려면 환경 변화에 빠르게 대처해야 한다. 최근 시스템의 요구사항이 복잡해짐에 따라 대규모의 분산 시스템을 통합 구축하기 위한 서비스 기반 구조 (Service Oriented Architecture)로 확산되고 있으며, 여기에서도 각 서비스간의 데이터 정제기법을 통한 신뢰성 있는 데이터 교환이 필수적이다. 따라서 본 논문에서는 서비스들이 하나의 시스템으로 통합되는 과정에서 이벤트를 통해 서비스 간에 전송되는 XML데이터의 품질 관리를 수행하여, 이미 통합되어 저장된 데이터베이스 데이터의 오류를 탐지하여 정제하는 것이 아니라 상호 작용하는 서비스간의 데이터 정제에 초점을 두고 SOA를 기반으로 하는 오류 데이터 정제 서비스를 개발한다.

MGCP Parameter를 이용한 VoIP서비스 음성품질 관리 시스템 설계 및 구현 (Design and Implementation of Voice Quality Management System by using MGCP parameter in VoIP Service)

  • 류내원;황부현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.325-327
    • /
    • 2004
  • VoIP는 음성 및 데이터 통합 뿐만 아니라 차세대 네트웍 등의 기반이 되는 기술이며, 인터넷전화 / IP Telephony, 화상회의, 메신저 서비스 등 여러 서비스에 활용되고 있다. 이러한 VoIP 서비스 제공시에 가장 중요시되는 부분이 음성품질이며 이를 측정 및 관리하는 기술이 필수적으로 필요하다. 지금까지는 품질측정장비를 가지고 직접 측정하는 것이 전부였으나 본 연구는 IETF의 VoIP 표준 프로토콜인 MGCP중 파라미터 값을 이용하여 ITU-T의 음성품질 기준인 R factor(G.107)를 계산해 내고 중앙에서 모든 단말 및 사용자들의 실제 발생한 통화에 대한 음성품질을 관리할 수 있는 시스템을 설계 및 구현한다.

  • PDF

정량적 분석 기법을 적용한 IT 서비스 품질 개선 모형 개발 (The Development of the Model for Enhancing the Quality of IT Services Applying the Quantitative Analysis)

  • 서성웅;홍성용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(D)
    • /
    • pp.202-205
    • /
    • 2011
  • 서비스 제공자와 사용자 간 이해관계를 유지하고, 제공되는 IT 서비스의 수준을 개선하기 위해서 서비스 수준관리가 필요하다. 그러나 무형의 IT 서비스는 정성적인 방법으로 평가될 수밖에 없는 한계가 존재 한다. 따라서 본 연구에서는 서비스 사용자가 동의할 수 있는 정량적 데이터를 바탕으로 서비스 품질을 향상시키는 개선 모형을 제시하였다. 이를 위해 기존 연구를 살펴보고 서비스 수준 관리 체계를 정립하였다. 본 논문에서 제시하고 있는 서비스 품질 개선 모형은 크게 4가지 방법으로 나누어 설명하였다. 첫 번째 우선관리지표를 선정하기 위해 AHP기법을 활용하였고, 두 번째 통계적 관리기법인 관리도를 이용하여 서비스 기대수준을 정의하는 방법을 제시하였다. 그리고 세 번째 측정되는 서비스 수준의 이상 유무 또는 이상 징후를 발견할 수 있는 관리도 사용방법을 설명하였다. 마지막 네 번째는 이상 원인을 해결한 후 서비스 기대수준을 재조정하는 방법을 설명하였다. 향후 연구 결과를 실제 조직에 적용시켜 검증함으로써 완성도를 높여 나감은 물론, 원인 분석 및 해결 방안에 대한 구체적인 대안을 제시하는 연구가 수행되어야 할 것이다.

공급체인관리에서의 지능형 생산체제 설계 (Design of Intelligent Production System in the Supply Chain Management)

  • 이장희
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 2006년도 추계 학술대회
    • /
    • pp.151-154
    • /
    • 2006
  • 본 연구는 공급사슬관리하에서 부품 및 원재료 공급기업에서 고객기업인 제조기업의 주문 사항과 공급기업내 생산관련 제약사항을 동시에 고려하여 최적의 생산 체제를 구축할 수 있는 방법론을 제시한다. 본 연구에서는 수주 및 비용 데이터베이스로부터 주문 및 생산관련 데이터를 SOM 신경망분석을 통해 그룹핑하고 고객기업군별로 특성분석을 통해 이에 맞는 생산체제를 구축할 것을 제안하였다. 공급사슬관리 환경하에서 원재료/부품 공급기업이 고객기업의 주문 요구와 내부 생산상의 제약을 동시에 고려함으로써 SCM 적용 성과를 극대화할 수 있다는 점에서 본 연구는 의미가 있다.

  • PDF

머신러닝 알고리즘을 이용한 결측 강우 데이터 추정에 관한 연구 (Imputation of missing precipitation data using machine learning algorithms)

  • 한희찬
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.320-320
    • /
    • 2023
  • 강우 데이터는 수문기상, 환경, 농업, 자연재해, 그리고 수자원 시스템 분야에서 가장 필수적인 기본 요소 중 하나이다. 또한 강우 데이터는 수문학적 분석에서 활용되는 필수 입력 자료 중 하나로 관측 데이터의 품질에 따라 수문 모형을 이용한 모의 결과물의 정확도가 결정된다고 할 수 있다. 따라서, 강우 관측소별로 강우 데이터의 품질을 어떻게 관리하느냐에 따라 수문 모형의 활용 범위 및 수자원 관리의 효율성이 결정될 수 있다. 강우의 시공간적 변동성은 수 많은 인자들과 직간접적으로 연계되어 있기 때문에 미계측 강우 자료에 대해 직접 관측이 아닌 수치 모형을 이용하여 강우의 발생과 강우량을 산정하는 것은 매우 복잡한 과제 중 하나이다. 현재 국내에서 운용되고 있는 강우 관측소의 경우에도 미계측 된 강우 데이터가 존재함으로써 강우 데이터의 활용에 제한이 생기는 경우가 있다. 따라서, 이러한 미계측 데이터의 추정 및 보완은 보다 효과적인 수재해 방지, 수자원 관리를 위한 필수 과제 중 하나이다. 일반적으로, 미계측 강우를 산정하기 위해서 Kriging, Thiessen, 등우선법, 그리고 역거리 관측법 등 다양한 수문학적 방법들이 적용되고 있다. 이러한 방법들은 산악효과나 강우 관측소의 분포 상태 등을 고려하지 못하기 때문에 측정하는 지역에 따라 강우 추정 오차가 커질 수 있다는 한계가 있다. 최근에는 데이터 관측 시스템과 빅데이터 기술의 발전과 활용 가능한 데이터의 양이 증가함에 따라 머신러닝을 활용한 사례가 증가하고 있다. 머신러닝은 데이터 사이의 관계를 기반으로 분류, 회귀, 그리고 예측 문제에 주로 사용되는 기법 중 하나이다. 따라서, 본 연구에서는 광주광역시 지역에 위치한 주요 강우 관측 지점들을 대상으로 미계측 된 시강우 데이터를 추정 및 복원하고자 한다. 여기서 데이터 추정 기술이란 미계측 강우의 발생 유무 및 강우량을 추정할 수 있는 기술을 의미한다. 이를 위해 대표적인 머신러닝 알고리즘인 인공신경망(Artificial Neural Network) 및 랜덤포레스트(Random Forest)를 적용하였다.

  • PDF

데이터 품질을 고려한 국가R&D정보 데이터베이스의 통합 사례 연구 - NTIS 데이터베이스 통합 사례 (A Data Cleansing Strategy for Improving Data Quality of National R&D Information - Case Study of NTIS)

  • 신성호;윤영준;양명석;김진만;손강렬
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.119-130
    • /
    • 2011
  • 데이터 품질관리 관점에서 볼 때, 데이터의 품질은 품질정책, 품질조직, 업무프로세스, 업무규칙 등 여러 요인에 의해 영향을 받는다. 이중에서도 업무규칙은 실제 데이터를 조작하는 행위의 지침이 되는 것으로써 데이터 품질에 직접적인 영향을 미친다. 여러 기관의 데이터베이스를 통합하여 단일의 데이터베이스를 구축하는 경우에는 더 신중하게 업무규칙을 수립할 필요가 있다. 분산된 데이터베이스 내에 있는 데이터를 단일의 데이터베이스로 통합한다는 것은 단순히 데이터의 통합만을 의미하는 것이 아니라 상이한 스키마, 코드 체계, 데이터 표준 등을 사전에 고려해야 함을 의미한다. 이런 요소들을 고려하더라도 데이터 자체는 형식, 단위, 표현 등에 따라서 다양한 모습을 가진다. 결국 데이터베이스의 구조적인 문제와 데이터 자체의 의미적인 문제가 데이터베이스 통합과 통합된 데이터베이스 내 데이터의 품질 제고를 위한 선결 과제라 할 수 있다. 이러한 문제들을 해결하기 위해서는 먼저 통합 시 통합 모델의 설계가 필요하고, 통합된 데이터베이스의 데이터에 대한 정제가 필요하다. 범부처적으로 분산되어 있는 국가R&D정보를 수집하여 서비스하는 국가과학기술종합정보서비스(NTIS)도 여러 기관에 존재하는 데이터베이스를 연계 통합하여 단일의 데이터베이스를 구축하였다. NTIS의 사례를 통해 체계적인 통합 모델 수립과 정제에 의해 통합된 데이터베이스의 데이터는 그렇지 않은 데이터보다 정확도 측면에서 품질이 제고되었음이 입증되었다.

과학기술분야 기관 연구데이터 리포지터리 운영 활성화 방안 연구 (A Study on Strategies to Promote the Activation of Institutional Research Data Repositories in the Field of Science and Technology)

  • 김예현;김지현
    • 한국비블리아학회지
    • /
    • 제34권3호
    • /
    • pp.109-134
    • /
    • 2023
  • 본 연구의 목적은 과학기술분야 연구기관에서 운영되는 기관 연구데이터 리포지터리 운영 현황을 파악하고 활성화 방안을 제시하는 것에 있다. 이를 위해 문헌 연구와 사례 분석, 국내외 기관 리포지터리 담당자와의 인터뷰를 수행하였으며, 리포지터리 규정 및 정책 수립, 연구데이터 공유 인식 개선, 연구데이터 품질 관리 강화를 골자로 하는 기관 연구데이터 리포지터리 운영 활성화 방안을 제안하였다. 첫째, 리포지터리 규정 및 정책 수립 측면에서는 현재 연구데이터와 관련한 규정인 국가연구개발정보 처리기준의 지위 향상과 리포지터리 근거 규정의 명시가 필요하다고 보았다. 둘째, 연구데이터 공유 인식 개선 측면에서 전반적인 연구데이터 교육과 우수 사례 발굴의 필요성을 제안하였다. 셋째, 연구데이터 품질 관리 강화 측면에서 연구자-담당자-위원회의 상호작용과 표준화 작업, 장기 보존을 위한 준비의 필요성을 제안하였다.

기계학습에 유효한 데이터 요건 및 선별: 공공데이터포털 제공 데이터 사례를 통해 (Valid Data Conditions and Discrimination for Machine Learning: Case study on Dataset in the Public Data Portal)

  • 오효정;윤보현
    • 사물인터넷융복합논문지
    • /
    • 제8권1호
    • /
    • pp.37-43
    • /
    • 2022
  • 인공지능 기술의 가장 큰 근간은 학습 가능한 데이터이다. 최근 정부나 사기업에서 수집·생산하는 데이터의 종류와 양이 기하급수적으로 증가하고 있지만, 실제 기계학습에 활용 가능한 데이터의 확보로는 아직까지 이어지지 않고 있다. 이에 본 연구에서는 기계학습에 실제 활용 가능한 데이터가 갖추어야 할 조건에 대해 논의하고, 실제 사례연구를 통해 데이터 품질을 저하시키는 요인을 파악한다. 이를 위해 공공빅데이터를 활용해 예측 모델을 개발한 대표사례를 선정, 공공데이터포털로부터 실제 문제 해결을 위한 데이터를 수집 후 데이터 품질을 확인하였다. 이를 통해 유효한 데이터 선별 기준을 적용하고 후처리한 결과와의 차이를 보인다. 본 연구의 궁극적인 목적은 인공지능의 핵심인 기계학습 기술 개발에 앞서 가장 근본적으로 선결되어야 할 데이터 품질을 관리하고 유효한 데이터를 축적하기 위한 기반 마련에 있다.

재난대응 의사결정 지원을 위한 분산정보 공유형 인벤토리 프로토타입 개발 방안 연구 (A Study on Development of An Integrated Inventory Management Prototype System for Decision Making in the Nature Disaster)

  • 최수영;강수명;김진만;조윤원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.633-633
    • /
    • 2015
  • 재해의 발생 빈도 증가와 불규칙성, 대형화 추세에 따른 SOC 시설물 피해가 증가함에 따라 유관 기관의 재난/재해 정보 수집은 지속적으로 이루어지고 있다. 그러나 각 기관별로 자료가 분산 관리됨에 따라 선제적 재해대응 체계는 갖추어지지 못하고 있는 실정이다. 이에, 예방적 유지관리체계 구현을 위한 분산정보 공유형 재해대응 인벤토리를 구축하고자 한다. 본 인벤토리는 3차원 공간정보를 기반으로 분산 관리되고 있는 재난/재해 관련 정보를 수집하고 이렇게 수집된 데이터들의 통합적 관리를 위해 데이터 표준화를 거쳐 선제적 재해 대응의 원천 데이터로 활용될 수 있다. 본 연구에서는 인벤토리 관리/연계 모듈의 설계 방안을 마련하고자 국내외 인벤토리 관련 시스템 현황조사를 진행하고 관리 및 연계 대상 데이터의 항목을 선정하고 내용을 분류하였다. 또한, 시스템 요구사항을 수집하고 정의하고 관리/연계 모듈의 세부기능 정의를 하였다. 뿐만아니라, 프로토타입 개발을 위해 서비스 제공 형태와 데이터 제공 방식을 결정하였다. 본 연구에서 개발하고 있는 프로토타입은 Web Service 기반의 REST 방식으로 데이터를 제공할 것이며, 3차원 공간 정보를 기반으로 하고 있다. 본 연구에서는 프로토타입 개발을 위해 기본 주재도를 제작하고 연구 지역의 시설물 정보를 구축하였다. 분산정보 공유형 재해대응 인벤토리 시스템은 분산 관리되고 있는 재난/재해 정보들을 자료 송/수신 모듈을 통하여 수집하고 데이터 필터링 모듈에서 수집된 자료의 표준화와 품질측정을 진행하여 데이터의 신뢰도를 향상 시킬 것이다. 또한, 데이터 관리 모듈을 이용하여 공간정보 데이터를 검증하고 최적화 관리를 할 수 있도록 하며, 시스템 관리 모듈에서 유관기관에서 유입되는 자료들을 관리하고자 한다. 이렇게 구축된 인벤토리 시스템은 선제적 재해대응 의사결정의 원천 데이터를 제공하고 SOC 시설물의 유지관리에 활용될 수 있을 것으로 판단된다.

  • PDF

요구사항단계의 결함관리를 위한 방법론에 관한 연구 (A Study on the Methodology for Defect Management in the Requirements Stage)

  • 이은서
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.205-212
    • /
    • 2020
  • 결함은 소프트웨어의 품질에서 중요한 요소가 된다. 결함을 관리하기 위하여 검색과 분류의 추가적인 정보를 제안하고자 한다. 추가적인 정보는 체계적인 분류체계와 연산방법을 제시한다. 본 연구에서는 결함관리를 위하여 요구사항 분석 단계의 추가적인 정보를 제시하고자 한다.