• 제목/요약/키워드: 데이터품질 평가모델

검색결과 192건 처리시간 0.026초

영역별 화소값 분석을 통한 흉부 X선 오픈 데이터셋 품질 평가 (Quality Evaluation of Chest X-ray Open Dataset through Pixel Value Analysis by Region)

  • 최현진;배수빈;선주성;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.614-617
    • /
    • 2022
  • 인공지능의 발전으로 의료영상 분야에서 딥러닝 기반 질병 진단 연구가 활발하다. 그러나 모델 개발 시 학습 데이터의 개수와 품질은 매우 중요한데, 의료 분야 특성상 접근 가능한 데이터셋이 적으며 오픈 데이터셋은 서로 다른 기관에서 배포되거나 웹상에서 수집된 것으로 진단에 적합한 품질을 기대하기 어렵다. 또한, 기존 연구는 데이터셋이 학습에 적합한지에 대한 품질검증 없이 사용한다. 따라서 본 논문에서는 임상에서 사용하는 화질 평가 요소에 근거를 두고 영역별 화소값 분석을 통한 흉부 X선 영상 품질 평가 기법을 제안한다. 오픈 데이터셋 JSRT, Chest14와 국내 A 병원 데이터셋 AUH에 제안한 기법을 적용한 결과 민감도 91.5%, 특이도 96.1%의 우수한 성능을 확인하였다.

국제표준 ISO/IEC 25023 을 기반으로 한 소프트웨어 품질평가 (The Software Quality Testing on the basis of the International Standard ISO/IEC 25023)

  • 정혜정
    • 한국융합학회논문지
    • /
    • 제7권6호
    • /
    • pp.35-41
    • /
    • 2016
  • 소프트웨어의 중요성이 높아지면서 소프트웨어 품질평가에 대한 관심이 높아지고 있다. 본 연구에서는 소프트웨어 품질 평가를 위한 국제 표준 문서를 비교 분석하고 테스트 데이터 분석을 통한 평가 방안을 제시한다. 국제표준 ISO/IEC 9126-2의 평가 모델과 ISO/IEC 25023의 평가 모델에 대한 차이점을 비교했다. ISO/IEC 25023의 평가모델인 8가지 품질 특성, 즉 기능성, 신뢰성, 사용성, 유지보수성, 이식성, 효율성, 상호운영성, 보안성적인 측면에서 평가 메트릭을 제시했다. 실제 테스트를 통해 얻어진 331개 자료를 분석해서 테스트 데이터의 발견된 오류 특징을 파악했다. 또한 결함 자료를 분석하고 차이점을 파악했다. 테스트데이터가 남녀에 따라서 시험 일수나 발견하는 품질 특성별 오류의 수에는 차이가 있음을 증명하고 시험일수를 기능성, 사용성, 성별을 가지고 예측했으며, 제품의 종류에 따라서도 오류수에 차이가 있음을 증명했다.

Verification of the Suitability of Fine Dust and Air Quality Management Systems Based on Artificial Intelligence Evaluation Models

  • Heungsup Sim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.165-170
    • /
    • 2024
  • 본 연구는 인공지능 평가 모델을 활용하여 양주시의 대기질 관리 시스템의 정확성을 검증하는 데 목적이 있다. 환경부 미세먼지 공공 데이터와 양주시 대기질 관리 시스템 데이터를 비교하여 미세먼지 데이터의 정합성과 신뢰성을 평가하였다, 이를 위해 데이터의 완전성, 유일성, 유효성, 일관성, 정확성, 무결성을 분석하였다. 데이터의 정합성을 비교하기 위해 탐색적 통계 분석을 활용하였다. 분석 결과, AI 기반 데이터 품질 지수 평가 결과, 두 데이터 세트 간에 통계적으로 유의미한 차이가 없음을 확인하였다. AI 기반 알고리즘 중 랜덤 포레스트 모델이 가장 높은 예측 정확도를 보였으며, ROC 커브와 AUC를 통해 예측 성능을 평가하였다. 특히, 랜덤 포레스트 모델은 대기질 관리 시스템의 최적화에 유용한 모델로 확인되었으며, 미세먼지 데이터의 신뢰성과 적합성을 AI 기반 모델 성능 평가로 활용할 수 있음을 확인하였다.

제조 기반 IIoT 환경에서 데이터 분석 소프트웨어의 품질 평가를 위한 모델 (Model for Quality Assessment of Data Analytics Software in Manufacturing-Based IIoT Environments)

  • 최종석;신용태
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권4호
    • /
    • pp.292-299
    • /
    • 2021
  • IT기술의 발달로 제조 기반의 IIoT환경을 기반으로 한 데이터 마이닝 형태의 소프트웨어들이 점차 늘어나고 있다. 그러나 빅데이터 및 데이터마이닝을 진행해야 하는 대량의 데이터를 가지는 제조 기업의 소프트웨어 특성상 일반 소프트웨어와 동일한 형태로 소프트웨어 품질을 평가하기 힘든 실정이다. 또한 이기종간의 장비 및 소프트웨어가 혼재된 제조 기반의 환경에서 특히 기존의 품질 특성을 적용하여 사용되는 소프트웨어에 대한 품질 판단을 진행하기 어렵다. 본 논문에서는 제조 기반의 특성을 조사하고 이에 맞는 소프트웨어 품질 평가 모델을 개발하여 평가를 실시하고자 한다.

도서관의 오픈 데이터 품질측정모델 개발 (Developing an Assessment Model of Library Open Data Quality)

  • 박진호
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.33-59
    • /
    • 2018
  • 본 연구는 최근 열린 정부 데이터에 대한 다차원 척도, 모델 개발 연구가 시작되고 있으나, 도서관에서는 관련 연구가 부족하다는 점을 고려하여 도서관에 적용할 수 있는 오픈 데이터 품질측정 모델개발을 목적으로 하였다. 본 연구는 모델개발과 모델평가 두 단계로 수행하였다. 모델개발은 델파이 기법을 적용하였으며, 모델평가는 도서관 오픈 데이터 이용자를 대상으로 설문조사를 실시하여 모델의 타당도와 신뢰도를 측정하였다. 모델개발은 델파이 기법을 적용하여 총 4차례 수행하여 3개 차원, 18개 요인, 133개 측정요소로 구성된 모델을 도출하였다. 모델평가는 델파이 기법으로 완성한 모델을 도서관 오픈 데이터 이용자인 국내 외 사서, 개발자, 오픈 데이터 활동가를 대상으로 적합성 설문조사를 실시하여 모델의 타당도와 신뢰도를 검증하였다. 그 결과 당초 18개 요인, 133개 측정요소는 15개 요인, 54개 측정요소가 타당성을 확보한 것으로 나타났다. 신뢰도는 차원별, 측정요인별로 모두 기준치인 0.6 이상의 결과를 보여주고 있어 높은 신뢰도를 확보한 것으로 나타났다. 모델평가를 통한 이용자 타당도, 신뢰도 분석으로 전문가가 구성한 평가모델은 현장에서 즉시 활용될 수 있을 정도로 정제되었다.

디지털 트윈국토 건물 데이터 품질 표준 개발을 위한 항목 도출에 관한 연구 (A Study on the Derivation of Items for Development of Data Quality Standard for 3D Building Data in National Digital Twin)

  • 김병선;이희석;홍상기
    • 지적과 국토정보
    • /
    • 제52권1호
    • /
    • pp.37-55
    • /
    • 2022
  • 본 연구는 디지털 트윈국토 건물 데이터 품질 표준을 개발하기 위한 품질 항목 모델을 제시하는데 목적이 있다. 이를 위해 3차원 공간정보 오류의 특징과 품질 표준 필요성에 대해 도출하였으며, 디지털 트윈국토 건물 품질 개발에 필요한 데이터 모델 표준과 공간정보 품질 표준에 대해 분석하였다. 이러한 내용을 토대로 디지털 트윈국토 건물 데이터의 품질 평가 범위, 품질 표준 확장 요소(기하 무결성, 기하 충실도, 위치 정확성, 시맨틱 분류 정확성) 및 품질 항목 모델(안)을 제시하였다. 본 연구에서 제안한 디지털 트윈국토 건물 품질 항목모델은 디지털 트윈국토 품질 표준 개발은 물론 이와 관련된 다양한 디지털 트윈국토 공간정보표준 개발에 기여할 것으로 판단된다.

공공데이터를 활용한 3차원 공간정보 객체의 수직위치 정확도 분석 (An Analysis of Vertical Position Accuracy for the Three-Dimensional Spatial Data Object Utilizing the Public Information)

  • 김정택;이수현;김종일;배상원
    • 대한공간정보학회지
    • /
    • 제22권3호
    • /
    • pp.137-143
    • /
    • 2014
  • 최근 정부는 정부3.0이라는 새로운 정부운영의 패러다임으로 공공데이터를 적극적으로 개방하고 공유하는 정책을 펼치고 있다. 이와 함께 국토교통부에서는 국가공간정보 및 3차원건물, 영상지도를 포함한 다양한 콘텐츠를 일반인에게 제공하는 공간정보 오픈플랫폼 통합지도서비스(이하 브이월드)를 운영하고 있다. W3C재단의 오픈데이터 현황 보고서(2013)의 평가결과 우리나라는 정부의 정책적 지원 및 계획 부분에서는 긍정적인 결과를 나타낸 반면 데이터 관리 분야에서 취약하여 이에 대한 품질개선이 필요한 실정이다. 또한, 3차원 공간정보 객체 데이터(이하 3차원 모델)의 경우 데이터 구축에 활용한 디지털항공사진영상의 최신성이 부족하여 데이터의 현행화가 필요하다. 이에 본 논문에서는 3차원 모델의 품질요소인 수직위치 정확도에 대해 공공데이터이며, 실측 데이터인 건축물 대장의 높이 데이터를 기준으로 국내표준 품질평가 기법을 적용하여 데이터 품질을 측정하고, 측정오차에 대한 원인을 분석하여 공공데이터를 활용한 3차원 모델의 수직위치 정확도 향상 및 최신성의 유지 가능성을 제시하고자 한다. 연구 수행 결과 건축물대장의 높이 값을 품질평가 기준으로 적용하였을 경우 수직위치 정확도가 향상되는 것을 확인하였으며, 건축물 대장의 재건축, 증축 정보를 활용할 경우 3차원 모델의 최신성의 유지를 할 수 있음을 확인하였다.

지문인식 시스템의 효율성에 관한 품질평가 모델 (Quality Evaluation Model about Efficiency for Fingerprint Recognition System)

  • 이하용;김중규
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.215-221
    • /
    • 2014
  • 지문인식시스템은 사용자의 지문을 전자적으로 읽어 미리 입력된 데이터와 비교해 본인 여부를 판별하여 사용자의 신분을 확인하는 시스템이다. 지문인식시스템의 성능은 지문 인식에 걸리는 시간이나 정확도 등에 좌우된다. 본 논문에서는 지문인식시스템의 품질 수준을 평가하기 위해 ISO 품질평가 표준을 기반으로 효율성에 관한 평가모델을 구축하였다. 본 연구를 통해 표준에 입각한 평가기준 구축과 활용에 기여할 수 있을 것으로 기대한다.

데이터 자산 가치 평가 모델 리뷰 (Data Asset Valuation Model Review)

  • 김옥기;박정;박천웅;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.153-160
    • /
    • 2021
  • 본 연구는 기업이나 기관에서 보유한 데이터의 가치 평가에 가장 많이 활용되는 소득(이익) 접근 모델의 선행 연구를 조사하고 모델의 핵심요인과 데이터 자산 가치 평가 과정의 고려사항에 대해 논의하였다. 이를 통해 데이터 자산의 공유가능성, 활용기간이 다른 기업의 자산들과 다른 특성이 있음을 규명하였다. 또한 데이터의 가치는 품질의 영향을 크게 받기에 데이터의 적시성, 정확성과 같은 다양한 관점을 검토해야하며, 사용자의 용도와 사용능력 및 가치 사슬을 총체적으로 검토하여 데이터 자산의 가치를 평가해야 함을 도출하였다. 향후 연구방향으로는 실제 현업에 적용되어야 할 모델에 대한 지속적인 연구개발 및 회계법 개정을 제언하였다.

A Study on the Domain Discrimination Model of CSV Format Public Open Data

  • Ha-Na Jeong;Jae-Woong Kim;Young-Suk Chung
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.129-136
    • /
    • 2023
  • 정부는 공공데이터 품질관리 수준평가를 진행하여 공공 개방데이터의 품질관리를 진행하고 있다. 공공 개방데이터는 XML, JSON, CSV 등 여러 오픈포맷 형태로 제공되며 CSV 형식이 대다수를 차지한다. 이러한 CSV 형식의 공공 개방데이터 품질진단 시 품질진단 담당자가 공공 개방데이터 파일의 필드명과 필드 내 데이터에 의존하여 필드 별 도메인을 판단하여 진단한다. 그러나 대량의 개방 데이터 파일을 대상으로 품질진단을 수행하기 때문에 많은 시간이 소요된다. 또한 의미 파악이 어려운 필드의 경우 품질진단의 정확성이 품질진단 담당자의 데이터 이해도 역량의 영향을 받는다. 본 논문은 필드명과 데이터 분포 통계를 이용한 CSV 형식 공공 개방데이터의 도메인 판별 모델을 제안하여 품질진단 결과가 품질진단 담당자의 역량에 좌지우지 되지 않도록 일관성과 정확성을 보장하고 진단 소요 시간 단축을 지원한다. 본 논문의 모델 적용 결과 행정안전부에서 제공하는 파일형식 개방데이터 진단도구보다 2.8% 높은 약 77%의 정답률을 보였다. 이를 통해 공공데이터 품질관리 수준진단·평가에 제안 모델 적용 시 정확성을 향상시킬 수 있을 것으로 기대한다.