• 제목/요약/키워드: Public dataset

검색결과 254건 처리시간 0.02초

국내 도로 환경에 특화된 자율주행을 위한 멀티카메라 데이터 셋 구축 및 유효성 검증 (Construction and Effectiveness Evaluation of Multi Camera Dataset Specialized for Autonomous Driving in Domestic Road Environment)

  • 이진희;이재근;박재형;김제석;권순
    • 대한임베디드공학회논문지
    • /
    • 제17권5호
    • /
    • pp.273-280
    • /
    • 2022
  • Along with the advancement of deep learning technology, securing high-quality dataset for verification of developed technology is emerging as an important issue, and developing robust deep learning models to the domestic road environment is focused by many research groups. Especially, unlike expressways and automobile-only roads, in the complex city driving environment, various dynamic objects such as motorbikes, electric kickboards, large buses/truck, freight cars, pedestrians, and traffic lights are mixed in city road. In this paper, we built our dataset through multi camera-based processing (collection, refinement, and annotation) including the various objects in the city road and estimated quality and validity of our dataset by using YOLO-based model in object detection. Then, quantitative evaluation of our dataset is performed by comparing with the public dataset and qualitative evaluation of it is performed by comparing with experiment results using open platform. We generated our 2D dataset based on annotation rules of KITTI/COCO dataset, and compared the performance with the public dataset using the evaluation rules of KITTI/COCO dataset. As a result of comparison with public dataset, our dataset shows about 3 to 53% higher performance and thus the effectiveness of our dataset was validated.

최적의 객체 검출 모델 개발을 위한 특화 데이터 세트 추출 방법 (Specialized Dataset Extraction Method for Developing Optimal Pedestrian Detection Model )

  • 박천수
    • 반도체디스플레이기술학회지
    • /
    • 제23권3호
    • /
    • pp.135-139
    • /
    • 2024
  • Public datasets, which are freely available and often labeled, play a crucial role in training object detection models in computer vision. While public datasets are effective for developing general object detection models, they may not be ideal for specialized tasks. For specific object detection needs, it is more beneficial to create and use a dataset tailored to the target object. This paper proposes a method for extracting a target-specific dataset from public datasets to develop object detection models with superior performance for the target object. This approach not only improves detection accuracy, but also reduces training data requirements and complexity. We evaluate the performance of the proposed method using the latest object detection model YOLOv10.

  • PDF

행정정보데이터세트의 데이터 품질평가 연구 (A Study on Data Quality Evaluation of Administrative Information Dataset)

  • 송치호;임진희
    • 기록학연구
    • /
    • 제71호
    • /
    • pp.237-272
    • /
    • 2022
  • 2019년부터 국가기록원의 주도로 행정정보데이터세트 기록관리체계 구축 시범사업이 본격적으로 시작되었다. 2021년까지 3년에 걸친 사업의 결과를 바탕으로 개선된 행정정보데이터세트 관리방안이 공공기록물 관련 법령과 지침에 반영될 예정이다. 이를 통해 행정정보데이터세트는 본격적인 공공기록관리의 대상이 된다. 공공기록이 전자문서 중심으로 전환되었고 행정정보시스템의 데이터세트까지 본격적인 공공기록관리의 대상으로 포함되었지만, 기록을 구성하는 원 자료(raw data)로서의 데이터 자체의 품질 요건에 관한 연구는 아직 부족한 상황이다. 데이터 품질이 보장되지 않으면 데이터의 구성체이며 기록의 집합체인 데이터세트는 기록의 4대 속성 전체가 위협받게 된다. 더욱이 표준기록관리시스템의 규격을 고려하지 않고 기관 실무 부서의 다양한 요구를 반영하여 구축된 행정정보시스템의 데이터는 기록관리 관점에서 그 품질에 대한 신뢰성이 부족할 경우 공공기록 자체의 신뢰성을 확보할 수 없을 것이다. 본 연구는 2021년 국가기록원에서 진행한 "행정정보데이터세트 기록정보 서비스 및 활용모형 연구"에서 제시된 행정정보데이터세트 관리방안을 기반으로, 적극적으로 개념이 확장된 평가, 그중에서 데이터 품질평가에 관한 연구를 수행하였다. 범정부적으로 추진되고 있는 다양한 데이터, 특히 공공 데이터 관련 정책과 가이드를 참고하여 기록관리 차원에서의 품질평가 요건을 도출하고, 구체적인 지표를 제시해 보고자 한다. 이를 통해 향후 본격화될 행정정보데이터세트 기록관리에 도움이 되기를 기대한다.

데이터세트 기록관리를 위한 기록관의 역할 연구: KR 사업관리시스템 사례를 중심으로 (A Study on the Role of Records Center for Dataset Records Management: Focused on Case Study of KR Project Management System)

  • 이경남;최광훈;임진희
    • 정보관리학회지
    • /
    • 제38권3호
    • /
    • pp.263-285
    • /
    • 2021
  • 행정정보데이터세트 관리의 시급성과 중요성을 인식하고 실무에 적용 가능한 실효성 있는 방안을 연구하는 것이 필요하다. 특히 데이터세트 평가를 위해 데이터세트 기록을 식별하고 기록관리를 위한 기준을 정하는 일은 상세하고 구체적으로 제시될 필요가 있다. 본 연구는 공공기관에서 운영 중인 행정정보시스템 데이터세트를 대상으로 데이터세트 식별과 평가 과정을 설계하고 검증하였다. 이와 함께 평가 과정에서 기록관을 비롯한 참여 주체들의 역할을 제시하였다. 본 연구 결과를 통해 기록관에서 데이터세트 기록 관리를 위한 구체적이고 실질적인 프로세스 및 도구를 개발하기 위한 유용한 시사점을 도출하였다.

STAR-24K: A Public Dataset for Space Common Target Detection

  • Zhang, Chaoyan;Guo, Baolong;Liao, Nannan;Zhong, Qiuyun;Liu, Hengyan;Li, Cheng;Gong, Jianglei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.365-380
    • /
    • 2022
  • The target detection algorithm based on supervised learning is the current mainstream algorithm for target detection. A high-quality dataset is the prerequisite for the target detection algorithm to obtain good detection performance. The larger the number and quality of the dataset, the stronger the generalization ability of the model, that is, the dataset determines the upper limit of the model learning. The convolutional neural network optimizes the network parameters in a strong supervision method. The error is calculated by comparing the predicted frame with the manually labeled real frame, and then the error is passed into the network for continuous optimization. Strongly supervised learning mainly relies on a large number of images as models for continuous learning, so the number and quality of images directly affect the results of learning. This paper proposes a dataset STAR-24K (meaning a dataset for Space TArget Recognition with more than 24,000 images) for detecting common targets in space. Since there is currently no publicly available dataset for space target detection, we extracted some pictures from a series of channels such as pictures and videos released by the official websites of NASA (National Aeronautics and Space Administration) and ESA (The European Space Agency) and expanded them to 24,451 pictures. We evaluate popular object detection algorithms to build a benchmark. Our STAR-24K dataset is publicly available at https://github.com/Zzz-zcy/STAR-24K.

행정정보 데이터세트 기록 이관 시 데이터 보정 및 품질 개선 방법 연구 - 데이터웨어하우스 ETT 경험을 기반으로 (A Study on Data Adjustment and Quality Enhancement Method for Public Administrative Dataset Records in the Transfer Process-Based on the Experiences of Datawarehouses' ETT)

  • 임진희;조은희
    • 기록학연구
    • /
    • 제25호
    • /
    • pp.91-129
    • /
    • 2010
  • 공공 부문의 정보시스템 의존도가 점차 높아지면서 행정정보 시스템에 축적되는 데이터세트 기록의 관리와 활용에 관한 다양한 방안이 모색되고 있다. 행정정보 데이터세트를 아카이브 시스템이나 공유서버로 이관할 때 데이터 보정이나 품질 개선의 요구가 발생할 수 있다. 이 논문의 목적은 데이터웨어하우스 구축을 위해 데이터를 추출하여 변형 후 전송하는 절차와 방법을 참조하여 이관하는 행정정보 데이터세트 기록의 보정 및 품질 개선 방법을 제시하는 것이다. 이 논문에서는 데이터세트 기록 이관 시 검토할 필요가 있는 전형적인 데이터 보정 및 품질 개선 사례로 (1)추출 시 데이터세트 수량과 유효값 확인, (2)일관된 코드값의 부여를 위한 코드 변환, (3)복합정보의 컴포넌트화, (4)날짜데이터의 정밀도 결정, (5)데이터 표준화, (6)코드값의 설명정보 (7)메타데이터 확보 등 7가지를 제시하고 각각의 처리방법을 제안하고 있다. 데이터세트 기록 이관 시 적용하는 데이터 보정 및 품질 개선 기준은 데이터세트를 생산하는 행정정보시스템의 데이터 품질요건으로 활용할 수 있다.

인공지능 학습용 토공 건설장비 영상 데이터셋 구축 및 타당성 검토 (Building-up and Feasibility Study of Image Dataset of Field Construction Equipments for AI Training)

  • 나종호;신휴성;이재강;윤일동
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.99-107
    • /
    • 2023
  • 최근 건설 현장의 안전사고 비율은 전체 산업에서 가장 높은 비중을 차지한다. 인공지능 기술을 건설 현장에 접목하기 위해서는 기초 학습 자료로 활용될 수 있는 데이터셋 확보가 필수적이다. 본 논문에서는 실제 현장 확보를 통해 원천 데이터를 수집하였으며, 토목 현장에서 주로 운용되고 있는 주요 건설장비 객체를 선정하고 약 9만장의 정지영상 데이터셋 가공을 통해 최적의 학습 데이터셋 구축을 완료하였다. 또한, 객체 인식분야의 대표적인 모델인 YOLO를 활용하여 구축된 데이터의 검증 작업을 수행하였고 90 % 근접한 검출 성능을 확인해 데이터 신뢰성을 확보하였다. 본 연구에서 사용되는 학습 데이터셋은 공공데이터포털에서 활용 가능하도록 공개를 완료하였다. 본 데이터셋은 향후 건설안전 분야의 객체 인식 기술의 건설현장 적용을 위한 기반 데이터로 활용 가능하리라 판단된다.

폐교 사립대학 행정정보 데이터세트의 기록관리 방안 연구 (A Study on Managing Dataset in the Administration Information System of Closed Private Universities)

  • 이재영;정연경
    • 한국기록관리학회지
    • /
    • 제21권1호
    • /
    • pp.75-95
    • /
    • 2021
  • 오늘날 대학의 신입생 충원율이 급감하면서 대학의 폐교가 새로운 문제로 등장함에 따라 폐교대학의 기록물 관리가 새로운 이슈로 다뤄지고 있다. 최근 사립학교법이 개정되면서 폐교 기록물 관리를 위한 기본적인 법적 토대가 마련되었지만, 전자기록 중 행정정보 데이터세트에 관한 사항은 반영되지 못한 상태이다. 또한 공공기록물법의 개정에 따라 폐교대학의 행정정보 데이터세트도 공공기록물로서 관리되어야 하나 현재 폐교대학의 기록물 관리는 비전자기록물의 이관이나 정리에 관한 이슈가 주를 이룬다. 본 연구는 이러한 현실을 지적하며 폐교대학 행정정보 데이터세트를 공공기록물로서 관리하기 위한 방안을 도출하는 것에 중점을 두었다. 기본적으로 각종 참고문헌 및 기관의 내부자료를 바탕으로 데이터세트에 관한 이론적 논의를 검토하고 폐교대학 데이터세트 관리현황을 파악하였다. 최종적으로는 폐교대학 통합정보관리시스템의 데이터 관리를 위한 방안으로 기록화 대상 선정, 보존기간 책정, 행정정보 데이터세트 관리기준표 작성, 행정정보 데이터 세트 평가·삭제, 폐교대학 행정정보 데이터세트 종합관리체계 구축 등을 제시하였다.

행정정보 데이터세트 종합관리시스템의 서비스 방안 연구 (A Study on the Service of the Integrated Administrative Information Dataset Management System)

  • 김지혜;윤성호;양동민
    • 한국기록관리학회지
    • /
    • 제22권2호
    • /
    • pp.27-49
    • /
    • 2022
  • 2020년 「공공기록물에 관한 법률 시행령」 개정에 따라 행정정보 데이터세트 기록관리 방안이 법제화되며, 국가기록원은 행정정보 데이터세트 기록관리 업무를 지원하기 위해 행정정보 데이터세트 종합관리시스템을 구축할 계획을 밝혔다. 하지만 데이터세트와 관리 기준표의 특성을 고려한 구체적인 서비스 방안은 부재한 작금이다. 이에 본 논문은 국내·외 공공데이터 포털 및 기록관 웹사이트 14곳을 대상으로 데이터세트 서비스 현황을 비교 분석하고 시사점을 도출하여 행정정보 데이터세트 종합관리시스템에 적용 가능한 서비스 방안 6가지를 제안했다. 본 연구의 결과가 행정정보 데이터세트 활용 및 서비스 활성화로 이어지기를 기대한다.

공공기관 행정정보시스템 관련 단위과제 및 보존기간 책정 현황분석 (Current Status Analysis of Business Units and Retention Period Estimation related to Administrative Information Systems of Public Institutions)

  • 윤성호;유신성;최기쁨;오효정
    • 한국비블리아학회지
    • /
    • 제31권2호
    • /
    • pp.139-160
    • /
    • 2020
  • 『공공기록물 관리에 관한 법률』이 제정된 2007년부터 이미 행정정보시스템이 전자기록생산시스템에 포함되었으며, 행정정보 데이터세트는 전자기록물의 한 유형으로 관리 대상임이 명시되었다. 특히 최근 시행령의 개정으로 행정정보 데이터세트 관리기준표를 기반으로 한 기록관리가 법제화된 상황 속에서, 본 연구는 공공기관의 행정정보시스템과 관련된 단위과제를 분석하고 유형별 보존기간 책정 현황을 파악하였다. 이를 위해 국가기록원의 직접관리기관과 재난관리 책임기관 49개 기관으로부터 36개 공공기관의 기록물 분류체계를 수집하여 행정정보시스템과 관련된 단위과제를 판별하였다. 선별된 824개 단위과제를 유형에 따라 대·소분류로 구분하고 보존기간을 비교, 분석하였다. 본 연구를 통해 도출된 문제점과 개선방안이 향후 행정정보 데이터세트 관리기준표를 작성하기 위한 기초자료로 활용되길 기대한다.