• 제목/요약/키워드: 데이터세트 기술

검색결과 174건 처리시간 0.027초

행정정보 데이터세트 기록관리 환경개선 모델 연구: 의료영상저장전송시스템(PACS)의 데이터세트를 중심으로 (A Study on the Improvement Model of Administrative Information Dataset Records Management Environment: Focused on the Dataset of Picture Archiving and Communication System)

  • 이선경
    • 한국기록관리학회지
    • /
    • 제22권2호
    • /
    • pp.51-73
    • /
    • 2022
  • 현재 행정정보 데이터세트 기록관리 실행방안은 마련되었으나 약 1.3%(EA 포털 등록 시스템: 16,199개, 컨설팅 시스템: 214개)의 사례를 적용하여 다양한 행정정보시스템에 대한 특수성을 분석하고 합리적 수준의 관리기준표를 작성하기에는 한계가 있다. 본 연구는 행정정보 데이터세트에 있어 기록관리 환경의 중요성을 인식하는 것에서 출발하였다. 의료영상저장전송시스템(PACS)의 관리기준표 6개 영역을 세 개의 그룹으로 나누고 기술(description)된 정보를 기초로 현재의 기록관리 환경을 분석하였다. 그 결과 현장에서 데이터세트 기록관리의 효과를 높이기 위한 체계적인 환경개선 모델을 제안하였다. 다양한 기관의 데이터세트 기록관리 환경 중 하나의 사례 분석이라는 한계는 있으나 기록관리 연구의 지평을 넓히는데 도움이 되고자 한다.

행정정보 데이터세트 이관도구 SIARD_KR의 개선방안 (Improvement of Administration Information Dataset Transfer Tools 'SIARD_KR')

  • 변우영;임진희
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.195-217
    • /
    • 2022
  • SIARD_KR은 스위스 연방 기록보존소에서 개발한 관계형 데이터베이스 컨텐츠의 장기보존에 이용하는 기술인 SIARD를 우리나라의 실정에 맞게 일부 수정한 행정정보 데이터세트 보존 도구이다. 기존의 선행연구는 SIARD가 얼마나 관계형 데이터베이스안에 들어있는 모든 데이터를 손실 없이 잘 추출할 수 있는지에 초점이 맞춰져 있다. 하지만 데이터베이스에 들어있는 데이터 전부가 의미 있는 정보, 즉 행정정보 데이터세트는 아니다. 따라서 이 논문은 SIARD_KR이 행정정보 데이터세트의 특성을 반영하고 있는가에 대한 문제의식에서 시작한다. SIARD_KR이 단순히 DB에 저장된 데이터를 추출하는 도구가 아니고 의미 있는 정보만을 식별하여 추출할 수 있을지, 본래의 시스템에서 유리되어도 의미 있는 정보를 유지할 수 있을지 확인하려 한다. 본 논문은 SIARD_KR의 구조를 분석하고, 예상되는 문제점을 도출하여 그에 대한 개선방안을 제시하는 것을 목적으로 한다.

웹 크롤링을 사용한 자동화된 이미지 분류 모델 (Automated Image Classification Model Using Web Crawling)

  • 이주혁;김미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.719-722
    • /
    • 2021
  • 최근 딥러닝은 이미지 인식, 음성 인식 등 여러 분야에서 고려되고 있는 기술이다. 그러나 딥러닝 기술을 이용하기 위해서는 대형데이터 세트가 필요하나 이를 구축하기 힘들고 많은 시간이 필요하다는 문제점이 있다. 이에, 본 논문에서는 웹 크롤링을 통해 사용자가 원하는 카테고리의 이미지 데이터 세트를 수집하고 수집한 데이터들을 전처리 과정을 통해 딥러닝 모델에 입력할 수 있는 데이터 세트의 구축을 자동화하며, 전이학습을 통해서 적은 훈련 시간과 높은 정확도를 얻을 수 있는 이미지 분류모델을 제안한다.

해외 도서관 링크드 데이터 구축의 최근 동향 연구 - 발행 데이터세트, 재사용 어휘집, 인터링킹 외부 데이터세트를 중심으로 - (A Study on Recent Trends in Building Linked Data for Overseas Libraries: Focusing on Published Datasets, Reused Vocabulary, and Interlinked External Datasets)

  • 이성숙
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.5-28
    • /
    • 2022
  • 이 연구에서는 해외 도서관의 LD 구축 사례를 발행 데이터세트, 재사용 어휘집, 인터링킹 외부 데이터세트를 중심으로 분석하고, 분석 결과를 토대로 국내도서관의 LD 구축 방안에 대한 기초적인 데이터를 확보하였다. 21개 해외 도서관 사례 분석 결과, 해외 도서관은 충실한 전거 LD를 구축하였고, 발행 LD를 활용한 새로운 서비스를 진행하였다. 이를 위해 해외 도서관은 도서관의 주도하에 다른 도서관과 문화기관들과 지역 내에서, 국가 내에서, 국가적으로 협력하였고, 이러한 협력을 바탕으로 특성화된 데이터세트를 발행하였다. 해외 도서관은 발행 LD의 가시성을 높이기 위해 Schema.org를 사용하였고, 기술의 세분화를 위해 BIBFRAME 등을 사용하여 다양한 개체를 정의하고, 정의된 개체에 기반하여 LD를 구축하였다. 해외 도서관은 다양한 개체를 관련 정보 연계와 검색 결과 디스플레이, 브라우징, 대량 다운로드에 활용하였다. 해외 도서관은 인터링킹 외부 데이터세트를 지속해서 현행화하였고, 외부 데이터를 직접적으로 활용하여 목록정보를 보강하였다. 이 연구에서는 도출된 시사점을 토대로 국내도서관의 LD 구축 시 고려할 점을 제안하였다. 연구 결과는 향후 국내도서관이 LD 서비스를 계획하거나 기존 서비스를 고도화할 때 기초자료로 활용될 수 있을 것이다.

데이터세트 보존포맷 검증방안에 관한 연구: 재난안전정보 데이터세트의 SIARD 적용을 통해 (Empirical Verification of Conversion and Restoration of Preservation Format for Dataset: Application of Dataset with Disaster Safety Information to SIARD)

  • 한희정;윤성호;오효정;양동민
    • 정보관리학회지
    • /
    • 제37권2호
    • /
    • pp.251-284
    • /
    • 2020
  • 정보의 활용이 국가 경쟁력의 핵심으로 부각되면서 우리 정부를 포함한 주요 선진국들은 데이터를 중요하게 인식하고 있으며, 이에 따라 장기보존 기술 연구 및 표준 제정 등을 추진하여 데이터의 체계적인 관리 및 보존을 위한 노력을 지속적으로 기울이고 있다. 그러나 현재 국내의 경우 다양한 유형의 데이터들에 대해 법령에는 기록관리 대상으로 명시하고 있지만, 이를 수집, 관리 및 보존하기 위한 구체적인 방법은 표준전자문서 이외에는 없는 상황이다. 특히, 행정정보시스템에서 생산되는 엄청난 규모의 데이터세트에 대한 관리 및 보존은 무엇보다 강하게 요구되어 왔으나 데이터세트에 대한 지침이 제대로 제공되고 있지 않고 있다. 보존포맷 선정체계가 마련되어야 시스템 보완 및 구축이 가능하기 때문에 우선적으로 데이터세트 특성을 고려한 보존포맷 선정 기준 체계가 보다 구체화 되어야 하며, 선정기준에 따라 도출된 데이터세트 보존포맷의 변환에 대한 실증적인 검증 작업이 필요하다. 이에 본 연구는 데이터세트의 특성을 고려한 보존포맷 선정 기준에 대한 평가체계를 도출하고, 보존포맷에 대한 실증적 검증을 통해 장기보존할 수 있는 방안을 제시하고자 한다.

실시간 온라인 수업 및 시험 태도 데이터 세트 설계 및 구현 (Real-time Online Study and Exam Attitude Dataset Design and Implementation)

  • 김준식;이찬휘;송혁;권순철
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.124-132
    • /
    • 2022
  • 최근 코로나바이러스감염증-19(COVID-19)로 인해 온라인 원격 수업과 비대면 시험으로 인해 수업 태도 및 시험 부정행위에 대한 관리가 어려움을 겪고 있다. 따라서 온라인으로 학생들의 행동을 자동으로 인식하고 검출하는 시스템이 필요하다. 사람의 행동을 인식하는 행동 인식의 경우 컴퓨터 비전에서 많이 연구되는 기술 중 하나이다. 이러한 시스템을 개발하기 위해서는 온라인 수업 및 시험에서 주요 정보가 될 수 있는 사람의 팔 움직임 정보와 주변 물체에 대한 정보를 포함하는 데이터가 필요하다. 기존 데이터 세트는 여러 분야에 대해 분류를 하거나 일상생활 행동으로 구성되어 있어 본 시스템에 적용시키기에 어려움이 있다. 본 논문에서는 실시간으로 진행되는 온라인 시험 및 수업에서 태도를 분류할 수 있는 데이터 세트를 제시한다. 또한, 기존의 행동 인식 데이터 세트와의 비교를 통해 제안된 데이터 세트가 올바르게 구성되었는지를 보여준다.

웨어러블 센싱 기반의 Quantified Self 기술동향 (State-of-the-Art on Quantified Self Technology Based on Wearable Sensing)

  • 박준석;임정묵;정현태
    • 전자통신동향분석
    • /
    • 제30권4호
    • /
    • pp.1-11
    • /
    • 2015
  • Quantified Self란 개인의 일상활동에서 신체적 정신적 상태를 센싱 및 트래킹하여 이를 수치화함으로써 자신의 상태를 분석하고 삶의 질을 개선하기 위한 방법을 연구하여 실생활에 적용하는 활동을 의미한다. 이는 최근 헬스와 피트니스에 활용 가능한 개인 센서 및 웨어러블 기기의 급속한 보급과 다양한 개인 정보 트래킹 기기의 출현으로 개인의 일상경험을 모니터링하고, 생성되는 정보를 수집, 통합 분석을 통해 새로운 개인화 서비스를 제공하기 위한 기술개발 이슈로 주목받고 있다. Quantified Self 데이터는 초기의 수작업으로 트래킹하여 수집한 소량의 관리 가능한 데이터 세트에서 점차 대용량의 Quantified Self 빅데이터 세트로 크기가 증가하고 있으며, 개인정보의 통합분석을 위한 빅데이터 모델과 자동적인 셀프-트래킹 플랫폼으로서의 웨어러블 컴퓨터 기술과 응용의 기대치를 증가시키고 있다. 본고에서는 Quantified Self 정의와 기술 및 서비스 동향에 대해 살펴보고, 웨어러블 센싱 기반 트래킹 기기의 개발사례와 Quantified Self의 주요이슈와 미래전망에 대해 조망해 본다.

  • PDF

비식별 데이터의 유사성 보존에 관한 연구 (A Study on the Preservation of Similarity of privated Data)

  • 강동현;오현석;용우석;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.285-288
    • /
    • 2017
  • 비식별화 모델은 데이터 공유를 위한 모델로 원본데이터를 비식별화 변환 처리하여 개인정보를 보호함과 동시에 분석에 필요한 데이터를 외부에 제공하는 모델로 연구되어 왔다. 변환 방법으로는 삭제, 일반화, 범주화 기술 등이 주로 사용되며 변환 과정 중에는 재식별 가능성을 최소화하기 위해 k-익명성, l-다양성, t-근접성 혹은 differential privacy 등의 프라이버시 모델이 적용되고 있다. 하지만 변환된 비식별 데이터 세트는 필연적으로 원본 데이터 세트와 다른 값을 가지며 이는 결과적으로 최종 분석 결과에 영향을 주게 된다. 이를 위해 두 데이터 세트 간의 차이를 상이도(dissimilarity) 혹은 정보 손실율(information loss)이라는 지표로 측정 하고 있으며 본 지표는 비식별 데이터의 활용성을 평가 하는 데에 매우 중요한 역할을 한다. 본 연구에서는 비식별 데이터와 원본 데이터와 간의 차이를 도메인 기반의 절대적인 기준대비로 표현한 상이도 측정 방법을 제안하며, 그 유효성을 실데이터 기반의 실험을 통해 검증하였다.

가상환자 데이터세트를 기반으로 악관절과 심미를 고려한 진단 및 치료계획 수립 (From TMJ to 3D Digital Smile Design with Virtual Patient Dataset for diagnosis and treatment planning)

  • 이수영;강동휘;이도연;김희철
    • 대한심미치과학회지
    • /
    • 제30권2호
    • /
    • pp.71-90
    • /
    • 2021
  • 가상 환자 데이터 세트는 단일 환자로부터 획득한 구강스캔 안면스캔 전신스캔 하악운동경로데이터 등 다양한 소스의 진단 데이터를 하나의 3차원 좌표계로 정렬한 데이터의 집합이다. 치과의사는 가상 환자 데이터 세트를 사용하여 효과적으로 치료 계획을 수립하고 다양한 치료 계획을 가상공간상에서 시뮬레이션 할 수 있으며, 가상 환자 데이터 세트에서 환자의 미소를 디자인 후 그 결과를 시뮬레이션하고 최적의 치료결과를 선택할 수 있다. 가상공간에서 선택된 치료 계획은 3D 프린팅, 밀링, 사출 성형과 같은 제조 기술을 사용하여 환자에게 동일하게 전달될 수 있다. 이러 치료 계획의 전달은 임시 수복물 제작 및 환자의 구강 내에서 목업 확인을 통해 최종 보철물 제작으로 연결할 수 있다. 이와 같이 진단 데이터, 중첩 및 가공의 정확도가 보장된다면 3차원 가상공간 상에서 시뮬레이션된 3D 디지털 스마일 디자인을 실제 환자에게 정확하게 전달할 수 있다. 가상환자데이터세트의 임상적용방법으로 동기능적교합측정 검사를 통해 교합조정치료를 치료계획에서 배제할수 있는 의사결정방법과, 턱관절질환을 가지고 있는 청소년기 특발성 척추측만증 환자의 턱관절 치료전후 전신스캔 비교분석방법, 그리고 전악수복증례인 상하악 총의치환자 진료시 가상환자데이터세트에 기반한 교합평면분석 및 디지털심미분석방법을 제시하였다.

호스트 기반 침입 탐지 데이터 분석 비교 (A Host-based Intrusion Detection Data Analysis Comparison)

  • 박대경;신동규;신동일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.490-493
    • /
    • 2020
  • 오늘날 정보통신 기술이 급격하게 발달하면서 IT 인프라에서 보안의 중요성이 높아졌고 동시에 APT(Advanced Persistent threat)처럼 고도화되고 다양한 형태의 공격이 증가하고 있다. 점점 더 고도화되는 공격을 조기에 방어하거나 예측하는 것은 매우 중요한 문제이며, NIDS(Network-based Intrusion Detection System) 관련 데이터 분석만으로는 빠르게 변형하는 공격을 방어하지 못하는 경우가 많이 보고되고 있다. 따라서 HIDS(Host-based Intrusion Detection System) 데이터 분석을 통해서 위와 같은 공격을 방어하는데 현재는 침입탐지 시스템에서 생성된 데이터가 주로 사용된다. 하지만 데이터가 많이 부족하여 과거에 생성된 DARPA(Defense Advanced Research Projects Agency) 침입 탐지 평가 데이터 세트인 KDD(Knowledge Discovery and Data Mining) 같은 데이터로 연구를 하고 있어 현대 컴퓨터 시스템 특정을 반영한 데이터의 비정상행위 탐지에 대한 연구가 많이 부족하다. 본 논문에서는 기존에 사용되었던 데이터 세트에서 결여된 스레드 정보, 메타 데이터 및 버퍼 데이터를 포함하고 있으면서 최근에 생성된 LID-DS(Leipzig Intrusion Detection-Data Set) 데이터를 이용한 분석 비교 연구를 통해 앞으로 호스트 기반 침입 탐지 데이터 시스템의 나아갈 새로운 연구 방향을 제시한다.