• 제목/요약/키워드: 바람데이터

검색결과 296건 처리시간 0.022초

과학기술분야 정부출연연구기관 연구데이터 관리 방안 연구 (A Study on Research Data Management Methods for Government-funded Research Institutes in the Field of Science and Technology)

  • 한나은;엄정호;임형준
    • 한국문헌정보학회지
    • /
    • 제58권2호
    • /
    • pp.151-175
    • /
    • 2024
  • 본 연구는 연구데이터의 공유 및 활용 촉진을 목적으로 NST 산하 출연(연)의 연구데이터 관리 현황을 분석하고, 이를 바탕으로 연구데이터 공유 및 관리 체계 구축을 위한 방법을 제언한다. 연구데이터 관리 현황 조사는 총 20개의 출연(연)을 대상으로 22년도 23년도, 두 차례에 걸쳐 진행되었으며, 기관별 보유 연구데이터 현황, 기관별 연구데이터 관리 정책 현황, 기관별 연구데이터 관리시스템 현황을 분석하였다. 뿐만 아니라 연구데이터의 관리 및 공유에 있어서 어려움과 개선되어야 할 점을 파악하고, 이를 기반으로 연구데이터 공유 및 관리 체계 구축을 위한 방법을 정책적 측면, 시스템적 측면, 연계 체계 구축 측면으로 나누어 제언하였다. 연구데이터 공유 체계 구축을 위해서는 정책적 근거를 마련하여 연구데이터의 정의, 적용 범위, 관리의 내용, 활용 방식, 선도기관 등의 내용을 제시하는 것이 바람직할 것이다. 또한 체계적이고 일원화된 연구데이터 관리를 위해 기관별로 리포지토리 및 관리시스템을 구축하여 관리하되 이를 DataON과 연계하고 원스톱 서비스를 제공함으로써 데이터의 접근성 및 활용도를 제고할 수 있을 것이다.

국내 대학도서관 정리부서 현황과 조직 변화에 대한 인식 연구 (A Study on the Organizational Changes in Technical Service of Korean University Libraries)

  • 이지원
    • 한국비블리아학회지
    • /
    • 제25권1호
    • /
    • pp.193-215
    • /
    • 2014
  • 이 연구는 도서관 정리부서 변화 요인을 조사하고 국내 대학도서관 정리부서 조직 현황과 변화에 관한 사서들의 인식을 살펴봄으로써, 정리부서 조직 개선을 위한 변화와 발전 방향을 파악하고자 하였다. 도서관 정리부서의 변화의 주요 요인은 분담편목과 아웃소싱, 그리고 다양한 형태의 전자자원과 이에 대한 메타데이터 생성이었다. 국내 32개 대학도서관 정리부서 담당자를 대상으로 정리부서 현황과 조직 변화에 대한 인식을 조사 분석한 결과, 대부분 정리전문사서의 양성, 정리부서 체제의 변화가 필요한 시점이라고 응답하였으며, 전통적인 편목과 함께 전자자원에 대한 메타데이터 업무가 통합된 형태로 운영되는 것이 바람직하다고 인식하고 있었다. 하지만 현재까지는 대학도서관 전반적으로 메타데이터 관련 업무가 분산되어 있었고, 정리부서 내에서 담당하지 않는 메타데이터 관련 업무에 대한 파악이 부족한 것으로 조사되었다.

속성값 이산화 및 부정값 허용을 하는 의사결정트리 기반의 유전자 발현 데이터의 마커 후보 식별 (Candidate Marker Identification from Gene Expression Data with Attribute Value Discretization and Negation)

  • 이경미;이건명
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.575-580
    • /
    • 2011
  • 맞춤형 의료에 대한 기대가 커지면서 분자생물학적인 의료정보의 분석이 중요해지고 있다. 유전자 발현 데이터는 생명현상의 분자생물학적 동태을 보여주는 대표적인 데이터이다. 유전자 발현 데이터의 분석을 통해서 유전자 발현 수준에서의 특정 질병의 발병, 전이, 재발 등을 예측하기 위한 마커에 대한 관심이 많다. 두 개의 대조적인 관심 집단을 식별하는 유전자를 찾기 위해 통계적인 방법 등이 이용되어 왔다. 이 논문에서는 여러 유전자의 조합을 통해서 집단을 식별할 수 있는 후보 마커를 찾는 의사결정트리 기반 방법을 제안한다. 제안한 방법에서는 수치적인 유전자의 발현값을 세 개의 범주값으로 이산화시키고, 유전자 발현값을 해당 범주값뿐만 아니라 범주값의 부정값을 허용할 수 있도록 한다. 한편, 마커로 활용하기 위해서는 소수의 유전자만을 사용하는 것이 바람직하기 때문에, 마커에 소속할 유전자의 개수를 제한하여 마커를 찾도록 한다.

다중대체와 재현자료 작성 (Multiple imputation and synthetic data)

  • 김정연;박민정
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.83-97
    • /
    • 2019
  • 사회가 발전함에 따라 이용자의 다양한 분석 요구에 대응하기 위해 개인 단위로 구성된 마이크로데이터 제공이 증가했다. 나아가 센서스, 행정자료와 같은 전수자료를 마이크로데이터 형태로 제공받아 연구하고자 하는 요구 역시 커지고 있다. 정책결정, 학술목적 등을 위한 마이크로데이터 분석은 가치 창출 측면에서 대단히 바람직하다. 하지만 자료 유용성이 확보된 마이크로데이터 제공은 개인정보가 노출될 가능성이라는 위험을 가질 수 밖에 없다. 이에, 자료의 유용성을 확보하면서 개인정보보호를 보장할 수 있는 여러 방법들이 고려되어 왔다. 이러한 방법 중 하나로 재현자료(synthetic data)를 생성해서 활용하는 방법이 연구되어 왔다. 본 논문은 재현자료 생성과 관련된 방법론 및 주의사항을 소개하여, 재현자료의 이해를 도모하고자 한다. 이를 위해 재현자료 작성에 필수적인 다중대체, 베이지안 예측 모형 및 베이지안 붓스트랩 등의 개념들을 먼저 설명하고, 완전 재현자료 및 부분 재현자료에 대해 살펴본다. 특히, 재현자료 작성을 심도 깊이 이해하기 위해 순차회귀 다중대체(sequential regression multivariate imputation)를 이용해 경시적(longitudinal) 자료를 재현자료로 작성하는 구체적 사례를 살펴본다.

초등 예비교사가 모의수업 시연에서 구성한 과학적 추론의 인식론적 의미 - 증거-설명 연속선의 관점 - (Epistemological Implications of Scientific Reasoning Designed by Preservice Elementary Teachers during Their Simulation Teaching: Evidence-Explanation Continuum Perspective)

  • 맹승호
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제42권1호
    • /
    • pp.109-126
    • /
    • 2023
  • 이 연구는 초등 예비교사가 모의수업 시연에서 구성한 과학적 추론을 증거-설명의 연속선 관점에서 해석하여 그들의 과학적 추론이 갖는 인식론적 의미를 조사하였다. 연구를 위해 계절 변화에 관한 모의 수업을 시연한 예비교사 2명, 고기압과 저기압 및 바람에 관한 모의수업을 시연한 예비교사 2명이 연구 참여자로 선정되었다. 예비교사의 교수발화 중에서 귀납적, 연역적(가설-연역적) 추론, 또는 귀추적 추론의 사례가 드러난 에피소드에서 각 추론이 증거-설명의 연속선의 단계에서 어떤 역할을 하는지 비교하여 예비교사의 과학적 추론이 가진 인식론적 의미를 분석하였다. 계절 변화의 원인에 관한 모의수업을 시연했던 두 예비교사는 학생들이 수집한 데이터를 비교하여 증거를 인식하였고, 증거와 가설을 비교하여 가설을 검증하는 가설-연역적 추론을 활용하여 설명을 구성하였다. 고기압과 저기압 및 바람의 방향을 주제로 모의수업을 시연했던 두 예비교사는 모둠별 데이터를 종합하여 증거로 인식하는 귀납적 추론과 선형적 논리 구조를 가진 연역적 추론을 설명구성 전략으로 선택하여 최종 설명을 제시하였다. 연구에 참여한 예비교사들은 유사한 주제의 모의수업 시연에서 대체로 비슷한 흐름의 과학적 추론을 활용하여 과학지식을 구성하였으나, 증거-설명의 연속선에서 데이터, 증거, 모델, 설명으로 전개되는 인식론적 의미 측면에서 조금씩 다른 양상을 보였다. 또한, 일부 사례를 제외하면, 공통적으로 증거에서 모델을 탐색하는 과학적 추론은 부족하였으며, 가설이나 설명모델을 추리하기 위한 귀추적 추론이 부재하였다. 이 연구에서 분석틀로 적용했던 증거-설명의 연속선 접근은 과학적 추론의 인식론적 의미를 파악할 수 있게 하며 대안적인 과학적 추론 함양 지도 방법으로 사용될 수 있음을 논의하였다.

DBSCAN을 이용한 등부표 위치 데이터 Clustering 연구(I) (A Study on Data Clustering of Light Buoy Using DBSCAN(I))

  • 최광영;김소라;박상원;송재욱
    • 한국항해항만학회지
    • /
    • 제47권4호
    • /
    • pp.231-238
    • /
    • 2023
  • 등부표는 조류, 바람 등 외력에 영향을 받아 위치가 항상 유동적이고 위치는 항로표지용 AIS 또는 RTU를 통해 확인할 수 있다. 위치 확인이 가능한 등부표의 최근 5년간(2017~2021년) 위치 데이터 분석 결과 위치 오류 데이터는 평균 15.4%로 나타났으며 항해 안전사고예방 및 관리를 위해서는 위치 오류 데이터를 검출하고 정제된 위치 데이터 획득이 필요하다. 본 연구에서는 항로표지용 AIS 또는 RTU를 통해 획득한 위치 데이터를 DBSCAN Clustering하여 위치 오류 데이터를 검출하고 정제된 위치 데이터를 획득하고자 한다. 이를 위하여 위치 오류가 가장 많은 서해 해역 중 RTU가 설치된 군산항 1호 등부표의 21년도 위치 데이터를 Python library를 사용하여 DBSCAN Clustering 하였다. DBSCAN Clustering에 필요한 minPts는 2차원 데이터에 일반적으로 사용하는 값을 적용하였고 epsilon은 k-NN(최근접 이웃)알고리즘을 사용하여 값을 산출 및 적용하였다. DBSCAN Clustering 결과 minPts와 epsilon을 만족하지 못하는 위치 오류 데이터를 검출하였고 정제된 위치 데이터를 획득할 수 있었다. 본 연구는 항로표지용 AIS 또는 RTU가 설치된 등부표의 신뢰성 있는 위치 데이터를 획득할 수 있는 기초 자료로 활용할 수 있으며 항해 안전사고 예방에도 큰 도움이 될 것으로 판단된다.

비디오 셧의 감정 관련 특징에 대한 통계적 모델링 (Statistical Model for Emotional Video Shot Characterization)

  • 박현재;강행봉
    • 한국통신학회논문지
    • /
    • 제28권12C호
    • /
    • pp.1200-1208
    • /
    • 2003
  • 비디오 데이터에 존재하는 감정을 처리하는 것은 지능적인 인간과 컴퓨터와의 상호작용을 위해서 매우 중요한 일이다. 이러한 감정을 추출하기 위해서는 비디오로부터 감정에 관련된 특징들을 검출하기 위한 컴퓨팅 모델을 구축하는 것이 바람직하다. 본 논문에서는 비디오 셧에 존재하는 저급 특징들의 확률적인 분포를 이용하여 감정 이벤트 발생에 관련된 통계학적인 모델을 제안한다. 즉, 비디오 셧의 기본적인 특징을 추출하고 그 특징을 통계적으로 모델화 하여 감정을 유발하는 셧을 찾아낸다. 비디오 셧의 특징으로는 칼라, 카메라 모션 및 셧 길이의 변화를 이용한다. 이러한 특징들을 EM(Expectation Maximization) 알고리즘을 이용하여 GMM(Gaussian Mixture Model) 으로 모델링하고, 감정과 시간과의 관계를 MLE(Maximum Likelihood Estimation)를 이용하여 시간에 따른 확률분포 모델로 구성한다. 이런 두 개의 통계적인 모델들을 융합하여 베이시안 분류법을 적용하여 비디오 데이터로부터 감정에 관련된 셧을 찾아낸다.

한국프로야구에서 승률 추정방법들의 비교 (A comparison of formulas to predict a team's winning percentage in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1585-1592
    • /
    • 2016
  • 한국프로야구에서 팀의 승률을 예측하는 것은 야구팬들에게중요한 관심사이다. 팀들의 승률을 1982년부터 2015년까지의 모든 한국프로야구 기록을 이용하여 야구의 피타고라스 모형과 선형회귀모형을 사용하여 추정하고 평균제곱오차의 제곱근 (root mean squared error; RMSE)을 이용하여 상대적 효율성을 비교하였다. 결론적으로 승률이 높거나 낮은 경우에는 피타고라스 모형, 승률이 50% 근방에서는 선형회귀모형이 각각 효율성이 뛰어났다. 또한 전체데이터를 사용하는 경우에는 피타고라스모형이 상대적 효율성이 좋았으며, 효율성이 비슷하면 선형회귀모형이 사용과 이해도의 측면에서 좀 더 바람직하다고 할 수 있다.

Topic Maps를 이용한 MARC데이터의 FRBR모델 구현에 관한 연구 (An Implementation of FRBR Model by Using Topic Maps)

  • 이현실;한성국
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.289-306
    • /
    • 2005
  • FRBR 모델에서는 서지 요소와 관계를 중심으로 ER 모델링 방식을 제공하고 있지만, 단지 구조적 프레임워크로서 FRBR 모델을 효율적으로 구현할 수 있는 도구가 필요하다. 본 연구에서는 Topic Maps를 이용하여 FRBR 모델을 구현하는 방법을 제시한다. Topic Maps 기반의 FRBR 모델 구현의 유효성을 실증적으로 보이기 위하여, 명성황후라는 주제와 관련된 MARC 데이터를 추출하여 FRBR 모델을 설계하였고, Topic Maps를 이용하여 이를 구현하였다. 연구 결과, FRBR의 entity-relation과 Topic Maps의 topic-association이 개념적으로 동일하기 때문에 FRBR 모델 개발의 적합함을 알 수 있었다. FRBR 구조는 Topic Maps 패러다임과 그대로 일치하기 때문에 FRBR 모델은 Topic Maps로 구현함이 바람직하다.

음성강조에의 응용을 위한 신경회로망에 의한 잡음량의 추정법 (Estimation method of noise intensity by neural network for application in speech enhancement)

  • 최재승
    • 대한전자공학회논문지SP
    • /
    • 제42권3호
    • /
    • pp.129-136
    • /
    • 2005
  • 잡음이 중첩된 음성으로부터 잡음을 제거하기 위해서는, 잡음의 크기에 따라서 음성처리 시스템의 매개변수를 변경하는 것이 양호한 음질의 음성을 재생하는데 바람직하다. 본 논문은 백색잡음 및 자동차의 주행잡음에 의해 저하된 3단계의 음성을 학습할 수 있는 3층 구조의 신경회로망을 사용하여, 음성 중의 잡음량의 크기를 추정하는 방식을 제안한다. 실험결과, 제안한 방법은 신경회로망에 의해서 잡음량이 추정될 수 있는 것을 알 수 있었으며, 화자와 음성 데이터가 학습데이터와 다르더라도 백색잡음에 대해서 평균 $95\%$ 이상의 높은 잡음 추정율을 구할 수 있었다.