• 제목/요약/키워드: Missing data estimation

검색결과 141건 처리시간 0.029초

국민건강영양조사 자료를 이용한 가공식품 데이터베이스 구축 (Development of processed food database using Korea National Health and Nutrition Examination Survey data)

  • 윤미옥;이현숙;김기랑;심재은;황지윤
    • Journal of Nutrition and Health
    • /
    • 제50권5호
    • /
    • pp.504-518
    • /
    • 2017
  • 본 연구는 가공식품의 섭취량이 증가하는 현실에서 국민건강영양조사 자료를 통한 정확한 영양소 섭취량 산출을 위해 국민건강영양조사의 원자료 중 최근 5년간 (2010~2014) 등장한 가공식품 4,858건에 대한 영양성분 DB를 구축하고, 이를 제6기 1차 년도 국민건강영양조사 (2013년) 자료에 적용하여 영양소 14종의 섭취량을 산출하여 구축한 DB에 대한 유용성을 검토하였다. 가공식품의 영양성분 DB 구축을 위해 국내 국가기관에 신고된 가공식품 목록 8,785건, 반조리 식품 자료배합비, 국내 국립기관에서 발간된 식품성분표 1종, 제조사 및 인터넷 등을 통해 수집된 자료를 모아 가공식품에 대한 수준별 DB를 구축하였다. 매칭 식품과 유사 식품 DB를 모두 적용 후 가공식품 섭취량은 505.8 g (30.8%)로 추정되었으며 총섭취량에 대한 기여율은 각각 에너지 29.5%, 탄수화물 27.0%, 단백질 36.7%, 지방 26.5%, 식이섬유 16.1%로 나타났다. 또한 DB 적용 후 대부분의 영양소 섭취량이 유의한 차이를 보여 구축된 DB의 유용성을 보여준다고 사료된다. 나트륨의 경우 가공식품으로 부터의 섭취량이 DB 적용 전 후 2,527.6 mg에서 3,006.2 mg으로 증가하였다. 국민건강영양조사자료의 영양소 섭취량 추정에 필요한 에너지 및 영양소 14종에 대한 국내 분석값 자료가 거의 없는 현실에서 본 연구는 DB 구축을 위한 계산값이나 대체값의 원칙을 세우고 문서화하여 가공식품 DB 구축을 위한 틀을 만들어 향후 DB 구축, 유지, 확대 등 식품영양 DB의 체계적 관리의 기초를 제공하였으며 국민건강영양조사자료를 이용하여 가공식품을 통한 영양소 섭취량 추정을 했다는 측면에서 의미가 있다고 사료된다. 향후 지속적이고 체계적인 가공식품 DB 구축과 관리가 필요하다.

Risk Index of Debris Flow Damage for Hydro- and Geographic Characteristics of Debris Flow with Bayesian Method

  • Lee, JunSeon;Yang, WooJun;You, KwangHo;Kim, MunMo;Lee, Seung Oh
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.241-242
    • /
    • 2016
  • Recent abnormal climate change induces localized heavy rainfall and extreme disasters such as debris flow near urban area. Thus many researches have been conducted to estimate and prevent, especially in focus of physical behavior of debris flow. Even though it is hardly to consider overall related parameters to estimate the extent and degree of directly or indirectly damages due to debris flow. Those analytic restraint would be caused by the diversity and complexity of regional topographic and hydrodynamic characteristics of debris flow inside. We have utilized the Bayesian method to compensate the uncertainty due to the complex characteristics of it after analyzing the numerical results from FLO-2D and field measurement data. Revised values by field measurements will enhance the numerical results and the missing parameters during numerical simulation will be supplemented with this methodology. As a final outcome in this study, the risk index of debris flow damage will be suggested to provide quantitative estimation in terms of hazard protection including the impact on buildings, especially in inner and outer of urban area.

  • PDF

자동차 와이퍼 피봇의 각속도 및 각가속도 측정 (Measuring Angular Speed and Angular Acceleration for Automotive Windshield Wiper Pivot)

  • 이병수
    • 한국자동차공학회논문집
    • /
    • 제13권4호
    • /
    • pp.58-65
    • /
    • 2005
  • A method measuring angular speed and estimating angular acceleration of an automotive wind shield wiper pivot with limited resources has been proposed. Limited resources refer to the fact that processes cannot be operated in real-time with a regular notebook running a Microsoft Windows. Also, they refer to the fact that data acquisition cards have only two general purpose counters as many generic cards do. An optical incremental encoder has been employed for measuring angular motion. To measure the angular speed of the pivot, periods for the encoder's output pulses have been measured as the speed is related to the reciprocal of the period. Since only information acquired from one counter channel is the magnitude of the angular speed, sign correction is necessary. Also the information for the exact time when a pivot passes left and right dead points is also missing and the situation is inherent to the hardware setup. To find out the zero-crossing time of the angular speed, a linear interpolation technique has been employed. Lastly, to overcome the imperfection of the mechanical encoders, the angular speed has been curve fitted to a spline. Angular acceleration can be obtained by a differentiation of the angular speed.

신경망 모형을 이용한 결측 강우 자료 추정방법의 적용성 연구 (Applicability of Missing Rainfall Data Estimation using Artificial Neural Networks)

  • 조혜린;박희성;김형섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.512-512
    • /
    • 2015
  • 시 공간적 관측에서 다양한 원인에 의해 강우 자료에 결측이나 오측이 발생할 수 있다. 강우를 측정하고 자료를 수집 관리하는 측면에서 결측 되거나 오측된 자료를 추정 보완할 필요가 있다. 현재까지 결측 강우 자료를 추정하기 위한 방법으로 결측 지점 인근의 관측소를 이용한 단순 가중 평균치 방법에서부터 복잡한 통계적 기반의 보간 방법에 이르기까지 많은 연구들이 진행되고있다. 본 연구에서는 결측 된 강우 자료를 추정하기 위해 인공 신경망을 이용하여 모형을 구축하고 주변 관측소의 강우자료를 이용해 신경망 학습을 실시하여 적용해 보았으며, 최근 관측의 단위가 짧아지고 있는 점을 고려하여 10분, 30분, 1시간 등 다양한 시간간격의 강우자료를 구축하고 선형회귀모형과 RDS 방법, 신경망 모형을 이용한 방법 등을 적용한 결과를 비교하여 신경망 모형의 적용성을 살펴보았다. 단순한 구조면에서는 기존의 RDS 방법에 대한 적용성이 높은 것으로 판단되었으나, 성능의 개선을 위한 별다른 방법이 없는 반면 신경망 모형은 입력 자료를 다양하게 변환하여 구성하는 경우 성능을 개선하여 적용성이 더 높아 질 수 있는 것으로 판단되었다. 향후 신경망 모형을 이용해 잘못 측정된 강우를 적절히 선별하고 결측된 보완함으로써 관측된 강우 자료의 활용성을 높일 수 있을 것이다.

  • PDF

한반도의 과거 기후 데이터 구축을 위한 누락된 기록 추정 (Estimation of Missing Records in Daily Climate Data over the Korean Peninsula)

  • 노규호;안국현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.135-135
    • /
    • 2020
  • 우리나라의 기후 자료는 일반적으로 기상청에서 발표하는 종관기상관측(ASOS)과 방재기상관측(AWS), 그리고 북한이 세계기상기구(WMO, World Meteorogical Organization)의 기상통신망(GTS)을 통해 보낸 북한기상관측(NKO)을 사용 할 수 있다. 그러나 이 중 40년 이상의 완전한 관측 자료를 얻을 수 있는 건 ASOS가 유일하지만 공간적인 표현에 한계를 갖고 있다. AWS는 관측소가 많다는 장점이 있지만 관측 기간이 길지 않고 이용 가능한 기간에도 관측이 연속적이지 못한 경우가 많다. NKO는 비록 27개의 관측소가 있지만 많은 데이터가 누락되어 일별 기후자료의 사용에 한계를 갖고 있다. 이러한 미관측 기간이나 관측 자료의 누락은 연속적인 시계열 자료분석을 기반으로 하는 수자원 모델링에 있어서 문제를 야기한다. 본 연구는 1973년부터 2019년까지 47년의 신뢰도 높은 한반도 일일 기후 자료를 구축하기 위해 다양한 방법론을 비교하였다. 추정에 사용한 방법은 총 7개로 EM algorithm for probabilistic principal components (PPCA-EM), Inverse distance weight method (IDWM), Nearest neighbor method (NNM), Multivariate normal copulas (Copula), Elastic net model (Elastic), Ordinary kriging (OK), Regularized principal components with EM algorithm (RPCA-EM)를 살펴보았다. 다양한 형태의 결측치를 가정하여 그 결과값을 비교하였고 이는 Root mean squared error(RMSE), Kling-Gupta efficiency(KGE), Nash-Sutcliffe efficiency(NSE)를 통해 평가하였다. 최종 선택된 방법론을 통하여 한반도 전역을 그리드 기반의 강수 및 최저온도/최고온도의 일별자료로 생성하였다.

  • PDF

국민건강영양조사 자료를 이용한 지방산 데이터베이스 구축 (Development of a fatty acids database using the Korea National Health and Nutrition Examination Survey data)

  • 윤미옥;김기랑;황지윤;이현숙;손태영;문현경;심재은
    • Journal of Nutrition and Health
    • /
    • 제47권6호
    • /
    • pp.435-442
    • /
    • 2014
  • 본 연구에서는 국가적 수준에서 지방산 섭취량을 추정할 수 있도록 국민건강영양조사에서 사용하는 식품목록에 수록된 5,144개의 식품에 대해 지방산 DB를 구축하고, 그 과정을 단계별로 정리하여 향후 개정에 활용할 수 있도록 하였다. 지방산 DB는 국내 국립기관에서 발행한 식품의 지방산 함량 분석 자료를 기본으로 하여, 국외의 권위 있는 기관에서 발간한 자료와 학술지에 보고된 함량 분석 자료를 수집한 후 자료의 질을 검토하고 대체하거나 계산하는 방법으로 구축되었다. 구축된 DB를 2011년 국민건강영양조사 자료에 적용하여 지방산 섭취량을 추정한 결과, 총 지방산 섭취량은 지방섭취량의 84% 수준으로 학술지에 보고되고 있는 섭취량 추정수준보다는 높은 수준이나 DB 구축과정에서 확인된 문제점들을 보완하여 자료의 질을 향상시키는 것이 필요할 것으로 사료된다. 본 연구는 관련 연구 분야와 국가 영양정책의 중요한 기본 자료를 확보하였다는데 의의가 있다.

Terra MODIS NDVI 및 LST 자료와 RNN-LSTM을 활용한 토양수분 산정 (RNN-LSTM Based Soil Moisture Estimation Using Terra MODIS NDVI and LST)

  • 장원진;이용관;이지완;김성준
    • 한국농공학회논문집
    • /
    • 제61권6호
    • /
    • pp.123-132
    • /
    • 2019
  • This study is to estimate the spatial soil moisture using Terra MODIS (Moderate Resolution Imaging Spectroradiometer) satellite data and machine learning technique. Using the 3 years (2015~2017) data of MODIS 16 days composite NDVI (Normalized Difference Vegetation Index) and daily Land Surface Temperature (LST), ground measured precipitation and sunshine hour of KMA (Korea Meteorological Administration), the RDA (Rural Development Administration) 10 cm~30 cm average TDR (Time Domain Reflectometry) measured soil moisture at 78 locations was tested. For daily analysis, the missing values of MODIS LST by clouds were interpolated by conditional merging method using KMA surface temperature observation data, and the 16 days NDVI was linearly interpolated to 1 day interval. By applying the RNN-LSTM (Recurrent Neural Network-Long Short Term Memory) artificial neural network model, 70% of the total period was trained and the rest 30% period was verified. The results showed that the coefficient of determination ($R^2$), Root Mean Square Error (RMSE), and Nash-Sutcliffe Efficiency were 0.78, 2.76%, and 0.75 respectively. In average, the clay soil moisture was estimated well comparing with the other soil types of silt, loam, and sand. This is because the clay has the intrinsic physical property for having narrow range of soil moisture variation between field capacity and wilting point.

표준통계분류를 이용한 내수시장 규모 추정방법에 관한 연구 (A Study on an Estimation Method of Domestic Market Size by Using the Standard Statistical Classifications)

  • 유형선;서주환;전승표;서진이
    • 기술혁신학회지
    • /
    • 제18권3호
    • /
    • pp.387-415
    • /
    • 2015
  • 본 연구에서는 표준통계분류체계 간 연계를 통해 산업 혹은 제품의 내수 시장규모를 추정하는 방법을 제안하고 실질적 활용 가능성을 타진하였다. 이를 위해 KSIC 분류로 조사된 통계청의 광업 제조업 조사 결과와 HS 분류로 조사된 무역데이터를 통계청과 UN 통계처에서 제공하는 연계표를 활용하여 연계하였다. KSIC-ISIC-HS 간 통합연계표를 이용하여 국내시장규모를 분석하는데 있어 가장 큰 문제는 분류체계 간 중복 연결 문제인데, 본 연구에서는 각 품목별 출하액과 무역액 사이에 강한 상관관계가 있음을 활용하여 출하액의 상대적인 비중을 가중치로 중복 연결된 HS 무역액을 배분하는 방법을 제시하였다. 이를 이용하면 제조업 분야의 총 125개 모든 ISIC 품목별 국내시장규모를 분석하고 이를 바탕으로 미래의 단기 시장 규모를 예측할 수 있다. 본 연구에서 제시한 방법은 ISIC 분류보다 세분화 된 품목에 대한 분석의 한계, 제조업 이외의 분야에 대한 적용 한계, 출하액 결측치로 인한 오차 등의 한계가 있으나, 내수 시장규모 정보를 가장 객관적이고 신뢰성 있으며 지속적으로 활용 가능한 데이터를 이용하여 분석 제공할 수 있는 방법을 제시한 점에 본 연구의 의의가 있다.

국내 MIS 연구에서 구조방정식모형 활용에 관한 메타분석 (A Meta Analysis of Using Structural Equation Model on the Korean MIS Research)

  • 김종기;전진환
    • Asia pacific journal of information systems
    • /
    • 제19권4호
    • /
    • pp.47-75
    • /
    • 2009
  • Recently, researches on Management Information Systems (MIS) have laid out theoretical foundation and academic paradigms by introducing diverse theories, themes, and methodologies. Especially, academic paradigms of MIS encourage a user-friendly approach by developing the technologies from the users' perspectives, which reflects the existence of strong causal relationships between information systems and user's behavior. As in other areas in social science the use of structural equation modeling (SEM) has rapidly increased in recent years especially in the MIS area. The SEM technique is important because it provides powerful ways to address key IS research problems. It also has a unique ability to simultaneously examine a series of casual relationships while analyzing multiple independent and dependent variables all at the same time. In spite of providing many benefits to the MIS researchers, there are some potential pitfalls with the analytical technique. The research objective of this study is to provide some guidelines for an appropriate use of SEM based on the assessment of current practice of using SEM in the MIS research. This study focuses on several statistical issues related to the use of SEM in the MIS research. Selected articles are assessed in three parts through the meta analysis. The first part is related to the initial specification of theoretical model of interest. The second is about data screening prior to model estimation and testing. And the last part concerns estimation and testing of theoretical models based on empirical data. This study reviewed the use of SEM in 164 empirical research articles published in four major MIS journals in Korea (APJIS, ISR, JIS and JITAM) from 1991 to 2007. APJIS, ISR, JIS and JITAM accounted for 73, 17, 58, and 16 of the total number of applications, respectively. The number of published applications has been increased over time. LISREL was the most frequently used SEM software among MIS researchers (97 studies (59.15%)), followed by AMOS (45 studies (27.44%)). In the first part, regarding issues related to the initial specification of theoretical model of interest, all of the studies have used cross-sectional data. The studies that use cross-sectional data may be able to better explain their structural model as a set of relationships. Most of SEM studies, meanwhile, have employed. confirmatory-type analysis (146 articles (89%)). For the model specification issue about model formulation, 159 (96.9%) of the studies were the full structural equation model. For only 5 researches, SEM was used for the measurement model with a set of observed variables. The average sample size for all models was 365.41, with some models retaining a sample as small as 50 and as large as 500. The second part of the issue is related to data screening prior to model estimation and testing. Data screening is important for researchers particularly in defining how they deal with missing values. Overall, discussion of data screening was reported in 118 (71.95%) of the studies while there was no study discussing evidence of multivariate normality for the models. On the third part, issues related to the estimation and testing of theoretical models on empirical data, assessing model fit is one of most important issues because it provides adequate statistical power for research models. There were multiple fit indices used in the SEM applications. The test was reported in the most of studies (146 (89%)), whereas normed-test was reported less frequently (65 studies (39.64%)). It is important that normed- of 3 or lower is required for adequate model fit. The most popular model fit indices were GFI (109 (66.46%)), AGFI (84 (51.22%)), NFI (44 (47.56%)), RMR (42 (25.61%)), CFI (59 (35.98%)), RMSEA (62 (37.80)), and NNFI (48 (29.27%)). Regarding the test of construct validity, convergent validity has been examined in 109 studies (66.46%) and discriminant validity in 98 (59.76%). 81 studies (49.39%) have reported the average variance extracted (AVE). However, there was little discussion of direct (47 (28.66%)), indirect, and total effect in the SEM models. Based on these findings, we suggest general guidelines for the use of SEM and propose some recommendations on concerning issues of latent variables models, raw data, sample size, data screening, reporting parameter estimated, model fit statistics, multivariate normality, confirmatory factor analysis, reliabilities and the decomposition of effects.

영산호 운영을 위한 홍수예보모형의 개발(I) -나주지점의 홍수유출 추정- (River Flow Forecasting Model for the Youngsan Estuary Reservoir Operations(I) -Estimation Runof Hydrographs at Naju Station)

  • 박창언;박승우
    • 한국농공학회지
    • /
    • 제36권4호
    • /
    • pp.95-102
    • /
    • 1994
  • The series of the papers consist of three parts to describe the development, calibration, and applications of the flood forecasting models for the Youngsan Estuarine Dam located at the mouth of the Youngsan river. And this paper discusses the hydrologic model for inflow simulation at Naju station, which constitutes 64 percent of the drainage basin of 3521 .6km$^2$ in area. A simplified TANK model was formulated to simulate hourly runoff from rainfall And the model parameters were optirnized using historical storm data, and validated with the records. The results of this paper were summarized as follows. 1. The simplified TANK model was formulated to conceptualize the hourly rainfall-run-off relationships at a watershed with four tanks in series having five runoff outlets. The runoff from each outlet was assumed to be proportional to the storage exceeding a threshold value. And each tank was linked with a drainage hole from the upper one. 2. Fifteen storm events from four year records from 1984 to 1987 were selected for this study. They varied from 81 to 289rn'm The watershed averaged, hourly rainfall data were determined from those at fifteen raingaging stations using a Thiessen method. Some missing and unrealistic records at a few stations were estimated or replaced with the values determined using a reciprocal distance square method from abjacent ones. 3. An univariate scheme was adopted to calibrate the model parameters using historical records. Some of the calibrated parameters were statistically related to antecedent precipitation. And the model simulated the streamflow close to the observed, with the mean coefficient of determination of 0.94 for all storm events. 4. The simulated streamflow were in good agreement with the historical records for ungaged condition simulation runs. The mean coefficient of determination for the runs was 0.93, nearly the same as calibration runs. This may indicates that the model performs very well in flood forecasting situations for the watershed.

  • PDF