• 제목/요약/키워드: Data Bias

검색결과 1,766건 처리시간 0.027초

위성 및 CFD모델 자료의 융합을 통한 도시지역에서의 고해상도 지표 순복사 산출 (Retrieval of High Resolution Surface Net Radiation for Urban Area Using Satellite and CFD Model Data Fusion)

  • 김홍희;이다래;최성원;진동현;허모랑;김재진;홍진규;홍제우;이근민;한경수
    • 대한원격탐사학회지
    • /
    • 제34권2_1호
    • /
    • pp.295-300
    • /
    • 2018
  • 순복사는 지구 에너지 순환의 열원으로 사용되는 총 복사에너지의 총량으로써, 지표면에서는 수문학, 기후 연구 및 농업과 같은 분야에서 중요한 요소이다. 원격탐사를 통해 순복사를 모니터링 함으로써 열섬 현상과 도시화 경향을 파악할 수 있어 매우 중요하지만, 원격 탐사 자료만을 이용한 순복사 추정은 일반적으로 구름의 유무에따라정확도차이가발생한다.따라서본논문에서는천리안위성(Communication, Ocean and Meteorological Satellite, COMS) 및 Landsat-8위성 기반의 자료와 건물 높이 차이를 반영한 전산유체역학(Computational Fluid Dynamics, CFD)모델 자료를 이용하여 도시화가 진행 중인 은평구 뉴타운 지역에서의 고해상도 순복사를 1시간 간격으로 산출 및 모니터링을 수행하였다. 은평구 플럭스 타워에서 관측된 순복사와 비교한 결과, RMSE $54.29Wm^{-2}$, Bias $27.42Wm^{-2}$의 정확도를 보였으며, 전체적으로 지점 관측 자료와의 유사한 경향을 보였다. 또한 산출된 순복사는 강수와 같은 기상상태를 잘 나타냈으며, 공간적 분포에서 식생 및 인공물 지역에 대한 순복사의 특징을 잘 나타냈다.

복사전달모의를 통한 중적외 파장역의 민감도 분석 및 지표면온도 산출 가능성 평가 (Evaluation of Sensitivity and Retrieval Possibility of Land Surface Temperature in the Mid-infrared Wavelength through Radiative Transfer Simulation)

  • 최윤영;서명석;차동환;서두천
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1423-1444
    • /
    • 2022
  • 본 연구에서는 대기 및 지표면 인자들에 대한 중적외 파장역의 복사휘도의 민감도를 복사전달모델인 MODerate resolution atmospheric TRANsmission (MODTRAN)6을 이용하여 분석하고 이를 이용하여 야간에 중적외 파장역 만을 이용한 지표면온도 산출 가능성을 평가하였다. 이를 기반으로 야간에 대해 다양한 조건을 반영한 지표면온도 산출식을 개발하고 처방 온도 자료와 현장 관측 자료를 이용하여 개발된 지표면온도 산출식의 수준을 평가하였다. 중적외 파장역을 활용한 위성 원격탐사에 주로 영향을 미치는 대기연직구조, 이산화탄소와 오존, 지표면온도의 일 변동, 지표면 방출률 그리고 위성의 관측각에 대해 민감도 실험을 실시하였다. 이때 분리대기창 기법 활용 가능성을 평가하기 위해 중적외 파장역을 투과율을 근거로 2개의 밴드로 분리한 후 민감도를 분석한 결과 밴드와 관계없이 대기연직구조에 가장 큰 영향을 받으며 지표면 방출률, 지표면온도의 일 변동, 위성의 관측각 순으로 영향을 받았다. 주요 변인 실험 모두에서 대기의 창에 해당되는 밴드 1은 민감도가 낮은 반면 오존과 수증기 흡수가 포함된 밴드 2에서는 민감도가 높아서 분리대기창 기법을 활용하여 지표면온도 산출이 가능할 것으로 판단하였다. 중적외 2개 밴드와 다양한 변인들을 이용하여 개발된 지표면온도 산출식은 복사모의 시 입력된 기준 지표면온도와 상관계수, 편의 그리고 root mean squared error (RMSE)가 각각 0.999, 0.023K과 0.437K의 수준을 보였다. 또한 26개의 현장관측 지표면온도 자료로 검증한 결과 상관계수는 0.993, 편의는 1.875K, RMSE는 2.079K을 보였다. 본 연구의 결과는 대기 및 지표면 조건이 야간의 중적외 두 밴드에 미치는 영향이 다른 특성을 이용하여 지표면온도를 산출할 수 있음을 제시한다. 따라서 향후에는 중적외 파장역 센서를 탑재한 위성자료를 이용하여 지표면온도를 산출하고 그 수준을 평가해 볼 필요가 있다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.

UTMI 표준에 부합하는 USB2.0 송수신기 칩 설계 (A UTMI-Compatible USB2.0 Transceiver Chip Design)

  • 남장진;김봉진;박홍준
    • 대한전자공학회논문지SD
    • /
    • 제42권5호
    • /
    • pp.31-38
    • /
    • 2005
  • 본 논문에서는, UTMI호환 USB2.0 PHY 칩의 구조와 세부 설계 내용 전반에 대하여 기술하였다. 노이즈 채널 환경에서, 수신데이터의 유효성을 판단하기 위한 방법으로 squelch 상태 검출 회로 및 전류모드 슈미트-트리거 회로를 설계하였으며, 레플리카 바이어스 회로를 사용한 온칩 종단(ODT) 회로와, 480Mbps 데이터 송신을 위한 전류모드 차동 출력 구동회로를 설계하였다. 또한, 플레시오크로너스 클럭킹 방식을 사용하는 USB 시스템에서, 송수신단 사이의 주파수 차이를 보상하기 위하여, 클럭데이터 복원회로와 FIFO를 사용한 동기화 회로를 설계하였다. 네트웍 분석기를 이용한 손실전송선(W-model) 모델 파라미터를 측정을 통해 추출하였으며, 설계를 위한 시뮬레이션 과정에 활용하였다. 설계된 칩은 0.25um CMOS 공정으로 제작하였으며, 이에 대한 측정 결과를 제시하였다. IO패드를 제외한 칩의 코어 면적은 $0.91{\times}1.82mm^2$ 이었고, 2.5V 전원전압에서 전체 전력소모량은, 480MHz 동작 시 245mW, 12MHz 동작 시 150mW로 시뮬레이션 되었다.

GNSS 정지측량을 통한 표고 산출 정확도 분석 (Accuracy Analysis of Orthometric Heights Based on GNSS Static Surveying)

  • 신광수;한중희;권재현
    • 한국측량학회지
    • /
    • 제32권5호
    • /
    • pp.527-537
    • /
    • 2014
  • 2013년 국토지리정보원에서는 합성 지오이드 모델 KNGeoid13(Korean National Geoid Model 2013)을 개발하여 제공함으로서 우리나라에서도 GNSS 측위 기술을 이용하여 높이측량을 적용하기 위한 기반이 마련되었다. 본 연구에서는 GNSS 정지측량 및 KNGeoid13을 이용하여 지역적인 수직기준과 부합하는 GNSS 기반 표고를 결정하기 위해 기지점의 타원체고 성과를 직접수준측량 성과와 모델 지오이드고를 더하여 계산된 보정타원체고로 사용하는 방법을 적용하고, 그 영향을 분석하였다. 보정타원체고를 이용하지 않은 경우에는 약 3cm 수준의 편의가 나타나는 반면 보정타원체고를 이용하면, 오차의 평균이 0.5cm 이하로 지역적인 편의가 제거되었다. GNSS 기반 표고의 정밀도를 관측시간에 따라 분석한 결과, 1일 4시간씩 2일간 관측할 경우에는 전체 데이터의 95%가 4cm 미만의 오차를 가진 것으로 나타났으며, 1일 4시간 및 2시간 관측을 수행하는 경우에는 5cm 이하의 오차를 보였다. 30분 관측하여 모호수가 고정될 경우, 전체 데이터의 95%가 10cm 이하의 정확도를 갖는 표고를 결정할 수 있는 것으로 나타났다. 본 연구에서 도출된 결과는 향후 공공측량에 GNSS 높이측량 도입을 위한 기반 자료로 활용될 수 있을 것으로 사료된다.

2005년 7월 5일 폭우 사례 시 우적계 R-Z 관계식이 레이더 강우 추정에 미치는 영향 (Effect of R-Z Relationships Derived from Disdrometer Data on Radar Rainfall Estimation during the Heavy Rain Event on 5 July 2005)

  • 이규원;권병혁
    • 한국지구과학회지
    • /
    • 제33권7호
    • /
    • pp.596-607
    • /
    • 2012
  • R-Z 관계식은 레이더 강우추정의 정확도를 결정하는 중요한 요소이다. 본 연구에서는 캐나다 궤벡주의 셍레미에서 홍수를 야기한 폭우사례에서 관측된 우적계 및 레이더 자료를 이용하여 레이더 강우추정 시 우적계 자료에서 도출된 R-Z 관계식의 효과를 분석하였다. 이를 위하여 맥길 S-밴드 레이더에서 시간 분해능 2.5분과 공간 분해능 $1^{\circ}{\times}250m$로 관측된 레이더 반사도를 사용하였다. 레이더 반사도 자료에서는 폭우를 동반한 강우세포가 셍레미를 통과한 것으로 관측되었지만 우량계 관측망에서는 낮은 공간 분해능으로 인하여 이 세포가 관측되지 않았다. 셍레미에서 30분과 1시간 최대 누적 강우량은 각각 39 mm와 42 mm였다. 강우사례 동안 두 개의 우적계(POSS; Precipitation Occurrence Sensor System)가 사용되었다. 하나의 우적계는 레이더 반사도와 우적계 반사도를 비교하여 레이더 반사도를 보정하고 다른 우적계는 R-Z 관계식을 유도하는데 사용되었다. 기후학적 R-Z 관계식을 사용하였을 때 보다 반사도에 의존적인 우적계에서 유도된 관계식을 사용하였을 때 강우 추정 오차가 크게 줄었다. 일 누적 강우량에 대하여 편차는 +12%에서 -2%, 평균제곱근오차가 16%에서 10%로 줄었다. 우적계에서 도출된 R-Z 관계식으로 추정된 레이더 강우장을 이용하였을 때 홍수사례에 대하여 강우 발생 시간 및 강우량이 잘 일치하였다.

표본 개념의 교육적 의의와 인식 특성 연구 (Pedagogical Significance and Students' Informal Knowledge of Sample and Sampling)

  • 이경화;지은정
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제15권2호
    • /
    • pp.177-196
    • /
    • 2005
  • 현재 학교 수학에서 통계는 표본 평균의 분포에 주목하여 표본과 모집단의 관계를 분석하는 높은 수준의 내용을 다루고 있다. 그러나 통계적 사고의 출발점이자 통계학에서 주요 연구 대상인 표본은 다소 소홀히 다루고 있다. 이 연구에서는 표본 개념의 교육적 의의를 살펴보고 초등학교 5학년부터 고둥학교 2학년까지 학생들을 대상으로 표본에 대한 그들의 인식을 조사하였다. 조사 결과, 학생들이 비형식적인 표본 개념을 지니고 있음을 확인하였다. 특히, 표본이 대표성을 지녀야 하고, 모집단과 표본 사이의 관계를 고려하기 위해 비례추론을 사용하는 것에 관련하여 높은 인식 수준을 나타내었다 또한 이런 능력들은 학년이 올라가면서 자발적으로 향상되는 것으로 파악되었다. 그러나 표본 조사 자체를 전수 조사에 비해 신뢰하지 않으며, 표본의 편의성과 관련하여서는 매우 낮은 인식 수준을 나타내었다 이것은 그 동안 표본 개념이 학교수학에서 소극적으로 다루어져 온 결과로 보인다. 그러므로 표본 개념의 교수학적 변환 방안에 대한 적극적인 연구가 필요함을 제기하였다.

  • PDF

초산부부의 모유수유에 대한 지식, 태도 및 실천의지 (Primiparous Couples' Knowledge, Attitude and Practice regarding Breastfeeding)

  • 강남미
    • 여성건강간호학회지
    • /
    • 제5권3호
    • /
    • pp.379-388
    • /
    • 1999
  • Breastfeeding is an excellent way of feeding infants and continues to be an important source of nutrition and antibodies for infants. Although breast-feeding is believed to be important, the rate of breastfeeding among Korean women is very low. One reason for the low breastfeeding rate is that the health professionals in the past have given little practical help couples to overcome difficulties encountered during breastfeeding. The promotion of breastfeeding has recently become a high priority among health professionals because of the undisputed physiological, psychological, social, economic, and nutritional benefits. Fathers have been found to influence the course of breastfeeding, but no one has conducted a systematic investigation into in and included fathers perspectives of breastfeeding in Korea. It is important to find strategies to solve the problems by assessing the knowledge, attitude and practice of breastfeeding with fathers as well as mothers. The purpose of this research is to find ways to promote primiparous(first child) couples's breastfeeding by assessing their general knowledge, attitude and practice of it. More specifically its purposes is to identify the relationship between knowledge, attitude, practice and the background factors of breastfeeding of primiparous couples in order to promote and support breastfeeding. The data will help health professionals to guide first-pregnancy couples to prepare and overcome any difficulties encountered during breastfeeding. Data were collected through a questionnaire which included both structured and open-ended questions. The questionnaire was composed referencing earlier literature, studies and surveys. This survey was made postpartum 2-3days after childbirth on 96 couples. The numbers of subjects for data analysis were selected 51 couples through pilot screening test. Data were coded and analyzed using the Statistical Package for Social Sciences : Cronbach's alpha coefficient, T-test, ANOVA, Stepwise pearson's correlation coefficient. The relations between the variables of breastfeeding were examined using a Pearson's correlation coefficient. This study showed that, the internal validity of the instrument was tested by Cronbach's alpha. The result was : mother knowledge 0.72, mother attitude 0.88, and father knowledge 0.70, father attitude 0.92, practice 0.76 and planning of breast feeding 0.95. The average age of mothers in the sample was 28.9 years old, and the average age of fathers in the sample was 31.3 years old. The other descriptive informations available included. the study also found that fathers were more important than doctors or nurses. However results of the study indicate that there were no differences between father and mother knowledge of breastfeeding(t=-0.39, p=0.698), and father attitude was statistically significant higher than mother attitude of breastfeeding (t=2.24, p=0.030). In analysis, the variable 'practice' with breastfeeding was the relationship with mother knowledge (p=0.031) and mother attitude(p=0.015). In this study, the correlation between one couple' knowledge and attitude was not significant. Primiparous couples surveyed in the postpartum period regarding knowledge, attitude and practice about breastfeeding might be affected by recall bias, the effects of the euphoria of the first 24-48 hours postpartum, but these variables were not examined. This study results add to the body of knowledge about nursing care for breastfeeding mothers and fathers. This indicates that a need for education about breastfeeding and, that fathers be included in it as well as mothers.

  • PDF

연년 산림자원조사 자료를 이용한 임목축적 추정 (Estimation of Forest Growing Stock by Combining Annual Forest Inventory Data)

  • 임종수;정일빈;김종찬;김성호;류주형;신만용
    • 한국산림과학회지
    • /
    • 제101권2호
    • /
    • pp.213-219
    • /
    • 2012
  • 제5차 국가산림자원조사는 다양한 산림자원의 현황을 평가하고 시간경과에 따른 산림자원의 변화를 모니터링하기 위하여 연년조사체계로 개편되었다. 본 연구는 충청북도를 대상으로 연년조사체계에서 수집된 현지조사 표본점 자료를 이용하여 일정시점의 평균임목축적을 추정하기 위한 방법을 모색하기 위해 수행되었다. 연년통계량의 산출을 위하여 임상구분의 표본층을 고려하지 않은 단순임의추출법과 표본층을 고려한 사후층화이중추출법의 추정식을 이용한 추정치를 비교한 결과, 사후층화이중추출법에 의한 추정치의 정확도가 높은 것으로 나타났다. 최근 5년간 수집된 현지조사 자료를 통합하기 위하여 조사년도의 차이를 고려하지 않은 시차 무시법(Temporally Indifferent Method), 조사년도별 추정치를 산출한 후 통합하는 단순이동평균법, 그리고 연도별 표본개수에 의해 가중치를 부여하는 가중이동평균법에 의한 평균임목축적과 추정분산을 비교하였다. 평균임목축적은 시차 무시법과 가중이동평균법에서 동일한 것으로 나타났지만, 추정치의 정도를 나타내는 추정분산은 가중이동평균법을 이용한 것이 약간 향상되었으며, 결과적으로 연도별 변이를 반영할 수 있는 가중이동평균법이 보다 적합한 것으로 평가되었다.