• Title/Summary/Keyword: data bias

Search Result 1,755, Processing Time 0.033 seconds

도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델 (Data Bias Optimization based Association Reasoning Model for Road Risk Detection)

  • 류성은;김현진;구병국;권혜정;박찬홍;정경용
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.1-6
    • /
    • 2020
  • 본 연구에서는 도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델을 제안한다. 이는 사용자의 개인적 특성과 주변 환경 데이터를 수집하고 교통사고 방지 서비스를 제공하기 위한 연관분석 기반의 마이닝 모델이다. 이는 다양한 상황 변수들로 구성된 트랜잭션 데이터를 생성한다. 생성된 정보를 바탕으로 연관 패턴 분석을 통해 각 트랜잭션 내 변수들의 유의미한 연관관계를 도출한다. 분류된 범주형 데이터의 편향성을 고려하여 최적화된 지지도 및 신뢰도 값으로 가지치기를 진행한다. 추출된 상위 연관규칙을 바탕으로 사용자에게 개인 특성과 주행 도로 상황에 대한 위험 탐지모델을 제공한다. 이는 데이터 편향성 문제를 극복하고 데이터간 연관성을 고려하여 잠재적인 도로 사고를 예방하는 교통 서비스가 가능하다. 성능 평가는 제안하는 방법이 정확도에서 0.778, Kappa 계수에서 0.743로 우수하게 평가된다.

대학생의 선호직업유형이 확증편향에 미치는 영향에 관한 질적 연구 (A Qualitative Study on the Influence of College Student Preference Job Type on Confirmation Bias)

  • 노선희;김기승
    • 한국산학기술학회논문지
    • /
    • 제20권10호
    • /
    • pp.169-178
    • /
    • 2019
  • 본 연구는 대학생의 선호 직업 유형이 진로 결정 과정에 미치는 영향과 역할을 검증하고, 그 과정에서 확증편향에 미치는 영향을 분석하는 연구이다. 자료 수집은 2017년 6월 20일부터 7월 9일까지 20일 동안 3회에 걸쳐 수도권 소재의 대학교 남녀 재학생을 대상으로 인터뷰를 통해 이루어졌다. 수집된 자료는 질적 연구 방법 중 사례 분석 방법을 사용하였다. 연구 참여자로부터 얻은 자료에서 분석한 결과는 선호 직업 유형, 진로 적성과 상관없이 개인별 정도의 차이가 있을 뿐 대부분 직업 진로에 대해 확증편향이 있음을 보여주었다. 확증편향적 사고는 연구 참여자들의 심리적, 환경적 요인의 영향을 받으며 사회적 인식이 반영된 틀 속에 자신을 맞추려는 현상으로 나타났다. 본 연구 시사점은 선호 직업 유형이 전공에 대한 선택에 영향을 미치며, 확증편향은 취업과 직업 탐색에 방해 요소가 되기도 한다는 점을 확인했다는 점과 개인별 직업 유형에 대한 선호도가 바르게 정립되도록 진로 교육과 교육 환경 및 기회가 제공되어야 한다는 점을 시사하고 있다.

편향 인장 및 트렐리스 시험에 의한 직물 복합재료의 면내 전단 물성 평가 (Characterization of In-plane Shear Behaviors of Woven Fabrics by Bias-extension and Trellis-frame Tests)

  • 이원오;엄문광;변준형
    • Composites Research
    • /
    • 제23권5호
    • /
    • pp.8-14
    • /
    • 2010
  • 서로 다른 길이비를 갖는 세 종류의 유리 직물 복합재료(평직, 균형능직, 비균형능직)의 면내 전단 물성 평가를 위해 편향인장 시험을 실시하였다. 직물 복합재료의 전단각을 결정하기 위하여 인장 변형량과 직물의 크기에 기인한 이론식, 직접측정법 및 이미지 분석법등을 이용하여 서로의 장단점을 비교하여 보았으며, 편향 인장 시험의 기하구조를 이용하여 유도된 식을 통해 면내 전단력을 계산하였다. 또한 트렐리스 시험(trellis-frame test)에 의한 결과와의 비교를 통해 편향 인장 시험에 의한 전단 물성 측정법의 정확도를 평가하였다. 실험 결과, 이론식에 의한 전단각 계산법은 전단각이 30도 이내일 경우에 이미지를 통한 직접 측정의 결과와 유사하였으며, 면내 전단력은 평직이나 균형 능직과 같은 등방형 직물의 경우에만 측정 샘플의 길이비에 무관한 균일한 결과를 보였다. 또한 편향 인장 시험과 트렐리스 시험 모두 비등방성이 큰 직물에 대한 전단 평가를 수행하는 데 있어서 많은 편차를 나타내었다.

이동통신시장에서의 단위편향 소비행태 발생에 관한 실증연구 (Empirical Study on Unit Bias under the Flat Rate Pricing in the Korean Mobile Telecommunication Market)

  • 이상우;정선화;이형직
    • 한국통신학회논문지
    • /
    • 제41권2호
    • /
    • pp.229-237
    • /
    • 2016
  • 본 논문의 목적은 국내 이동통신시장에서 발생가능한 대표적인 인식편향(cognitive bias) 중 하나인 단위편향(unit bias) 현상의 발생 여부를 실증적으로 분석하고, 단위편향 발생을 최소화하기 위한 바람직한 요금제 개선방안을 제시하는 것이다. 분석 결과 이용자들은 정액요금제하에서 단위편향적 소비행태 발생에 따라 자신의 최적소비량보다 많은 통화량 혹은 데이터량을 사용함으로써 자신의 효용극대화를 위한 최적 통신비 지출보다 많은 통신비를 지출할 가능성이 높은 것으로 나타났다. 따라서 정액요금제의 요금구간을 보다 세분화함으로써 소비자들이 단위편향 발생에 따른 비합리적 소비를 최소화하고 자신의 효용함수에 따라 최적 소비량을 이용토록 마련하여 가계통신비 절감은 물론 소비자 후생을 극대화할 수 있도록 유도하는 것이 가능할 것으로 기대된다.

순환 신경망과 합성곱 신경망을 이용한 뉴스 기사 편향도 분석 (Analyzing Media Bias in News Articles Using RNN and CNN)

  • 오승빈;김현민;김승재
    • 한국정보통신학회논문지
    • /
    • 제24권8호
    • /
    • pp.999-1005
    • /
    • 2020
  • 오늘날의 검색 포털은 뉴스의 창구로서는 가장 큰 비율을 차지하지만, 중립성에 대해서는 의문이 제기되고 있다. 이는 포털 뉴스가 편향된 정보의 소비를 유도할 수 있기 때문이다. 본 논문은 뉴스 기사의 정치적 편향도를 딥러닝을 이용하여 측정하는 방법에 대하여 소개한다. 이는 기사를 비판적으로 바라보는 시각을 뉴스 독자에게 제공할 것이다. 구체적으로, 국회 회의록에서 추출한 키워드에 편향도를 부여하고, 이를 기반으로 기사의 편향도를 분석하여 머신러닝용 데이터를 구축하였다. 최종적으로 순환 신경망과 합성곱 신경망을 융합한 딥러닝을 통해 기사의 편향도를 계산하는 것을 목표로 하였다. 학습한 모델의 정확도를 분석한 결과 문장별 편향의 좌/우편향 판정은 95.6%의 정확도를 보였으나, 신문기사 전체에서는 46.0%의 정확도를 보였다. 이는 기존의 여러 편향성 연구와 다르게 특정 주제에 한정되지 않고 기사의 보수-진보 편향성을 분석할 수 있도록 한다.

A review of analysis methods for secondary outcomes in case-control studies

  • Schifano, Elizabeth D.
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.103-129
    • /
    • 2019
  • The main goal of a case-control study is to learn the association between various risk factors and a primary outcome (e.g., disease status). Particularly recently, it is also quite common to perform secondary analyses of the case-control data in order to understand certain associations between the risk factors of the primary outcome. It has been repeatedly documented with case-control data, association studies of the risk factors that ignore the case-control sampling scheme can produce highly biased estimates of the population effects. In this article, we review the issues of the naive secondary analyses that do not account for the biased sampling scheme, and also the various methods that have been proposed to account for the case-control ascertainment. We additionally compare the results of many of the discussed methods in an example examining the association of a particular genetic variant with smoking behavior, where the data were obtained from a lung cancer case-control study.

듀얼칼만필터를 이용한 이중편파 레이더 강우의 실시간 편의보정 (Real-time bias correction of Beaslesan dual-pol radar rain rate using the dual Kalman filter)

  • 나우영;유철상
    • 한국수자원학회논문집
    • /
    • 제53권3호
    • /
    • pp.201-214
    • /
    • 2020
  • 본 연구에서는 듀얼칼만필터를 이용하여 이중편파 레이더 강우의 편의를 실시간으로 보정할 수 있는 방법을 제안하였다. 듀얼칼만필터는 기존의 칼만필터와 달리 두 개의 시스템(상태추정시스템, 모형추정시스템)이 동시에 가동되면서 실시간으로 상태변수가 예측된다. 강우강도 추정치에 보정계수를 적용함으로써 편의보정이 이루어지며, 보정계수는 듀얼칼만필터의 상태-공간모형에 의해 실시간으로 예측된다. 해당 기법을 2016년 7월에 발생한 지속시간이 긴 호우사상에 대해 적용하고 편의보정 결과를 평가하였다. 먼저, 보정계수는 대부분 1과 2 사이의 값으로 산정되어 지상관측 강우강도보다 레이더 강우강도가 약간 과소추정되는 경향을 보였다. 보정계수에 대한 시계열을 설명할 수 있는 모형으로는 AR(1) 모형이 적합한 것으로 확인되었다. 아울러 듀얼칼만필터로 예측한 보정계수는 관측된 자료를 이용하여 산정한 보정계수와 유사한 경향을 가지는 것으로 나타났다. 칼만필터와의 비교 결과, 보정계수의 변동성이 커질수록 듀얼칼만필터가 칼만필터에 비해 우수한 예측 성능을 가지는 것으로 확인되었다. 본 연구를 통해 강우의 변동성이 크고, 지속시간이 긴 호우사상에 대한 듀얼칼만필터의 적합성이 검증되었다.

Satellite-based Rainfall for Water Resources Application

  • Supattra, Visessri;Piyatida, Ruangrassamee;Teerawat, Ramindra
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.188-188
    • /
    • 2017
  • Rainfall is an important input to hydrological models. The accuracy of hydrological studies for water resources and floods management depend primarily on the estimation of rainfall. Thailand is among the countries that have regularly affected by floods. Flood forecasting and warning are necessary to prevent or mitigate loss and damage. Merging near real time satellite-based precipitation estimation with relatively high spatial and temporal resolutions to ground gauged precipitation data could contribute to reducing uncertainty and increasing efficiency for flood forecasting application. This study tested the applicability of satellite-based rainfall for water resources management and flood forecasting. The objectives of the study are to assess uncertainty associated with satellite-based rainfall estimation, to perform bias correction for satellite-based rainfall products, and to evaluate the performance of the bias-corrected rainfall data for the prediction of flood events. This study was conducted using a case study of Thai catchments including the Chao Phraya, northeastern (Chi and Mun catchments), and the eastern catchments for the period of 2006-2015. Data used in the study included daily rainfall from ground gauges, telegauges, and near real time satellite-based rainfall products from TRMM, GSMaP and PERSIANN CCS. Uncertainty in satellite-based precipitation estimation was assessed using a set of indicators describing the capability to detect rainfall event and efficiency to capture rainfall pattern and amount. The results suggested that TRMM, GSMaP and PERSIANN CCS are potentially able to improve flood forecast especially after the process of bias correction. Recommendations for further study include extending the scope of the study from regional to national level, testing the model at finer spatial and temporal resolutions and assessing other bias correction methods.

  • PDF

레이더 자료의 품질평가 기법 제안 (A Proposal of Quality Evaluation Methodology for Radar Data)

  • 유철상;윤정수
    • 대한토목학회논문집
    • /
    • 제30권5B호
    • /
    • pp.429-435
    • /
    • 2010
  • 본 연구에서는 레이더 강우자료의 품질평가를 위해 통계학 분야의 분산분석과 유사한 방법론을 제안하였다. 이 방법은 자료가 가지고 있는 편의로 인한 오차 및 변동성으로 인한 오차를 구분하여 나타내도록 한다. 제안된 방법론은 두 개의 호우사상에 적용하여 평가하였다. 그 결과 레이더 원자료의 경우는 편의로 인한 오차가 전체 오차의 대부분을 차지하는 반면, 품질 향상된 자료의 경우에는 편의로 인한 오차가 상대적으로 크게 줄어드는 것을 확인하였다. 그러나 변동성으로 인한 오차는 품질 향상 후 오히려 증가하였음을 파악하였다. 본 연구에서 제안된 방법론은 주어진 호우사상을 품질향상 단계별로 자료의 품질을 평가하는 데는 유효하나, 여러 호우사상의 품질을 비교하는데 한계를 가짐을 확인하였다. 보다 일반적인 적용을 위해서는 이에 대한 보완이 필요한 것으로 나타났다.

Parameter estimation and assessment of bias in genetic evaluation of carcass traits in Hanwoo cattle using real and simulated data

  • Mohammed Bedhane;Julius van der Werf;Sara de las Heras-Saldana;Leland Ackerson IV;Dajeong Lim;Byoungho Park;Mi Na Park;Seunghee Roh;Samuel Clark
    • Journal of Animal Science and Technology
    • /
    • 제65권6호
    • /
    • pp.1180-1193
    • /
    • 2023
  • Most carcass and meat quality traits are moderate to highly heritable, indicating that they can be improved through selection. Genetic evaluation for these types of traits is performed using performance data obtained from commercial and progeny testing evaluation. The performance data from commercial farms are available in large volume, however, some drawbacks have been observed. The drawback of the commercial data is mainly due to sorting of animals based on live weight prior to slaughter, and this could lead to bias in the genetic evaluation of later measured traits such as carcass traits. The current study has two components to address the drawback of the commercial data. The first component of the study aimed to estimate genetic parameters for carcass and meat quality traits in Korean Hanwoo cattle using a large sample size of industry-based carcass performance records (n = 469,002). The second component of the study aimed to describe the impact of sorting animals into different contemporary groups based on an early measured trait and then examine the effect on the genetic evaluation of subsequently measured traits. To demonstrate our objectives, we used real performance data to estimate genetic parameters and simulated data was used to assess the bias in genetic evaluation. The results of our first study showed that commercial data obtained from slaughterhouses is a potential source of carcass performance data and useful for genetic evaluation of carcass traits to improve beef cattle performance. However, we observed some harvesting effect which leads to bias in genetic evaluation of carcass traits. This is mainly due to the selection of animal based on their body weight before arrival to slaughterhouse. Overall, the non-random allocation of animals into a contemporary group leads to a biased estimated breeding value in genetic evaluation, the severity of which increases when the evaluation traits are highly correlated.