• Title/Summary/Keyword: sampling bias

검색결과 186건 처리시간 0.025초

Quantitative Accuracy Assessment of a SPOT DEM along the Coast-Donghae City Area

  • Kim, Seung-Bum;Lee, Hae-Yeoun
    • 대한원격탐사학회지
    • /
    • 제16권2호
    • /
    • pp.177-188
    • /
    • 2000
  • Quantitative accuracy assessment of a SPOT DEM (Digital Elevation Model) generated by a fully automatic software is performed along the 90km long coast around Donghae city. The theoretical requirement on the layout of the CPS (Global Positioning System) check points is derived: the Nyquist sampling. Since in practice the Nyquist frequency of a terrain is difficult to determine, the relaxed requirements are introduced and 31 check points are collected accordingly. Accuracy of the SPOT DEM is calculated to be 8.9, 11.5 and 12.0m r.m.s. in latitudinal, longitudinal and elevation directions. The bias is distinguishable from zero only for elevation and is 2.2m. The simple comparison with the world's leading commercial softwares reveals the similar accuracy level.

An improved estimation procedure of population mean using bivariate auxiliary information under non-response

  • Bhushan, Shashi;Pandey, Abhay Pratap
    • Communications for Statistical Applications and Methods
    • /
    • 제26권4호
    • /
    • pp.347-357
    • /
    • 2019
  • We propose new classes of estimators of population mean under non-response using bivariate auxiliary information. Some improved regression (or difference) type estimators have been proposed in four different situations of non response along with their properties and the expressions for the bias and mean square errors of the proposed estimators are derived under double (two-stage) sampling scheme. The properties of the suggested class of estimators are studied and it is observed that the proposed estimators performed better when compared to conventional estimators proposed by Singh and Kumar (Journal of Statistical Planning and Inference, 140, 2536-2550, 2010b), Shabbir and Khan (Communications in Statistics - Theory and Methods, 42, 4127-4145, 2013) and Bhushan and Naqvi (Journal of Statistics and Management Systems, 18, 573-602, 2015). A comparative study is also conducted both theoretically as well as empirically in order to support the results.

Item sum techniques for quantitative sensitive estimation on successive occasions

  • Priyanka, Kumari;Trisandhya, Pidugu
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.175-189
    • /
    • 2019
  • The problem of the estimation of quantitative sensitive variable using the item sum technique (IST) on successive occasions has been discussed. IST difference, IST regression, and IST general class of estimators have been proposed to estimate quantitative sensitive variable at the current occasion in two occasion successive sampling. The proposed new estimators have been elaborated under Trappmann et al. (Journal of Survey Statistics and Methodology, 2, 58-77, 2014) as well as Perri et al. (Biometrical Journal, 60, 155-173, 2018) allocation designs to allocate long list and short list samples of IST. The properties of all proposed estimators have been derived including optimum replacement policy. The proposed estimators have been mutually compared under the above mentioned allocation designs. The comparison has also been conducted with a direct method. Numerical applications through empirical as well as simplistic simulation has been used to show how the illustrated IST on successive occasions may venture in practical situations.

Enhancing Malware Detection with TabNetClassifier: A SMOTE-based Approach

  • Rahimov Faridun;Eul Gyu Im
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.294-297
    • /
    • 2024
  • Malware detection has become increasingly critical with the proliferation of end devices. To improve detection rates and efficiency, the research focus in malware detection has shifted towards leveraging machine learning and deep learning approaches. This shift is particularly relevant in the context of the widespread adoption of end devices, including smartphones, Internet of Things devices, and personal computers. Machine learning techniques are employed to train models on extensive datasets and evaluate various features, while deep learning algorithms have been extensively utilized to achieve these objectives. In this research, we introduce TabNet, a novel architecture designed for deep learning with tabular data, specifically tailored for enhancing malware detection techniques. Furthermore, the Synthetic Minority Over-Sampling Technique is utilized in this work to counteract the challenges posed by imbalanced datasets in machine learning. SMOTE efficiently balances class distributions, thereby improving model performance and classification accuracy. Our study demonstrates that SMOTE can effectively neutralize class imbalance bias, resulting in more dependable and precise machine learning models.

Estimation of the time-dependent AUC for cure rate model with covariate dependent censoring

  • Yang-Jin Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제31권4호
    • /
    • pp.365-375
    • /
    • 2024
  • Diverse methods to evaluate the prediction model of a time to event have been proposed in the context of right censored data where all subjects are subject to be susceptible. A time-dependent AUC (area under curve) measures the predictive ability of a marker based on case group and control one which are varying over time. When a substantial portion of subjects are event-free, a population consists of a susceptible group and a cured one. An uncertain curability of censored subjects makes it difficult to define both case group and control one. In this paper, our goal is to propose a time-dependent AUC for a cure rate model when a censoring distribution is related with covariates. A class of inverse probability of censoring weighted (IPCW) AUC estimators is proposed to adjust the possible sampling bias. We evaluate the finite sample performance of the suggested methods with diverse simulation schemes and the application to the melanoma dataset is presented to compare with other methods.

Self Calibration Current Bias 회로에 의한 10-bit 100 MSPS CMOS D/A 변환기의 설계 (A 10-bit 100 MSPS CMOS D/A Converter with a Self Calibration Current Bias Circuit)

  • 이한수;송원철;송민규
    • 대한전자공학회논문지SD
    • /
    • 제40권11호
    • /
    • pp.83-94
    • /
    • 2003
  • 본 논문에서는 빠른 정착시간을 갖는 전류셀(Current Cell) 매트릭스의 구조와 출력의 Gain error를 보정할 수 있는 Self calibration current bias 회로의 기능을 가진 고성능 10-bit D/A 변환기를 제안한다. 매트릭스 구조 회로의 복잡성으로 인한 지연시간의 증가 및 전력 소모를 최소화하기 위해 상위 6MSB(Most Significant Bit)전류원 매트릭스와 하위 4LSB(Least Significant Bit)전류원 매트릭스로 구성된 2단 매트릭스 구조로 설계되어 있다. 이러한 6+4 분할 구조를 사용함으로써 전류 원이 차지하는 면적과 Thermometer decoder 부분의 논리회로를 가장 최적화 시켜 회로의 복잡성과 Chip 사이즈를 줄일 수 있었고 낮은 Glitch 특성을 갖는 저 전력 D/A 변환기를 구현하였다. 또한 self Calibration이 가능한 Current Bias를 설계함으로서 이전 D/A 변환기들의 칩 외부에 구현하던 Termination 저항을 칩 내부에 구현하고 출력의 선형성 및 정확성을 배가시켰다. 본 연구에서는 3.3V의 공급전압을 가지는 0.35㎛ 2-poly 4-metal N-well CMOS 공정을 사용하였고, 모의 실험결과에서 선형성이 매우 우수한 출력을 확인하였다. 또한 소비전력은 45m W로 다른 10bit D/A 변환기에 비해 매우 낮음을 확인 할 수 있었다. 실제 제작된 칩은 Spectrum analyzer에 의한 측정결과에서 100㎒ 샘플링 클럭 주파수와 10㎒ 입력 신호 주파수에서 SFDR은 약 65㏈로 측정되었고, INL과 DNL은 각각 0.5 LSB 이하로 나타났다. 유효 칩 면적은 Power Guard ring을 포함하여 1350㎛ × 750 ㎛ 의 면적을 갖는다.

우리나라의 수계에서 어류채집 효율성을 위한 전기충격기의 도입 (Introduction of an Electrofishing Technique for Assessments of Fish Assemblages to Korean Watersheds)

  • 황순진;배대열;이재연;김자현;안광국
    • 생태와환경
    • /
    • 제38권4호통권114호
    • /
    • pp.482-493
    • /
    • 2005
  • 본 연구의 목적은 2005년 6-9월까지 38개 조사지점을 대상으로 하여 채집된 어류의 종 수 및 개체 수 풍부도에 대란 전통적 채집방법 (주로, 투망 및 족대 이용)및 전기충격기를 이용하는 방법의 조사 효율성을 평가하는 것이었다. 채집도구는 전기충격기를 이용하는 방법 (EM), 전통적인 조사법 (CM) 및 이 두 가지 방법을 조합하는 기법 (CT)의 3가지로 구분하여 통계적 유의성 차이를 비교 ${\cdot}$ 검토하였다. CM기법과 EM기법사이의 어종 구성도에 있어서 뚜렷한 차이는 미꾸라지 및 참종개와 같은 저서어종 (Benthic species) 및 돌로 된 하상을 선호하는 꺽지와 같은 종에서 나타났다. 이런종들의 출현빈도는 CM기법 보다는 EM기법에 의해 통계적 유의성이 높게 나타나 기존의 조사기법을 그대로 이용할 경우 저서성 어류 혹은 돌을 선호하는 종 (Lithophilic species)의 풍부도 산정시 과소평가되는 것으로 나타났다. 한편, 피라미와 갈겨니 같은 수층종(Water column species)은 CM기법 이용 시 개체 수 증가가 뚜렷하여 이런 종류의 개체군은 과대평가 될 수 있는 것으로 나타났다. 초강천, 유구천, 대전천 및 갑천 수계의 통계적 t-검정 결과에 따르면, 이들 모든 하천에서 종 수 및 개체 수는 CM기법보다는 CT기법에 의하여 통계적으로 높게 나타났다 (t 값 =2.806-6.896, p 값<0.05, n = 5-14). 마찬가지로 계절별 통계 분석에서도 두 가지 기법 사이에 통계적 유의성이 크게 나타났다 (p 값< 0.001,n = 10-24). 이러한 연구 결과는 전기충격기를 이용한 어류채집방법이 기존의 방법에 추가되지 않는다면 실제 수환경내의 어류 개체군 및 군집분석은 과소평가되며, 저서성종 혹은 돌이나 암반을 선호하는 종은 분석에서 배제되는 것으로 나타났다. 즉, 이러한 결과는 궁극적으로 채집오류는 물론이고 어류상, 개체군 및 군집풍부도 산정 시 큰 오류를 가져오는 것으로 나타났다. 결론적으로, 우리나라에서 어류조사 시 기존의 방법과 함께 전기충격기 방법의 새로운 도입은 실제 어류개체군 및 군집에 대한 과소평가의 분석오류를 감소시킬 것으로 사료되는 바. 북미 및 유럽에서 가장 보편적으로 사용하는 전기충격 채집법은 환경부 혹은 해양수산부의 어류 현장 지침서에 추가되어야 할 것으로 사료된다.

DMB 응용을 위한 10b 25MS/s $0.8mm^2$ 4.8mW 0.13um CMOS A/D 변환기 (A 10b 25MS/s $0.8mm^2$ 4.8mW 0.13um CMOS ADC for Digital Multimedia Broadcasting applications)

  • 조영재;김용우;이승훈
    • 대한전자공학회논문지SD
    • /
    • 제43권11호
    • /
    • pp.37-47
    • /
    • 2006
  • 본 논문에서는 Digital Video Broadcasting (DVB), Digital Audio Broadcasting (DAB) 및 Digital Multimedia Broadcasting (DMB) 등과 같이 저전압, 저전력 및 소면적을 동시에 요구하는 고성능 무선 통신 시스템을 위한 10b 25MS/s $0.8mm^2$ 4.8mW 0.13um CMOS A/D 변환기 (ADC)를 제안한다. 제안하는 ADC는 요구되는 해상도 및 속도 사양을 만족시키면서 동시에 면적 및 전력 소모를 최소화하기 위해 2단 파이프라인 구조를 사용하였으며, 스위치 기반의 바이어스 전력 최소화 기법(switched-bias power reduction technique)을 적용하여 전체 전력 소모를 최소화하였다. 입력단 샘플-앤-홀드 증폭기는 낮은 문턱전압을 가진 트랜지스터로 구성된 CMOS 샘플링 스위치를 사용하여 10비트 이상의 해상도를 유지하면서, Nyquist rate의 4배 이상인 60MHz의 높은 입력 신호 대역폭을 얻었으며, 전력소모를 최소화하기 위해 1단 증폭기를 사용하였다. 또한, Multiplying D/A 변환기의 커패시터 열에는 소자 부정합에 의한 영향을 최소화하기 위해서 인접신호에 덜 민감한 3차원 완전 대칭 구조의 커패시터 레이아웃 기법을 제안하며, 기준 전류 및 전압 발생기는 온-칩으로 집적하여 잡음을 최소화하면서 필요시 선택적으로 다른 크기의 기준 전압을 외부에서 인가할 수 있도록 설계하였다. 또한, 다운 샘플링 클록 신호를 사용하여 바이어스 전류를 제어함으로써 10비트의 해상도에서 응용 분야에 따라서 25MS/s 뿐만 아니라 10MS/s의 동작 속도에서 더 낮은 전력 사용이 가능하도록 하였다. 제안하는 시제품 ADC는 0.13um 1P8M CMOS 공정으로 제작되었으며 측정된 최대 DNL 및 INL은 각각 0.42LSB 및 0.91LSB 수준을 보인다. 또한, 25MS/s 및 10MS/s의 동작 속도에서 최대 SNDR 및 SFDR이 각각 56dB, 65dB이고, 전력 소모는 1.2V 전원 전압에서 각각 4.8mW, 2.4mW이며 제작된 ADC의 칩 면적은 $0.8mm^2$이다.

분석기법의 차이에 따른 현장시료의 VOC 분석결과 비교연구: 분석오차의 발생 양상과 원인 (A comparative analysis of volatile organic compound levels in field samples between different gas chromatographic approaches)

  • 안지원;수딜 팬디;김기현
    • 분석과학
    • /
    • 제23권5호
    • /
    • pp.465-476
    • /
    • 2010
  • 본 연구에서는 대기환경시료 및 현장조건에서 채취한 현장시료들 중, 악취성분 및 주요 VOC 성분들 중에서 여러 유형의 관리대상으로 지정 중인 benzene, toluene, p-xylene, styrene, methyl ethyl ketone의 농도분석 방식들을 비교하였다. 이때, GC/FID와 튜브를 연계한 F-T 분석방식과 GC/MS와 백(bag)을 연계한 M-B방식으로 같은 시료를 각각 분석하고 이들 결과 값을 비교하였다. 상관분석결과, toluene과 pxylene에서 F-T와 M-B방법간의 결과에서 큰 상관성을 보이는 것으로 나타났다(P < 1.4E-08). 양 기기간의 오차를 percent difference (PD)와 같이 산술적으로 구하여 평가한 결과, benzene과 toluene의 농도는 상대적으로 비슷한 경향을 보였다. 그러나 분석대상 성분들 간에 양 방식의 차이는 평균적으로 35%가 넘으면서 F-T와 M-B간의 오차가 일정 수준이상으로 존재하였다. 그리고 F-T/M-B ratio가 대부분 1 이하로 나타나면서, M-B의 결과 값이 F-T에 비해 상대적으로 크게 나타나는 경향을 보였다. 양 분석기기로부터 산출한 결과 값을 통계적으로 판단하기 위해, t-test를 실시하였다. 그 결과, 95% 신뢰수준에서 toluene, pxylene, styrene, methyl ethyl ketone 성분에서는 두 시스템간의 결과 값에 차이가 유의한 것으로 나타났다(P < 0.043). 그러나 전반적으로 양 분석기법의 차이에 따른 오차는 상당 부분 선택한 표준시료의 성상 및 백내부의 시료손실 등과 같은 요인에 크게 영향을 받는 것으로 나타났다.

불완전한 자료에 대한 보완기법(EM 알고리듬과 2단계(Two Stage) 모델) (EM Algorithm and Two Stage Model for Incomplete Data)

  • 박경숙
    • 한국인구학
    • /
    • 제21권1호
    • /
    • pp.162-183
    • /
    • 1998
  • 여기서는 많은 수의 비관측사례로부터 발생할 수 있는 표본의 편의(bias) 문제를 탐구한다. 이 연구는 본래 일본 후생성이 1989년 실시한 <가족주기와 가구형태에 대한 인구학적 조사> 자료를 이용하여 노인부보와 자녀간 근접성을 분석하는 목적에서 이루어졌다. 그런데 <가족주기와 가구형태에 대한 인구학적 조사>는 노인부모를 대상으로 한 조사가 아니라 전체 가구 일반에 대한 조사이기 때문에 노인부모에 대한 많은 정보를 손상하고 있었다. 또한 본 조사는 가구주를 통하여 가족원에 대한 정보를 획득하는 방식으로 설계되었기 때문에 가족원에 대한 정보가 완전하지 못하였다. 나아가 비관측사례의 유형을 보면 여러 항목들이 동시적으로 관측되지 않고 있었다. 이와 같이 복합적 메커니즘에서 발생한 비관측 사례는 분석의 편의를 초래할 위험이 크다. 우선, 많은 수의 비관측사례로 표준오차를 잘못 추정할 소지가 크다. 더욱이 사례들이 선택적으로 관측되지 않았다면 관측된 자료에 따른 추정을 심각한 편의를 포함할 수 있다. 이와 같이 손상된 자료로부터 발생할 수 있는 추정 편의를 개선하기 위하여 여기서는 두 가지 기법을 활용하였다. 첫째, 관측치와 공변인간의 관계에 기초하여 비관측사례를 추정하는 방법으로 EM 알고리듬을 활용하였다. 둘째, 관찰의 선택성에서 비롯된 추정 편의를 개선하기 위하여 이단계(two stage) 모형을 활용하였다.

  • PDF