• 제목/요약/키워드: Skewed Data

검색결과 203건 처리시간 0.03초

Drought Forecasting with Regionalization of Climate Variables and Generalized Linear Model

  • Yejin Kong;Taesam Lee;Joo-Heon Lee;Sejeong Lee
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.249-249
    • /
    • 2023
  • Spring drought forecasting in South Korea is essential due to the sknewness of rainfall which could lead to water shortage especially in spring when managed without prediction. Therefore, drought forecasting over South Korea was performed in the current study by thoroughly searching appropriate predictors from the lagged global climate variable, mean sea level pressure(MSLP), specifically in winter season for forecasting time lag. The target predictand defined as accumulated spring precipitation(ASP) was driven by the median of 93 weather stations in South Korea. Then, it was found that a number of points of the MSLP data were significantly cross-correlated with the ASP, and the points with high correlation were regionally grouped. The grouped variables with three regions: the Arctic Ocean (R1), South Pacific (R2), and South Africa (R3) were determined. The generalized linear model(GLM) was further applied for skewed marginal distribution in drought prediction. It was shown that the applied GLM presents reasonable performance in forecasting ASP. The results concluded that the presented regionalization of the climate variable, MSLP can be a good alternative in forecasting spring drought.

  • PDF

주행차량의 복륜 여부 판정을 통한 차종분류 방안 (Development of Vehicle Classification Method using Discriminant Function Based on Detection of Dual Tire)

  • 오주삼
    • 대한토목학회논문집
    • /
    • 제30권1D호
    • /
    • pp.45-51
    • /
    • 2010
  • 차종별 교통량 자료는 도로의 운영, 제어, 유지관리 계획 수립 및 과적차량 단속에도 매우 중요한 자료이다. 본 논문에서는 축검지 센서를 차량 진행방향에 대해서 경사지게 설치하고 이를 통해서 얻어지는 자료를 활용하여 차종분류 알고리즘을 개발하였다. 새로운 개발한 차종분류 알고리즘에서는 2축 차량에서 후륜 차량바퀴의 복륜 여부를 새로운 분류변수로 설정하였다. 분석대상이 차량은 1,878대로 CCTV를 활용하여 기록했으며 인력식 조사를 통하여 복륜여부와 차종을 구분하였다. 계측된 차량바퀴 접지면의 대각선 길이 성분의 크기를 입력 자료로 활용한 판별분석을 통하여 후륜바퀴가 복륜인지 단륜인지를 구분하였다. 복륜 여부만을 이용하여 차종분류를 했을 때, 차종분류의 정확도는 1종에 속하는 차량의 경우는 96.92%, 3종에 속하는 차량에서는 82.91% 그리고 4종에 속하는 차량에서는 79.13%에 이르는 것으로 분석되었다.

The fundamental frequency (f0) distribution of American speakers in a spontaneous speech corpus

  • Byunggon Yang
    • 말소리와 음성과학
    • /
    • 제16권1호
    • /
    • pp.11-16
    • /
    • 2024
  • The fundamental frequency (f0), representing an acoustic measure of vocal fold vibration, serves as an indicator of the speaker's emotional state and language-specific pattern in daily conversations. This study aimed to examine the f0 distribution in an English corpus of spontaneous speech, establishing normative data for American speakers. The corpus involved 40 participants engaging in free discussions on daily activities and personal viewpoints. Using Praat, f0 values were collected filtering outliers after removing nonspeech sounds and interviewer voices. Statistical analyses were performed with R. Results indicated a median f0 value of 145 Hz for all the speakers. The f0 values for all speakers exhibited a right-skewed, pointy distribution within a frequency range of 216 Hz from 75 Hz to 339 Hz. The female f0 range was wider than that of males, with a median of 113 Hz for males and 181 Hz for females. This spontaneous speech corpus provides valuable insights for linguists into f0 variation among individuals or groups in a language. Further research is encouraged to develop analytical and statistical measures for establishing reliable f0 standards for the general population.

A Scrutiny of the Essence of Business Incubators in the Distribution Sector

  • ERESIA-EKE, Chukuakadibia;IWU, Chux Gervase;JAIYEOLA, Afeez Olalekan;MUSIKAVANHU, Tichaona Buzy
    • 유통과학연구
    • /
    • 제17권6호
    • /
    • pp.5-13
    • /
    • 2019
  • Purpose - The potential for small businesses in the distribution sector to contribute to socio-economic development remains largely inert due to a litany of challenges that they face. Incubators have emerged as the 'silver bullet' for most of the problems but the extent to which they are effectively helping small business overcome their challenges remains debatable. This study seeks to determine the core reasons why respondents enrolled in an incubator, the essence of the incubator and the extent to which the incubator performance is satisfactory. Research design, data, and methodology - A positivist philosophical approach was adopted for the study. This quantitative study used a survey method to collect data from incubatees in a cross-sectional manner. The data were subsequently analysed to generate necessary insights. Results - Results reveal that the gender composition of incubatees is severely skewed in favour of males. Also, most incubatees enrolled in the incubators with a hope that it would ease their pathway to big businesses, financiers and business registration institutions, and it is not. Conclusion - Incubators are mostly inward-looking and are adept at offering training interventions. To improve the effectiveness of incubators, it is necessary to invest efforts in attracting more females and building networks with key external stakeholders that could possibly assist the incubatees establish and grow their businesses.

절사표본에서 최적 절사점에 관한 연구 (A Study on the Optimal Cut-off Point in the Cut-off Sampling Method)

  • 이상은;조민지;신기일
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.501-512
    • /
    • 2014
  • 상당수의 사업체 조사는 절사표본설계법을 사용하고 있다. 이는 절사표본설계법에서 얻은 전수층이 많은 정보를 포함하고 있어 전체 표본크기를 최소화 할 수 있는 장점이 있기 때문이다. 그러나 최근 전수층에 포함된 사업체들의 무응답률이 높아감에 따라 전수층이 가지고 있는 장점에 한계가 나타나고 있다. 이에 Lee (2011), Shin과 Lee (2013)는 표본설계 단계에서부터 주어진 허용오차를 만족하면서 전수층 규모를 최소화하는 연구를 실시하였다. 본 연구에서는 주어진 허용오차를 만족하고 Hidiroglou (1986)가 제안한 방법으로 산출 된 표본크기를 고정한 상태에서 표본층 분산에 알려진 함수를 적합하여 전수층 크기를 최소화하는 새로운 최적 절사점을 제안하였다. 또한 Hidiroglou (1986)와 Shin과 Lee (2013)가 제안한 절단분포를 이용한 방법과 본 연구에서 제안한 방법을 모의실험과 사례연구를 통해 비교하였다.

비휘발성 메모리의 마모도 평준화를 위한 레드블랙 트리 (A Swapping Red-black Tree for Wear-leveling of Non-volatile Memory)

  • 정민성;이은지
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.139-144
    • /
    • 2019
  • 비휘발성 메모리는 높은 용량과 DRAM에 준하는 수준의 접근 성능을 제공하여 차세대 메모리 기술로 각광을 받고 있다. 최근 미국 반도체 시장을 중심으로 비휘발성 메모리가 상용화 되면서 그 활용 방법에 대한 관심은 더욱 고조되고 있다. 그러나 비휘발성 메모리는 쓰기 연산 시 셀이 마모되는 물리적 특성을 가지고 있어 마모 평준화를 수행하지 않으면 특정 셀의 과도한 마모로 메모리의 용량이 감소되는 현상이 발생할 수 있다. 본 논문은 현재 균형 이진 탐색 트리로 널리 사용되고 있는 레드-블랙 트리(Red-black tree)가 비휘발성 메모리 위에서 동작할 때 잦은 리밸런싱 동작이 트리의 상위 레벨 노드들의 빈번한 쓰기를 발생시켜 특정 셀의 마모를 가속화 시킨다는 것을 관찰하고, 이를 해결하기 위한 새로운 형태의 레드-블랙 트리를 제안한다. 실제 시스템에서 추출한 레드-블랙 트리 접근 트레이스를 활용한 성능평가에서 제안된 레드-블랙 트리는 기존 자료구조 대비 셀 간의 쓰기 횟수 편차를 최대 12.5% 감소시킴을 보여주었다.

결합 로그노말-파레토 분포에서 추출된 양쪽 중도 절단된 표본을 이용한 모수추정 (Estimation on composite lognormal-Pareto distribution based on doubly censored samples)

  • 이광호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권2호
    • /
    • pp.171-177
    • /
    • 2011
  • 최근에 비약적으로 발달하는 보험 산업에 수반하여 보험금 지불 분포에 대한 연구가 활발하게 진행되고 있다. 보험금 지불금의 분포는 일반적으로 두터운 꼬리를 가지면서 좌로 치우친 왜도를 가지는 파레토 분포나 로그노말 분포로 잘 설명된다고 알려져 왔으며 Cooray와 Ananda (2005)는 이들 두 분포를 결합한 결합 로그노말-파레토분포를 제시하고 이 분포의 적합도가 높음을 보였다. 그런데 보험금 지불의 경우 보금지불 총 금액의 한도로 인하여 극단적으로 큰 보험금이나 혹은 매우 사소한 보험지불금의 경우는 옵션을 두어 예외적으로 취금하는 경우가 많다. 본 논문에서는 결합 로그노말-파레토 분포로부터 추출된 표본이 양쪽 중도 절단되어 있는 경우에 대하여 모수를 추정하는 문제를 다루어 보았다.

보훈의료지원 대상자의 외래 처방의약품 사용경향과 적정성 평가 (Trends and Appropriateness of Outpatient Prescription Drug Use in Veterans)

  • 이인향;심다영
    • 한국임상약학회지
    • /
    • 제28권2호
    • /
    • pp.107-116
    • /
    • 2018
  • Objective: This study analyzed the national claims data of veterans to generate scientific evidence of the trends and appropriateness of their drug utilization in an outpatient setting. Methods: The claims data were provided by the Health Insurance Review & Assessment (HIRA). Through sampling and matching data, we selected two comparable groups; Veterans vs. National Health Insurance (NHI) patients and Veterans vs. Medical Aid (MAID) patients. Drug use and costs were compared between groups by using multivariate gamma regression models to account for the skewed distribution, and therapeutic duplication was analyzed by using multivariate logistic regression models. Results: In equivalent conditions, veteran patients made fewer visits to medical institutions (0.88 vs. 1), had 1.86 times more drug use, and paid 1.4 times more drug costs than NHI patients (p<0.05); similarly, veteran patients made fewer visits to medical institutions (0.96 vs. 1), had 1.11 times more drug use, and paid 0.95 times less drug costs than MAID patients (p<0.05). The risk of therapeutic duplication was 1.7 times higher (OR=1.657) in veteran patients than in NHI patients and 1.3 times higher (OR=1.311) than in MAID patients (p<0.0001). Conclusion: Similar patterns of drug use were found in veteran patients and MAID patients. There were greater concerns about the drug use behavior in veteran patients, with longer prescribing days and a higher rate of therapeutic duplication, than in MAID patients. Efforts should be made to measure if any inefficiency exists in veterans' drug use behavior.

사회재난 지표별 등급화 기법 비교: 가축질병을 중심으로 (Comparison of Rating Methods by Disaster Indicators)

  • 이효진;윤홍식;한학
    • 한국재난정보학회 논문집
    • /
    • 제17권2호
    • /
    • pp.319-328
    • /
    • 2021
  • 연구목적: 최근 대형 사회재난이 발생하면서 사회재난 안전도 진단에 대한 필요성이 요구되며 행정안전부에서 지역 안전지수, 국가안전대진단 등 지역의 안전도 등급을 계산하여 매년 공표하고 있다. 기존의 안전도 진단 시스템은 등간격 혹은 정규분포를 이용해서 획일화된 방법으로 등급화를 진행하여 위험지도를 작성하고 있다. 연구방법: 하지만 등간격 기법은 위험등급을 객관적으로 분석할 수 있지만 분포가 한쪽에 치우쳐있는 경우 위험등급을 분류하는데 한계가 있으며 z-score 기법은 모집단이 정규분포를 따르지 않으면 신뢰도가 떨어지는 문제가 있다. 지표별로 통계 데이터의 분포가 상이하기 때문에 데이터 분포별로 가장 적합한 등급화를 적용해야한다. 연구결과: 따라서 본 논문에서는 재난 지표의 데이터를 분석하여 각 지표마다 최적화된 등급화를 진행하고자 기존의 등간격 기법과 네츄럴브레이크 기법을 비교 및 적합한 방법을 제시하였다. 결론: 그 결과 기존의 등급화 기법과 다르게 적용된 것은 6새 지표 중 3개에 해당하였다.

센서 네트워크에서 저장 공간의 활용성과 에너지 효율성을 위한 시간 매개변수 기반의 데이타 중심 저장 기법 (A Time-Parameterized Data-Centric Storage Method for Storage Utilization and Energy Efficiency in Sensor Networks)

  • 박용훈;윤종현;서동민;김준;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권2호
    • /
    • pp.99-111
    • /
    • 2009
  • 최근 무선 센서 네트워크 환경에서 감지되는 데이타를 네트워크상에 효과적으로 저장하고 처리하기 위한 다양한 기법들이 제안되었다. 데이타 중심 저장(Data-Centric Storage : DCS) 기법은 분할된 데이타 영역을 센서들에게 할당하고, 수집된 데이타를 해당 데이타 영역을 담당하는 센서에 저장하는 기법이다. 기존 연구된 DCS 기반 기법들은 데이타 전송을 위한 통신비용의 감소와 정합 질의(Exact Query) 및 영역 질의(Range Query)의 효과적인 처리를 위해 제안되었다. 하지만 방대한 데이타가 발생하는 데이타 영역을 담당하는 센서의 저장 부하 문제는 고려되지 않았다. 최근 이와 같은 저장 부하 문제를 해결하기 위해 K-D 트리를 기반으로 동적 분할 데이타 영역을 사용하는 KDDCS가 제안되었다. 하지만 KDDCS를 포함한 모든 기존 DCS 기반 기법들은 인기 있는(많은 질의 요청을 받는) 데이타 영역에 대한 질의 부하가 고려되지 않았기 때문에, 결과적으로 전체 센서 네트워크의 수명이 단축된다. 그래서 본 논문에서는 저장 부하뿐만 아니라 질의 부하도 효과적으로 해결할 수 있는 새로운 DCS 기반 기법인 TPDCS(Time parameterized DCS)를 제안한다. 제안하는 기법은 데이타 차원뿐만 아니라 시간 차원을 함께 고려하여 센서에 할당되는 데이타 영역을 분할한다. 제안하는 방법은 데이타 저장과 질의 처리 분산을 통해 전체 센서 네트워크의 수명을 크게 연장시킨다. 또한 본 논문에서는 대표적인 기존 DES기반 기범들과 다양한 성능 비교 평가를 통해 제안하는 기법의 우수성을 보인다.