• Title/Summary/Keyword: 통계적인 추론

Search Result 187, Processing Time 0.034 seconds

Research on Federated Learning with Differential Privacy (차분 프라이버시를 적용한 연합학습 연구)

  • Jueun Lee;YoungSeo Kim;SuBin Lee;Ho Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.749-752
    • /
    • 2024
  • 연합학습은 클라이언트가 중앙 서버에 원본 데이터를 주지 않고도 학습할 수 있도록 설계된 분산된 머신러닝 방법이다. 그러나 클라이언트와 중앙 서버 사이에 모델 업데이트 정보를 공유한다는 점에서 여전히 추론 공격(Inference Attack)과 오염 공격(Poisoning Attack)의 위험에 노출되어 있다. 이러한 공격을 방어하기 위해 연합학습에 차분프라이버시(Differential Privacy)를 적용하는 방안이 연구되고 있다. 차분 프라이버시는 데이터에 노이즈를 추가하여 민감한 정보를 보호하면서도 유의미한 통계적 정보 쿼리는 공유할 수 있도록 하는 기법으로, 노이즈를 추가하는 위치에 따라 전역적 차분프라이버시(Global Differential Privacy)와 국소적 차분 프라이버시(Local Differential Privacy)로 나뉜다. 이에 본 논문에서는 차분 프라이버시를 적용한 연합학습의 최신 연구 동향을 전역적 차분 프라이버시를 적용한 방향과 국소적 차분 프라이버시를 적용한 방향으로 나누어 검토한다. 또한 이를 세분화하여 차분 프라이버시를 발전시킨 방식인 적응형 차분 프라이버시(Adaptive Differential Privacy)와 개인화된 차분 프라이버시(Personalized Differential Privacy)를 응용하여 연합학습에 적용한 방식들에 대하여 특징과 장점 및 한계점을 분석하고 향후 연구방향을 제안한다.

A Study on Forecasting Accuracy Improvement of Case Based Reasoning Approach Using Fuzzy Relation (퍼지 관계를 활용한 사례기반추론 예측 정확성 향상에 관한 연구)

  • Lee, In-Ho;Shin, Kyung-Shik
    • Journal of Intelligence and Information Systems
    • /
    • v.16 no.4
    • /
    • pp.67-84
    • /
    • 2010
  • In terms of business, forecasting is a work of what is expected to happen in the future to make managerial decisions and plans. Therefore, the accurate forecasting is very important for major managerial decision making and is the basis for making various strategies of business. But it is very difficult to make an unbiased and consistent estimate because of uncertainty and complexity in the future business environment. That is why we should use scientific forecasting model to support business decision making, and make an effort to minimize the model's forecasting error which is difference between observation and estimator. Nevertheless, minimizing the error is not an easy task. Case-based reasoning is a problem solving method that utilizes the past similar case to solve the current problem. To build the successful case-based reasoning models, retrieving the case not only the most similar case but also the most relevant case is very important. To retrieve the similar and relevant case from past cases, the measurement of similarities between cases is an important key factor. Especially, if the cases contain symbolic data, it is more difficult to measure the distances. The purpose of this study is to improve the forecasting accuracy of case-based reasoning approach using fuzzy relation and composition. Especially, two methods are adopted to measure the similarity between cases containing symbolic data. One is to deduct the similarity matrix following binary logic(the judgment of sameness between two symbolic data), the other is to deduct the similarity matrix following fuzzy relation and composition. This study is conducted in the following order; data gathering and preprocessing, model building and analysis, validation analysis, conclusion. First, in the progress of data gathering and preprocessing we collect data set including categorical dependent variables. Also, the data set gathered is cross-section data and independent variables of the data set include several qualitative variables expressed symbolic data. The research data consists of many financial ratios and the corresponding bond ratings of Korean companies. The ratings we employ in this study cover all bonds rated by one of the bond rating agencies in Korea. Our total sample includes 1,816 companies whose commercial papers have been rated in the period 1997~2000. Credit grades are defined as outputs and classified into 5 rating categories(A1, A2, A3, B, C) according to credit levels. Second, in the progress of model building and analysis we deduct the similarity matrix following binary logic and fuzzy composition to measure the similarity between cases containing symbolic data. In this process, the used types of fuzzy composition are max-min, max-product, max-average. And then, the analysis is carried out by case-based reasoning approach with the deducted similarity matrix. Third, in the progress of validation analysis we verify the validation of model through McNemar test based on hit ratio. Finally, we draw a conclusion from the study. As a result, the similarity measuring method using fuzzy relation and composition shows good forecasting performance compared to the similarity measuring method using binary logic for similarity measurement between two symbolic data. But the results of the analysis are not statistically significant in forecasting performance among the types of fuzzy composition. The contributions of this study are as follows. We propose another methodology that fuzzy relation and fuzzy composition could be applied for the similarity measurement between two symbolic data. That is the most important factor to build case-based reasoning model.

The Rainfall Quantile Change Analysis of the Different Duration and Return Period in Seoul (서울지역의 지속시간 및 재현기간별 확률강우량의 경년변화 분석)

  • Ahn, Sang-Hyun;Park, In-Chan;Cho, Won-Cheol
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.764-769
    • /
    • 2006
  • 본 연구에서는 최근에 빈번히 발생하는 단시간 집중호우양상의 변화와 자료기간의 누적에 따른 지속시간 및 재현기간별로 확률강우량의 변화양상을 분석하였다. 분석 대상 지점으로는 서울지점을 선정하였다. 강우자료는 기상청 산하의 강우관측소 자료를 이용하였으며 확률강우량 산정을 위한 강우지속시간은 10분, 20분, 30분, 40분, 50분 60분, 120분, 180분, 360분, 720분, 1440분을 지속시간으로 선정하였고 재현기간은 5년, 10년, 15년, 20년, 25년, 30년, 50년, 80년, 100년, 200년으로 수공구조물 설계시 많이 고려되어지는 재현기간을 선정하였다. 먼저 최근의 강우양상의 변화와 확률강우량의 경년변화 양상을 비교 분석하기 위하여 서울지점의 강우자료에 대한 장기 변동성을 분석하였고, 연강우량과 지속시간별 연 최대 강우량의 상관성을 분석하였다. 다음으로 통계적 분석을 통하여 확률강우량의 경년변화 양상을 지속시간 및 재현기간별로 분석하였다. 연강우량과 지속시간별 연최대강우량의 상관성 분석은 상호상관분석과 회귀분석을 실시하여 분석하였다. 확률강우량의 경년변화 분석 방법은 기본자료기간을 20년으로 산정하여 매해 강우자료를 추가하면서 확률강우량을 산정하여 경년변화를 살펴보았다. 확률강우량의 산정은 국립방재연구소와 연세대학교가 공동으로 제작한 FARD모형을 사용하였다. 분석결과 최근 강우량이 증가 추세에 있는 것을 확인 할 수 있었으며, 연강우량과 지속시간별 연 최대 강우량의 상관성은 없는 것으로 나타났다. 또한 확률강우량의 분석결과에서는 자료의 누적에 따른 확률강우량의 지속시간 및 재현기간에 따라 차이가 상이하며, 변동폭은 20% 내외로 나타났다. 토양수분 계산에도 영향을 준 것으로 보인다. 본 연구는 WEP 모형의 토양수분 해석능력에 대한 시험적용에 그 의의가 있으며, 향후 토양 및 지표하 매개변수 정보가 충분히 갖추어지고, 토양수분 관측결과 있는 대상유역에 대한 적용이 요구된다.-Moment 방법에 의해 추정된 매개변수를 사용한 Power 분포를 적용하였으며 이들 분포의 적합도를 PPCC Test를 사용하여 평가해봄으로써 낙동강 유역에서의 저수시의 유출량 추정에 대한 Power 분포의 적용성을 판단해 보았다. 뿐만 아니라 이와 관련된 수문요소기술을 확보할 수 있을 것이다.역의 물순환 과정을 보다 명확히 규명하고자 노력하였다.으로 추정되었다.면으로의 월류량을 산정하고 유입된 지표유량에 대해서 배수시스템에서의 흐름해석을 수행하였다. 그리고, 침수해석을 위해서는 2차원 침수해석을 위한 DEM기반 침수해석모형을 개발하였고, 건물의 영향을 고려할 수 있도록 구성하였다. 본 연구결과 지표류 유출 해석의 물리적 특성을 잘 반영하며, 도시지역의 복잡한 배수시스템 해석모형과 지표범람 모형을 통합한 모형 개발로 인해 더욱 정교한 도시지역에서의 홍수 범람 해석을 실시할 수 있을 것으로 판단된다. 본 모형의 개발로 침수상황의 시간별 진행과정을 분석함으로써 도시홍수에 대한 침수위험 지점 파악 및 주민대피지도 구축 등에 활용될 수 있을 것으로 판단된다. 있을 것으로 판단되었다.4일간의 기상변화가 자발성 기흉 발생에 영향을 미친다고 추론할 수 있었다. 향후 본 연구에서 추론된 기상변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감

  • PDF

Consideration for evaluation patterns of normalized RMR parameters (정규화한 RMR 변수들의 평가 경향에 대한 고찰)

  • Lee, Seong-Min;Lee, Yeon-Hee;Kim, Sun-Myung
    • Journal of Korean Tunnelling and Underground Space Association
    • /
    • v.14 no.1
    • /
    • pp.23-35
    • /
    • 2012
  • Due to the convenience, RMR has been widely applied in civil engineering works such as tunnel, slope, and so on. Many researchers have studied to suggest more simple and trustable RMR by modifying its parameters. However, those researches have just focused on looking for easy modified-RMRs by reducing number of parameters using various statistical analyses. Therefore, this research studied questions of modified-RMRs and gaps between RMR and its parameters. Approximately 2,000 parameters of 400 RMRs from various tunnel sites were normalized respectively and compared with one another to study their relations and divergences. The comparison results showed that there were common patterns among RMR and parameters. Data of uniaxial compressive strength and RQD, qualitative parameters, were located in upper side of RMR line. Discontinuity condition and ground water, quantitative oriented parameters, were opposite to them. It means if both qualitative and quantitative parameters can be properly combined then it can be easy to make simple and easy modified-RMRs without using difficult statistics. This results also show that the majority of field engineers used to estimate RMR conservatively when they did quantitative oriented parameters.

Detection of Imprinted Quantitative Traits Loci (QTL) for Reproductive and Growth Traits in Region of IGF II Gene on fig Chromosome (돼지 염색체상의 IGF II 유전자 인접 부위에서 번식 및 성장형질에 연관된 Imprinting 양적형질 유전자 좌위(QTL)의 탐색)

  • Lee, Hakkyo
    • Korean Journal of Animal Reproduction
    • /
    • v.25 no.4
    • /
    • pp.295-304
    • /
    • 2001
  • Characterization of quantitative trait loci (QTL) was investigated in the experimental crosses between Berkshire and Yorkshire breed. A total of 525 F$_2$ progenies from 65 matting of F$_1$ Parents were produced. Phenotypic measurements included average daily gain (ADG), average back fat thickness (ABF), and loin eye area (LEA). To identify the presence of QTL for reproductive performance, birth weight (BWT) and body weight at 16 days (16DAY) were included as indirect trait. QTL segregation was deduced using 8 markers assigned to chromosome 2 (SSC2). Quantitative trait locus analyses were performed using interval mapping by regression under line-cross model. Presence of imprinting was tested under the statistical model that separated the expression of paternally and maternally inherited alleles. To set the evidence of QTL presence, significance thresholds were derived by permutation following statistical tests, respectively. Genome scan revealed significant evidence for three quantitative trait loci (QTL) affecting growth and body compositions, of which two were identified to be QTL with imprinting expression mode near the ICF II gene region. For average back fat thickness (ABF), a paternally expressed QTL was found on chromosome 2 (SSC2). A paternally expressed QTL affecting loin eye area (LEA) was found in the region of SSC2 where evidence of imprinted QTL was found for average back fat thickness (ABF). For average daily gain (ADG), QTL expressed with Mendelian mode was found on chromosome 2 (SS2). Also, QTL affecting average daily gain (ADC), was identified to be expressed with Mendelian express mode.

  • PDF

Decision Supporting System for Shadow Mask′s Development Using Rule and Case (Rule과 Case를 활용한 설계 의사결정 지원 시스템)

  • 김민성;진홍기;정사범;손기목;예병진
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.05a
    • /
    • pp.315-322
    • /
    • 2002
  • 최근에 경험적 지식을 체계화하는 방법으로 사례기반추론(CBR: Case Based Reasoning) 및 규칙기반추론(RBR: Rule Based Reasoning)이 여러 분야에서 이용되고 있다. CBR과 RBR이 각각 활용되기도 하지만 문제 해결의 정확성을 높이기 위해 복합된 형태로 사용되기도 하고, 흑은 효과적으로 문제를 해결하기 위해 문제 해결 단계별로 각각 사용되기도 한다 또한 데이터에서 지식을 추출하기 위한 세부 알고리즘으로는 인공지능과 통계적 분석기법 등이 활발하게 연구 및 적용되고 있다. 본 연구는 모니터의 핵심 부품인 섀도우마스크(Shadow Mask)를 개발하는데 있어 도면 협의부터 설계가지의 과정에 CBR과 RBR을 활용하고 발생되는 데이터를 이용하여 진화(Evolution)하는 지식기반시스템(Knowledge Based System)으로 구축하는 것을 목적으로 하고 있다. 특히 도면 협의시 인터넷상에 웹서버 시스템을 통하여 규격 (User Spec.)을 생성하고 이를 이용하여 자동으로 도면이 설계되도록 하고 저장된 사례들을 공유할 수 있도록 하여 도면 검토 시간이 단축되고 검토의 정확성을 기할 수 있어 실패비용을 감소시켰다. 그리고 실제 설계시 CBR과 RBR을 활용하여 자동설계를 할 수 있게 하였고 현장에서 발생되는 데이터를 지식화하여 유사사례 설계가 가능하도록 하였다. 지식기반시스템은 신속한 도면 검토가 가능하므로 인원 활용이 극대화되고, 섀도우 마스크 설계자와 마스터 패턴 설계자 사이의 원활한 의사소통을 통해 고객과의 신뢰성 확보와 신인도 향상을 기대할 수 있는 효과가 있다. 그리고 고급설계자에게만 의지되어온 것을 어느 정도 해결할 수 있고, 신입설계자에게는 훌륭한 교육시스템이 될 수 있다.한 도구임을 입증하였다는 점에서 큰 의의를 갖는다고 하겠다.운 선용품 판매 및 관련 정보 제공 등 해운 거래를 위한 종합적인 서비스가 제공되어야 한다. 이를 위해, 본문에서는 e-Marketplace의 효율적인 연계 방안에 대해 해운 관련 업종별로 제시하고 있다. 리스트 제공형, 중개형, 협력형, 보완형, 정보 연계형 등이 있는데, 이는 해운 분야에서 사이버 해운 거래가 가지는 문제점들을 보완하고 업종간 협업체제를 이루어 원활한 거래를 유도할 것이다. 그리하여 우리나라가 동북아 지역뿐만 아니라 세계적인 해운 국가 및 물류 ·정보 중심지로 성장할 수 있는 여건을 구축하는데 기여할 것이다. 나타내었다.약 1주일간의 포르말린 고정이 끝난 소장 및 대장을 부위별, 별 종양개수 및 분포를 자동영상분석기(Kontron Co. Ltd., Germany)로 분석하였다. 체의 변화, 장기무게, 사료소비량 및 마리당 종양의 개수에 대한 통계학적 유의성 검증을 위하여 Duncan's t-test로 통계처리 하였고, 종양 발생빈도에 대하여는 Likelihood ration Chi-square test로 유의성을 검증하였다. C57BL/6J-Apc$^{min/+}$계 수컷 이형접합체 형질전환 마우스에 AIN-76A 정제사료만을 투여한 대조군의 대장선종의 발생률은 84%(Group 3; 21/25례)로써 I3C 100ppm 및 300ppm을 투여한 경우에 있어서는 각군 모두 60%(Group 1; 12/20 례, Group 2; 15/25 례)로 감소하는 경향을 나타내었다. 대장선종의 마리당 발생개수에 있어서는 C57BL/6J-Apc$^{min/+}$계 수컷 이형접합체 형질전환 마우스에 AIN-76A 정제사료만을 투여한

  • PDF

Immunohistochemical c-fos Expression in Osteosarcoma (골육종의 c-fos 발현에 관한 면역조직화학적 검색)

  • Park, Yong-Koo;Park, Hye-Rim
    • The Journal of the Korean bone and joint tumor society
    • /
    • v.5 no.3
    • /
    • pp.162-168
    • /
    • 1999
  • The products of c-fos and c-jun proto-oncogenes form the heterodimeric complex activator protein 1 (AP-1), which plays an important part in the control of bone cell proliferation and differentiation, as well as in the development of bone tumors. The expression of c-fos protein was examined in 35 cases of human osteosarcomas as formalin-fixed paraffin-embedded tissue sections using a monoclonal antibody. The expression of c-fos was restricted to bone-forming lesions, while low grade cartilaginous tumors were devoid of immunoreactivity. The highest levels of c-fos expression were detected in osteoblastic osteosarcoma (13 of 17 cases with grade one on two) while two chondroblastic osteosarcomas, one fibroblastic osteosarcoma, and two parosteal osteosarcomas were negative. Two cases of telangiectatic osteosarcomas were positive for c-fos protein. However, since there is a tendency of high c-fos protein expression at the higher histological grade, significant differences were not present in the expression of c-fos protein. Thus c-fos expression may be implicated in the development of osteosarcomas, but they appear to have little or no relevance in the development of low grade cartilaginous neoplasms.

  • PDF

Changes in Steroid Receptor Number of and Bioactivity of Gonadotropin in the Follicular Fluid of Porcine Ovafian Atretic Follicles I. Bioavailable Testosterone (돼지의 폐쇄여포내 스테로이드 수용체의 변화와 여포액내 생식소자극 호르몬의 활성도 변화 1. 활성적 Testosterone의 농도)

  • 윤용달;이창주;전은현;이주영
    • The Korean Journal of Zoology
    • /
    • v.32 no.3
    • /
    • pp.281-289
    • /
    • 1989
  • The present study was disigned to determine the concentration of bioavailable steroid hormones in the atretic follicular fluid (FF). The concentradons of progesterone (P), testosterone (T), estradiol (E), androstenedione (A), and 5-$\alpha$ dihydrotestosterone (DIlT) were determined by the established methods of luminescent immunoassay (LIA) or radioimmunoassay (RIA). Concentrations of T, A and Diff in human FF from smail (< 6 mm). medium (8-15 mm), and large (> 15 mm) atretic follicles were significandy higher than those of normal ones (p < 0.01). However, the levels of T, A and DHT in smail atretic foflicle were significandy lower than those found in normal one. The concentrations of P in atretic FF from porcine small (< 3 mm), medium (4-6 mm), and large (> 7 mm) follicles were not different from that of normal ones. However, the concentration of E in atretic forncles of each group was significantly lower than that of normal group (p < 0.001 in each group). On the other hand, the percentages of bioavailable T (BI) in human FF were significandy (p <0.001) higher than those in normal groups. The BT in normal or atretic FF was more than 90 % of total T. The present result demonstrates that the bioavailable androgen, but not E levels in atretic follicles is higher than that of normal one, and that the atretic mechanism might be dependent on the ovarian forncle size in the developmental stage and on the animal model system. Moreover, the present study suggests that the steroids found in the FF are the bioavailable forms and the concentration of BT in FF could be used as one of the valuable criteria classifying the ovarian atretic follicle.

  • PDF

Confidence Bounds following Adaptive Group Sequential Tests with Repeated Measures in Clinical Trials (반복측정자료를 가지는 적응적 집단축차검정에서의 신뢰구간 추정)

  • Joa, Sook Jung;Lee, Jae Won
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.4
    • /
    • pp.581-594
    • /
    • 2013
  • A group sequential design can end a clinical trial early if a confirmed efficacy or a futility of study medication is found during clinical trials. Adaptation can adjust the design of clinical trials based on accumulated data. The key to this methodology is considered to control the overall type 1 error rate while maintaining the integrity of clinical trials. The estimation would be more complex and the sample size calculation will be more difficult if the clinical trials have repeated measurement data. Lee et al. (2002) suggested a repeated observation case by using the independent increments properties of the interim test statistics and investigated the properties of the proposed confidence interval based on the stage-wise ordering. This study extend Lee et al. (2002) to adaptive group sequential design. We suggest test statistics for the adaptation as redesigning the second stage of clinical trials and induce the stage-wise confidence interval of parameter of interests. The simulation will help to confirm the suggested method.

A Report on the Inter-Gene Correlations in cDNA Microarray Data Sets (cDNA 마이크로어레이에서 유전자간 상관 관계에 대한 보고)

  • Kim, Byung-Soo;Jang, Jee-Sun;Kim, Sang-Cheol;Lim, Jo-Han
    • The Korean Journal of Applied Statistics
    • /
    • v.22 no.3
    • /
    • pp.617-626
    • /
    • 2009
  • A series of recent papers reported that the inter-gene correlations in Affymetrix microarray data sets were strong and long-ranged, and the assumption of independence or weak dependence among gene expression signals which was often employed without justification was in conflict with actual data. Qui et al. (2005) indicated that applying the nonparametric empirical Bayes method in which test statistics were pooled across genes for performing the statistical inference resulted in the large variance of the number of differentially expressed genes. Qui et al. (2005) attributed this effect to strong and long-ranged inter-gene correlations. Klebanov and Yakovlev (2007) demonstrated that the inter-gene correlations provided a rich source of information rather than being a nuisance in the statistical analysis and they developed, by transforming the original gene expression sequence, a sequence of independent random variables which they referred to as a ${\delta}$-sequence. We note in this report using two cDNA microarray data sets experimented in this country that the strong and long-ranged inter-gene correlations were still valid in cDNA microarray data and also the ${\delta}$-sequence of independence could be derived from the cDNA microarray data. This note suggests that the inter-gene correlations be considered in the future analysis of the cDNA microarray data sets.