• Title/Summary/Keyword: 모집단

검색결과 807건 처리시간 0.025초

Smallest-Small-World Cellular Genetic Algorithms (최소좁은세상 셀룰러 유전알고리즘)

  • Kang, Tae-Won
    • Journal of KIISE:Software and Applications
    • /
    • 제34권11호
    • /
    • pp.971-983
    • /
    • 2007
  • Cellular Genetic Algorithms(CGAs) are a subclass of Genetic Algorithms(GAs) in which each individuals are placed in a given geographical distribution. In general, CGAs# population space is a regular network that has relatively long characteristic path length and high clustering coefficient in the view of the Networks Theory. Long average path length makes the genetic interaction of remote nodes slow. If we have the population#s path length shorter with keeping the high clustering coefficient value, CGAs# population space will converge faster without loss of diversity. In this paper, we propose Smallest-Small-World Cellular Genetic Algorithms(SSWCGAs). In SSWCGAs, each individual lives in a population space that is highly clustered but having shorter characteristic path length, so that the SSWCGAs promote exploration of the search space with no loss of exploitation tendency that comes from being clustered. Some experiments along with four real variable functions and two GA-hard problems show that the SSWCGAs are more effective than SGAs and CGAs.

A Genetic Algorithm with Local Competing (지역적으로 경정하는 유전자 알고리즘)

  • Kang, Tae-Won
    • Journal of KIISE:Software and Applications
    • /
    • 제29권6호
    • /
    • pp.396-406
    • /
    • 2002
  • On the whole, the simple GAs with just one population set is effective in finding one optimal solution. However, many real world problems have a lot of optimal solutions, and often it is important to find all of them. In this paper, we propose a GA that has a population set containing multiple optimal solutions. In the proposed GA, each of the individuals in population set has its own geological neighbors, and they exchange their genes globally as well as compete with others locally. The paper then evaluates the proposed GA along with many multimodal problems including a 30bit, order-six bipolar-deceptive function. Finally, we present some improvement directions of the proposed GA.

Two-sample chi-square test for randomly censored data (임의로 관측중단된 두 표본 자료에 대한 카이제곱 검정방법)

  • 김주한;김정란
    • The Korean Journal of Applied Statistics
    • /
    • 제8권2호
    • /
    • pp.109-119
    • /
    • 1995
  • A two sample chi-square test is introduced for testing the equality of the distributions of two populations when observations are subject to random censorship. The statistic is appropriate in testing problems where a two-sided alternative is of interest. Under the null hypothesis, the asymptotic distribution of the statistic is a chi-square distribution. We obtain two types of chi-square statistics ; one as a nonnegative definite quadratic form in difference of observed cell probabilities based on the product-limit estimators, the other one as a summation form. Data pertaining to a cancer chemotheray experiment are examined with these statistics.

  • PDF

Calculating Sample Variance for the Combined Data (두 자료들의 평균과 분산을 이용한 혼합자료의 분산 계산)

  • Shin, Mi-Young;Cho, Tae-Kyoung
    • The Korean Journal of Applied Statistics
    • /
    • 제21권1호
    • /
    • pp.177-182
    • /
    • 2008
  • There are times when we need more sample to achieve a more accurate estimator. Since these two sets of sample have the information about the same population, it is necessary to treat both as a single combined data. In this paper we present the unpooled sample variance for the combined data when we just know a sample mean and variance for the each data set without the raw data. It is shown that the pooled variance $s^2_p$ is always greater than the exact variance $s^2_t$ when ${\bar{x}}_n\;=\;{\bar{y}}_m$. And the difference of means for two data, ${\bar{x}}_n-{\bar{y}}_m}$, is larger, the difference of $s^2_p$ and $s^2_t$ is larger.

A Quantative Homogeneity Analysis of Seoul Rainfall using Bootstrap (Bootstrap 기법을 이용한 서울지점 강우자료의 정량적 동질성 분석)

  • Hwang, Seok-Hwan;Kim, Joong-Hoon;Yoo, Chul-Sang;Jung, Sung-Won;Yoo, Do-Guen
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1157-1161
    • /
    • 2009
  • 본 연구에서는 부트스트랩(Bootstrap) 기법을 이용하여 측우기 강우량 관측계열(CWK)과 근대우량계 강우량 관측계열(MRG)에 대해 동질성 분석을 실시하였다. 서로다른 두 자료계열에 대한 전통적인 통계적 동질성 검정 방법은 모집단의 분포형을 알고 있어야 검정결과가 유효하였기 때문에 모집단의 분포가 복잡한 기상자료들은 이러한 전통적 방법을 사용하여 동질성을 파악하는 것이 매우 어려웠고 결과로 제시된 통계적 유의성에 대해서도 의심의 여지가 있었다. 이러한 이유로 본 논문에서는 모집단을 가정하지 않아도 되는 비모수적 모의 방법인 부트스트랩 기법을 이용하여 두 자료계열간의 동질성 검정을 실시하였다. 분석 결과 M20의 CWK와 MRG는 미소한 기후의 경년변화 (Trend)의 영향을 제외하면 동질성을 가진 자료로 볼 수 있었으나, 갈수기의 경우는 월강우량의 크기에 변화가 있으며 호우기의 경우는 일강우량의 크기 및 호우의 형태에 변화가 있는 것으로 나타났다.

  • PDF

Visual inspection of overlapping confidence intervals for comparison of normal population means (정규 모집단의 평균 비교를 위한 신뢰구간 겹치기 시각화)

  • Choi, Sookhee;Han, Kyungsoo
    • The Korean Journal of Applied Statistics
    • /
    • 제30권5호
    • /
    • pp.691-699
    • /
    • 2017
  • Data analysts sometimes test the equality of two normal population means by the inspection of the overlapping of two confidence intervals. This method seems simple to use; however, it is a common statistical misconception to suppose that two normal means are not significantly different because of no overlapping. This article will present transforming the confidence interval of the mean difference to individual confidence intervals that are visualized to inspect overlapping. It will also be shown that this technique can be extended when comparing the k normal population means with equal variances.

Generalization of modified systematic sampling and regression estimation for population with a linear trend (선형추세를 갖는 모집단에 대한 변형계통표집의 일반화와 회귀추정법)

  • Kim, Hyuk-Joo;Kim, Jeong-Hyeon
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권6호
    • /
    • pp.1103-1118
    • /
    • 2009
  • When we wish to estimate the mean or total of a finite population, the numbering of the population units is of importance. In this paper, we have proposed two methods for estimating the mean or total of a population having a linear trend, for the case when the reciprocal of the sampling fraction is an even number and the sample size is an odd number. The first method involves drawing a sample by using a method which is a generalization of Singh et al's (1968) modified systematic sampling, and using interpolation in determining the estimator. The second method involves selecting a sample by modified systematic sampling, and estimating the population parameters by the regression estimation method. Under the criterion of the expected mean square error based on Cochran's (1946) infinite superpopulation model, the proposed methods have been compared with existing methods. We have also made a comparison between the two proposed methods.

  • PDF

A Hybrid Genetic Algorithm for the Identical Parallel Machine Total Tardiness Problem (동종 병렬기계에서 납기지연 최소화를 위한 혼합형 유전 알고리즘의 개발)

  • Choe, Hong-Jin;Lee, Jong-Yeong;Park, Mun-Won
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.624-627
    • /
    • 2004
  • 본 연구는 동일한 병렬기계에서의 총 납기지연의 합을 최소화하는 일정계획 문제에 대해 다룬다. 이 문제는 Lenstra et al. (1977)에 의해 NP-hard로 알려져 있으며, 작업의 수와 기계의 수가 큰 현실적 문제에 대해 적절한 시간 내에 최적해를 찾는다는 것은 사실상 불가능하다. 따라서 본 연구에서는 이 문제를 해결하기 위하여 혼합형 유전 알고리즘(hybrid genetic algorithm)을 제안한다. 혼합형 유전 알고리즘에서는 임의로 발생시킨 모집단에 대해 먼저 유전 알고리즘(genetic algorithm)이 세대를 진행하며 해를 개선한다. 유전 알고리즘이 일정기간동안 더 이상 해를 개선하지 못하면, 부분탐색 알고리즘(local-search algorithm))이 유전 알고리즘의 모집단의 개체들에 대해 해의 개선을 시도한다. 즉, 부분 탐색 알고리즘은 모집단 속의 각각의 개체를 초기해로 하여 모집단 내의 개체 수만큼의 부분 최적해(local optimum)들을 구한다. 이렇게 구한 부분 최적해들로 새로운 모집단을 구성하면 다시 유전 알고리즘이 진행된다. 이 과정을 종료조건에 이를 때까지 번갈아가며 반복 수행한다. 본 연구에서 제안한 유전 알고리즘에서는 Bean(1994)이 제안한 Random key 방법으로 개체를 표현하였으며 Park(2000)이 제안한 3가지 교차 연산자들을 채용하였다. 부분탐색 알고리즘을 위해서는 쌍대교환(pair-wise interchange) 방법을 통해 이웃해를 생성하였다. 선행실험을 통하여 제안한 혼합형 유전알고리즘에서 사용하는 다양한 모수(parameter)값들을 최적화하였으며 알고리즘의 성능을 비교하기 위하여 기존의 알고리즘과도 비교실험을 수행하였다.복적인 지표가 채택되는 경우를 포함하고 있다. 셋째는 추상적이며 측정이 어려운 지표를 채택하고 있는 경우이다. 여기에는 지표에 대한 정확한 정의가 이루어져 있지 않아 피 평가자가 불필요하거나 과다한 평가 자료를 준비해야 하거나 평가자로 하여금 평가 시 혼돈을 유발할 가능성이 있거나, 또는 상위개념의 평가항목과 하위개념의 평가항목이 혼재되어 구분이 모호한 경우를 포함하고 있다. 바탕으로 '생태적 합리성'이라는 체계적인 지식교육을 거쳐서, '환경정의' 의식의 제고로 이어가고, 굵직한 '환경갈등'의 상황에서 뚜렷한 정치적 태도와 실천을 할 수 있는 '생태적 인간상'의 육성으로 나아갈 수 있어야 한다는 것이 필자의 생각이다. 이를 위해서는 어찌되었건 체험학습 영역에서는 환경현안에 대한 사회적 실천을 '교육 소재'로 삼을 수 있어야 하며, 교과학습 영역에서는 한국사회의 환경현안에 대한 정치경제적 접근을 외면하지 말고 교과서 저작의 소재로 삼을 수 있어야 하며, 이는 '환경관리주의'와 '녹색소비'에 머물러 있는 '환경 지식교육'과 실천을 한단계 진전시키는 작업으로 이어질 것이다. 이후 10년의 환경교육은 바로 '생태적 합리성'과 '환경정의'라는 두 '화두'에 터하여 세워져야 한다.배액에서 약해를 보였으나, 25% 야자지방산의 경우 50 ${\sim}$ 100배액 어디에서도 액해를 보이지 않았다. 별도로 적용한 시험에서, 토마토의 경우에도 25% 야자지방산 비누 50 ${\sim}$ 100배액 모두 약해를 발생하지 않았으나, 오이에서는 25% 야자지방산 비누 100배액에도 약해를 나타내었다. 12. 이상의 결과, 천연지방산을 이용하여 유기농업에 허용되는 각종의 살충비누를 제조할 수 있었으

  • PDF

A Case Study on the Construction of the Sampling Frame and Sampling Design for 2008 Seoul Survey (2008 서울서베이 표본추출틀 구축 및 표본추출 사례 연구)

  • Kang, Hyun-Cheol;Park, Seung-Yeol;Kim, Jee-Youn;Kim, In-Soo;Lee, Dong-Su;Hwang, Ja-Eil;Park, Min-Gue
    • Survey Research
    • /
    • 제10권3호
    • /
    • pp.157-172
    • /
    • 2009
  • For a survey research in which the characteristics of the population of interest are investigated from a sample, representativeness of the sampling frame is one of the most important part to be considered. If the sampling frame fails to represent the population properly, statistical procedures based on the even efficient sampling design result in significant nonsampling biases and thus the statistical validities of the results could be damaged. But the construction of the reliable sampling frame that covers the population properly costs money and time and thus the sampling frame based on a census or a large scale survey is often used in practice. For example, the sampling frame based on the population households census is used for many household surveys in Korea. But due to the time difference between the census and a survey of interest, the sampling frame constructed from the census is expected to fail to cover the population of interest. Especially, one could expect a large amount of population and household movement in a large city like Seoul. Thus in our research, we considered the construction of new sampling frame and the procedure of sample selection for 2008 Seoul survey. We analyzed the sampling frame based on 2005 population households census and found that it does not represent the population properly. Thus, we proposed a new sampling frame based on resident registration DB for 2008 Seoul survey. We also proposed the sampling weights and estimator of the population mean based on the sample selected from the newly constructed sampling frame.

  • PDF

Case Study on Big Data Sampling Population Collection Method Errors in Service Business (서비스 비즈니스의 빅데이터 모집단 산정방식 오류에 관한 사례연구)

  • Ahn, Jinho;Lee, Jeungsun
    • Journal of Service Research and Studies
    • /
    • 제10권2호
    • /
    • pp.1-15
    • /
    • 2020
  • As big data become more important socially and economically in recent years, many problems have been derived from the indiscriminate application of big data. Big data are valuable because it can figure out the meaning of informative information hidden within the data. In particular, to predict customer behavior patterns and experiences, structured data that were extracted from Customer Relationship Management (CRM) or unstructured data that were extracted from Social Network Service(SNS) can be defined as a population to interpret the data, during which many errors can occur. However, those errors are usually overlooked. In addition to data analysis techniques, some data, which should be considered in the analysis, are not included in the population and thus do not show any meaningful patterns. Therefore, this study presents the measurement and interpretation of the data generated when the cause of error in the population setting is strong relationship and interaction between people or a person and an object. In other words, it will be shown that if the relationship and interaction are strong, it is important to include data collected from the perspective of user experience and ethnography in the population by comparing various cases of big data application, through which the meaning will be derived and the best direction will be suggested.