• 제목/요약/키워드: Small Sample Size Problem

검색결과 55건 처리시간 0.019초

공시된 자료를 이용한 한의원 환산지수 연구 (A Conversion factor of Oriental Medicine based on the publicly available information)

  • 오동일
    • 한국산학기술학회논문지
    • /
    • 제9권2호
    • /
    • pp.535-543
    • /
    • 2008
  • 본 연구에서는 그 동안 많은 조사비용에도 불구하고 원가분석연구의 단점으로 지적되어왔던 적은 표본수와 신뢰성 문제를 해결하고 보다 적은 비용으로 한의원 환산지수를 산출할 수 있는 방법론을 개발하였다. 널리 공시되어 있고 쉽게 구할 수 있는 대규모 자료에 기반을 둠으로써 분석의 공정성과 검증가능성을 확보할 수 있었다. 그러나 공시된 자료의 종류에 따라 환산지수 차이가 발생하므로 공시된 자료를 이용한 분석과 표본 추출에 의한 원가분석을 병행해서 사용할 필요성이 있다. 보다 근본적으로는 합리적인 수가 산출을 위해서는 한의원과 관련된 원가정보를 포함하는 보건 의료 통계시스템 구축이 매우 절실하다.

의사 샘플 신경망을 이용한 토석류 퇴적 모델의 파라미터 추정 (Parameter Estimation in Debris Flow Deposition Model Using Pseudo Sample Neural Network)

  • 허경용;이창우;박충식
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권11호
    • /
    • pp.11-18
    • /
    • 2012
  • 토석류 퇴적 모델은 토석류에 의한 피해지 예측을 위해 random walk model(RWM)을 사용하여 구성한 모델로 피해지 예측에서 그 효용성이 입증되었지만 몇 개의 자유 파라미터가 실험적으로 결정되어야 하는 문제점이 있다. 파라미터를 자동으로 추정하기 위한 방법은 여러 가지가 있지만 토석류 데이터는 학습 데이터의 크기가 작아 기존 학습 기법을 적용하는데 어려움이 있다. 이 논문에서는 학습 데이터 크기 문제를 완화할 수 있는 신경망의 변형인 의사 샘플 신경망을 제안하였다. 의사 샘플 신경망은기존 샘플로부터 의사 샘플을생성하고 이를 학습에 사용한다. 의사 샘플은 해공간을 평탄화시키고 국부 최적해에 빠질 확률을 줄여줌으로써 기존 신경망에 비해 안정적인 파라미터 추정이 가능해진다. 이러한 사실은 실험 결과 통해 확인할 수 있다.

Analyzing Cognitive or Non-Cognitive Factors Involved in the Process of Physics Problem Solving in an Everyday Context - An Effort for Sucessful Problem Solving in an Everyday Context -

  • Park, Jong-Won
    • 한국과학교육학회지
    • /
    • 제24권4호
    • /
    • pp.774-784
    • /
    • 2004
  • In the previous study, six factors which could disturb students' problem solving in an everyday context were identified and discussed. In this study, teaching materials to help students overcome those disturbing factors for successful problem solving in an everyday context were developed and applied to twenty-nine grade 10 students, and the effects of teaching materials were analyzed. According to the analysis of the correlation between the performance in everyday context problem solving and the benefit from the teaching materials, it was found that students who received the help from the teaching materials showed better performance with statistical significance. And students noted that teaching materials were helpful for them to solve the physics problems. Analyzing the overall performance of students in solving the everyday context problem, students in the experimental group showed better performance than the control group and this performance difference was larger among low-score students in school science testing. However, these differences were not statistically significant because the sample size was small. And, based on the analysis of interviews with students, it was also found that some students who showed low performance might not receive help from the teaching materials because the materials were too complex to be read easily, or because the basic concepts needed to solve the problem were not understood. Therefore, the results obtained from the interviews will be used to design more effective teaching for problem solving in an everyday context.

Microfluidic Devices for Cell Analysis

  • Bachman, Mark;Li, G.P.
    • 한국재료학회:학술대회논문집
    • /
    • 한국재료학회 2009년도 추계학술발표대회
    • /
    • pp.3.2-3.2
    • /
    • 2009
  • Microfluidics and BioMEMStechnology has increasingly been used as a tool for studying small volumes oftissue and even individual cells. One of the most important benefits ofmicrofluidic technology is the potential to build devices that analyze and sortmammalian cells. The "sorting problem" typically requires that a fewcells be selected and isolated from a larger population of hundreds, thousandsor even millions of other cells. For example, cancer tumor cells may resideamong a large population of healthy cells, but it would be of great interest toidentify, isolate and study only the cancer cells. In another application, onemay want to determine the number of white blood cells within a sample of blood.We have developed microfluidic devices that enable researchers to select cellsfrom a population by a variety of methods, including antibody staining,dielectrophoretic selection, and physical size selection. These devices haveapplications in cancer research where cancer cells must be identified fromnormal tissue, but where only small samples of tissue are available. In thistalk, we will present some of our microfluidic cell sorting devices, discusstheir physical principles, and their use in biological applications.

  • PDF

A Spatial Regularization of LDA for Face Recognition

  • Park, Lae-Jeong
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제10권2호
    • /
    • pp.95-100
    • /
    • 2010
  • This paper proposes a new spatial regularization of Fisher linear discriminant analysis (LDA) to reduce the overfitting due to small size sample (SSS) problem in face recognition. Many regularized LDAs have been proposed to alleviate the overfitting by regularizing an estimate of the within-class scatter matrix. Spatial regularization methods have been suggested that make the discriminant vectors spatially smooth, leading to mitigation of the overfitting. As a generalized version of the spatially regularized LDA, the proposed regularized LDA utilizes the non-uniformity of spatial correlation structures in face images in adding a spatial smoothness constraint into an LDA framework. The region-dependent spatial regularization is advantageous for capturing the non-flat spatial correlation structure within face image as well as obtaining a spatially smooth projection of LDA. Experimental results on public face databases such as ORL and CMU PIE show that the proposed regularized LDA performs well especially when the number of training images per individual is quite small, compared with other regularized LDAs.

라그랑지 기법을 쓴 영 공간 기반 선형 판별 분석법의 변형 기법 (Transformation Technique for Null Space-Based Linear Discriminant Analysis with Lagrange Method)

  • 호우위시;민황기;송익호;최명수;박선;이성로
    • 한국통신학회논문지
    • /
    • 제38C권2호
    • /
    • pp.208-212
    • /
    • 2013
  • 부류안 분산 행렬의 특이성 때문에 선형 판별 분석은 작은 표본 크기 문제에 쓰기에 알맞지 않다. 이에 선형 판별 분석을 확장하여 작은 표본 크기 문제에서 좋은 성능을 갖는 영 공간 기반 선형 판별 분석이 제안되었다. 이 논문에서는 라그랑지 기법을 바탕으로 하여, 영 공간 기반 선형 판별 분석을 써서 특징을 추출하는 문제를 선형 방정식 문제로 바꾸는 과정을 제안하였다.

의사 샘플 신경망에서 학습 샘플 및 특징 선택 기법 (Training Sample and Feature Selection Methods for Pseudo Sample Neural Networks)

  • 허경용;박충식;이창우
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.19-26
    • /
    • 2013
  • 의사 샘플 신경망은 학습 샘플의 수가 적은 경우 학습된 신경망이 국부 최적해에 빠져 성능이 저하되는 것을 보완하기 위해 기존 샘플들로부터 의사 샘플을 생성하고 이를 통해 해공간을 평탄화 시킴으로써 학습된 신경망의 성능을 향상시킬 수 있는 신경망의 변형이다. 이는 학습 샘플의 양에 관한 문제로 이 논문에서는 이에 더해 학습 샘플의 질을 향상시킴으로써 학습된 신경망의 성능을 더욱 높일 수 있는 방법을 제시하였다. 잡음이 적게 포함된 전형적인 학습 샘플들만이 주어지고 입력 특징 중 출력과 연관성이 높은 특징만을 사용함으로써 학습된 신경망의 성능을 높일 수 있음은 자명하다. 따라서 이 논문에서는 커널밀도 추정을 통해 비전형적인 학습샘플을 제거하고 입력값이 출력값에 미치는 영향을 나타내는 연관성 척도를 사용하여 연관성이 적은 특징을 제거함으로써 의사 샘플 신경망의 성능을 향상시킬 수 있음을 보였다. 제시한 방법의 유효성은 토석류 데이터를 이용한 실험을 통해 확인할 수 있다.

정보검색 연구의 방법론에 관한 고찰 (Methodological Problems in Information Retrieval Research)

  • 이명희
    • 한국비블리아학회지
    • /
    • 제7권1호
    • /
    • pp.231-246
    • /
    • 1994
  • A major problem for information retrieval research in the past three decades has been methodology, even though some progress has been made in obtaining useful results from methodologically sound experiments. Within a methodology, potential problems include artificial data generated by the researcher, small sample size interpretation of findings. Critics have pointed out that some room exists for improving methodology of information retrieval research; using existing data, having big enough sample size, including large numbers of search queries, introducing more control in relation to variables, utilizing more appropriate performance measures, conducting rests carefully and evaluating findings properly. Relevance judgments depend entirely on the perception of the user and on the situation of the moment. In an experiment, the best judge of relevance is a user with a well defined information need. Normally more than two categories for relevance judgments are desirable becase there are degrees of relevance. In experimental design, careful control of variables is meeded for internal validity. When no single database exists for comparison, existing operational databases should be used cautiously, Careful control for the variations of search queries, inter-searcher sonsistency, intra-searcher consistency and search strategies is necessary. Parametric statistics requiring rigid assumptions are not appropriate in information retrieval research and non-parametric statistics requiring few assumptions are necessary. Particularly, the sign test and the Wilcoxon test are good alternatives.

  • PDF

Modified partial least squares method implementing mixed-effect model

  • Kyunga Kim;Shin-Jae Lee;Soo-Heang Eo;HyungJun Cho;Jae Won Lee
    • Communications for Statistical Applications and Methods
    • /
    • 제30권1호
    • /
    • pp.65-73
    • /
    • 2023
  • Contemporary biomedical data often involve an ill-posed problem owing to small sample size and large number of multi-collinear variables. Partial least squares (PLS) method could be a plausible alternative to an ill-conditioned ordinary least squares. However, in the case of a PLS model that includes a random-effect, how to deal with a random-effect or mixed effects remains a widely open question worth further investigation. In the present study, we propose a modified multivariate PLS method implementing mixed-effect model (PLSM). The advantage of PLSM is its versatility in handling serial longitudinal data or its ability for taking a randomeffect into account. We conduct simulations to investigate statistical properties of PLSM, and showcase its real clinical application to predict treatment outcome of esthetic surgical procedures of human faces. The proposed PLSM seemed to be particularly beneficial 1) when random-effect is conspicuous; 2) the number of predictors is relatively large compared to the sample size; 3) the multicollinearity is weak or moderate; and/or 4) the random error is considerable.

사전 클러스터링을 이용한 LDA-확장법들의 최적화 (On Optimizing LDA-extentions Using a Pre-Clustering)

  • 김상운;구범용;최우영
    • 전자공학회논문지CI
    • /
    • 제44권3호
    • /
    • pp.98-107
    • /
    • 2007
  • 얼굴인식 등과 같은 고차원 패턴인식에서 학습패턴의 수가 패턴 차원에 비해 매우 적을 경우 희소성 문제(the Small Sample Size problem)가 발생한다. 최근 이 문제를 해결하기 위하여 LDA, PCA+LDA, Direct-LDA 등을 비롯한 다양한 LDA-확장 법이 제안되었다. 본 논문에서는 LDA-확장 법으로 차원을 축소하기 전에 학습 패턴을 사전 클러스터링하여 서브 클래스 수를 증가시키는 방법으로 LDA-확장에 기반을 둔 식별기의 성능을 향상시키는 방법을 제안한다. LDA (또는 Direct-LDA)에서 축소된 특징공간의 차원은 학습패턴의 클래스 수로 제한되기 때문에 LDA의 식별 성능을 향상시킬 수 있도록 학습패턴을 사전에 클러스터링하여 서브 클래스의 수를 증가시키는 방법이다. 즉, 학습패턴의 특성공간(the eigen space)은 레인지 공간(the range space)과 널 공간(the null space)으로 구성되며, 레인지 공간의 차원은 클래스 수의 증가에 따라 증가한다. 따라서 변환 행렬을 구성할 때 클래스의 수를 늘려 널 공간을 최소화하게 되면 이 공간에 기인한 정보의 손실을 최소화 할 수 있다. 제안 방법을 X-OR 형태의 인공데이터와 AT&T와 Yale 벤취마크 얼굴영상 데이터베이스를 대상으로 실험한 결과 본 방법의 효용성을 확인하였다.