• 제목/요약/키워드: 집단함수

검색결과 165건 처리시간 0.023초

세 집단 판별분석 상황에서의 영향함수 유도 및 그 응용 (Derivation and Application of In uence Function in Discriminant Analysis for Three Groups)

  • 이혜정;김홍기
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.941-949
    • /
    • 2011
  • 본 논문에서는 세 집단만을 판별분석 할 경우에 계산되는 오분류확률에 영향을 미치는 이상치 판별을 목적으로 하며, 쉽게 응용 가능한 간단한 영향함수식을 제시하였다. 그리고 제시된 수식을 이용하여 안면 데이터로 세 가지 사상체질을 분류해보고 각 관찰값들의 오분류확률에 대한 영향함수를 계산하였다. 이상치를 제거하고 재 판별분석을 하는 데 있어, 오분류확률에 대한 영향함수를 이용하는 것이 효율적인 방법임을 확인하였다.

서로 다른 진화 특성을 가지는 부집단들을 사용한 새로운 하이브리드 진화 프로그래밍 기법과 카메라 보정 응용 (A New Hybrid Evolutionary Programming Technique Using Sub-populations with Different Evolutionary Behaviors and Its Application to Camera Calibration)

  • 조현중;오세영;최두현
    • 전자공학회논문지C
    • /
    • 제35C권9호
    • /
    • pp.81-92
    • /
    • 1998
  • 실수형 최적화 문제의 전역 최적해를 빠르고 정확하게 찾을 가능성을 높이기 위해, 서로 다른 진화특성을 가지는 여러 부집단들을 사용한 새로운 하이브리드 기법이 제안된다. 제안된 알고리듬은 세 개의 부집단을 사용하는데, 복잡한 적합도 함수를 가지는 문제에서 좋은 성능을 보이는 NPOSA 알고리듬이 두개의 부집단에 적용되고, 진화 방향과 크기가 조절되는 자기 적응 진화 알고리듬이 나머지 하나의 부집단에 적용되었다. 각 부집단들은 서로 다른 방법으로 진화하며 부집단들간의 상호교류를 통해 전역 최적해로 빠르게 도달하게 한다. 이 기법의 효율성은 몇 개의 표준 테스트 문제들을 사용하여 검증하였다. 마지막으로, 제안한 알고리듬이 실제 문제에 적용 가능함을 보이기 위해 카메라 파라메터의 최적값을 찾는 문제에 적용하였다. 보정 블럭에서 측정된 특징점들을 사용하여 오차 함수를 정의한 후, 하이브리드 방법이 그 오차 함수를 최소화하는 카메라 파라메터의 값을 찾을 수 있음을 보였다.

  • PDF

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

임금함수와 근속급의 비모수적 추정 (Nonparametric Estimation of Wage Equation and Return to Seniority)

  • 장인성
    • 노동경제논집
    • /
    • 제36권2호
    • /
    • pp.37-65
    • /
    • 2013
  • 본 연구는 임금함수의 비모수적 추정을 통해 근속급 및 경력급의 근로자집단별 특징을 비교해 보고, 2000년대 후반의 변화를 분석하였다. 근속 프리미엄이 가장 높은 집단은 대기업 고졸 숙련직으로 나타났으며, 비정규직, 영세업체 근로자는 근속급과 경력급이 미미하였다. 노조 유무는 근속급과 경력급에 큰 영향을 미치지 않았다. 또한 대기업 중심으로 경력에 대한 보상이 전반적으로 강화되었다. 한편, 비모수 모형설절 검정 결과 Mincer 임금함수의 설정 오류로 인한 편의는 근속 30년차 근속급 추정치의 경우 -25~29%, 경력급 추정치는 -42~6%였다.

  • PDF

공항 접근 교통수단선택 효용함수의 매개변수 추정 및 민감도 분석에 관한 연구

  • 김지홍;전경수
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 제34회 추계 학술발표회
    • /
    • pp.261-261
    • /
    • 1998
  • 교통계획의 목적은 교통체계를 분석하여 교통과 활동간의 상호작용을 효율화시켜 도시 및 지역사회의 목표를 달성하는데 있으며, 합리적인 교통계획을 수립하여 한정된 투자재원을 효율적으로 배분하기 위해서는 교통수요에 대한 합리적 접근이 필요하다. 교통수요예측의 접근방법은 미시적인 개별적 접근방법과 거시적인 집단적 접근방법으로 구분되며, 다시 모형화 기법이 결정적인가 확률적인가에 따라 개별결정적, 개별활률적, 그리고 집단결정적, 집단확률적 모형의 4가지로 구분될 수 있다. 이 중에서 일반적으로 관심의 대상이 되는 2가지 형태는 집단결정적, 개발확률적 모형이다. 집단결정적모형은 전통적 교통수요예측모형에 해당되며, 개별확률적모형은 1970년대 Mc Fadden을 시작으로 Ben-Akiva, Manheim을 중심으로 한 소비자 행동선택 이론에 근거한 개별행태모형이 이에 해당된다. 개별행태모형은 개개인의 통행행태를 다른 모든 조건이 동일할 때 개개인은 비용의 최소화를 추구하고, 비용과 관련한 통행행태는 거시적 수준에서의 주어진 제약 조건과 관계가 있으며, 의사결정은 확률분포에 의해서 결정되는 효용원칙(Efficiency Principle)에 입각하여 해석한다. 도시내와 도시간, 취업자와 비취업자, 출퇴근 시, 목적별 등의 여러 가지 통행에 있어서 다양한 변수들을 사용하여 교통수단 선택모형의 파라메카 값을 추정하고 통행패턴을 분석해 왔다. 본 논문에서는 개별행태모형인 로짓모형 중에서 집단다항로짓모형을 이용하여 여러 통행 중 공항시설의 접근에 필요한 교통수단 효용함수의 파라메타 값 추정 시, 일반적으로 사용되는 통행시간, 통행비용이라는 변수를 공통으로 두고, 대중교통의 경우에만 해당하는 환승이라는 특정대안변수(Specific alternative variable)를 첨가하여 그것이 수단선택에 미치는 영향을 분석한다. 또한, 대중교통의 속성을 가지고 있는 지하철과 버스를 하나의 대안으로 묶어서 효용함수를 구한 다음 다시 승용차, 택시, 대중교통을 독립된 대안으로 두고 모형을 정립하는 NESTED LOGIT모형으로 파라메타를 추정하여 대중교통의 효용에 관해 분석·비교하였다. 본 논문에 이용된 자료는 공항을 이용하는 이용객들을 대상으로 직접 설문·면접조사한 자료이며 대상 교통수단은 승용차, 택시, 지하철, 버스로 설정하였다.

  • PDF

신경망기법을 이용한 기업부실예측에 관한 연구

  • 정기웅;홍관수
    • 재무관리연구
    • /
    • 제12권2호
    • /
    • pp.1-23
    • /
    • 1995
  • 본 연구의 목적은 특정 금융기관의 주거래기업들에 대한 부실예측을 위해 주거래기업들을 잠식, 도산, 그리고 건전기업과 같이 세집단으로 구분하여 예측하고자 하며, 기업부실 예측력에 영향을 미치는 세 가지 요인으로서 표본구성, 투입 변수, 분석 기법의 관점에서 다음을 살펴보는 것이다. 첫째, 기업부실예측에서 전통적인 delta learning rule과 sigmoid함수를 사용한 역전파학습(신경망 I)과 이들의 변형형태인 normalized cumulative delta learning rule과 hyperbolic tangent함수를 사용한 역전파 학습(신경망 II)과의 예측력의 차이를 살펴보고 또한 이러한 두가지 신경망기법의 예측력을 MDA(다변량판별분석) 결과와 비교하여 신경망기법에 대한 예측력의 유용성을 살펴보고자 한다. 둘째, 세집단분류문제에서는 잠식, 도산, 건전기업의 구성비율이 위의 세가지 예측기법의 결과에 어떠한 영향을 미치는지를 살펴보고자 한다. 세째, 투입 변수선정은 기존연구 또는 이론을 바탕으로 연구자의 판단에 의해 선택하는 방법과 다수의 변수를 가지고 통계적기법에 의해 좋은 판별변수의 집합을 찾는 것이다. 본 연구에서는 이러한 방법들에 의해 선정된 투입변수들이 세가지 예측기법의 결과에 어떠한 영향을 미치는지를 살펴보고자 한다. 이러한 관점에서 본 연구의 실증분석 결과를 요약하면 다음과 같다. 1) 신경망기법이 두집단에서와 같이 세집단 분류문제에서도 MDA보다는 더 높은 예측력을 보였다. 2) 잠식과 도산기업의 수는 비슷하게 그리고 건전기업의 수는 잠식과 도산기업을 합한 수와 비슷하게 표본을 구성하는 것이 예측력을 향상하는데 도움이 된다고 할 수 있다. 3) 속성별로 고르게 투입변수로 선정한 경우가 그렇지 않은 경우보다 더 높은 예측력을 보였다. 4) 전통적인 delta learning rule과 sigmoid함수를 사용한 역전파학습 보다는 normalized cumulative delta learning rule과 hyperbolic tangent함수를 사용한 역전파 학습이 더 높은 예측력을 보였다. 이러한 현상은 두집단문제에서 보다 세집단문제에서 더 큰 차이를 나타내고 있다.

  • PDF

불균형 자료의 분류분석을 위한 가중 L1-norm SVM (Weighted L1-Norm Support Vector Machine for the Classification of Highly Imbalanced Data)

  • 김은경;전명식;방성완
    • 응용통계연구
    • /
    • 제28권1호
    • /
    • pp.9-21
    • /
    • 2015
  • SVM은 높은 수준의 분류 정확도와 유연성을 바탕으로 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 집단별 개체수가 상이한 불균형 자료의 분류분석에서 SVM은 다수집단으로 편향되게 분류함수를 추정하므로 소수집단의 분류 정확도가 심각하게 감소하게 된다. 불균형 자료의 분류분석을 위하여 집단별 오분류 비용을 차등 적용하는 가중 $L_2$-norm SVM이 개발되었으나, 이는 릿지 형태의 벌칙함수를 사용하므로 분류함수의 추정에서 불필요한 잡음변수의 제거에는 효율적이지 못하다. 따라서 본 논문에서는 라소 형태의 별칙함수를 사용하고 훈련개체의 오분류 비용을 차등적으로 부여함으로서 불균형 자료의 분류분석에서 변수선택의 기능을 지니는 가중 $L_1$-norm SVM을 제안하였으며, 모의실험과 실제자료의 분석을 통하여 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

읽기 장애 아동과 주의력 결핍/과잉 활동장애 아동의 인지적 특성 (COGNITIVE CHARACTERISTICS OF CHILDREN WITH DYSLEXIA AND/OR ATTENTION DEFICIT/HYPERACTIVITY DISORDER)

  • 김승태;김지혜
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제7권2호
    • /
    • pp.224-232
    • /
    • 1996
  • 읽기 장애 아동, 주의력 결핍/과잉 활동 장애(이하 주의력 장애) 아동 및 읽기 장애와 주의력 장애를 함께 지니고 있는 혼합형 장애 아동의 인지적 특성을 조사하였다. 조사 대상은 읽기 장애 아동 16명, 주의력 장애 아동 26명, 혼합형 장애 아동 17명이었으며, 지능검사, 성취도 검사 및 주의력 검사를 포함하는 신경심리 검사를 실시하였다. 주의력 장애 아동과 혼합형 장애 아동은 Test of Variables of Attention(TOVA)의 변산성, 정반응 시간에서 읽기 장애 아동에 비하여 의미있는 비효율성을 나타내었으며, 읽기 장애 아동과 혼합형 장애 아동은 주의력 장애 아동에 비하여 문자 및 단어 읽기 과제, 단어 재인 과제 및 문장 이해력을 측정하는 과제에서 두드러진 비효율성을 나타내었다. 지능검사에서 언어성 지능과 동작성 지능의 차이를 비교한 결과, 읽기 장애 집단과 혼합형 집단은 주의력 장애 집단에 비하여 언어성 지능이 의미있게 저하되어 있었다. 지능검사 소검사 중 읽기 장애 집단과 주의력 장애 집단사이에 의미있는 차이가 나타난 것은 상식 소검사뿐이었다. 수자 소검사에서는 혼합형 집단만 의미하는 저하를 나타내었다. 혼합형 장애 집단은 저기 장애와 주의력 장애의 인지적 결함이 모두 나타났을 뿐 아니라 수행효율이 전반적으로 낮았다. 각 검사의 진단 유용성을 살펴보기 위한 판별 분석에서는 2개의 판별함수가 도출되었다 함수 1은 주의력 장애 집단과 나머지 두 집단을 의미있게 판별해 주었으며, 함수 2는 혼합형 집단과 나머지 두 집단을 판별해 주었다. 판별 정확율은 93.88%였다.

  • PDF

협력적 필터링에서 추가정보를 이용한 선호도 예측 정확도 향상에 관한 연구 (A Study on improvements of prediction accuracy using additional information in collaborative filtering)

  • 이희춘;이석준;김선옥
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 춘계학술대회
    • /
    • pp.349-352
    • /
    • 2009
  • 본 연구는 협력적 필터링 기법을 이용한 선호도 예측 과정에서 발생하는 추가 정보를 이용하여 선호도 예측 정확도를 향상시킬 수 있는 방안에 대하여 연구하였다. 본 연구에서는 특정 상품에 대한 목표 고객의 선호도 예측에 선정된 이웃의 수와 선호도 예측 정확도와의 관계를 분석하였다. 분석을 위하여 선호도 예측 과정에 선정된 이웃의 수를 4분위수로 4집단으로 구분하여 구분 집단 간 선호도 예측 정확도에 차이가 나타남을 알 수 있었으며 각 집단의 예측 오차들의 평균들을 이용하여 선형의 보정함수를 제안한다. 본 연구의 결과를 바탕으로 추천시스템에서 이웃 수를 이용한 보정함수를 이용하면 예측 정확도를 높일 수 있다.

  • PDF

협력적 필터링 추천기법에서 이웃 수를 이용한 선호도 예측 정확도 향상 (Improving the prediction accuracy by using the number of neighbors in collaborative filtering)

  • 이희춘
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권3호
    • /
    • pp.505-514
    • /
    • 2009
  • 본 연구는 협력적 필터링 기법을 이용한 선호도 예측 과정에서 이웃의 수와 선호도 예측 정확도와의 관계를 분석하였다. 선호도 예측 과정에 선정된 이웃의 수를 4분위수로 4집단으로 구분하여 구분한 집단 간 선호도 예측 정확도에 차이가 나타남을 알 수 있었으며 각 집단의 예측 오차들의 평균들을 이용하여 선형의 보정함수를 제안하였다. 본 연구의 결과를 바탕으로 추천시스템에서 이웃 수를 이용한 보정함수를 이용하면 예측 정확도를 높일 수 있다.

  • PDF