• 제목/요약/키워드: 통계 분류

검색결과 2,155건 처리시간 0.023초

Kano 모델과 통계 기법을 이용한 요구사항 분류 및 협상을 위한 정보 생성 기법 (A Technique for Classifying Requirement/Stakeholder and Generating Information for Negotiation Using Kano Model and Statistical Method)

  • 변정원;김지혁;류성열;황만수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.161-169
    • /
    • 2010
  • 요구사항 추출 활동은 다양한 이해당사자의 요구를 요구사항으로 추출하고 협상을 위한 정보를 생성하는 사전 준비 작업이다. 그러나 현재 고객으로부터 요구사항 수집을 위한 기법은 다수 존재하고 있으나, 요구사항 분류와 협상을 위한 정보 제공에 대한 연구는 부족한 실정이다. 본 연구는 요구사항을 분류하고, 협상을 위한 정보를 식별하는 기법에 대한 연구이다. 본 연구는 요구사항 분류를 위해 Kano 모델과 통계 기법을 활용하였으며, 협상을 위한 정보를 생성하기 위해 요구사항과 문제의 관계를 고려하였다. 제안한 기법에 대한 시뮬레이션, Rough Set Theory, 사례 검증을 수행하여 제안한 방법의 타당성을 검증하였다.

AROC 곡선과 최적분류점 (AROC Curve and Optimal Threshold)

  • 홍종선;이희정
    • 응용통계연구
    • /
    • 제24권1호
    • /
    • pp.185-191
    • /
    • 2011
  • 혼합분포를 가정한 신용평가 연구에서 ROC 곡선은 부도와 정상 차주의 판별력을 탐색하는데 유용한 그림이다. ROC 곡선을 개선하여 스코어를 파악할 수 있는 AROC 곡선을 수리적으로 분석하고, 정규분포를 적용하여 다양한 곡선의 형태를 파악한다. 최적분류점을 발견하는 다양한 분류정확도 통계량과 AROC 곡선의 관계를 발견하고, 두 분포의 분산이 동일한 경우에 AROC 곡선의 극소점으로 최적의 분류점을 추정할 수 있음을 발견한다.

음향 장면 분류를 위한 경량화 모형 연구 (Light weight architecture for acoustic scene classification)

  • 임소영;곽일엽
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.979-993
    • /
    • 2021
  • 음향 장면 분류는 오디오 파일이 녹음된 환경이 어디인지 분류하는 문제이다. 이는 음향 장면 분류와 관련한 대회인 DCASE 대회에서 꾸준하게 연구되었던 분야이다. 실제 응용 분야에 음향 장면 분류 문제를 적용할 때, 모델의 복잡도를 고려하여야 한다. 특히 경량 기기에 적용하기 위해서는 경량 딥러닝 모델이 필요하다. 우리는 경량 기술이 적용된 여러 모델을 비교하였다. 먼저 log mel-spectrogram, deltas, delta-deltas 피쳐를 사용한 합성곱 신경망(CNN) 기반의 기본 모델을 제안하였다. 그리고 원래의 합성곱 층을 depthwise separable convolution block, linear bottleneck inverted residual block과 같은 효율적인 합성곱 블록으로 대체하고, 각 모델에 대하여 Quantization를 적용하여 경량 모델을 제안하였다. 경량화 기술을 고려한 모델은 기본 모델에 대비하여 성능이 비슷하거나 조금 낮은 성능을 보였지만, 모델 사이즈는 503KB에서 42.76KB로 작아진 것을 확인하였다.

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.

종양 분류를 위한 마이크로어레이 데이터 분류 모델 설계와 구현 (The Design and Implement of Microarry Data Classification Model for Tumor Classification)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.1924-1929
    • /
    • 2007
  • 오늘날 인간 프로젝트와 같은 종합적 인 연구의 궁극적 목적을 달성하기 위해서는 이 들 연구로부터 획득한 대량의 관련 데이터에 대해 새로운 현실적 의미를 부여할 수 있어야 한다. 마이크로어레이를 기반으로 하는 종양 분류 방법은 종양 종류에 따라 다르게 발현되는 유전자 양상을 통계적으로 발견함으로써 정확한 종양 분류에 기여 할 수 있다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 종양을 분류하기 위해서는 특정 종양 분류와 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 정보력 있는 유전자 목록을 별도로 추출하여 보다 정확한 종양 분류 모델을 구축하고 각각의 실험 결과들을 비교 분석함으로써 성능평가를 하였다. 피어슨 적률 상관 계수를 이용하여 선택된 유전자들을 멀티퍼셉트론 분류기로 분류한 결과 98.6%의 정확도를 보였다.

마이크로어레이자료분석에서의 최신 분류방법들의 비교연구 (Comparison of recently developed classification tools in microarray data analysis)

  • 이재원;이정복;박미라
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.99-104
    • /
    • 2002
  • cDNA 마이크로어레이자료를 이용한 분류방법은 수많은 유전자의 발현을 동시에 모니터링 할 수 있으므로 특정 질병간의 분자생물학적 변이를 이해하는데 있어 기존의 분류방법보다 신뢰성이 훨씬 높을 것으로 기대되고 있다 최근에 Dudoit et al.(2001)은 cDNA 마이크로어레이를 이용한 유전자발현자료의 분석에 있어 분류를 위한 여러 고전적인 판별분류기법 및 최근에 개발된 기법들을 비교, 평가하였다. 본 논문에서는 Dudoit et al.(2001)에서 다루지 않았던 많은 최신 기법들을 포함하여 인간의 종양 자료뿐만이 아니라 농작물을 포함한 동식물 자료에 적용하여 보다 폭넓은 비교연구를 하였다.

  • PDF

ROC와 CAP 곡선에서의 최적 분류점 (Optimal Threshold from ROC and CAP Curves)

  • 홍종선;최진수
    • 응용통계연구
    • /
    • 제22권5호
    • /
    • pp.911-921
    • /
    • 2009
  • 신용평가 연구에서 부도와 정상차주에 대한 판별력을 평가하는 방법으로 Receiver Operating Characteristic(ROC)와 Cumulative Accuracy Profile(CAP) 곡선을 사용한다. ROC 곡선에서 최적의 분류정확도를 갖는 분류점과 CAP 곡선에서 최대의 이익을 나타내는 분류점은 일반적인 정확도의 개념으로 정의된 동일한 성과를 가진 접선을 사용하여 구한다. 본 연구에서는 정확도의 대안적인 측도로 진실율을 제안하고, 이 진실율을 이용하여 ROC와 CAP 곡선에서 대안적인 최적의 분류점을 구한다. 대부분 실제 차주의 모집단에서 부도차주는 정상차주보다 훨씬 수가 적다. 이러한 경우에 진실율은 정확도보다 비용함수의 측면에서 더욱 효율적일 수 있다. 진실율을 이용하여 최적의 분류정확도를 나타내는 분류점과 최대의 이익을 의미하는 분류점에 대응하는 스코어는 동일하다는 것을 보였으며, 이 스코어는 부도와 정상 차주의 분포함수의 동일성을 검정하는 Kolmogorov-Smirnov 통계량에 대응하는 스코어와도 일치하는 것을 발견하였다.

여자대학생의 BMI와 신체상평정척도(CDRS) 분류기준에 대한 일치도 검정 (The Measures of Agreement between the Classification Standard of BMI and that of CDRS in Women university students)

  • 남덕현
    • 디지털융복합연구
    • /
    • 제14권2호
    • /
    • pp.519-527
    • /
    • 2016
  • 이 연구는 BMI 분류기준과 9점-신체상평정척도 분류기준의 일치도를 조사하여 현장적용의 유용성을 확인하고, 여대생들이 체형에 대해 실제로 인식하고 정도를 파악하여 체형인식의 왜곡에 대한 올바른 정보와 비만의 기준에 대한 정보 제공에 목적이 있다. BMI 분류기준과 신체상평정척도 분류기준의 일치도, 그리고 여대생의 BMI에 따른 신체상 인식 정도를 알아보기 위하여 교차분석, Spearman의 등위차상관계수 및 카파통계량을 산출하였다. 분석결과 일반 여자대학생이 판정한 신체상 평정척도 분류기준과 BMI 분류기준은 통계적으로 ${\rho}=.719$(p<.001)로 높은 상관과 ${\kappa}=.506$(p<.001)로 보통 수준의 일치도를 나타냈다. 이러한 결과를 바탕으로 차후 신체상과 관련하여 인종의 특성에 따른 크기와 형태를 조정할 필요가 있으며 인구통계학적 특성이 다르거나 비만도가 높은 대상자를 선별하여 그들의 체형인식과 심리적인 측면에 관한 추가적인 연구가 필요하다.

韓國統計의 現況과 將來 - 統計와 電算

  • 박성현
    • Journal of the Korean Statistical Society
    • /
    • 제10권
    • /
    • pp.81-82
    • /
    • 1981
  • 허문열 박사에 의하여 분류된 EDP의 3단계에 대하여 전적으로 동감하며, 우리나라가 현재 초기단계를 벗어나 성장단계에 접어들고 있는 것도 사실이라고 하겠다. 또한 조만간 (5-6년후)에 성숙단계에 접어들기 시작하면 컴퓨터에 의하여 처리되는 통계 package의 사용이 급증하고 이를 다룰 줄 아는 통계인의 수요가 매우 크리라고 믿어진다. 통계를 다루는 학자 또는 실무자들은 사회에서 요구하는 통계서비스(statistical consulting service)를 할 수 있는 것이 바람직하고, 우리의 역할을 다 할 수 있도록 우리 스스로를 준비시켜야 할 것이다. 사회에 통계를 보급시키고 통계의 활용을 더욱 촉진시키기 위하여 다음의 몇가지를 제안하는 바이다. 이들은 또한 허문열 박사의 주제논문에서도 암시되고 있는 방향이라고도 하겠다.

  • PDF

K-평균 군집방법을 이요한 가중커널분류기 (Kernel Pattern Recognition using K-means Clustering Method)

  • 백장선;심정욱
    • 응용통계연구
    • /
    • 제13권2호
    • /
    • pp.447-455
    • /
    • 2000
  • 본 논문에서는 커널분류기에 요구되는 다량의 계산량과 자료저장공간을 감소시키도록 고안된 최적군집방법을 적용한 K-평균 가중커널분류기법이 제안되었다. 이 방법은 원래의 훈련표본보다 작은 수의 참고벡터들과 그들의 가중값을 들을 찾아 원래 커널분류 기준을 근사화하여 패턴을 인식하는 것이다. K-평균 가중커널분류기법은 가중파젠윈도우(WPW)분류기법을 개량한 것으로서 참고벡터들을 계산하기 위한 초기 부적절하게 군집된 관측값들을 최적으로 재군집화 함으로써 WPW기법의 단범을 극복하였다. 실제자료들에 제안된 방법을 적용한 결과 WPW분류기법보다 참고벡터들의 대표성과 자료축소면에서 월등히 향상된 결과를 확인하였다

  • PDF