• 제목/요약/키워드: 예측점수

검색결과 464건 처리시간 0.023초

확률기상예보를 이용한 중장기 ESP기법 개선 (Improvement of Mid/Long-Term ESP Scheme Using Probabilistic Weather Forecasting)

  • 김주철;김정곤;이상진
    • 한국수자원학회논문집
    • /
    • 제44권10호
    • /
    • pp.843-851
    • /
    • 2011
  • 수문학 분야에서 중장기 유출량 예측은 입력변수의 불확실성 등으로 인하여 확률론적 방법을 사용하는 것이 바람직한 것으로 알려져 왔다. 본 연구에서는 금강유역을 대상으로 구성된 바 있는 RRFS-ESP 시스템에 PDF-ratio 방법을 기반으로한 사전처리기능을 장착하여 보다 효율적인 중장기 예측시스템으로의 확장을 시도하여 보았다. 이를 위하여 기상청에서 제공하는 확률기상정보를 이용하여 가중치를 산정하고 이를 기반으로 시나리오별 예측확률을 갱신하였다. 예측결과에 대하여 각 기법별 예측점수를 산정하여 본 결과 우선 ESP 기법에 의한 예측점수의 평균이 초보예측 점수를 상회하여 본 연구에서 구성한 RRFS-ESP 시스템의 적용성을 확인할 수 있었다. 또한 확률기상전망을 이용하여 갱신한 유입량 시나리오의 예측점수가 ESP 기법에 의한 예측점수를 상회하고 있음을 확인할 수 있어 ESP 기법에 의한 예측결과를 확률기상전망을 이용하여 갱신할 경우 예측 정확도를 보다 개선시킬 수 있음을 확인할 수 있었다.

철자 기반과 음절 기반 속도가 한국인 영어 학습자의 발음 평가에 미치는 영향 비교 (Comparing the effects of letter-based and syllable-based speaking rates on the pronunciation assessment of Korean speakers of English)

  • 정현성
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.1-10
    • /
    • 2023
  • 본 연구에서는 AI Hub에 구축된 '교육용 한국인의 영어 음성 데이터'에 있는 발음 평가 데이터를 활용하여 철자 기반 발화 속도 및 조음 속도와 음절 기반 발화 속도 및 조음 속도 중 발음 정확성 및 운율 유창성, 합산 점수를 예측하는 모델에 어떤 요소가 더 유의미한 영향을 미치는지 분석하였다. 이를 위해 13세, 19세, 26세 연령별, 성별, 수준별로 이 코퍼스의 훈련 데이터에서 총 900개 발화를 추출하여 데이터에 포함된 다양한 요소를 활용해 평가 점수를 예측하는 선형효과분석을 실행하였다. 선형효과분석에서 최적의 세 개 모델을 통해 예측된 평가 점수를 검증 데이터에서 추출한 총 180개 발화의 평가 점수와 얼마나 상관관계가 있는지도 분석하였다. 분석 결과 발음의 정확성과 운율의 유창성, 합산 점수 예측 모델 모두 철자 기반 발화 속도와 조음 속도보다 음절 기반 발화 속도와 조음 속도가 평가 점수를 예측하는데 더 큰 영향을 주는 것으로 밝혀졌다. 모델에서 예측한 점수와 검정 데이터의 실제 점수와의 상관계수는 .65에서 .68 사이로 각 모델의 평가 점수 예측력이 나쁘지 않았다. 발화 속도와 조음 속도 간에 어떤 요소가 더 큰 영향을 미치는지는 본 연구를 통해 밝혀내지 못하였다.

ESP-PDF 기법을 이용한 Citarum 유역의 월 유출 예측 (Monthly Runoff Forecasting of Citarum River Basin by means of ESP-PDF Technique)

  • 김주철;김정곤;이상진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.318-318
    • /
    • 2012
  • 인도네시아의 Citarum 유역을 대상으로 구축된 RRFS를 이용하여 해당유역의 상류에 위치한 다목적 댐인 Saguling 댐에 대한 2005년 월 유입량예측을 수행하여 보았다. 실제 예측과정에는 ESP 기법을 적용하였고 여기에 기상전망을 고려할 수 있는 사전처리기법인 PDF ratio 방법을 이용하여 유출량 시나리오의 발생확률을 갱신하였다. 이를 위하여 대상유역의 월 강우량 관측 자료에 대한 초보예측을 통하여 2005년 관측 강우량에 따라 기상전망을 생성하였다. 또한 Saguling 댐의 월 유입량 과거 관측자료에 대한 초보예측을 통하여 High Flow, Normal Flow, Low Flow에 대한 예측구간을 구성하여 보았다. Fig. 1과 Fig. 2는 각각 ESP 기법과 PDF ratio 방법을 이용하여 산정한 Normal Flow와 Low Flow의 상한계 유입량의 발생확률의 변화를 도시한 것이다. 관측 유입량이 발생한 구간의 예측확률을 기반으로 예측점수를 산정해 본 결과 ESP 기법에 의한 예측점수가 0.333을 상회하고 있음을 볼 수 있었다. 이는 ESP 기법에 의한 예측결과가 초보예측보다 정확도가 높음을 의미하는 것으로 본 연구에서 구성한 ESP 시스템의 적용성을 확인할 수 있다. 또한 고무적인 결과로서 PDF ratio 방법에 의한 예측점수가 ESP 기법에 의한 예측점수를 상회하고 있음을 확인할 수 있다. 이는 ESP 기법에 의한 예측결과를 확률기상전망을 이용하여 갱신할 경우 예측 정확도를 개선시킬 수 있음을 의미하는 것이다.

  • PDF

동적 웹 어플리케이션의 특성을 반영한 조정 기능 점수 산정 방안 (Adjusted Function Point Estimation Based on Characteristics of Dynamic Web Application)

  • 허승현;최은만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.355-357
    • /
    • 2004
  • 소프트웨어의 측정은 소프트웨어의 생명주기 초기에 분석되어 규모와 비용의 예측에 도움을 주어야 한다. 초기에는 정확한 LOC 기반 규모예측이 어려워 기능 점수 기반의 측정에 의하여 예측할 수 있다. 그러나 현재의 기능 점수 기반 측정은 모든 시스템에 획일화되어 있어 시스템의 특성을 반영할 수 없으며, IFPUG에서 제시한 일반 시스템 특성은 웹 기반 어플리케이션에서 사용자의 인지도가 매우 낮다. 본 논문에서는 웹 기반 어플리케이션 중에 동적 웹사이트에 특화된 시스템 특성 집합 및 영향도 측정 방법을 제시한다. 이 요소를 근거로 동적 웹사이트의 시스템 특성을 분석하여 기능 정수의 값 조정 인자에 반영하고 실제 시스템을 대상으로 조정된 기능 점수를 산정한다.

  • PDF

유스케이스 트랜잭션 기반의 소프트웨어 공수 예측 기법 (Software Effort Estimation based on Use Case Transaction)

  • 이선경;강동원;배두환
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.566-570
    • /
    • 2010
  • 본 논문에서는 기존 유스케이스 점수 기법의 공수 예측 정확도 향상을 위해 유스케이스 트랜잭션을 기반으로 한 공수 예측 기법을 제안한다. 유스케이스 점수 기법은 소프트웨어 유스케이스 모델을 기반으로 하는 공수 예측 기법으로서 객체 지향 소프트웨어 개발 프로젝트에서 사용되고 있다. 그러나 유스케이스 점수는 트랜잭션의 개수를 규모 산정의 단위로 활용하여 트랜잭션 별 구현 공수의 차이를 반영할 수 없고 트랜잭션 수의 범위에 따라 유스케이스의 규모를 결정함으로써 상이한 트랜잭션 수를 갖는 유스케이스들이 공수 예측 시 동일한 크기로 반영되어 상세수준에서의 문제를 갖는다. 이런 한계점들은 부정확한 공수 예측을 야기하여 프로젝트의 성공률을 저해하는 요소가 될 수 있다. 이를 개선하기 위해 본 논문에서는 공수 예측 시 트랜잭션을 단위 연산으로 세분화하고, 각 연산에 대한 복잡도를 활용하여 규모를 산정하는 트랜잭션 점수 기법을 제안하고자 한다.

우울증에 대한 예측모형 (A Prediction Model for Depression Risk)

  • 김재용;민병주;이재훈;장재승;하태현;하규섭;박태성
    • 응용통계연구
    • /
    • 제27권2호
    • /
    • pp.317-330
    • /
    • 2014
  • 양극성 장애는 조증 삽화(manic episode)와 주요 우울삽화(major depressive episode)를 특징으로 하는 정신질환이다. 주요 우울삽화 시기에는 양극성 장애 환자들의 810%가 자살하는 것으로 알려져 있다. 그러므로 양극성 장애 환자를 치료할 때, 우울증상의 정도를 측정하는 것이 중요하다. 우울증상의 정도를 측정하기 위해 가장 많이 사용하는 검사법은 해밀턴 우울평가 척도(Hamilton depression rating scale)이다. 본 논문에서는 해밀턴 우울평가척도 점수를 이용하여 환자들의 치료 효과를 예측하기 위해 선형혼합효과모형(linear mixed effects model)과 전이모형(transition model)을 제시하였다. 예측을 위해 사용된 자료는 분당서울대학교병원을 방문하여 초진일 당시의 해밀턴 우울평가 척도 점수가 8 점 이상인 환자들의 정보를 사용하였다. 첫 조사시점부터 6개월, 12개월 후 세 차례에 걸쳐 관측된 해밀턴 우울평가 척도 점수를 선형혼합효과모형과 전이모형에 적합시켰다. 그 결과를 토대로 특정시점의 해밀턴 우울평가 척도 점수를 예측하였다. 첫 조사시점부터 6개월, 12개월 후의 해밀턴 우울평가 척도 점수를 사용해 선형혼합효과모형과 전이모형에 적합 시켰다. 이 모델들을 이용해 조사시점부터 24개월 후의 해밀턴 우울평가 척도 점수를 예측한다. 이 예측모델은 조사된 24개월 후의 점수와 예측된 24개월의 후의 점수를 비교하여 평가하였다.

한국어 학습 모델별 한국어 쓰기 답안지 점수 구간 예측 성능 비교 (Comparison of Korean Classification Models' Korean Essay Score Range Prediction Performance)

  • 조희련;임현열;이유미;차준우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.133-140
    • /
    • 2022
  • 우리는 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 문제에서 세 개의 딥러닝 기반 한국어 언어모델의 예측 성능을 조사한다. 이를 위해 총 304편의 답안지로 구성된 실험 데이터 세트를 구축하였는데, 답안지의 주제는 직업 선택의 기준('직업'), 행복한 삶의 조건('행복'), 돈과 행복('경제'), 성공의 정의('성공')로 다양하다. 이들 답안지는 네 개의 점수 구간으로 구분되어 평어 레이블(A, B, C, D)이 매겨졌고, 총 11건의 점수 구간 예측 실험이 시행되었다. 구체적으로는 5개의 '직업' 답안지 점수 구간(평어) 예측 실험, 5개의 '행복' 답안지 점수 구간 예측 실험, 1개의 혼합 답안지 점수 구간 예측 실험이 시행되었다. 이들 실험에서 세 개의 딥러닝 기반 한국어 언어모델(KoBERT, KcBERT, KR-BERT)이 다양한 훈련 데이터로 미세조정되었다. 또 두 개의 전통적인 확률적 기계학습 분류기(나이브 베이즈와 로지스틱 회귀)도 그 성능이 분석되었다. 실험 결과 딥러닝 기반 한국어 언어모델이 전통적인 기계학습 분류기보다 우수한 성능을 보였으며, 특히 KR-BERT는 전반적인 평균 예측 정확도가 55.83%로 가장 우수한 성능을 보였다. 그 다음은 KcBERT(55.77%)였고 KoBERT(54.91%)가 뒤를 이었다. 나이브 베이즈와 로지스틱 회귀 분류기의 성능은 각각 52.52%와 50.28%였다. 학습된 분류기 모두 훈련 데이터의 부족과 데이터 분포의 불균형 때문에 예측 성능이 별로 높지 않았고, 분류기의 어휘가 글쓰기 답안지의 오류를 제대로 포착하지 못하는 한계가 있었다. 이 두 가지 한계를 극복하면 분류기의 성능이 향상될 것으로 보인다.

경계 배치법(Boundary Collocation Method)에 의한 근거리 음장 자료로부터 원거리 음장의 예측 ; 최적 측정점 개수의 결정 (Far-Field Sound Field Estimation from Near-Field Sound Field Data Using Boundary Collocation Method ; Decision of Optimum Points of Measurement)

  • 김원호;윤종락
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.31-37
    • /
    • 1999
  • 본 논문은 근거리 음장 측정 자료로부터 원거리 음장 예측을 위한 기술에 대한 것이다. 음원의 음장 분포 특성은 원거리에서 측정된 자료의 해석으로 이루어지는 것이 일반적 방법이나, 음향수조 또는 무향실과 같은 제한된 공간에서는 근거리 영역에서 측정이 이루어지는 경우가 발생한다. 따라서 근거리 영역에서의 측정으로부터 원거리 음장이 예측되어야 한다. 이 경우 음원을 둘러싼 근거리 음장의 측정점수는 원거리 음장 예측치의 정확도와 자료 처리의 계산량과 상관된다. 기존 연구 결과는 최적측정점수는 음원의 kL에 비례하고 음원의 기하학적 형태 또는 지향특성에 따라 kL의 의존성이 다르게 나타난다고 되어 있으나 정확한 기준이 없다. 따라서 본 논문에서는 최적측정지점수에 대한 기준을 유도하기 위해 Helmholtz 적분식과 Green 함수를 근간으로 한 원거리 음장 예측 기술인 경계배치법(Boundary Collocation Method)을 분석하여 최적측정점수는 kL이 증가함에 따라 0.54kL로 수렴한다는 결과를 얻었다. 기존의 연구 결과 보다 최적측정점수를 1/2 정도로 줄였다.

  • PDF

단백질 상호작용 데이터의 신뢰도 검증 기법 (A scoring method for evaluating the reliability of protein-protein interaction data)

  • 홍진선;한경숙
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.292-294
    • /
    • 2004
  • 단백질 상호작용 검출 방법의 발달로 많은 양의 데이터가 산출되고 있고, 이러한 상호작용 데이터의 방대한 양으로 인해 통계적 방법을 이용하여 데이터를 처리함으로서 유용한 지식을 얻을 수 있다 예측한 상호작용 데이터는 첫째, 대량의 데이터를 생산해내므로, 많은 false-positive를 내포하고 있고, 둘째, 예측한 상호작용을 검증시 실험을 하는 방법 외에는 신뢰도를 측정하기가 어렵다는 문제점이 있다. 본 연구에서는 점수 할당시스템을 사용함으로서 예측한 인간 단백질 상호작용 데이터의 false-positive를 줄이고, 각각 상호작용에 점수를 부설함으로서 상호작용 데이터의 신뢰도를 검증하는 방법을 제안하고 있다.

  • PDF

정보전략계획 단계에서의 정보시스템 규모 예측:기능점수모형을 중심으로 (Software Size Measurement from Information Strategy Planning With the Function Point Method)

  • 배준수;정재윤
    • 한국전자거래학회지
    • /
    • 제14권3호
    • /
    • pp.153-168
    • /
    • 2009
  • 기업과 정부는 경쟁력 제고와 효율성 확보를 위해 지속적인 정보화사업을 추진하고 있다. 정보화사업의 규모가 커짐에 따라 정보시스템 개발 규모를 측정하고 비용을 예측하는 일이 중요해지고 있다. 본 연구에서는 정보전략계획 단계에서 정보시스템 개발 규모를 합리적으로 측정하기 위하여 기능점수를 활용하는 과정을 설명한다. 정보전략계획의 산출물로부터 프로젝트 종류를 식별하고, 기능점수 산출 범위와 경계를 정의한 후, 데이터 기능과 트랜잭션 기능으로 나누어 기능점수를 계산한다. 특히, 정보전략계획 단계에서 불명확한 기능점수의 복잡도 계산을 하기 위하여 간이기능점수를 활용한다. 합리적인 정보시스템 규모 예측은 투입공수와 사업 대가를 결정함으로써 성공적인 정보화 사업을 수행하는 밑거름이 될 것이다.

  • PDF