• 제목/요약/키워드: Linear regression models

검색결과 961건 처리시간 0.028초

빠른 화자 적응과 연산량 감소를 위한 MLLR알고리즘 개선 (ImprovementofMLLRAlgorithmforRapidSpeakerAdaptationandReductionofComputation)

  • 김지운;정재호
    • 한국통신학회논문지
    • /
    • 제29권1C호
    • /
    • pp.65-71
    • /
    • 2004
  • 본 논문은 주성분분석(PCA, Principle Component Analysis) 혹은 독립성분분석(ICA, Independent Principle Component Analysis)를 이용하여 HMM(Hidden Markov Model) 파라메타의 차수를 감소시킴으로써 MLLR(Maximum Likelihood Linear Regression) 화자 적응 알고리즘을 개선하였다. 데이터의 특징을 잘 나타내는 PCA와 ICA를 통해 모델 mixture component의 상관관계를 줄이고 상대적으로 데이터의 분포가 적은 축을 삭제함으로써 추정해야 하는 적응 파라메타의 수를 줄였다. 기존의 MLLR 알고리즘은 SI(Speaker Independent)모델 보다 좋은 인식성능을 나타내기 위해 30초 이상의 적응 데이터가 요구되었고, 반면 제안한 알고리즘은 적응 파라메타의 수를 감소시킴으로써 10초 이상의 적응데이터가 요구되었다. 또한, 36차의 HMM 파라메타는 기존의 MLLR 알고리즘과 비슷한 인식성능을 나다내는 10차의 주성분이나 독릭성분을 사용함으로써 MLLR 알고리즘에서 적응파라메타를 추정할 때 요구되는 연산량을 1/167로 감소시켰다.

변기 및 세탁기 가정용수 사용량의 시계열모형 연구 (An analysis of time series models for toilet and laundry water-uses)

  • 명성민;김동건;이두진;김화수;조진남
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1141-1148
    • /
    • 2013
  • 가정용수의 용도별 사용량은 주거형태, 거주자 생활양식, 주택구조 등의 내부적인 요인과 온도, 날씨, 수도요금 등과 같은 외부요인들의 영향을 받게 된다. 장기적으로는 거주민의 생활양식, 주거형태, 수도관련 시설의 변화에 따라 사용량이 점진적으로 변화하게 되며, 단기적으로는 기온이나 가뭄과 같은 기후조건이나 절수정책과 같은 인위적인 영향에 의해 사용량이 크게 변화하기도 한다. 본 연구에서는 가정에서 사용하고 있는 변기 및 세탁기 용수의 물 사용량 특성을 파악하기 위하여 전국을 대상으로 실측자료를 모니터링하고 각 사용량의 기준이 되는 원단위 (${\ell}pcd$; liter per capita day)를 도출하였으며 향후 가정용수 사용량 예측을 위하여 변기 및 세탁기 용수를 대상으로 오차항이 자기상관을 따르는 시계열 회귀모형을 이용하였다. 분석결과, 자기회귀오차 모형으로 변기 및 세탁기 용수의 사용량을 71% 정도 설명할 수 있다.

발전용 신종액체 연료의 연소반응성 해석 (Study on the Combustion Reactivity of Residual Oil as a New Fuel for Power Generation)

  • 박호영;서상일;김영주;김태형;정재화;이성호;안광익;정영갑
    • 한국수소및신에너지학회논문집
    • /
    • 제22권4호
    • /
    • pp.534-545
    • /
    • 2011
  • This paper describes the evaluation of kinetic parameters for pyrolysis and carbon char oxidation of residual oil. The non-isothermal pyrolysis of residual oil was carried out with TGA (Thermo-Gravimetric Analyzer) at heating rate of 2, 5, 10 and $20^{\circ}C/min$ up to $800^{\circ}C$ under N2 atmosphere. The first order and nth order pyrolysis models were used to fit the experimental data, and the nth order model was turned out to follow the experimental data more precisely than the first order model. For carbon char oxidation experiment, TGA and four heating rates used in pyrolysis experiment were also adapted. The kinetic parameters for the residual carbon char particle were obtained with three char oxidation model, that is, volume reaction, grain and random pore model. Among them, the random pore model described the char oxidation behaviour quite well, compared to other two models. The non-linear regression method was used to obtain kinetic parameters for both pyrolysis and carbon char oxidation of residual oil.

Examination of Correlations Between Several Biochemical Components and Powdery Mildew Resistance of Flax Cultivars

  • Aly, Aly A.;Mansour, Mahmoud T. M.;Mohamed, Heba I.;Abd-Elsalam, Kamel A.
    • The Plant Pathology Journal
    • /
    • 제28권2호
    • /
    • pp.149-155
    • /
    • 2012
  • A field trial was conducted in 2009/2010 and 2010/2011 growing seasons at Giza Agricultural Research Station to examine correlations between some biochemical componets and powdery mildews ($PM_s$) resistance in flax cultivars. Nine flax cultivars could be divided into five distinct groups, i.e., highly susceptible (Cortland and C.I. 2008), moderately susceptible (Giza 7, and Marshall), moderately resistant (Cass), resistant (Koto, Dakota and Wilden), and highly resistant (Ottowa 770B). The cultivars showed considerable variation in PM severity ranged from 8.05 on Ottowa 770B to 97.02% on Cortland. Total soluble proteins, total phenols, antioxidant enzymes (peroxidase and polyphenoloxidase), ascorbic acid, tocopherol, and malondialdehyde (MDA), were determined in uninfected leaves of the tested cultivars. Pearson's correlation coefficient was calculated to measure the degree of association between PM severity and each component. All components showed significant (P < 0.05) or highly significant (P < 0.01) negative correlation with PM severity except MDA, which showed positive correlation (P < 0.01). Linear regression analysis was used to evaluate the causal relationship between the biochemical components (independent variables) and PM severity (dependent variable). Coefficient of determination ($R^2$) values of the generated models ranged from 48.76 to 77.15%. Tocopherol, MDA, and proteins were the most important contributors to the total variation in PM severity as the $R^2$ values of their models were 71.78, 75.28, and 77.15%, respectively. The results of the present study suggest that tocopherol, MDA, and proteins in uninfected leaves can be used as biochemical markers to predict PM resistance in flax.

Mandibular Kinesiograph의 선형충실도 및 계측정확도에 관한 연구 (A Study on the Measurement Accuracy and Linearity of the Mandibular Kinesiograph)

  • 김인권
    • 대한치과의사협회지
    • /
    • 제22권7호통권182호
    • /
    • pp.607-620
    • /
    • 1984
  • Mandibular Kinesiograph (MKG-5R)으로부터 얻어지는 자료의 유효성에 관한 연구를 위하여 비철, 비자석성의 기구를 이용해서 3cm×4cm×5cm의 4차원적 입체공간내에서 수행하였다. Kinesiograph로 부터의 직접 얻어지는 자료(관찰치)와 실제 움직인 거리(실제치)간의 관계를 먼저 보기위해 Scatter plot과 Correlation이 연구됐다. 그러나 최종의 목표는 어떤 형태의 공식을 만들어 이것으로 Kinesiograph관찰치를 이용, 실제치를 알도록 하는 것이었으므로 관찰치의 통계학적 회귀분석이 수행되었다. 통계분석의 결과는 Kinesiograph 관찰치와 실제치 간의 강한 상관관계를 보였다. 그러나 높은 상관계수가 반드시 얻어진 선형모형의 완벽한 예측성을 의미하는 것은 아니다. 이 연구로부터 얻어진 선형모형이 실제치를 모두 완벽하게 예측할수는 없었다. 그 이유로서는 종속변수(실제치)의 불연속성과 관찰치(비종속변수) 상호간의 독랩성 때문이다. 결론적으로 Kinesiograph가 어떤 형태로든 적절한 방법에 의해 수정이 있지 않으면 그 계통자체내에 내재하는 비선형적 특성 때문에 그 이용이 하악운동의 제한된 범위내에만 적용될 수 있다.

  • PDF

New prediction equations for the estimation of maxillary mandibular canine and premolar widths from mandibular incisors and mandibular first permanent molar widths: A digital model study

  • Shahid, Fazal;Alam, Mohammad Khursheed;Khamis, Mohd Fadhli
    • 대한치과교정학회지
    • /
    • 제46권3호
    • /
    • pp.171-179
    • /
    • 2016
  • Objective: The primary aim of the study was to generate new prediction equations for the estimation of maxillary and mandibular canine and premolar widths based on mandibular incisors and first permanent molar widths. Methods: A total of 2,340 calculations (768 based on the sum of mandibular incisor and first permanent molar widths, and 1,572 based on the maxillary and mandibular canine and premolar widths) were performed, and a digital stereomicroscope was used to derive the the digital models and measurements. Mesiodistal widths of maxillary and mandibular teeth were measured via scanned digital models. Results: There was a strong positive correlation between the estimation of maxillary (r = 0.85994, $r^2=0.7395$) and mandibular (r = 0.8708, $r^2=0.7582$) canine and premolar widths. The intraclass correlation coefficients were statistically significant, and the coefficients were in the strong correlation range, with an average of 0.9. Linear regression analysis was used to establish prediction equations. Prediction equations were developed to estimate maxillary arches based on $Y=15.746+0.602{\times}sum$ of mandibular incisors and mandibular first permanent molar widths (sum of mandibular incisors [SMI] + molars), $Y=18.224+0.540{\times}(SMI+molars)$, and $Y=16.186+0.586{\times}(SMI+molars)$ for both genders, and to estimate mandibular arches the parameters used were $Y=16.391+0.564{\times}(SMI+molars)$, $Y=14.444+0.609{\times}(SMI+molars)$, and $Y=19.915+0.481{\times}(SMI+molars)$. Conclusions: These formulas will be helpful for orthodontic diagnosis and clinical treatment planning during the mixed dentition stage.

에너지 소산장치를 장착한 사장교의 지진 취약도 해석 (Seismic Fragility Analysis of a Cable-stayed Bridge with Energy Dissipation Devices)

  • 박원석;김동석;최현석;고현무
    • 한국지진공학회논문집
    • /
    • 제10권3호
    • /
    • pp.1-11
    • /
    • 2006
  • 이 논문에서는 에너지 소산장치가 장착된 사장교의 지진 취약도 해석 방법을 제시하고 에너지 소산장치의 장착 및 주탑-보강형 연결 조건에 따른 지진 취약도 변화를 살펴본다. 입력지반운동, 에너지 소산장치 특성값 및 사장교 강성 모형에 확률 변수를 도입하여 불확실성을 고려하고 에너지 소산장치의 비선형 이력거동을고려하여 시간이력 해석을 수행한다. 해석결과의 회귀분석을 통한 최대 응답과 입력지반운동 세기(intensity) 사이의 관계식으로부터 취약도 해석을 위한 소요 역량(demand)을 수립한다. 역량(capacity)에 해당하는 한계상태는 주탑 하부의 전단력, 보강형의 교축방향 변위, 케이블 장력의 변동량 그리고 강주탑의 좌굴이 고려된다. 해석 예제로서 강주탑 사장교인 제 2 진도대교 모형에 대하여 취약도 해석을 수행하였다. 취약도 해석결과 에너지 소산장치의 사용을 통하여 구속 또는 비구속 연결조건시 높은 손상확률을 보이던 한계상태에 대하여 그 손상확률을 크게 줄일 수 있음을 확인하였다.

Prediction of drowning person's route using machine learning for meteorological information of maritime observation buoy

  • Han, Jung-Wook;Moon, Ho-Seok
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권3호
    • /
    • pp.1-12
    • /
    • 2022
  • 해양조난사고 발생 시 해상 익수자의 안전과 생명 보장을 위해 구조자산을 활용한 신속한 탐색 및 구조작전은 매우 중요하다. 본 연구는 해양관측부이에서 수집되는 기상정보에 다중선형회귀분석, 의사결정나무, 서포트벡터머신, 벡터자기회귀, 순환신경망의 LSTM을 활용하여 울릉도 북서해역의 표층해류를 분석하고 유향과 유속에 대한 각각의 예측모형을 구축하여 예측된 유향과 유속정보를 통해 해상 익수자의 이동경로를 예측하는 모형들을 제안한다. 본 연구에서 적용한 다양한 기계학습 모형을 MAE와 RMSE의 성능 평가척도로 비교해 볼 때 LSTM이 가장 우수한 성능을 보였다. 또한, 익수자 이동지점과 예측모형의 예측지점 간 거리 차이에 있어서도 LSTM이 다른 모형들에 비해 탁월한 성능을 나타내었다.

Research on Selecting Influential Climatic Factors and Optimal Timing Exploration for a Rice Production Forecast Model Using Weather Data

  • Jin-Kyeong Seo;Da-Jeong Choi;Juryon Paik
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권7호
    • /
    • pp.57-65
    • /
    • 2023
  • 쌀 생산량 예측의 정확성을 높이기 위한 대다수의 연구는 모델의 정확도 증진에 초점이 맞춰져 있다. 이에 비해, 예측 모델을 적용할 대상 데이터 자체에 관한 연구는 상대적으로 미흡하다. 쌀 생산량 데이터에 동일한 종속변수와 예측 모델을 사용하여 다른 특성들로 구성된 두 부류의 데이터에 적용하면, 결과의 차이가 발생하는데 이때 어느 데이터 셋이 더 우수한지 판단하기는 어려운 일이다. 이러한 문제를 해결하기 위해, 예측 모델 적용 전에 데이터 내에서 예측 결과에 큰 영향을 미칠 가능성이 있는 특성들을 선별하고, 이를 중심으로 모델링을 수행하면, 데이터의 구성이 다르더라도 안정적인 예측 결과를 얻을 수 있을 것이다. 본 연구에서는 기상청의 종관기상관측(ASOS) 데이터를 활용하여, 쌀 생산량의 안정적이고 일관된 예측을 위해 데이터 구성 특성들의 조정을 통해 최적의 기반 변수를 선별하는 방법에 대해 제안한다. 본 연구의 결과는 향후 다른 연구에서 성능평가의 유용성을 높이는 데 기여할 것으로 기대한다.

철자 기반과 음절 기반 속도가 한국인 영어 학습자의 발음 평가에 미치는 영향 비교 (Comparing the effects of letter-based and syllable-based speaking rates on the pronunciation assessment of Korean speakers of English)

  • 정현성
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.1-10
    • /
    • 2023
  • 본 연구에서는 AI Hub에 구축된 '교육용 한국인의 영어 음성 데이터'에 있는 발음 평가 데이터를 활용하여 철자 기반 발화 속도 및 조음 속도와 음절 기반 발화 속도 및 조음 속도 중 발음 정확성 및 운율 유창성, 합산 점수를 예측하는 모델에 어떤 요소가 더 유의미한 영향을 미치는지 분석하였다. 이를 위해 13세, 19세, 26세 연령별, 성별, 수준별로 이 코퍼스의 훈련 데이터에서 총 900개 발화를 추출하여 데이터에 포함된 다양한 요소를 활용해 평가 점수를 예측하는 선형효과분석을 실행하였다. 선형효과분석에서 최적의 세 개 모델을 통해 예측된 평가 점수를 검증 데이터에서 추출한 총 180개 발화의 평가 점수와 얼마나 상관관계가 있는지도 분석하였다. 분석 결과 발음의 정확성과 운율의 유창성, 합산 점수 예측 모델 모두 철자 기반 발화 속도와 조음 속도보다 음절 기반 발화 속도와 조음 속도가 평가 점수를 예측하는데 더 큰 영향을 주는 것으로 밝혀졌다. 모델에서 예측한 점수와 검정 데이터의 실제 점수와의 상관계수는 .65에서 .68 사이로 각 모델의 평가 점수 예측력이 나쁘지 않았다. 발화 속도와 조음 속도 간에 어떤 요소가 더 큰 영향을 미치는지는 본 연구를 통해 밝혀내지 못하였다.