• 제목/요약/키워드: variable confidence threshold

검색결과 5건 처리시간 0.016초

가변 신뢰도 문턱치를 사용한 미등록어 거절 알고리즘에 대한 연구 (A Study on Out-of-Vocabulary Rejection Algorithms using Variable Confidence Thresholds)

  • 방기덕;강철호
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1471-1479
    • /
    • 2008
  • 본 논문에서는 음성인식 분야에서 많이 사용되고 있는 가변어휘 단어 인식 시스템에서 미등록어에 대한 거절 성능을 향상시키는 방법을 제안한다. 거절 기능을 구현하는 방식은 핵심어 검출(keyword spotting)방식과 발화검증(utterance verification)으로 구분이 된다. 발화 검증 방식은 각 음소마다 이와 유사한 반음소모델(anti-phoneme model)을 생성한 후 정상적인 음소 모델과 반음소 모델의 유사도를 비교하여 결정하는 방식이다. 본 논문에서는 화자가 발성할 때마다 구해지는 화자확인 확률값을 신뢰도 문턱치를 결정할 때 적용하는 방법에 대하여 제안하였다. 제안한 방법을 사용하였을 때, 사무실 환경에서 CA(Correctly Accepted for keyword)가 94.23%, CR(Correctly Rejected for out-of-vocabulary)이 95.11%로 나타났고, 잡음 환경에서는 CA가 91.14%, CR이 92.74%로 나타나서 성능이 향상됨을 확인할 수 있었다.

  • PDF

Discovery of Association Rules Using Latent Variables

  • Park, Hee-Chang;Cho, Kwang-Hyun
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2005년도 추계학술대회
    • /
    • pp.177-188
    • /
    • 2005
  • Association rule mining searches for interesting relationships among items in a given large data set. Association rules are frequently used by retail stores to assist in marketing, advertising, floor placement, and inventory control. There are three primary threshold measures in association rule; support and confidence and lift. In the case of appling real world to association rules, we have some difficulties in data interpretation because we obtain many rules. In this paper, we develop the model of association rules using latent variables for environmental survey data.

  • PDF

Discovery of Association Rules Using Latent Variables

  • Park, Hee-Chang;Cho, Kwang-Hyun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권1호
    • /
    • pp.149-160
    • /
    • 2006
  • Association rule mining searches for interesting relationships among items in a given large data set. Association rules are frequently used by retail stores to assist in marketing, advertising, floor placement, and inventory control. There are three primary threshold measures in association rule; support and confidence and lift. In the case of appling real world to association rules, we have some difficulties in data interpretation because we obtain many rules. In this paper, we develop the model of association rules using latent variables for environmental survey data.

  • PDF

연관 규칙 마이닝에서의 평가기준 표준화 방안 (Standardization for basic association measures in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.891-899
    • /
    • 2010
  • 연관성 규칙은 방대한 양의 데이터베이스 속에 있는 각 항목들 간의 관련성을 수치화함으로써 두개 이상의 항목간의 관련성을 나타내는 기법으로 데이터 마이닝 분야에서 가장 많이 활용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 가장 기본적인 평가기준에는 지지도, 신뢰도, 향상도 등이 있으며, 이들을 이용하여 연관성 규칙을 생성하게 된다. 이 때 사용되는 향상도는 그 값의 범위가 지지도나 신뢰도와는 다르므로 지지도나 신뢰도의 범위를 동일하도록 하기 위해 표준화할 필요가 있으며, 지지도와 신뢰도도 하나의 후항변수에 대해 여러 개의 전항변수들이 있는 경우 이들 중 어느 것이 후항변수와 가장 연관성이 있는지를 객관적으로 비교하기 위해서도 표준화가 필요하다. 본 논문에서는 각 항목집합의 주변 발생확률을 고려하여 객관적이고도 정확한 연관성 정도를 파악하기 위해 연관성 평가기준을 표준화하는 방안에 대해 연구하고자 한다. 또한 흥미도 측도의 세 가지 조건의 충족 여부를 점검해 본 후, 구체적인 예제를 통하여 기존의 연관성 평가기준과 표준화된 연관성 평가기준을 비교 분석하고자 한다.

Validity of the scoring system for traumatic liver injury: a generalized estimating equation analysis

  • Lee, Kangho;Ryu, Dongyeon;Kim, Hohyun;Jeon, Chang Ho;Kim, Jae Hun;Park, Chan Yong;Yeom, Seok Ran
    • Journal of Trauma and Injury
    • /
    • 제35권1호
    • /
    • pp.25-33
    • /
    • 2022
  • Purpose: The scoring system for traumatic liver injury (SSTLI) was developed in 2015 to predict mortality in patients with polytraumatic liver injury. This study aimed to validate the SSTLI as a prognostic factor in patients with polytrauma and liver injury through a generalized estimating equation analysis. Methods: The medical records of 521 patients with traumatic liver injury from January 2015 to December 2019 were reviewed. The primary outcome variable was in-hospital mortality. All the risk factors were analyzed using multivariate logistic regression analysis. The SSTLI has five clinical measures (age, Injury Severity Score, serum total bilirubin level, prothrombin time, and creatinine level) chosen based on their predictive power. Each measure is scored as 0-1 (age and Injury Severity Score) or 0-3 (serum total bilirubin level, prothrombin time, and creatinine level). The SSTLI score corresponds to the total points for each item (0-11 points). Results: The areas under the curve of the SSTLI to predict mortality on post-traumatic days 0, 1, 3, and 5 were 0.736, 0.783, 0.830, and 0.824, respectively. A very good to excellent positive correlation was observed between the probability of mortality and the SSTLI score (γ=0.997, P<0.001). A value of 5 points was used as the threshold to distinguish low-risk (<5) from high-risk (≥5) patients. Multivariate analysis using the generalized estimating equation in the logistic regression model indicated that the SSTLI score was an independent predictor of mortality (odds ratio, 1.027; 95% confidence interval, 1.018-1.036; P<0.001). Conclusions: The SSTLI was verified to predict mortality in patients with polytrauma and liver injury. A score of ≥5 on the SSTLI indicated a high-risk of post-traumatic mortality.