• 제목/요약/키워드: Multinomial model

검색결과 251건 처리시간 0.03초

다항시행접근 단순 베이지안 문서분류기의 개선 (Improving Multinomial Naive Bayes Text Classifier)

  • 김상범;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.259-267
    • /
    • 2003
  • 단순 베이지언 분류모형은 구현이 간단하고 효율적이기 때문에 실용적으로 사용하기에 적합하다. 그러나 이 분류모형은 많은 기계학습 도메인에서 우수한 성능을 보임에도 불구하고 문서분류에 적용되었을 경우에는 그 성능이 매우 낮은 것으로 알려져왔다. 본 논문에서는 단순 베이지언 분류모형중 가장 성능이 우수한 것으로 알려진 다항 시행접근 단순 베이지언 분류모형을 개선하는 세가지 방법을 제안한다. 첫 번째는 범주에 대한 단어의 확률추정방법을 문서모델에 기반하여 개선하는 것이고, 두 번째는 문서의 길이에 따라 범주와의 관련성이 선형적으로 증가하는 것을 억제하기 위해 길이에 대한 정규화를 수행하는 것이며, 마지막으로 범주판정에 중요한 역할을 하는 단어들의 영향력을 높여주기 위하여 상호정보가중 단순 베이지언 분류방법을 사용하는 것이다. 제안하는 방법들은 문서분류기의 성능 평가를 위한 벤치마크 문서집합인 Reuters21578과 20Newsgroup에서 기존의 방범에 비해 상당한 성능향상을 가져옴을 알 수 있었다.

Relation Between News Topics and Variations in Pharmaceutical Indices During COVID-19 Using a Generalized Dirichlet-Multinomial Regression (g-DMR) Model

  • Kim, Jang Hyun;Park, Min Hyung;Kim, Yerin;Nan, Dongyan;Travieso, Fernando
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1630-1648
    • /
    • 2021
  • Owing to the unprecedented COVID-19 pandemic, the pharmaceutical industry has attracted considerable attention, spurred by the widespread expectation of vaccine development. In this study, we collect relevant topics from news articles related to COVID-19 and explore their links with two South Korean pharmaceutical indices, the Drug and Medicine index of the Korea Composite Stock Price Index (KOSPI) and the Korean Securities Dealers Automated Quotations (KOSDAQ) Pharmaceutical index. We use generalized Dirichlet-multinomial regression (g-DMR) to reveal the dynamic topic distributions over metadata of index values. The results of our analysis, obtained using g-DMR, reveal that a greater focus on specific news topics has a significant relationship with fluctuations in the indices. We also provide practical and theoretical implications based on this analysis.

개인별 선택행위에서의 동력모형의 유효성 (Validity of Gravity Models for Individual Choies)

  • 음성직
    • 대한교통학회지
    • /
    • 제1권1호
    • /
    • pp.43-47
    • /
    • 1983
  • Within the conventional transportation planning process, "trip distribution" has a significant role to play. The most widely applied trip distribution model is the gravity model, for which Wilson provided the theoretical basis in 1967. The concept of the gravity model, however, still remains ambiguous if we analyze the "trip distribution" with a disaggregate data set. Thus, this paper hypothesizes that the gravity technique is still valid even with the disaggregate data set, by proving that the estimated coefficients of the gravity model, which is derived under the principle of entropy maximization, are identical with those of the multinomial logit model, which is derived under the principle of individual utility maximization.tility maximization.

  • PDF

노선선택행태의 모형화 (Modeling of the Route Choice Behavior)

  • 이인원;차재혁
    • 대한교통학회지
    • /
    • 제7권1호
    • /
    • pp.35-42
    • /
    • 1989
  • The multinomial logit model has been applied for various choice problems. Among others, the joint destination mode choice, the mode choice and the route choice are the three major modeling topics for korean transportation planners. This paper examines with real world data (the Olympic road and its competing two major arterials) the usefulness of a Logit route choice model. Quites surpisingly, it is found that the multinomial route choice behavioral model calibrated for this study based on (0,1) individula data base can not provide a good estimate for O-D trips less than 6㎞. 400data points and 3case studies might not be sufficient for a sound conclusion. It is, however, believed from a series of similar studies conducted by the authors that the route choice behavior is more sensitive (more demand elastic with respect to travel time changes) than the mode choice and the shorter trip, the more sensitive. The travel time parameters for destination choice models are usually smalle than the travel time parameters for mode choice models and these parameters (for mode choice models) turn our smaller than the travel time parameters for route choice models from this study. Table 2 in this paper shows parameter changes for three different markets and Table 3 shows the modeling errors when the estimated individual probabilities are aggregated into a route level.

  • PDF

이단계 군집분석에 의한 농촌관광 편의시설 유형별 소비자 선호 결정요인 (Determinants of Consumer Preference by type of Accommodation: Two Step Cluster Analysis)

  • 박덕병;윤유식;이민수
    • 마케팅과학연구
    • /
    • 제17권3호
    • /
    • pp.1-19
    • /
    • 2007
  • 본 연구에서는 농촌관광 방문객에게 제공되는 편의시설을 유형화하고 어떤 특징을 가진 방문객이 어떤 편의시설을 선호하는지를 규명하기 위한 방법과 그 분석결과를 제시하였다. 이를 위하여 우선 2단계 군집분석법을 사용하여 농촌관광 편의시설을 유형화하였다. 그 다음으로 군집분석에 사용되는 변인이 범주형 변인이 있을 경우 전통적인 군집분석 방법을 적용할 수 없기 때문에 2단계 군집분석을 하였다. 본 연구는 2단계 군집분석법이 범주형 변인으로 측정된 농촌관광의 편의시설을 유형화하는 데 매우 유용하다는 것을 보여 주고 있다. 다중로짓 모형을 사용하여 특정 편의시설 유형을 선호할 확률에 영향을 미치는 농촌관광 방문자의 사회인구학적 특성과 여행특성을 규명하였다. 즉, 다중로짓 모형을 통해 참조항(일반농가형)으로 설정된 편의시설 유형에 비해 특정 편의시설을 선호할 확률에 영향을 미치는 소비자의 특성을 규명할 수 있다는 것이 본 연구의 특징이다.

  • PDF

데이터마이닝 기법을 기반으로 한 성공적인 Joint Venture 전략 (Successful Joint Venture Strategies Based on Data Mining)

  • 김진형;손소영
    • 대한산업공학회지
    • /
    • 제33권4호
    • /
    • pp.424-429
    • /
    • 2007
  • The purpose of this study is to propose types of joint venturesthat can increase the competitivenessof a company in the marketplace. We examine the characteristics of individual venture enterprises based on technology. We considered 16 TEA in order to categorize companies into four groups. Next, we used a multinomial logistic regression model to identify the significant characteristics of a venture company that successfully predicts group membership. Based on this information, we propose various forms of joint venture which complement each other and produce higher overall competence. Our study can provide important feedback information to academics, Policy-makers.

로짓모형을 이용한 친환경차 구매행태 분석 (Analysis of Green Vehicle Purchasing Behavior Using Logit Model)

  • 한진석;이장호
    • 대한교통학회지
    • /
    • 제34권2호
    • /
    • pp.135-145
    • /
    • 2016
  • 본 연구에서는 다항로짓모형 기반의 차종선택모형을 추정하여 개별 구매자의 차종선택행태를 분석하였다. 차량운전자를 대상으로 SP 설문조사를 수행하여 모형추정을 위한 자료를 수집하였으며, 설문응답자가 선택 가능한 대안은 가솔린차, HEV, PHEV, EV로 한정하였다. 모형에 포함된 설명변수는 대부분 유의수준 5% 하에서 유의한 것으로 나타났으며, price, fuel 변수를 제외한 나머지 변수는 모두 양(+)의 부호로 상식적인 방향과 일치하여 결과가 합리적인 것으로 판단된다. 중 대형을 선택하는 구매자는 타 차급을 선택하는 구매자보다 경제적 여유가 있어 차량가격 등에 비하여 상대적으로 지출금액이 낮은 연료비는 크게 고려하지 않는 경향이 강하다. 이러한 이유로 대형 차급의 모형에서는 fuel 변수가 유의하지 않은 것으로 판단되며, 사회경제변수의 경우 경 소형에서는 age, infor 변수가, 중 대형에서는 age, infor, inc3 변수가 통계적으로 유의한 것으로 나타났다.

데이터마이닝 기법들을 통한 제주 안개 예측 방안 연구 (A Study on Fog Forecasting Method through Data Mining Techniques in Jeju)

  • 이영미;배주현;박다빈
    • 한국환경과학회지
    • /
    • 제25권4호
    • /
    • pp.603-613
    • /
    • 2016
  • Fog may have a significant impact on road conditions. In an attempt to improve fog predictability in Jeju, we conducted machine learning with various data mining techniques such as tree models, conditional inference tree, random forest, multinomial logistic regression, neural network and support vector machine. To validate machine learning models, the results from the simulation was compared with the fog data observed over Jeju(184 ASOS site) and Gosan(185 ASOS site). Predictive rates proposed by six data mining methods are all above 92% at two regions. Additionally, we validated the performance of machine learning models with WRF (weather research and forecasting) model meteorological outputs. We found that it is still not good enough for operational fog forecast. According to the model assesment by metrics from confusion matrix, it can be seen that the fog prediction using neural network is the most effective method.

임금과 인사고과 : 대기업 인사데이터를 활용한 실증분석 (Wage and Performance Rating : New Evidence from Personnel Data of a Korean Large Firm)

  • 엄동욱
    • 노동경제논집
    • /
    • 제31권3호
    • /
    • pp.47-74
    • /
    • 2008
  • 본 연구는 임금과 생산성의 관계에 대한 선행 연구에서 근호자의 생산성 지표로서 인사고과 정보를 활용한 Medoff and Abraham과 Flabbi and Ichino의 연구를 한국 대기업의 인사데이터(2000년, 제조업 근로자)에 적용하여 재현하였다. 임금함수의 OLS 추정과 임금 및 인사고과 분포를 활용한 다항로짓함수 추정을 통해 분석한 결과, 근로자 개인의 생산성을 통제한다고 하더라도 연공임금은 계속 나타났다. 이는 선행연구와 동일하게 연공임금을 설명함에 있어 인적자본 이론보다는 인센티브 이론이 더 적절하다는 것을 시사한다.

  • PDF

농산촌체험마을 지역주민의 체험프로그램 참여의향 - 산촌생태마을사업을 위한 정책적 제언 - (Participation Intention of Activity-oriented Program of Local Residents of Rural and Mountain Villages - Policy Implication for the Eco-Mountain Village Project -)

  • 이덕재;김종호;전준헌
    • 한국조경학회지
    • /
    • 제36권1호
    • /
    • pp.1-11
    • /
    • 2008
  • Factors for promoting the resident participation in mountain villages are suggested to introduce the activity-oriented program of green tourism using a multinomial logit model(MNLM). Direct surveying, using a structured questionnaire was performed on local residents in the different types of rural tourism villages such as mountain villages, agricultural themed villages, and the mixed types of villages. The MNLM revealed that participation intention in the program was significantly higher for males, those with lower education, and residents in mountain villages. The participation intention of the program had a negative relationship with the increase of expected problems not from the program itself, but from the results of the program such as income distribution and nature destruction. Participation intention also increased with the indirect effects of an investment by the Village Development Project, such as local cooperativeness, public mind, etc. It was suggested that to introduce the activity-oriented program in mountain villages, negative effects from the results had to be minimized, and positive effects from the indirect changes between local residents had to be maximized through better communication and policy endeavors.