• 제목/요약/키워드: RankBoost

검색결과 13건 처리시간 0.021초

Learning-to-rank 기법을 활용한 서울 경마경기 순위 예측 (Horse race rank prediction using learning-to-rank approaches)

  • 정준형;신동욱;황세용;박건웅
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.239-253
    • /
    • 2024
  • 본 연구는 learning-to-rank (LTR) 기법 중 point-wise와 pair-wise learning을 적용하여 서울 경마경기 순위 예측을 수행하였다. Point-wise learning으로는 선형 회귀와 랜덤 포레스트를 pair-wise learning으로는 RankNet, LambdaMART (XGBoost Ranker, LightGBM Ranker, CatBoost Ranker)을 활용하였다. 또한 데이터 불균형 문제를 해결하기 위해 전처리 과정에서 경주기록을 경주거리에 따라 표준화하는 방식을 채택하였으며, 모형의 예측 능력 향상을 위해 경기 정보, 기수 정보, 마필 정보, 조교사 정보 등의 다양한 데이터를 사용하였다. 그 결과 아이템 간의 순위관계를 학습할 수 있는 pair-wise learning이 point-wise learning보다 전반적으로 더 뛰어난 예측력을 보이는 것을 확인하였다. 특히 CatBoost Ranker는 제시된 모형들 중 가장 뛰어난 예측 성능을 보였다. 마지막으로 섀플리 값을 통해 CatBoost Ranker에서 경주마의 성적, 직전 경주기록, 경주마의 출발훈련 횟수, 누적 출발훈련 횟수, 질병 진단횟수 등이 상위 10개 중요 변수에 포함된 것을 확인하였다.

스마트폰 상에서의 개인화 학습을 위한 랭크부스트 알고리즘 (RankBoost Algorithm for Personalized Education of Chinese Characters on Smartphone)

  • 강대기;장원태
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.70-76
    • /
    • 2010
  • 본 논문에서는 스마트폰 상에서 한자 학습 시스템을 랭크부스트 알고리즘을 이용하여 개인화하는 방법에 대해 논하고자 한다. 한자 학습의 일반적인 환경을 보면, 학습자는 급수에 따라 일정한 개수의 학습할 한자들이 있으며, 학습이 진행됨에 따라 그 한자들 중 자신이 잘 틀리는, 즉 자신에게는 난이도가 높은 한자들이 생기게 된다. 본 논문에서는 이러한 난이도의 측정을 랭크부스트 알고리즘을 통해 구현하였다. 알고리즘은 초기에는 모든 한자들에 대해 동일한 가중치를 가지고 학습을 시작하게 하지만, 사용자가 자주 틀리는 한자에 대해서는 가중치를 높여 나간다. 본 논문에서 제안하는 랭크부스트 알고리즘은 학습자에 개인화된 난이도 순위를 매겨줌으로, 학습자가 어려운 한자에 더 자주 노출되게 한다면 학습 효과를 높일 수 있다.

Composition and Structure of Himalayan Oak (Quercus leucotrichophora A. Camus) Forest under Various Degrees of Disturbance

  • Prasad, Sunil;Uniyal, Pooja;Chauhan, D.S.
    • Journal of Forest and Environmental Science
    • /
    • 제31권1호
    • /
    • pp.7-13
    • /
    • 2015
  • Forest disturbance sometime considered as a tool of management as it believed that mid level disturbance constructs better micro-climatic conditions which ultimately boost up the plant diversity. The effect of different levels of disturbance on species composition and regeneration is very important. Present attempt was carried out in a temperate evergreen oak forest which was under various degree of disturbance. The study area is one of the large ranges of oak forest in Garhwal Himalaya and compensating various types of daily needs of local people. On the basis of IVI values Quercus leucotrichophora holds first position in all the disturbance zones whereas Myrica esculenta upgraded it's rank in highly disturbed zone and showed less impacted species by disturbance. Berberis aristata and Eupatorium adenophorum in shrub layer and Anaphalis adnata and Bidens pilosa in herb layer were found as disturbance friendly species because they attained higher rank in highly disturbed zone whereas Caryopteris foetida was found disturbance-sensitive in shrub layer. The banj oak regenerated well under mid disturbance as compared to no and high degree of disturbance and a sharp downfall in the species diversity was recorded with increasing magnitude of disturbance. Density-diameter curves showed a reverse trend of lower density in higher girth classes. The results of the study should be useful for the forest management strategies.

인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구 (A Study on the Win-Loss Prediction Analysis of Korean Professional Baseball by Artificial Intelligence Model)

  • 김태훈;임성원;고진광;이재학
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.77-84
    • /
    • 2020
  • 본 연구에서는 인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구를 했다. 승리할 팀과 해당 팀의 최종 리그 순위를 예측했고, 사용자의 편의를 위해 웹사이트도 구축했다. 각 1·3·5이닝 별로 가장 정확도가 높으면서도 오차가 적은 모델을 최적 모델로 선정해 승·패 결과를 예측했고, 이를 토대로 순위표를 작성했다. 결과표는 2020년 개막인 5월 5일부터 8월 30일까지의 예측 결과를 바탕으로 작성했다. 기아타이거즈가 아닌 다른 구단끼리의 경기는 실제 결과를 사용했다. 머신러닝 모델은 KNN과 AdaBoost가 최적 모델로 선정되었으며, 실제 순위와 비교해 본 결과, 경기가 진행될수록, 예측 결과의 순위 오차가 점점 작아지는 것을 확인했다. 딥러닝 모델은 89%의 정확도를 기록했고, 머신러닝 모델과 마찬가지로 경기를 진행할수록 예측 결과 순위 오차가 작아지는 것을 확인했다. 실험 결과는 한국 프로야구 승·패 결과 예측뿐 아니라 다양한 분야에서 사용할 수 있을 것으로 사료된다. 방송국에서 야구 경기를 중계하는 중 이닝별로 인공지능 알고리즘이 예상한 승·패 여부를 중계화면에 띄울 수 있다. 시청자들에게 새로운 흥미를 일으킬 수 있을 것이고, 나아가 구단의 감독들이 이닝마다 데이터를 분석해 경기 중 유동적으로 승리하기 위한 전략을 세울 수 있을 것으로 기대된다.

공학캠프를 통한 공학과 기술에 대한 이미지 변화 연구 (The Effect on Images of an Engineering Program Participate toward 'Engineering' and 'Technology' through Semantic Differential Method)

  • 임나영;이창훈
    • 공학교육연구
    • /
    • 제20권6호
    • /
    • pp.68-75
    • /
    • 2017
  • This study has a purpose to analyse changes in perception and image about engineering and technology of students who participated in the engineering camp. To achieve this objective, the questions were as follows. 1) What about participants' image difference for engineering before and after participating the engineering camp 2) What about participants' image difference for technology before and after participating the engineering camp. For this study, the program was progressed from Aug in 2017 and the data was collected from 88 students, middle school seniors and high school freshmen. The results of this study were as follows: First, secondary students perceived 'valuable(6.74)', 'meaningful(6.73)', 'rich(6.40)', 'collaborative(6.42)', 'nice(6.22)' as high image rank of the positive response for engineering. On the other hand, 'complex(3.59)', 'labored(3.80)', 'hard(4.66)', 'dangerous(4.48)', 'cold(4.86)' were perceived as low image rank of the negative response for engineering. We can realize that they generally has the image that engineering is valuable, meaningful and nice but also labored, complex and hard. The students who participated in the engineering camp showed the greatest difference in 'complex - simple' and 'dangerous - safe' engineering categories before and after the camp, followed by 'cold - hot', 'labored - easy', and 'hard - soft', respectively. Second, secondary students perceived 'meaningful(6.58)', 'valuable(6.55)', 'wide(6.38)', 'nice(6.37)', 'strong(6.25)' as high image rank of the positive response for technology. On the other hand, 'complex(3.85)', 'labored(3.93)', 'hard(4.62)', 'dangerous(4.72)', 'cold(5.05)' were perceived as low image rank of the negative response for technology. The students who participated in the engineering camp had the big change in 'hard - soft' technology category before and after the camp, followed by 'complex - simple', 'labored - easy', 'theoretical - practical' and 'dangerous - safe', respectively. We can see that the negative images for technology which were complex, labored, dangerous, theoretical was improved with positive image such as simple, easy, safe and practical, after conducting the engineering camp. In conclusion, both image recognitions for engineering and technology have improved after the camp. It means that interesting and entertaining engineering-technology program can boost interests in engineering and technology which felt difficult, so that images about them can be turned out positive. Also, it is possible to reduce avoidance of natural science and engineering subjects, as part of the purpose of training creative talents in science and engineering, so it can be said that the engineering camp is highly meaningful because it can lead students into the field of science and engineering.

검색 광고 마케팅 서비스 유형 분석과 서비스 품질 개선방안 (Analytical Study on Classification and Service Quality Improvement for Keyword & Blog Advertising Marketing Services)

  • 최윤호;이재원
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.456-466
    • /
    • 2015
  • 본 연구는 검색포탈의 키워드 검색과 광고주 블로그를 융합적으로 활용하여 바이럴 마케팅을 실행하는 검색광고 마케팅 서비스를 연구의 대상으로 한다. 키워드 검색 결과의 상단에 블로그를 통해 간접광고를 노출하여 소비자를 유인하는 서비스를 운영 중인 회사에 대한 사례조사를 통해서 제공되고 있는 검색광고 마케팅 서비스의 거래 당사자들 간의 거래관계를 중심으로 하는 서비스 유형을 분석하고, 서비스의 품질인식정도와 사용자 그룹간의 인식의 차이를 조사 및 분석하여 운영서비스의 개선방안을 제시함을 목적으로 한다. 수행 방법으로는 검색광고 솔루션을 사용하는 광고 마케팅 커뮤니티의 게시물 분석을 수행하여 서비스 솔루션의 4가지의 유형과 거래관계를 표현하는 4가지 서비스 구조도 유형을 분석하였다. 또한 면접법을 사용한 사전 연구로 설계된 SERVQUAL 기반의 설문조사를 사용하여 광고주와 광고대행사 그룹간 서비스에 대한 품질인식 정도와 차이를 분석하였다. 이를 통해 공론화의 한계를 갖고 있는 검색광고 마케팅 서비스에 대한 사례기업의 개선방안을 제시하였다.

SVD-LDA: A Combined Model for Text Classification

  • Hai, Nguyen Cao Truong;Kim, Kyung-Im;Park, Hyuk-Ro
    • Journal of Information Processing Systems
    • /
    • 제5권1호
    • /
    • pp.5-10
    • /
    • 2009
  • Text data has always accounted for a major portion of the world's information. As the volume of information increases exponentially, the portion of text data also increases significantly. Text classification is therefore still an important area of research. LDA is an updated, probabilistic model which has been used in many applications in many other fields. As regards text data, LDA also has many applications, which has been applied various enhancements. However, it seems that no applications take care of the input for LDA. In this paper, we suggest a way to map the input space to a reduced space, which may avoid the unreliability, ambiguity and redundancy of individual terms as descriptors. The purpose of this paper is to show that LDA can be perfectly performed in a "clean and clear" space. Experiments are conducted on 20 News Groups data sets. The results show that the proposed method can boost the classification results when the appropriate choice of rank of the reduced space is determined.

우리나라 환경산업의 무역구조와 국제경쟁력에 관한 연구 (A Study on the Trade Structures and International Competitiveness of the Korean Environmental Industry)

  • 박복재;문영수
    • 통상정보연구
    • /
    • 제15권2호
    • /
    • pp.345-364
    • /
    • 2013
  • 본 논문에서는 DDA 환경상품 무역자유화 협상에 대비하여 세계 주요국과 우리나라의 환경산업 제품에 대한 무역구조를 분석하였다. OECD에서 제안한 161종의 환경상품 리스트를 기반으로 2002년부터 2011년까지 10년간 전 세계 환경상품의 무역 통계를 조사하였다. 환경산업의 세계 무역규모는 2002년 4,639억 달러에서 2011년 1조4,778억 달러로 3배 이상 증가하였다. 우리나라의 2011년 환경상품의 세계시장 점유율은 3.2%이며, 무역특화지수는 -0.128, 현시비교우위지수는 1.002이며 세계시장에서 일본과 수출경합도가 가장 높은 것으로 나타났다. 본 논문에서 우리나라의 환경상품의 국제경쟁력은 무역규모에 비해 국제경쟁력이 상대적으로 약한 것으로 조사되었다. 따라서 향후 지속될 DDA 환경상품 자유화 협상에서 우리나라는 환경상품의 유예기간 설정 등 단계별 무역자유화 추진과 국내 산업의 경쟁력 향상을 위해 노력해야 할 것이다.

  • PDF

대용량 그래프 압축과 마이닝을 위한 그래프 정점 재배치 분산 알고리즘 (A Distributed Vertex Rearrangement Algorithm for Compressing and Mining Big Graphs)

  • 박남용;박치완;강유
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1131-1143
    • /
    • 2016
  • 수십억 개 간선들로 구성된 대용량 그래프를 어떻게 효과적으로 압축할 수 있을까? 정점 재배치를 통해 인접 행렬의 0이 아닌 값들을 집중시키면 그래프를 효율적으로 압축할 수 있을 뿐 아니라 페이지랭크 등 여러 그래프 마이닝 알고리즘의 수행 속도를 개선할 수 있다. 최신 정점 재배치 기법인 SlashBurn은 실세계 네트워크의 멱법칙 특성을 활용하는 실세계 그래프에 효과적인 방법이다. 하지만 단일 머신 기반으로 설계되어 대용량 그래프에 대해 처리 속도가 현저히 느려지거나 적용이 불가능한 한계가 있다. 본 논문에서는 이러한 한계를 극복하기 위한 분산 SlashBurn을 제안한다. 분산 SlashBurn은 대규모의 정점 재배치 프로세스를 분산 처리하여 대용량 그래프를 기존 방법보다 훨씬 빠르고 확장성 있게 처리한다. 대용량 실세계 그래프들에 대한 실험 결과, 분산 SlashBurn은 단일 머신 SlashBurn보다 45배 이상 빠르게 동작하였고, 16배 이상 큰 그래프를 처리할 수 있었다.

SNS를 이용한 패션업체의 마케팅 실태 연구 -Facebook을 중심으로- (A Study on the State of Fashion Marketing Using the SNS -Focused on the Facebook-)

  • 김태진;진성아
    • 한국산학기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.2305-2312
    • /
    • 2012
  • 시대의 변화에 따른 IT 기술의 급속한 발전은 전반적인 산업영역에서 예전보다 쉽게 정보를 취득하고 가공할 수 있는 여건을 형성하고 있다. 최근 각광 받고 있는 SNS의 변화를 살펴보면 스마트폰 이용이 대중화되면서 마케팅 툴로서의 가치가 더욱 급부상하고 있다. 본 연구는 패션 마케팅 분야에서 새로운 시장으로 떠오르고 있는 Facebook 활용 사례를 연구하였다. 패션업체 10곳을 선정하여 활동지표의 기준이 되는 '게시글', 'like this', 'people talking about this' '이벤트'를 중심으로 페이스북 페이지를 연구하였고 spearman 순위 상관계수를 이용하여 위 지표들 간의 상관분석을 실시하였다. 연구 결과 '게시글'과 'like this'의 관계는 높은 상관관계를 보여 주었고 다른 요인들 사이에서는 상관관계를 확인할 수 없었다. 페이스북 페이지를 이용한 마케팅은 소비자와 업체와의 소통이 기존 매체에 비해 원활하였는데 이는 SNS의 마케팅의 이용이 기존의 마케팅의 한계였던 소통의 벽을 넘을 수 있음을 보여주는 결과였다.