• 제목/요약/키워드: Sports Mining

검색결과 36건 처리시간 0.025초

Evaluation of Shopping Items: Focused on Purchase of Foreign Tourists in South Korea

  • Jeong, Dong-Bin
    • 동아시아경상학회지
    • /
    • 제7권2호
    • /
    • pp.21-30
    • /
    • 2019
  • Purpose - In this work, we categorize the 21 shopping items which foreign tourists purchase in South Korea and monitor the level of dissimilarity (or similarity) between each item by utilizing distance matrix, and both hierarchical and k-means cluster analyses, respectively, based on several purpose of visit attributes in 2017. In addition, multidimensional scaling (MDS) method is applied for mining visual appearance of proximities among shopping items based on purpose of visit attributes. Research design and methodology - This study is carried out in 2017 by Ministry of Culture, Sports and Tourism and conduct a face-to-face survey of foreign tourists from 20 countries who purchase shopping items in South Korea. CLUSTER, PROXIMITIES and ALSCAL modules in IBM SPSS 23.0 are used to perform this work. Results - We ascertain that 21 shopping items can be classified into five similar groups which have homogeneous traits by going through two-step cluster analysis. We can position homogeneous places of cluster and shopping items joining each cluster. Conclusions - We can relatively assess patterns and characteristics of each shopping item, come by useful information in activating shopping tour based on the actual state of recognition of foreign tourists and practically apply to each tourism industry on underlying results.

텍스트 마이닝과 네트워크 이론을 활용한 권역별 국가하천 점용허가 키워드 분석 (Analysis of Keywords in national river occupancy permits by region using text mining and network theory)

  • 정성윤
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.185-197
    • /
    • 2023
  • 점용허가 정보를 기록하는 단순 용도로만 사용되고 있는 허가 대장에서 허가 내용에 내재한 점용 신청과 허가업무 수행에 유용한 정보를 추출하기 위해 텍스트 마이닝과 네트워크 이론을 활용하여 본 연구를 진행하였다. 텍스트 마이닝 기반으로 불용어 제거와 형태소 분석 등 정규화 과정을 비롯하여 서울·경기, 경상, 전라, 충청, 강원 등 5개 권역별로 어휘 출현 빈도와 토픽 모델링을 분석, 비교하였다. 네트워크 이론에 가정 많이 사용되는 단계, 근접, 매개 및 고유벡터 등 4종의 중심성 알고리즘을 적용하여 네트워크에서 중심적인 위치에 있거나 중간 매개체 역할을 하는 키워드를 살펴보았다. 이러한 어휘 출현 빈도, 토픽 모델링 및 네트워크 중심성을 종합적으로 분석하여 모든 권역에서 '설치' 키워드가 가장 영향력이 큰 것을 알 수 있었다. 이는 환경부의 허가관리청에서는 시설물을 건설하거나 공작물을 설치하는 허가가 많아서 나타난 결과라고 판단된다. 또한, 도로 시설, 치수 시설, 지하 매설 시설, 전력·통신 시설, 체육·공원 시설 등과 연관된 키워드가 토픽 모델링과 네트워크에서 중심적 위치에 있거나 중간 매개체의 역할을 하는 것을 알 수 있었다. 키워드 대부분은 출현 빈도와 분포 비율이 낮은 짚프의 원칙(Zipf' Law)의 통계분포 형태를 보이는 것으로 보였다.

4차 산업혁명이 주목한 Z세대의 스포츠 소비 스타일 탐색: 데이터마이닝 기반 의사결정 나무 분석 적용 (Exploring Sport Consumption Style of Generation Z that the 4th Industrial revolution paid attention to: Applying Decision Tree Analysis based on Data Mining)

  • 신진호;임영삼;김지선
    • 한국응용과학기술학회지
    • /
    • 제37권5호
    • /
    • pp.1208-1221
    • /
    • 2020
  • 본 연구는 데이터 마이닝 기반 의사결정 나무 분석을 적용해 Z세대 스포츠 소비 스타일을 탐색하여 Z세대가 주도할 스포츠 소비 시장을 예측하기 위한 기초자료를 제공하고자 했다. 따라서 Z세대 중 만 19세 이상 남성 및 여성을 표본으로 선정해 본 조사를 실시했으며, 총 429명의 자료를 최종 분석에 사용했다. 자료처리는 SPSS statistics(ver. 21.0) 프로그램을 이용하여 빈도분석, 탐색적 요인분석, 재검사 신뢰도 및 신뢰도 분석, 의사결정 나무 분석을 실시했다. 본 연구의 주요 결과는 다음과 같다. 첫째, 합리 효율성 지수가 높고, 심미적 소비 지수가 낮을 경우 여성 집단으로 분류될 확률이 96.8%로 나타났다. 반면에 합리 효율성과 가격 지향 지수가 낮을 경우 남성 집단으로 분류될 확률이 100%로 나타났다. 둘째, 브랜드 지향, 가격 지향, 합리 효율성 지수가 높을 경우 수도권 집단으로 분류될 확률이 97.3%로 나타났다. 앞서 제시한 결과와는 상반적으로 브랜드 지향, 기념 의례, 지위 상징 지수가 낮을 경우 이외 지역 집단으로 분류될 확률이 82.1%로 나타났다. 셋째, 지위 상징, 유행 지향 지수가 높으며, 기능성 지수가 낮을 경우 일상생활 및 패션 집단으로 분류될 확률이 77.6%로 나타났다. 이와 반대로 지위 상징 지수가 낮고, 소속감 유지, 소비 향유 지수가 높을 경우 운동 및 경기 집단으로 분류될 확률이 81.0%로 나타났다.

Mecab-ko 형태소 분석을 이용한 한국체육학회지 연구동향 분석 (The Research Trend Analysis of the Korean Journal of Physical Education using Mecab-ko Morphology Analyzer)

  • 박성건;김완섭;이대택
    • 한국체육학회지인문사회과학편
    • /
    • 제56권6호
    • /
    • pp.595-605
    • /
    • 2017
  • 본 연구의 목적은 Mecab-ko 형태소 분석을 기반으로 한국체육학회 연구자들이 선호하는 연구 분야가 무엇이며, 인문사회과학과 자연과학 분야 간 연구자들의 관심사에 차이점이 있는지 그리고 이유는 무엇인지 텍스트 분석을 통해 알아보는 것이다. 본 연구를 위해 수집된 데이터는 2002년 3월~2017년 3월까지 한국체육학회지 온라인에 게재된 5,014편의 논문이다. 본 연구에서는 수집된 문서에서 키워드를 추출하기 위해 Mecab-ko 형태소 분석기를 사용하였다. 연구 결과, 한국체육학회지에 게재되는 논문 수는 감소하고 있는 것으로 나타났다. 연구자들이 선호하는 연구 분야는 여가, 생활체육 및 건강이 경기력 향상보다 상대적으로 높게 나타났으며, 관심이 높은 연구 대상은 여성, 중년, 노인으로 나타났다. 인문사회과학 분야 연구자들은 전통적 연구 분야와 사회적 관심사에 모두 관심을 보인 반면에, 자연과학 분야 연구자들은 전통적 연구를 보다 깊게 연구하는 것에 관심이 높은 것으로 나타났다. 결론적으로, 스포츠 분야 융합 연구 활성화를 구현하기 위해서는 연구의 깊이와 폭에 중점을 두어야 하는 학문 분야가 무엇인지, 새로운 학문 분류 체계 및 정립이 필요하다.

코로나 19에 따른 프로야구 무관중 시청품질요인의 중요도, 만족도 분석 (Analysis of the Importance and Satisfaction of Viewing Quality Factors among Non-Audience in Professional Baseball According to Corona 19)

  • 백승헌;김기탁
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권2호
    • /
    • pp.123-135
    • /
    • 2021
  • 본 연구의 자료처리는 '코로나 19와 프로야구', '코로나 19와 프로야구 무관중'과 관련된 키워드를 중심으로 텍스톰(textom)프로그램의 텍스트마이닝과 소셜네트워크 분석을 활용해 문제점 도출 및 시청품질의 변인을 설정하는데 활용하였다. 정량적 분석을 위해 시청품질에 관한 설문지를 구성하였으며, 270부의 설문응답자 중 250부의 설문을 최종연구에 사용하였다. 설문지의 타당도와 신뢰도를 확보하기 위한 도구로 탐색적 요인 분석과 신뢰도 분석을 실시하였으며, 타당도와 신뢰도가 확보된 설문을 바탕으로 IPA분석(중요도-만족도)을 실시하여 결과 및 전략을 제시하였다. IPA분석을 실시한 결과 1사분면에 영상과 관련된 요인(영상구성, 영상배색, 영상 선명도, 영상 확대 및 구도, 고음질 영상)이 나타났고 2사분면은 경기상황(응원 팀 경기수준, 응원 선수 경기수준, 스타선수 발굴, 라이벌 팀과의 경기)과 경기정보(경기일정 안내, 선수정보 확인, 팀 성적 및 선수성적, 경기정보), 상호작용(응원팀과의 공감대) 일부의 요인이 나타났으며, 3사분면은 해설자(야구관련 지식, 의사전달 능력, 발음과 목소리, 표준어 사용, 경기관련 정보 소개)와 상호작용(프런트와 실시간 소통, 시청자와의 공감대, 채팅 등의 정보교환)의 요인이 나타났다.

위치기반 소셜 미디어 데이터의 텍스트 마이닝 기반 공간적 클러스터링 분석 연구 (Spatial Clustering Analysis based on Text Mining of Location-Based Social Media Data)

  • 박우진;유기윤
    • 대한공간정보학회지
    • /
    • 제23권2호
    • /
    • pp.89-96
    • /
    • 2015
  • 위치기반 소셜 미디어 데이터는 빅데이터, 위치기반서비스 등 다양한 분야에서 활용가능성이 매우 큰 데이터이다. 본 연구에서는 위치기반 소셜 미디어 데이터의 텍스트 정보를 분석하여 주요한 키워드들이 공간적으로 어떻게 분포하고 있는지를 파악할 수 있는 일련의 분석방법론을 적용해보았다. 이를 위해, 위치태그를 지닌 트윗 데이터를 서울시 강남지역과 그 주변지역에 대하여 2013년 8월 한달 간 수집하였으며, 이 데이터를 대상으로 하여 텍스트 마이닝을 통해 주요 키워드들을 도출하였다. 이러한 키워드들 중 음식, 엔터테인먼트, 업무 및 공부의 세 카테고리에 해당하는 키워드들만 추출, 분류하였으며 각 카테고리에 해당하는 트윗 데이터들에 대해서 공간적 클러스터링을 실시하였다. 도출된 각 카테고리별 클러스터들을 실제 그 지역의 건물 또는 벤치마크 POI들과 비교한 결과, 음식 카테고리 클러스터는 대규모 상업지역들과 일치도가 높았고 엔터테인먼트 카테고리의 클러스터는 공연장, 극장, 잠실운동장 등과 일치하였다. 업무 및 공부 카테고리 클러스터들은 학원 밀집지역 및 사무용 빌딩 밀집지역과 높은 일치도를 나타내었다.

의사결정나무 분석을 통한 세계핸드볼 승패결정요인 분석 (A Study of Influencing Factors on World Handball Win-Loss using the Decision Tree Analysis)

  • 김현철
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.461-468
    • /
    • 2021
  • 이 연구는 2019년 남녀 핸드볼 세계선수권대회에 참가하는 모든 국가를 대상으로 국제핸드볼연맹이 제공한 공식 기록을 수집해 팀 경기 기록의 승패를 가리는 중요한 슈팅 변수를 규명하는 데 목적이 있다. 이 연구의 목적을 달성하기 위해 2019 핸드볼 세계선수권대회에 참가한 24개국 남녀대표팀의 총 192경기를 수집해 승패 그룹에 따른 대회 기록의 차이를 검증한 이후 8가지 슈팅 변수에 따라 승패요인을 분류하기 위해 데이터마이닝 기법의 하나인 의사결정 트리 방식(CART 알고리즘)을 적용해 분석했다. 분석 결과 9m 슈팅성공률과 Near 슈팅성공률이 남녀 모두에게 가장 중요한 요인으로 평가됐다. 남자는 9m 슈팅성공률이 32.5% 이상, Near 슈팅성공률이 67.5% 이상이면 83.3% 승리하며, 여자는 9m 슈팅성공률이 75%이상, Near 슈팅성공률이 51% 이상이면 75%를 승리한다. 또한, 여자팀은 페널티 요인 중 옐로카드는 승패를 결정짓는 중요 변수로 판단된다. 결론적으로 본 연구를 통하여 국제핸드볼 경기에서 승리와 패배 팀의 기록 특성 차이와 승패를 구분하는 중요 슈팅 변수를 남녀 모두에서 확인 할 수 있었다.

빅데이터를 활용한 골프웨어에 관한 인식 연구 (A Study of Perception of Golfwear Using Big Data Analysis)

  • 이아름;이진화
    • 한국의류산업학회지
    • /
    • 제20권5호
    • /
    • pp.533-547
    • /
    • 2018
  • The objective of this study is to examine the perception of golfwear and related trends based on major keywords and associated words related to golfwear utilizing big data. For this study, the data was collected from blogs, Jisikin and Tips, news articles, and web $caf{\acute{e}}$ from two of the most commonly used search engines (Naver & Daum) containing the keywords, 'Golfwear' and 'Golf clothes'. For data collection, frequency and matrix data were extracted through Textom, from January 1, 2016 to December 31, 2017. From the matrix created by Textom, Degree centrality, Closeness centrality, Betweenness centrality, and Eigenvector centrality were calculated and analyzed by utilizing Netminer 4.0. As a result of analysis, it was found that the keyword 'brand' showed the highest rank in web visibility followed by 'woman', 'size', 'man', 'fashion', 'sports', 'price', 'store', 'discount', 'equipment' in the top 10 frequency rankings. For centrality calculations, only the top 30 keywords were included because the density was extremely high due to high frequency of the co-occurring keywords. The results of centrality calculations showed that the keywords on top of the rankings were similar to the frequency of the raw data. When the frequency was adjusted by subtracting 100 and 500 words, it showed different results as the low-ranking keywords such as J. Lindberg in the frequency analysis ranked high along with changes in the rankings of all centrality calculations. Such findings of this study will provide basis for marketing strategies and ways to increase awareness and web visibility for Golfwear brands.

서울 경마 경기 우승마 예측 모형 연구 (Analysis of Horse Races: Prediction of Winning Horses in Horse Races Using Statistical Models)

  • 최혜민;황나영;황찬경;송종우
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1133-1146
    • /
    • 2015
  • 경마 산업은 국내 합법 사행산업의 대부분을 차지하고 있다. 그러나 사행성 도박이라는 인식 하에 여타 스포츠 산업에 비해 활발한 통계적 분석이 이루어지지 않고 있다. 본 연구의 목적은 다양한 데이터마이닝 기법을 이용하여 우승마를 예측하는 모형 개발에 있다. 모형 적합에 사용한 데이터는 한국 마사회에서 제공하는 자료를 바탕으로 하였으며, 경마 성적표, 경주마 정보, 기수 정보, 조교사 정보 등을 사용하였다. 예측 모형은 크게 두 모형으로 나누어 순위를 기반으로 한 모형과 기록을 기반으로 한 모형으로 적합하였고, 분석 방법으로는 선형회귀분석, 랜덤 포레스트, 로지스틱 회귀 분석을 사용하였다. 그 결과 말 기본 정보와 과거 우승 경력, 기수의 과거 우승 경력 등이 순위 예측에 큰 영향을 미치는 것을 알 수 있었다. 모형 적합에 사용되지 않은 최근 1개월 간 데이터를 이용하여 단승식, 복승식, 삼복승식으로 배팅한 결과 모형 간 큰 차이가 없었고, 모두 양의 수익을 얻을 수 있었다.

빅데이터를 활용한 도시공원 이용행태 특성의 시계열 분석 (A Time Series Analysis of Urban Park Behavior Using Big Data)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제48권1호
    • /
    • pp.35-45
    • /
    • 2020
  • 본 연구는 현대사회에서 도시민의 행태를 지원하는 공간으로 공원에 주목하였다. 현대의 도시공원은 특정한 역할을 하는 공간으로 국한되지 않으며, 공공의 성격을 가지고 있어 이용자의 이용행태에 따라 그 기능·의미가 변화할 수 있다. 또한, 현재 온라인상의 데이터는 방문할 공원의 선택 혹은 공원 이용행태의 결정을 지원하는 단계로 접어들었다. 이에 본 연구는 빅데이터의 자료 기반의 특징인 시계열 분석이 가능하도록 데이터를 수집할 수 있는 최초 년도인 2000년부터 2018년까지 여의도공원·여의도 한강공원과 양재 시민의 숲의 행태 변화를 빅데이터 기법인 텍스트마이닝(Text Mining)과 소셜 네트워크(Social Network;사회연결망)분석을 활용하여 분석하였다. 연구결과의 요약은 다음과 같다. 먼저 시간의 흐름에 따라 주요 이용행태와 행태에 영향을 미치는 요소에 변화가 있었다. 여의도공원·여의도 한강공원의 이용행태는 제 I시기는 '타다'(동적행태), 제 II시기는 '찍다'(정보통신서비스 행태), 제 III시기는 '걷다'(동적행태), 제 IV시기는 '먹다'(에너지원 행태)로 시간의 흐름에 따라 주요 행태가 다양하게 변화하는 모습이고, 양재 시민의 숲은 제 I시기는 '걷다'(동적행태), 제 II시기는 '걷다'(동적행태), 제 III시기는 '걷다'(동적행태), 제 IV시기는 '놀다'(동적행태)로 주로 동적행태 위주의 행태가 나타나는 것으로 나타났다. 주요 행태에 영향을 미치는 요소로 여의도공원·여의도 한강공원은 스포츠 및 레저, 문화·예술, 여가와 관련된 요소가 도출되었고, 양재 시민의 숲은 자연자원 요소가 도출되어 주요 이용행태에 영향을 미치는 요소에 차이가 있었다. 다음으로 대상지의 행태는 시기별로 특정 행태에 집중화되어 있으며, 차후 발생하는 행태를 선택하거나 제약하는 역할을 하는 것으로 나타났다. 이러한 결과는 대상지에 다양한 행태가 일어나지 않을 뿐만 아니라, 공간, 시설 등이 골고루 활용되지 않고 있다는 것을 알 수 있다. 연구결과의 흥미로운 점은 두 공원에서 공통적으로 눈에 띄게 급증한 행태는 에너지원 행태(먹다, 마시다)와 소비행태(사다, 대여하다)이다. 에너지원 행태는 두 공원에서 모두 제 III시기에서 제 IV시기 사이에 10배 이상으로 치솟았으며, 다른 행태와 빈도에서 큰 차이를 보이며 월등히 높았다. 또한, 공원에 방문하는 시민들은 식음료비, 자전거 등의 대여비, 이밖에 행사 참여 등과 관련된 소비의사가 있으며, 공원이 도심 내 휴식공간에서 지역경제 활성화라는 측면에서 본다면 긍정적으로 평가할 수 있을 것이다. 본 연구는 데이터 기법을 활용하여 도시공원 이용행태를 분석하였다는 점과 오늘날 도시공원은 휴식, 산책 등의 역할을 넘어서 시대적인 트렌드를 반영하며, 소비 성향이 나타나는 놀이공간으로 성향이 변화하였다는 결과를 도출하였다는 점에서 큰 의의가 있다. 현대 도시공원에서 일어나는 행태는 양과 내용이 과거와 다르게 변화하고 있다. 그러므로 빅데이터를 통해 수집되는 대규모 집단의 행태를 유형화하고, 이러한 결과를 바탕으로 이루어지는 다학제적인 논의를 통해 오늘날 도시공원을 시민들이 어떻게 이용하고 있는지를 보다 명확하게 이해할 수 있을 것이다.