• 제목/요약/키워드: Market data classification

검색결과 227건 처리시간 0.03초

스포츠 4.0 시장 소비자의 온라인 소비성향 탐색: 생산 가능인구의 세대별 스포츠 용품 소비를 중심으로 (Exploring On-line Consumption Tendency of Sports 4.0 Market Consumer: Focused on Sports Goods Consumption by Generation of Working Age Population)

  • 신진호
    • 한국응용과학기술학회지
    • /
    • 제40권1호
    • /
    • pp.24-34
    • /
    • 2023
  • 본 연구는 생산 가능인구의 세대별 스포츠 용품 온라인 소비성향을 탐색하고, 스포츠 4.0 시장의 온라인 소비자를 세분화하여 미래의 소비 시장을 예측하기 위한 기초자료를 제공하고자 했다. 따라서 생산 가능인구의 세대별 집단(Y세대 이상, Z세대) 중 스포츠 용품을 소비한 경험자를 대상으로 본 조사를 실시했으며, 총 478명의 자료를 최종 분석에 적용했다. 자료처리는 SPSS statistics(ver. 21.0)으로 빈도분석, 탐색적 요인분석, 재검사 신뢰도의 상관관계 분석, 신뢰도 분석, 의사결정 나무 분석을 실시했다. 생산 가능인구의 세대별에 따른 스포츠 용품 온라인 소비성향 탐색결과, 여유, 즐거움, 자아 상징, 가격 요인이 높을 경우와 자아 상징, 기능, 환경 친화 요인이 낮을 경우 Z세대 집단으로 분류될 확률이 크게 나타났으며, 여유 요인이 낮고, 자아 상징 요인이 높을 경우와 즐거운 요인이 낮고, 연대적 소비 요인이 높을 경우 Y세대 이상 집단으로 분류될 확률이 크게 나타났다. 또한 이와 같은 모형의 분류 정확도는 69.7%로 나타났다.

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

5개국 바이오헬스 산업의 기술융합과 트렌드 분석 : 특허 동시분류분석과 텍스트마이닝을 활용하여 (Technology Convergence & Trend Analysis of Biohealth Industry in 5 Countries : Using patent co-classification analysis and text mining)

  • 박수현;윤영미;김호용;김재수
    • 한국융합학회논문지
    • /
    • 제12권4호
    • /
    • pp.9-21
    • /
    • 2021
  • 본 연구는 IP5국가(KR, EP, JP, US, CN)의 바이오헬스 분야 특허데이터를 기반으로 기술의 융합과 트렌드를 파악하여 해당 산업 분야의 발전 방향을 제시하는 것을 목적으로 한다. 기술융합 현황 파악을 위해 특허 동시분류분석 기반의 네트워크분석과 TF-IDF 기반의 텍스트마이닝을 주요 방법론으로 활용하였고, 분석 결과 바이오헬스 산업의 기술융합 클러스터는 크게 (A)치료용 의료기기, (B)의료데이터프로세싱, (C)생체계측용 의료기기의 세 가지 형태로 도출되었다. 또한 기술융합 결과를 토대로 한 트렌드 분석의 결과에서 우리나라는 (B)의료데이터프로세싱 분야에서 시장선도국으로 도출됨에 따라 향후 상업적 가치가 높은 특허로 시장 우위를 선점할 수 있는 가능성이 높다고 분석되었다. 특히 해당 분야는 2019년 1월 국회에서 통과된 '데이터3법'이라는 정책적 변환과 더불어, 국내 바이오헬스 기업들의 의료데이터 활용 가능성이 확대됨에 따라 해당 기술에 대한 기술융합 활성화 정책 수립과 R&D 지원 전략이 필요할 것으로 전망된다.

Text Mining and Sentiment Analysis for Predicting Box Office Success

  • Kim, Yoosin;Kang, Mingon;Jeong, Seung Ryul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권8호
    • /
    • pp.4090-4102
    • /
    • 2018
  • After emerging online communications, text mining and sentiment analysis has been frequently applied into analyzing electronic word-of-mouth. This study aims to develop a domain-specific lexicon of sentiment analysis to predict box office success in Korea film market and validate the feasibility of the lexicon. Natural language processing, a machine learning algorithm, and a lexicon-based sentiment classification method are employed. To create a movie domain sentiment lexicon, 233,631 reviews of 147 movies with popularity ratings is collected by a XML crawling package in R program. We accomplished 81.69% accuracy in sentiment classification by the Korean sentiment dictionary including 706 negative words and 617 positive words. The result showed a stronger positive relationship with box office success and consumers' sentiment as well as a significant positive effect in the linear regression for the predicting model. In addition, it reveals emotion in the user-generated content can be a more accurate clue to predict business success.

A methodology for Internet Customer segmentation using Decision Trees

  • Cho, Y.B.;Kim, S.H.
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.206-213
    • /
    • 2003
  • Application of existing decision tree algorithms for Internet retail customer classification is apt to construct a bushy tree due to imprecise source data. Even excessive analysis may not guarantee the effectiveness of the business although the results are derived from fully detailed segments. Thus, it is necessary to determine the appropriate number of segments with a certain level of abstraction. In this study, we developed a stopping rule that considers the total amount of information gained while generating a rule tree. In addition to forwarding from root to intermediate nodes with a certain level of abstraction, the decision tree is investigated by the backtracking pruning method with misclassification loss information.

  • PDF

비행 로그 복호화 방식에 따른 DJI 드론 분류 (Classification of DJI Drones Based on Flight Log Decryption Method)

  • 이영우;김주환;유지현;윤주범
    • 정보보호학회논문지
    • /
    • 제32권1호
    • /
    • pp.77-88
    • /
    • 2022
  • 드론(Drone)의 제작기술이 발전하고 대중화되면서 주로 산업, 농업, 군사 등에 치우쳐 있던 드론 시장은 개인·상업 시장에서도 큰 성장세를 보인다. 그중에서 DJI는 개인·상업용 드론 시장에 높은 점유율을 보이고, 이에 따라 DJI 드론의 포렌식 분석이 주목받고 있다. 특히, 범죄행위에 사용된 드론을 탈취·획득하여 분석할 때, 드론의 비행경로 및 하드웨어 정보를 기록한 비행 로그를 해석하는 기술이 필요하고, 이는 DJI의 드론 모델마다 복호화 방식의 차이로 인해 드론 모델별로 다르게 적용할 수밖에 없다. 따라서, 디지털 포렌식 조사관의 관점에서 불상의 드론을 획득하였을 때, 분석할 수 있는 드론 모델에 대한 명확한 분류가 필요하다. 본 논문에서는 포렌식을 통해 DJI 드론의 아티팩트를 추출하여 분석하는 방법을 제안하고, DJI의 출시 연월이 다른 세 가지 드론 모델에 대해서 미디어 데이터의 분석 및 비행 로그 분석 결과와 복호화 방식에 대해서 분석한다. 마지막으로, 상용화된 DJI 드론 비행 로그의 복호화 여부에 따라 DJI 제품군의 드론을 분류한다.

인터넷 서점의 사회과학분야 분류체계에 관한 연구 (A Study on the Classification System for Social Science Field in Internet Bookstore)

  • 민혜영;이성숙
    • 정보관리연구
    • /
    • 제43권1호
    • /
    • pp.41-62
    • /
    • 2012
  • 전자상거래의 발달로 출판유통시장에서의 인터넷 서점의 비중은 해마다 높아지고 있다. 전자책의 보급에 따라 인터넷 서점에서의 도서검색은 앞으로 더욱 활발해질 것이며, 인터넷 서점의 도서 분류체계의 중요성 또한 지속적으로 높아질 것으로 예상된다. 이 연구는 인터넷 서점 사회과학 도서의 효율적인 검색을 제공하기 위한 목적에서 이루어졌으며, 국내 외 10개 인터넷 서점의 분류체계를 분석하였다. 또한 사회과학 도서 분류체계 설계안을 구성하여 향후 사회과학 도서의 분류체계 설계에 활용될 수 있는 기초자료를 제시하고자 하였다.

Design of Coordinator Based on Android for Data Collection in Body Sensor Network

  • Min, Seongwon;Lee, Jong-Yong;Jung, Kye-Dong
    • International Journal of Advanced Culture Technology
    • /
    • 제5권2호
    • /
    • pp.98-105
    • /
    • 2017
  • Smartphones are fast growing in the IT market and are the most influential devices in our daily life. Smartphones are being studied for their use in body sensor networks with excellent processing power and wireless communication technology. In this paper, we propose a coordinator design that provides data collection, classification, and display using based on Android-smartphone in multiple sensor nodes. The coordinator collects data of sensor nodes that measure biological patterns using wireless communication technologies such as Bluetooth and NFC. The coordinator constructs a network using a multiple-level scheduling algorithm for efficient data collection at multiple sensor nodes. Also, to support different protocols between heterogeneous sensors, a data sheet recording wireless communication protocol information is used. The designed coordinator used Arduino to test the performance of multiple sensor node environments.

TIME-VARIANT OUTLIER DETECTION METHOD ON GEOSENSOR NETWORKS

  • Kim, Dong-Phil;I, Gyeong-Min;Lee, Dong-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2008년도 International Symposium on Remote Sensing
    • /
    • pp.410-413
    • /
    • 2008
  • Existing Outlier detections have been widely studied in geosensor networks. Recently, machine learning and data mining have been applied the outlier detection method to build a model that distinguishes outliers based on anchored criterion. However, it is difficult for the existing methods to detect outliers against incoming time-variant data, because outlier detection needs to monitor incoming data and classify irregular attacks. Therefore, in order to solve the problem, we propose a time-variant outlier detection using 2-dimensional grid method based on unanchored criterion. In the paper, outliers using geosensor data was performed to classify efficiently. The proposed method can be utilized applications such as network intrusion detection, stock market analysis, and error data detection in bank account.

  • PDF