• 제목/요약/키워드: Market data classification

검색결과 225건 처리시간 0.02초

Supervised Learning-Based Collaborative Filtering Using Market Basket Data for the Cold-Start Problem

  • Hwang, Wook-Yeon;Jun, Chi-Hyuck
    • Industrial Engineering and Management Systems
    • /
    • 제13권4호
    • /
    • pp.421-431
    • /
    • 2014
  • The market basket data in the form of a binary user-item matrix or a binary item-user matrix can be modelled as a binary classification problem. The binary logistic regression approach tackles the binary classification problem, where principal components are predictor variables. If users or items are sparse in the training data, the binary classification problem can be considered as a cold-start problem. The binary logistic regression approach may not function appropriately if the principal components are inefficient for the cold-start problem. Assuming that the market basket data can also be considered as a special regression problem whose response is either 0 or 1, we propose three supervised learning approaches: random forest regression, random forest classification, and elastic net to tackle the cold-start problem, comparing the performance in a variety of experimental settings. The experimental results show that the proposed supervised learning approaches outperform the conventional approaches.

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

A Model-based Collaborative Filtering Through Regularized Discriminant Analysis Using Market Basket Data

  • Lee, Jong-Seok;Jun, Chi-Hyuck;Lee, Jae-Wook;Kim, Soo-Young
    • Management Science and Financial Engineering
    • /
    • 제12권2호
    • /
    • pp.71-85
    • /
    • 2006
  • Collaborative filtering, among other recommender systems, has been known as the most successful recommendation technique. However, it requires the user-item rating data, which may not be easily available. As an alternative, some collaborative filtering algorithms have been developed recently by utilizing the market basket data in the form of the binary user-item matrix. Viewing the recommendation scheme as a two-class classification problem, we proposed a new collaborative filtering scheme using a regularized discriminant analysis applied to the binary user-item data. The proposed discriminant model was built in terms of the major principal components and was used for predicting the probability of purchasing a particular item by an active user. The proposed scheme was illustrated with two modified real data sets and its performance was compared with the existing user-based approach in terms of the recommendation precision.

기업의 빅데이터 투자가 기업가치에 미치는 영향 연구 (The effect of Big-data investment on the Market value of Firm)

  • 권영진;정우진
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.99-122
    • /
    • 2019
  • IDC(International Data Corporation) 사(社)의 최근 보고서에 따르면, 2025년에는 2016년에 생성된 데이터의 10배에 달하는 163제타바이트의 데이터가 생성될 것이고 그 주체의 비중은 소비자에서 기업으로 이동하고 있다고 한다. 이러한 소위 '빅데이터의 물결'은 도래하고 있고 그 파장은 산업 전반적으로 영향을 미칠 것이다. 따라서, 방대한 데이터를 효과적으로 관리하는 것은 기업의 관점에서 그 어느 때보다 더 중요하다. 하지만, IT 투자에 대한 효과를 측정한 선행 연구는 다수 존재함에도 불구하고 빅데이터 투자 효과를 측정한 선행 연구는 거의 전무한 실정이다. 따라서, 해당 투자 효과를 정량적으로 분석한다면 기업의 의사 결정을 도울 수 있을 것이다. 본 연구는 효율적 시장 가설을 이론적 바탕으로 둔 사건연구방법론(Event Study Methodology)을 적용하여, 기업의 빅데이터 투자가 시장 투자자들의 반응에 미치는 영향을 측정하였다. 또한, 보다 심층적으로 이 효과를 분석하기 위해서 5가지 하위 변수를 설정했고 그 내용은 기업 크기 구분, 산업 구분(Finance와 ICT), 투자 구축 완료 구분, 벤더 유무 구분이다. 분석 결과, 91개 기업은 빅데이터 투자 공시 이후 시장 가치가 평균 0.92% 상승한다는 사실을 확인하였다. 특히 Finance 기업, non-ICT 기업, 시가 총액이 작은 기업, 빅데이터 전문 벤더 기업을 통해 투자한 기업, 그리고 빅데이터 시스템이 구축 완료됐다는 공시에 해당하는 기업의 시장 가치가 두드러지게 상승한다는 사실을 알 수 있었다. 본 연구는 빅데이터 투자 효과를 측정한 선행 연구가 거의 전무하다는 점에서 학문적인 의의를 지니고, 빅데이터 투자를 고려 중인 기업 의사 결정자들에게 실질적인 참고 자료가 될 수 있다는 점에서 실무적인 시사점을 갖는다.

Add-on selling strategies in an online open market

  • Shim, Beomsoo;Lee, Hanjun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권4호
    • /
    • pp.985-995
    • /
    • 2015
  • Add-on selling can provide new chances to increase sellers' profits and meet customers' needs. Although prior studies have advocated add-on selling for its business value, there is an argument that add-on selling can cause customer repulsion. Therefore, we need to understand customer purchasing pattern related to add-on selling in order to promote it and to mitigate the customer repulsion. To that end, we applied data mining techniques to the 24,925 transactions of data from an online open market in Korea. We then conducted feature selection to investigate the most influential factors that can explain the characteristics of add-on selling transactions using a classification model. We also identified association rules among add-on selling and promotions. Finally, based on the findings in our experiments, we proposed add-on selling strategies for the target online market.

사업체 규모 및 출하특성 자료를 이용한 화물운송시장 분할 (Freight Market Segmentation Using Company Size and Shipment Characteristics Data)

  • 최창호;남두희
    • 대한교통학회지
    • /
    • 제24권4호
    • /
    • pp.103-113
    • /
    • 2006
  • 화물운송시장의 분할은 운송시장의 효율화를 기하고 운송인이 물동량을 유치하기 위한 전략을 알기 위해 사용된다 화주 개개인의 성향을 파악하기 어려우므로 화주를 동질성을 갖는 몇 개의 군집으로 묶어 집단의 성향을 파악한다. 우리나라의 경우 표준산업분류의 배열순서에 따라 시장분할을 하여 왔다. 본 연구는 제조업체를 대상으로 새로운 운송시장 분할 가능성을 평가하였다. 연구의 결과 시장분할을 위한 적정 기준은 연간 입 출하량으로 우수한 분할능력을 보였다 또한 표준산업분류표의 배열순서에 따른 시장분할과 다른 결과를 도출하였다 본 연구는 물동량 발생 주체인 제조업체의 규모와 출하특성을 나타내는 자료를 이용하여 운송시장을 분할한 시도로서 의의가 있다.

스타트업 데이터 기반의 시장융합 다이내믹스 분석: 한국을 중심으로 (A Study on Market Convergence Dynamics Based on Startup Data: Focusing on Korea)

  • 송지훈
    • 한국산업융합학회 논문집
    • /
    • 제25권4_2호
    • /
    • pp.627-636
    • /
    • 2022
  • Market convergence plays an increasingly important role in sustaining competitiveness and providing impetus for the new product development. However, existing research focused mostly on the analysis of convergence at technology level. This study examines the phenomenon of market convergence based on the start-up data. Similar to the analysis of technology convergence, this study adopts the concept of co-classification analysis for constructing the co-occurrence matrix and the corresponding network. In this context, network centrality measures were calculated to assess the influence of individual market segments. Based on three metrics "growth", "persistence" and "novelty", the market convergence dynamics were explored and promising interactions between two distinct market segments were highlighted. The findings suggest that both segments "AI" and "blockchain" are acting as a driver that fosters market convergence in the startup landscape. The analysis results can provide valuable information for the R&D managers and policy makers in the design of targeted policies and programs, which can promote market convergence and interdisciplinary knowledge transfer.

기술력평가에서 사업성수준과 기술성변수간 연관성에 관한 실증연구 (An Empirical Study on the Relationship between Market Feasibility Levels and Technology Variables from Technology Competitiveness Assessment)

  • 성웅현
    • 품질경영학회지
    • /
    • 제32권3호
    • /
    • pp.198-215
    • /
    • 2004
  • Technology competitiveness evaluates environmental and engineered technology and process at both the scientific and market levels. There are increasing concerns to measure the effects of the technology variables on the potential market feasibility levels. However, there are very little empirical analysis studies on that issue. This study investigates the impacts of technology variables on the levels of market feasibility based on 230 data obtained from Korea Technology Transfer Center. As various statistical analysis, the canonical discriminant model, logit discriminant model and classification model were used and their results were compared. This study results showed that major technology variables had very significant relations to discriminate high and low categories of market feasibility. Finally, this study will help building management strategies to level up the potential market performance and also help financial Institutions to decide funds needed for small-sized technology firms.

SVM과 협업적 필터링 기법을 이용한 소비자 맞춤형 시장 분석 기법 설계 (A Design of Customized Market Analysis Scheme Using SVM and Collaboration Filtering Scheme)

  • 정은희;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권6호
    • /
    • pp.609-616
    • /
    • 2016
  • 본 논문에서는 SVM과 협업적 필터링을 이용한 소비자 맞춤형 시장 분석 기법을 제안하였다. 제안하는 소비자 맞춤형 시장 분석 기법은 DC(Data Classification) 모듈, ICF(Improved Collaborative Filtering) 모듈, 그리고 CMA(Customized Market Analysis) 모듈로 구성된다. DC 모듈은 SVM을 이용하여 온 오프라인 쇼핑몰과 전통시장의 특성을 가격, 품질평가, 주력상품으로 분류하고, ICF 모듈은 나이 가중치와 직업 가중치를 추가한 유사도를 생성하고, 사용자들간의 구매 아이템에 대한 유사도를 이용하여 네트워크를 생성하고, 이웃 노드의 추천 리스트를 생성한다. 그리고 CMA 모듈은 DC모듈의 데이터 분류 결과와 ICF 모듈의 추천 리스트를 이용하여 사용자 맞춤형 시장 분석 결과를 제공한다. 제안된 사용자 맞춤형 추천리스트와 기존의 사용자기반 추천 리스트를 비교한 결과, 기존의 협업적 필터링기법을 이용한 추천리스트의 경우, precision는 0.53, recall은 0.56, F-measure은 0,57인데 반해, 제안하는 소비자 맞춤형 추천리스트는 precision이 0.78, recall은 0.85, 그리고 F-measure은 0.81로 나타났다. 즉, 제안하는 소비자 맞춤형 추천리스트가 좀 더 정확한 것으로 나타났다.

해외 발전플랜트 리스크 분류체계 및 관계형 데이터베이스 구축 방안 (Risk Classification and Relational Database Schema in Overseas Power Plant Construction)

  • 김민;정영수
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2014년도 춘계 학술논문 발표대회
    • /
    • pp.192-193
    • /
    • 2014
  • Due to the decreasing domestic construction market since 2007, Korean construction companies are expanding overseas market. As a result, the international market share by Korea has been continuously increased and achieved 65.2 billion dollars in 2013. Despite of such visible results, profitability concerns are constantly arising. It is pointed out that the low-priced bid competition between Korean construction companies and various unpredictable risks are the most crucial factors which aggravate the profitability in the overseas projects. From this point of view, predicting the risks in advance and controling them could be the most important tasks to improve the profitability. This research proposed 202 risk factors with a hierarchy and relational database schema for power plant construction, which is based on the 24 risk classifications in previous research (Kim & Jung 2013). Proposed risk classification and relational database schema could be utilized as the basic data in risk management system.

  • PDF