• 제목/요약/키워드: Statistical Analytics

검색결과 44건 처리시간 0.022초

STATISTICAL MODELLING USING DATA MINING TOOLS IN MERGERS AND ACQUISITION WITH REGARDS TO MANUFACTURE & SERVICE SECTOR

  • KALAIVANI, S.;SIVAKUMAR, K.;VIJAYARANGAM, J.
    • Journal of applied mathematics & informatics
    • /
    • 제40권3_4호
    • /
    • pp.563-575
    • /
    • 2022
  • Many organizations seek statistical modelling facilitated by data analytics technologies for determining the prediction models associated with M&A (Merger and Acquisition). By combining these data analytics tool alongside with data collection approaches aids organizations towards M&A decision making, followed by achieving profitable insights as well. It promotes for better visibility, overall improvements and effective negotiation strategies for post-M&A integration. This paper explores on the impact of pre and post integration of M&A in a standard organizational setting via devising a suitable statistical model via employing techniques such as Naïve Bayes, K-nearest neighbour (KNN), and Decision Tree & Support Vector Machine (SVM).

R 프로그래밍: 통계 계산과 데이터 시각화를 위한 환경 (R programming: Language and Environment for Statistical Computing and Data Visualization)

  • 이두호
    • 전자통신동향분석
    • /
    • 제28권1호
    • /
    • pp.42-51
    • /
    • 2013
  • The R language is an open source programming language and a software environment for statistical computing and data visualization. The R language is widely used among a lot of statisticians and data scientists to develop statistical software and data analysis. The R language provides a variety of statistical and graphical techniques, including basic descriptive statistics, linear or nonlinear modeling, conventional or advanced statistical tests, time series analysis, clustering, simulation, and others. In this paper, we first introduce the R language and investigate its features as a data analytics tool. As results, we may explore the application possibility of the R language in the field of data analytics.

  • PDF

Facilitating Conditions in Adopting Big Data Analytics at Medical Aid Organizations in South Africa

  • VELA, Junior Vela;SUBRAMANIAM, Prabhakar Rontala;OFUSORI, Lizzy Oluwatoyin
    • 산경연구논집
    • /
    • 제13권11호
    • /
    • pp.1-10
    • /
    • 2022
  • Purpose: This study measures the influence of facilitating conditions on employees' attitudes towards the adoption of big data analytics by selected medical aid organizations in Durban. In the health care sector, there are various sources of big data such as patients' medical records, medical examination results, and pharmacy prescriptions. Several organizations take the benefits of big data to improve their performance and productivity. Research design, data, and methodology: A survey research strategy was conducted on some selected medical aid organizations. A non-probability sampling and the purposive sampling technique were adopted in this study. The collected data was analysed using version 23 of Statistical Package for Social Science (SPSS) Results: the results show that the "facilitating conditions" have a positive influence on employees' attitudes in the adoption of big data analytics Conclusions: The findings of this study provide empirical and scientific contributions of the facilitating conditions issues regarding employee attitudes toward big data analytics adoption. The findings of this study will add to the body of knowledge in this field and raise awareness, which will spur further research, particularly in developing countries.

대화처리를 위한 통계기반 한국어 음성언어이해 시스템 (Statistical Korean Spoken Language Understanding System for Dialog Processing)

  • 노윤형;양성일;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-218
    • /
    • 2012
  • 본 논문에서는 한국어 대화 처리를 위한 통계기반 음성언어이해 시스템에 대해 기술한다. 음성언어이해시스템은 대화처리에서 음성 인식된 문장으로부터 사용자의 의도를 인식하여 의미표현으로 표현하는 기능을 담당한다. 한국어의 특성을 반영한 실용적인 음성언어이해 시스템을 위해서 강건성과 적용성, 확장성 등이 요구된다. 이를 위해 본 시스템은 음성언어의 특성상 구조분석을 하지 않고, 마이닝 기법을 이용하여 사용자 의도 표현을 생성하는 방식을 취하고 있다. 또한 한국어에서 나타나는 특징들에 대한 처리를 위해 자질 추가 및 점규화 처리 등을 수행하였다. 정보서비스용 대화처리 시스템을 대상으로 개발되고 있고, 차량 정보서비스용 학습 코퍼스를 대상으로 실험을 하여 문장단위 정확률로 약 89%의 성능을 보이고 있다.

  • PDF

Predicting Selling Price of First Time Product for Online Seller using Big Data Analytics

  • Deora, Sukhvinder Singh;Kaur, Mandeep
    • International Journal of Computer Science & Network Security
    • /
    • 제21권2호
    • /
    • pp.193-197
    • /
    • 2021
  • Customers are increasingly attracted towards different e-commerce websites and applications for the purchase of products significantly. This is the reason the sellers are moving to different internet based services to sell their products online. The growth of customers in this sector has resulted in the use of big data analytics to understand customers' behavior in predicting the demand of items. It uses a complex process of examining large amount of data to uncover hidden patterns in the information. It is established on the basis of finding correlation between various parameters that are recorded, understanding purchase patterns and applying statistical measures on collected data. This paper is a document of the bottom-up strategy used to manage the selling price of a first-time product for maximizing profit while selling it online. It summarizes how existing customers' expectations can be used to increase the sale of product and attract the attention of the new customer for buying the new product.

Analysis of Market Trajectory Data using k-NN

  • Park, So-Hyun;Ihm, Sun-Young;Park, Young-Ho
    • Journal of Multimedia Information System
    • /
    • 제5권3호
    • /
    • pp.195-200
    • /
    • 2018
  • Recently, as the sensor and big data analysis technology have been developed, there have been a lot of researches that analyze the purchase-related data such as the trajectory information and the stay time. Such purchase-related data is usefully used for the purchase pattern prediction and the purchase time prediction. Because it is difficult to find periodic patterns in large-scale human data, it is necessary to look at actual data sets, find various feature patterns, and then apply a machine learning algorithm appropriate to the pattern and purpose. Although existing papers have been used to analyze data using various machine learning methods, there is a lack of statistical analysis such as finding feature patterns before applying the machine learning algorithm. Therefore, we analyze the purchasing data of Songjeong Maeil Market, which is a data gathering place, and finds some characteristic patterns through statistical data analysis. Based on the results of 1, we derive meaningful conclusions by applying the machine learning algorithm and present future research directions. Through the data analysis, it was confirmed that the number of visits was different according to the regional characteristics around Songjeong Maeil Market, and the distribution of time spent by consumers could be grasped.

Bayesian Prediction of Exponentiated Weibull Distribution based on Progressive Type II Censoring

  • Jung, Jinhyouk;Chung, Younshik
    • Communications for Statistical Applications and Methods
    • /
    • 제20권6호
    • /
    • pp.427-438
    • /
    • 2013
  • Based on progressive Type II censored sampling which is an important method to obtain failure data in a lifetime study, we suggest a very general form of Bayesian prediction bounds from two parameters exponentiated Weibull distribution using the proper general prior density. For this, Markov chain Monte Carlo approach is considered and we also provide a simulation study.

Enhanced Regular Expression as a DGL for Generation of Synthetic Big Data

  • Kai, Cheng;Keisuke, Abe
    • Journal of Information Processing Systems
    • /
    • 제19권1호
    • /
    • pp.1-16
    • /
    • 2023
  • Synthetic data generation is generally used in performance evaluation and function tests in data-intensive applications, as well as in various areas of data analytics, such as privacy-preserving data publishing (PPDP) and statistical disclosure limit/control. A significant amount of research has been conducted on tools and languages for data generation. However, existing tools and languages have been developed for specific purposes and are unsuitable for other domains. In this article, we propose a regular expression-based data generation language (DGL) for flexible big data generation. To achieve a general-purpose and powerful DGL, we enhanced the standard regular expressions to support the data domain, type/format inference, sequence and random generation, probability distributions, and resource reference. To efficiently implement the proposed language, we propose caching techniques for both the intermediate and database queries. We evaluated the proposed improvement experimentally.

소셜네트워크서비스 빅데이터 분석을 위한 연구문제 설정과 통계적 제 문제-융합적 관점 (Doing social big data analytics: A reflection on research question, data format, and statistical test-Convergent aspects)

  • 박한우;최경호
    • 디지털융복합연구
    • /
    • 제14권12호
    • /
    • pp.591-597
    • /
    • 2016
  • 타당한 연구 수행을 위해서는 방법론이 중요하다. 소셜네트워크서비스로부터 수집되는 데이터를 대상으로 하는 소셜 빅데이터 연구는 최근 들어 새롭게 부각되는 연구이지만 아직 이에 합당한 연구방법이 충분하지 않은 실정이다. 이에 본 연구에서는 소셜 빅데이터 분석에 합당한 연구방법론 개발에 앞서, 연구문제의 설정에 대하여 체계적으로 정리하고 질문의 기본 유형을 제시하고자 한다. 그리고 제시되는 6가지 기본 유형에 따른 데이터 형태를 살펴보고자 한다. 나아가 SNS로부터 수집되는 빅데이터 분석과 관련된 통계적인 제 문제에 대해서도 고찰해 보도록 하겠다. 본 연구의 결과는 향후 관련 연구자들이 데이터 유형에 맞는 올바른 연구문제를 수립하고 분석함으로써 타당한 정보를 도출하는데 도움이 될 것으로 사료된다.

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.