• Title/Summary/Keyword: 통계 분석 데이터

Search Result 2,487, Processing Time 0.038 seconds

Patent and Statistics, What's the Connection? (특허와 통계학, 그 연결은?)

  • Jun, Sung-Hae;Uhm, Dai-Ho
    • Communications for Statistical Applications and Methods
    • /
    • v.17 no.2
    • /
    • pp.205-222
    • /
    • 2010
  • A patent is a right of intellectual properties to an inventor or its assignee for a limited period under an international law. Not only in an invention of new machines, but it is competitive for using and creating technology in the world based on the patents. Most of the business models are good examples for patented technology, however a statistical analyzing model could be another one. In this paper we study and analyze the patents for the statistical analyzing and data mining models which are currently applied and registered, and suggest a statistical tool for analyzing and categorizing patent data. For this study all the patents in Korea and U.S. are listed and searched to sample the only cases concerning statistics.

데이터 마이닝에서 배깅과 부스팅 알고리즘 비교 분석

  • Lee, Yeong-Seop;O, Hyeon-Jeong
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.05a
    • /
    • pp.97-102
    • /
    • 2003
  • 데이터 마이닝의 여러 기법중 모형의 변동성을 줄이고 정확도가 높은 분류자를 형성하기 위하여 다양한 앙상블 기법이 연구되고 있다. 그 중에서 배깅과 부스팅 방법이 가장 널리 알려져 있다. 여러 가지 데이터에 이 두 방법을 적용하여 오분류율을 구하여 비교한 후 각 데이터 특성을 입력변수로 하고 배깅과 부스팅 중 더 낮은 오분류율을 갖는 알고리즘을 목표변수로 하여 의사결정나무를 형성하였다. 이를 통해서 배깅과 부스팅 알고리즘이 어떠한 데이터 특성의 패턴이 존재하는지 분석한 결과 부스팅 알고리즘은 관측치, 입력변수, 목표변수 수가 큰 것이 적합하고 반면에 배깅 알고리즘은 관측치, 입력변수, 목표변수 수의크기가 작은 것이 적합함을 알 수 있었다.

  • PDF

Development of Automated Statistical Analysis Tool using Measurement Data in Cable-Supported Bridges (특수교 계측 데이터 자동 통계 분석 툴 개발)

  • Kim, Jaehwan;Park, Sangki;Jung, Kyu-San;Seo, Dong-Woo
    • Journal of Korean Society of Disaster and Security
    • /
    • v.15 no.3
    • /
    • pp.79-88
    • /
    • 2022
  • Cable-supported bridges, as important large infrastructures, require a long-term and systematic maintenance strategy. In particular, various methods have been proposed to secure safety for the bridges, such as installing various types of sensor on members in the bridges, and setting management thresholds. It is evidently necessary to propose a strategic plan to efficiently manage increasing number of cable-supported bridges and data collected from a number of sensors. This study aims to develop an analysis tool that can automatically remove abnormal signals and calculate statistical results for the purpose of efficiently analyzing a wide range of data collected from a long span bridge measurement system. To develop the tool, basic information such as the types and quantity of sensors installed in long span bridges and signal characteristics of the collected data were analyzed. Thereafter, the Humpel filtering method was used to determine the presence or absence of an abnormality in the signal and then filtered. The statistical results with filtered data were shown. Finally, one cable-stayed bridge and one suspension bridge currently in use were chosen as the target bridges to verify the performance of the developed tool. Signal processing and statistical analysis with the tool were performed. The results are similar to the results reported in the existing work.

Positioning-error Analysis of Vibration Sensors for Prognostics and Health Management in Rotating System (갠트리 크레인 호이스트의 건전성 평가를 위한 진동 모사시스템 구축과 데이터 통계 분석)

  • Jang, Jaewon;Han, Zhiqiang;Zhang, Haiyang;Oh, Daekyun
    • Journal of the Korean Society of Marine Environment & Safety
    • /
    • v.28 no.2
    • /
    • pp.346-353
    • /
    • 2022
  • Recently, studies on the integrity of rotating machines, such as gantry cranes, which are used in the shipbuilding industry, have been actively conducted. Gantry cranes are driven at relatively low revolutions per minute (RPM), are frequently operated and stopped, and are impacted by external environmental factors, such as shock and noise in the measurement data. The purpose of this study was to construct a replica of a gantry crane hoist used in indoor shipbuilding and analyze the acquired data for errors caused by the shift in operating conditions (RPM) and the change in the position of the data acquisition sensor. Consequently, we observed that the error caused by differences in sensor positions did not occur significantly under low operating conditions but occurred significantly under relatively high operating conditions. Thus, we determined that both the operating condition and position of the acquisition sensor affected the data acquired by the rotary machine.

Exploratory data analysis for Chatterjee's ξ coefficient (Chatterjee의 ξ 계수에 대한 탐색적자료분석)

  • Jang, Dae-Heung
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.3
    • /
    • pp.421-434
    • /
    • 2022
  • Chatterjee (2021) proposed a new correlation coefficient ξ. Focusing on two questions (1. Is ξ coefficient distinguishable for Anscombe's quartet data set?, 2. How does the ξ coefficient value change according to the number of data for various kinds of scatterplots?), an exploratory data analysis is attempted for ξ coefficient. We can compare three measures (ξ coefficient, Pearson's correlation coefficient and mutual information).

A study on data processing of electric vehicle charging archives (전기자동차 충전기록 데이터 처리에 관한 연구)

  • Hwang, Yunweong;Jin, Hyojeong;Kim, Soyeon;Lee, Junghoon
    • Annual Conference of KIPS
    • /
    • 2022.11a
    • /
    • pp.337-338
    • /
    • 2022
  • 본 논문에서는 환경공단이 제공하는 전기자동차 충전기의 운영기록 분석하는 과정에서 주기적으로 공개 데이터를 수집하여 지역 데이터베이스에 저장하고 데이터의 오류를 정제하는 방안에 대해 연구한다. 전력시스템 부하에 직접적으로 영향을 주는 급속충전기 운영기록만을 추출하고 날짜필드에서의 오류 혹은 역전을 포함하는 트랜잭션을 제거한 후 일차적으로 충전시간길이를 히스토그램으로 분석한다. 대부분의 충전이 20분 이내에 완료되었지만 23%는 충전완료 후에도 충전기에서 플러그를 제거하지 않은 것으로 보인다.

Data Processing Architecture on the Jeju Taxi Telematics System (제주 택시 텔레매틱스 시스템에서 이동 이력 데이터의 처리 구조)

  • Lee, Jung-Hoon;Hong, Young-Shin;Park, Gyung-Leen
    • Annual Conference of KIPS
    • /
    • 2008.05a
    • /
    • pp.879-880
    • /
    • 2008
  • 본 논문은 제주 택시 텔레매틱스 시스템에 축적되고 있는 차량들의 이동이력 데이터에 대한 처리구조를 설계하고 구현한다. 각 차량은 1분마다 자신의 위치와 GPS 정보 및 택시의 상태에 관련된 보고를 발생시키며 중앙의 관제시스템은 이를 수합하여 이력데이터를 구성한다. 본 논문에서 구현하는 시스템은 위치 보고를 처리하여 인코딩 변환, 좌표 변환, 맵 매칭, 도로상에서의 위치 계산 등을 수행한 후 오라클 데이터베이스의 이력 테이블에 저장하도록 한다. 이를 위하여 도로 네트워크가 데이터베이스로 변환되었으며 도로망에의 가시화를 위하여 지도 인터페이스 프로그램이 구현되었다. 이러한 정보들은 이력 테이블과 아울러 공간 데이터베이스 엔진과 결합하여 C 언어나 SQL 문장에 의하여 다양한 위치기반 질의를 가능하게 할 뿐 아니라 배차 정보 분석, 현재 통행 속도 분석 등 부가가치가 높은 정보를 산출하는데 필수적인 역할을 수행한다.

Analysis of Web Data Applying Data Mining (데이터마이닝을 이용한 웹 데이터 분석)

  • 채승경;서용무
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.345-361
    • /
    • 2001
  • 인터넷의 확산으로 웹 구조, 웹 로그 등을 분석하는 웹마이닝(Web Mining)에 대한 연구가 활발히 진행되고 있다. 그러나 웹에서 발생하는 데이터에 대한 분석은 아직 미약한 상태이다. 웹에서 획득된 데이터는 신뢰도가 낮아 통계와 같은 기존의 분석 방법을 적용하기에 많은 어려움이 따른다. 또한 대용량 데이터와 실제 데이터에 유연한 분석을 제공하는 데이터 마이닝은 아직까지 적용 분야가 매우 한정되어 있다. 본 논문에서는 인터넷 사이트의 실제 데이터를 이용하여 데이터마이닝 과정에 따라 데이터 정제, 데이터 선택, 데이터 변환 등 효과적인 데이터 전처리 방법을 제시한다. 또한 이렇게 전처리된 데이터로 고객 세분화, 우수 고객 분류를 위한 데이터마이닝 기법을 적용한 후 수행 결과를 분석한다. 마지막으로 분석의 한계점을 지적하고 보다 양질의 데이터마이닝을 위한 시스템 및 사이트 설계 방안을 제시한다.

  • PDF

On the Bayesian Statistical Inference (베이지안 통계 추론)

  • Lee, Ho-Suk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.263-266
    • /
    • 2007
  • This paper discusses the Bayesian statistical inference. This paper discusses the Bayesian inference, MCMC (Markov Chain Monte Carlo) integration, MCMC method, Metropolis-Hastings algorithm, Gibbs sampling, Maximum likelihood estimation, Expectation Maximization algorithm, missing data processing, and BMA (Bayesian Model Averaging). The Bayesian statistical inference is used to process a large amount of data in the areas of biology, medicine, bioengineering, science and engineering, and general data analysis and processing, and provides the important method to draw the optimal inference result. Lastly, this paper discusses the method of principal component analysis. The PCA method is also used for data analysis and inference.

  • PDF

A Data Transformation Method for Visualizing the Statistical Information based on the Grid (격자 기반의 통계정보 표현을 위한 데이터 변환 방법)

  • Kim, Munsu;Lee, Jiyeong
    • Spatial Information Research
    • /
    • v.23 no.5
    • /
    • pp.31-40
    • /
    • 2015
  • The purpose of this paper is to propose a data transformation method for visualizing the statistical information based on the grid system which has regular shape and size. Grid is better solution than administrator boundary or census block to check the distribution of the statistical information and be able to use as a spatial unit on the map flexibly. On the other hand, we need the additional process to convert the various statistical information to grid if we use the current method which is areal interpolation. Therefore, this paper proposes the 3 steps to convert the various statistical information to grid. 1)Geocoding the statistical information, 2)Converting the spatial information through the defining the spatial relationship, 3)Attribute transformation considering the data scale measurement. This method applies to the population density of Seoul to convert to the grid. Especially, spatial autocorrelation is performed to check the consistency of grid display if the reference data is different for same statistic information. As a result, both distribution of grid are similar to each other when the population density data which is represented by census block and building is converted to grid. Through the result of implementation, it is demonstrated to be able to perform the consistent data conversion based on the proposed method.