• Title/Summary/Keyword: 통계 분석 데이터

Search Result 2,487, Processing Time 0.038 seconds

Nominal Compound Analysis Using Statistical Information and WordNet (통계정보와 WordNet을 이용한 복합명사 분석)

  • 류민홍;나동열;장명길
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.33-40
    • /
    • 2000
  • 복합명사의 한 구조는 구성 명사간의 수식관계의 집합이라고 본다. 한 복합 명사에 대하여 가능한 여러 구조 중에서 올바른 구조를 알아 내는 것이 본 논문의 목표이다. 이를 위하여 우리는 최근에 유행하는 통계 기반 분석 기법을 이용한다. 먼저 우리의 복합 명사 분석 asn제에 알맞은 통계 모델을 개발하였다. 이 모델을 이용하면 분석하려는 복합명사의 가능한 분석 구조바다 확률값을 얻게 된다. 그 다음 가능한 구조들 중에서 가장 확률값이 큰 구조를 복합구조로 선택한다. 통계 기반 기법에서 항상 문제가 되는 것이 데이터 부족문제이다. 우리는 이를 해결하기 위해 개념적 계층구조의 하나인 워드넷(WordNet)을 이용한다.

  • PDF

Market Research - 전국 커피자판기 설치 현황, 베일을 벗다

  • 한국자동판매기공업협회
    • Vending industry
    • /
    • v.10 no.2
    • /
    • pp.27-29
    • /
    • 2010
  • "전국에 설치되어 운영 중인 커피자판기가 몇 대가되나요?" 협회로 이런 문의를 하는 전화들이 가끔씩 걸려 온다. 이렇게 외부에서는 실질적으로 자판기 운영대수를 궁금해 하는 경우가 많다. 하지만 협회에서 내는 통계는 매년 생산량기준으로 집계가 되기 때문에 이런 궁금증을 흡족하게 풀어주지 못했다. 실제 운영 중인 커피자판기의 추정대수 정도만을 이야기 할 수 있었지, 객관적인 데이터를 제공하지 못해 왔다. 이 같은 현상은 전국에 산재해 있는 커피자판기들의 대수를 합산하여 통계를 내는 시스템을 구축하기가 힘들기 때문이다. 국내의 경우 전문 운영업자들의 수도 무척 많은 데다가, 거미줄처럼 연계된 개인 운영자까지 포함을 하면 통계 대상이 엄청 광범위해 진다. 따라서 이들을 대상으로 통계 데이터를 합산하는 일은 거의 불가능에 가깝다. 캔음료자판기의 경우는 그래도 대형 음료업체의 수량 데이터를 제공받으면 객관적인 집계가 가능한 점과는 차이가 있다. 이런 탓에 국내는 커피자판기 운영 통계에 대한 갈증이 컸다. 전국에 몇 대 커피자판기가 운영되는지 지역별 분포는 어떻게 되는지 알고자 하는 수요는 많았지만 정보공급자는 없었다. 이러한 현실에서 금호 '마켓 리서치'에서는 운영 통계에 대한 정보갈증을 해소시키는 데이터를 공개한다. 이번에 공개하는 자료는 전국에 영업 신고된 식품자판기의 전체 통계이다. 본지에서 이미 지난 2009년 여름호에 '서울시 영업신고된 식품자판기 운영 현황'을 분석한 기사를 게재하여 큰 반향을 일으킨바 있다. 하지만 이번에 공개되는 데이터는 전국을 대상으로 해 정보가치가 더 크다. 과연 전국에는 몇 대의 식품자판기가 설치되어 있고, 지역별 어떠한 분포와 특징을 나타내고 있는지를 살펴보기로 하자.

  • PDF

Analysis of Weather News using Big Data Analytics Tools R (빅데이터 분석도구 R을 활용한 기상뉴스 데이터분석)

  • Kim, YongSu;Ban, ChaeHoon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.10a
    • /
    • pp.448-450
    • /
    • 2016
  • 정보기술과 디지털 경제의 확산으로 대규모의 데이터가 생산되는 정보화시대에서 빅 데이터의 중요성이 강조되고 있으며 다양한 분야에서 이를 응용하고 있다. 빅 데이터 분석도구인 R은 통계 기반의 정보 분석을 가능하게 하는 언어와 환경이다. 본 논문에서는 R을 이용하여 기상뉴스에 나타난 기상관련 빅 데이터를 분석한다. 다양한 뉴스에서 기상 관련 데이터를 수집하고 어떠한 텍스트가 분포되어 있는지 빈도 조사를 수행한다.

  • PDF

Statistical Data Extraction and Validation from Graph for Data Integration and Meta-analysis (데이터통합과 메타분석을 위한 그래프 통계량 추출과 검증)

  • Sung Ryul Shim;Yo Hwan Lim;Myunghee Hong;Gyuseon Song;Hyun Wook Han
    • The Journal of Bigdata
    • /
    • v.6 no.2
    • /
    • pp.61-70
    • /
    • 2021
  • The objective of this study was to describe specific approaches for data extraction from graph when statistical information is not directly reported in some articles, enabling data intergration and meta-analysis for quantitative data synthesis. Particularly, meta-analysis is an important analysis tool that allows the right decision making for evidence-based medicine by systematically and objectively selects target literature, quantifies the results of individual studies, and provides the overall effect size. For data integration and meta-analysis, we investigated the strength points about the introduction and application of Adobe Acrobet Reader and Python-based Jupiter Lab software, a computer tool that extracts accurate statistical figures from graphs. We used as an example data that was statistically verified throught an previous studies and the original data could be obtained from ClinicalTrials.gov. As a result of meta-analysis of the original data and the extraction values of each computer software, there was no statistically significant difference between the extraction methods. In addition, the intra-rater reliability of between researchers was confirmed and the consistency was high. Therefore, In terms of maintaining the integrity of statistical information, measurement using a computational tool is recommended rather than the classically used methods.

반응편향성을 내포한 리커트형 척도 자료의 분석방법 - 통계 상담 사례 연구 -

  • Kim, Sang-Ryong;Jo, Gil-Ho;Lee, Su-Hyeong
    • Journal of the Korean Data and Information Science Society
    • /
    • v.5 no.2
    • /
    • pp.107-116
    • /
    • 1994
  • 이 논문은 통계상담사례연구의 일종으로 설문지를 이용한 통계자료분석에 도움이 되도록 소개하고자 한다. 여러항목을 종합하여 한 척도를 구성하고 각 항목마다 중요도나 선호도 등에 따라 다품등 리커트형 척도를 묻는 자료는 개인의 성향이나 지리적 문화적 여건에 따라 그 응답경향이 달라 가질지도 모르는 반응편향성(Response Set Bias)을 감소시켜 보다 좋은 통계자료분석을 할 수 있는 통계적 방법을 소개하며, 이 방법을 적용시킨 통계상담을 예시하고자 한다.

  • PDF

Analysis of Fire Occurrence Factors based on Public Data (공공데이터 기반 화재 발생 요인 분석)

  • Da-hyun Kim;Jai-Soon Baek;Sung-Jin Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.163-166
    • /
    • 2024
  • 최근 통계자료에 따르면, 매년 화재 발생 건수와 이로 인한 피해가 증가하는 것으로 나타나고 있다. 이에 따라 본 연구에서는 여러 공공 데이터를 분석하여 각 지역별 특성이나 환경적 요인에 따른 화재의 원인을 분석해고보가 한다. 분석을 위하여 화재 발생 건수, 시도별 공장 수와 인구수, 계절별 화재 발생수, 장소별 화재 요인에 대한 각각의 공공 데이터를 활용하였다. 분석 결과 지역별 공장 수와 비례하지않은 화재 발생 건수나, 대중적으로 생각하는 겨울철 가장 많은 화재의 발생보다 봄철에 더 많은 화재가 발생되었던 통계 결과와 같이 각 지역적인 특성이나 발화요인에 따라 화재 발생률에 미치는 영향은 다르게 나타난다는 것을 알 수 있었다.

  • PDF

퍼지이론의 통계적 응용을 위한 교과목 연구

  • Lee, Yeong-Seop;Kim, Hye-Jung;Lee, Ju-Seong;An, Seong-Heon
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.167-174
    • /
    • 2004
  • Zadeh(1965)에 의하여 도입된 퍼지이론은 최근 컴퓨터공학이나 산업공학에 응용되기 시작하면서 그 유용성이 확인된 후 여러 분야에서 관심을 갖기 시작한 새로운 이론이다. 특히 제 산업분야에서 나타나는 통계모델의 정확한 분석을 위한 퍼지이론의 이용은 그들 분야의 발전은 물론 새로운 통계분석 방법을 제시하는데 큰 의의가 있다하겠다. 이와 같은 중요성에 비추어 퍼지이론을 이용한 통계 분석을 학생들에게 효과적으로 학습시키는 것은 매우 중요한 일로서 이 연구는 통계분석방법을 퍼지이론으로 이해하고 또한 새로운 통계적 퍼지 모델을 어떻게 개발하고 응용할 것인가를 제시하고자 하는 교과목 연구이다. 이 연구가 향후 다양한 시대적 요구에 부응하는 새로운 교과목 개발의 전기가 되기를 기대한다.

  • PDF

A Study of Library Grouping using Cluster Analysis Methods (군집분석 기법을 이용한 공공도서관 그룹화에 대한 연구)

  • Kwak, Chul Wan
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.31 no.3
    • /
    • pp.79-99
    • /
    • 2020
  • The purpose of this study is to investigate the model of cluster analysis techniques for grouping public libraries and analyze their characteristics. Statistical data of public libraries of the National Library Statistics System were used, and three models of cluster analysis were applied. As a result of the study, cluster analysis was conducted based on the size of public libraries, and it was largely divided into two clusters. The size of the cluster was largely skewed to one side. For grouping based on size, the ward method of hierarchical cluster analysis and the k-means cluster analysis model were suitable. Three suggestions were presented as implications of the grouping method of public libraries. First, it is necessary to collect library service-related data in addition to statistical data. Second, an analysis model suitable for the data set to be analyzed must be applied. Third, it is necessary to study the possibility of using cluster analysis techniques in various fields other than library grouping.

Data Collection and Management on the World Wide Web : Evaluating system for Lecture (웹을 이요한 데이터 수집 및 관리에 관한 연구 : 강의평가 시스템 구현)

  • 안정용;최승현;한경수
    • The Korean Journal of Applied Statistics
    • /
    • v.13 no.2
    • /
    • pp.287-296
    • /
    • 2000
  • Data collection, management, and analysis to furnish information are very important in these modern days. In this paper, we discuss the methods of data collection and management on the World Wide \Veb and introduce an evaluating system for lecture.

  • PDF

이력 기반 취약성 평가를 위한 데이터 수집 및 활용 방안

  • Lee, Jae-Uk;Jo, Gi-Jeong;Kim, Geon-Ung;Park, Gye-Gak
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2018.11a
    • /
    • pp.336-338
    • /
    • 2018
  • 대부분의 해양사고는 인적요인에 의한 과실이 대다수이며 이 문제를 해결하기 위해 해양수산부는 국제 e-Navigation의 주도를 위해 한국형 이네비게이션 사업단을 선정하여 연구과제를 수행 중에 있다. 이네비 연구과제의 사고 취약선박 모니터링 지원 서비스는 선박, 해역, 환경의 취약상황을 반영한 항해 위험도를 산출하는 알고리즘을 개발하고 있으며 충돌 알고리즘 산출을 위해 다양한 종류의 데이터를 수집 및 분석을 수행하고 있다. 이 연구는 이력 기반 취약성 평가를 위한 해상 통계데이터 수집 및 그 데이터의 활용 방안을 수립하고, 데이터 분석결과를 보인다.

  • PDF