• 제목/요약/키워드: 통계방법

검색결과 9,312건 처리시간 0.036초

인공지능 기반 사회 통계 생산 방법론 고도화 방안: 가계동향조사와 생활시간조사 사례 (Advancing Societal Statistics Processing Methodology through Artificial Intelligence: A Case Study on Household Trend Survey and Time Use Survey)

  • 오교중;최호진;김일구;한승우;김건수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.563-567
    • /
    • 2023
  • 본 연구는 한국 통계청이 수행하는 가계동향조사와 생활시간조사에서 자료처리 과정 및 방법을 혁신하려는 시도로, 기존의 통계 생산 방법론의 한계를 극복하고, 대규모 데이터의 효과적인 관리와 분석을 가능하게 하는 인공지능 기반의 통계 생산을 목표로 한다. 본 연구는 데이터 과학과 통계학의 교차점에서 진행되며, 인공지능 기술, 특히 자연어 처리와 딥러닝을 활용하여 비정형 텍스트 분류 방법의 성능을 검증하며, 인공지능 기반 통계분류 방법론의 확장성과 추가적인 조사 확대 적용의 가능성을 탐구한다. 이 연구의 결과는 통계 데이터의 품질 향상과 신뢰성 증가에 기여하며, 국민의 생활 패턴과 행동에 대한 더 깊고 정확한 이해를 제공한다.

  • PDF

인터넷 서버에서 통계 그래픽의 처리 방법

  • 정남철
    • Communications for Statistical Applications and Methods
    • /
    • 제5권3호
    • /
    • pp.767-776
    • /
    • 1998
  • 본 논문에서는 인터넷 상에서 통계 그래픽을 서버에서 처리하는 방법에 대하여 연구하고자 한다. 이 방법은 서버와 통계 패키지와의 인터페이스를 통하여 서버에서 Xlisp-Stat이 생성한 통계 그래픽을 브라우저가 표현할 수 있는 이미지로 변환하여 클라이언트에 전송하는 방법으로서 C언어를 사용하여 CGI 프로그램을 구현하였다.

  • PDF

베이지안 방법을 포함한 일반적 통계 추론에 대한 상관모의를 이용한 평가방법 (EVALUATION OF FREQUENTIST AND BAYESIAN INFERENCES BY RELEVANT SIMULATION)

  • 김윤태
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2000년도 추계학술대회 발표논문집
    • /
    • pp.41-62
    • /
    • 2000
  • 현실적으로 통계추론 방법의 적용시, 그 정당성이 보장되는 기본가정이외에도 추가적인 가정이 불가피하여, 본래의 정당성이 퇴색되는 경우가 흔히 발생한다. 따라서 이런 경우에는 통계추론의 평가가 필수적일 것이나, 많은 경우에 분석적 평가를 하기에는 너무 복잡하여, 특정상황을 상정한 모의분석 평가가 주류를 이루고 있다. 본 고에서는 보다 일반적 상황에서의 통계추론의 평가를 위해 브트스트랩방법과 같이 관찰값에 의존한 모의방법(observation-based simulation)을 이용한 평가방법을 제안한다. 우선 설득력 있는 평가요소로서 구간추정시 포함확률(coverage probability)와 같은 빈도성질(frequency property)를 선택하였다. 빈도성질은 고전적 통계추론은 물론 베이지안 통계추론을 대상으로도 의미있는 평가기준으로 판단되는 바, 이를 평가요소로서 선택하고, 이의 추정을 위한 방법과, 그 추정결과의 해석과 나아가 이를 기준으로 한 통계추론 결과의 조정 방법까지 일련의 절차에 대한 방법론을 제시하였다.

  • PDF

통계 데이타베이스의 보호에 관한 조사 연구

  • 김철
    • 정보보호학회지
    • /
    • 제4권1호
    • /
    • pp.44-52
    • /
    • 1994
  • 정보화 사회에서는 가계, 기업, 정보 등의 정보 활동의 주체들이 가진 정보자산은 데이타 베이스(이하DB)와 소프트웨어(S/W)로 대변할 수 있으며, 이중 DB는 정보화 사회의 기반시설의 하나라고 볼 수 있다. 특별히 통계DB는 각 주체들에게는 필수적인 정보를 갖고 있다. 금융자산의 정보, 국방에 관련된 병력, 장비, 군수물자등의 정보, 회계정보 뿐 아니라 인구센서스, 경제계획수립 등등의 다양한 분야에 이 통계 DB는 사용되고 있다. 이러한 통계DB는 기존의DB에서의 데이타의 저장, 관리, 추출 기능외에 통계적인 데이타의 분석기능이 요구되고 있다. 통계 처리를 위한 데이타베이스관리 시스템(DBMS, database management system)은 주로 기존의 DBMS 에 통계처리를 위한 기능을 추가하거나 통계를 위한 DB를 따로 구축하는 방법을 사용하고 있다. 따라서 일반적인 DB 보호 기술과 더불어 통계 의 환경을 이해하는 보호 기술이 요구되고 있다. 일반적으로 DB 를 보호하는 방법으로는 물리적인 보안(physical security)과 운영체계 보안(operating system security) 이 있으며, 이들과 함께 데이타 암호화(data encryption)의 방법을 사용하고 있다. DB 의 보안 방법에 관한 연구 중 George I. Davida 등에 의한 방법은 중국인의 나머지 정리(chinese remainder thorem)를 사용하는 암호화 알고리즘을 이용하여 레코드(record) 단위의 암호화를 하며, Khamis A. Omar등에 의한 방법은 읽기, 쓰기, 갱신의 3단계의 사용자 등급을 부여하여 DB 접근의 제약을 가하는 기능을 갖고 있다. 본고에서는 특히 그 중요성이 더해가고 있는 통계 의 일반적인 개념을 살펴보며, 특성 지향형 질의 모델(characteristic-specified query model)의 보호기술을 살펴본다. 특별히 본고는 통계 DB의 보호에 대한 일반적인 조사 연구로서 잘 알려진 사실들을 많은 참고 문헌과 더불어 소개하는 내용으로 통계 DB의 보호에 관한 새로운 연구 결과는 아니다.

  • PDF

집단화된 자료의 분위수를 계산하는 수정된 방법

  • 김혁주;유지선
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.147-154
    • /
    • 2005
  • 본 논문에서는 집단화된 자료의 분위수들을 계산하는 수정된 방법을 제시하였다. 제시된 방법은 각 계급구간 안의 자료들이 그 구간에 걸쳐 균등한 간격으로, 그리고 구간의 중간점에 관하여 대칭으로 분포하고 있다고 가정하고 분위수들을 계산하는 방법이다. 개개의 자료값들이 주어진 자료를 통하여, 제시된 방법과 기존의 방법을 비교하였다.

  • PDF

통계패키지에서의 시계열 분석방법의 비교연구

  • 김수화;김승희;조신섭
    • Communications for Statistical Applications and Methods
    • /
    • 제1권1호
    • /
    • pp.119-130
    • /
    • 1994
  • 각종 통계패키지 내에 수용되어 있는 시계열 분석방법은 패키지의 특성이나 기능에 따라 다소 차이가 있다. 본 논문에서는 일반덕으로 많이 사용되고 있는 8종류의 통계패키지 (EXECUSTAT, MINITAB, RATS, SAS, SCA, S-PLUS, TSP)에서 시계열 분석이 어떻게 이루어지는지를 비교 검토하였다. 지수평활법과 ARIMA 모형에 의한 분석방법을 중심으로 비교하였으며, 아울러 사용자 관점에서 편리하고 보다 효율적인 패키지가 갖추어야 할 기능들을 제시하였다.

  • PDF

다차원 자료의 구조탐색에서 통계 그래픽스 방법의 활용

  • 허문열;이경미
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.423-433
    • /
    • 1995
  • 자료분석에서 다루는 차원의 수는 무한히 클 수 있다. 따라서 컴퓨터 그래픽스 분야에서 많이 연구하고 있는 결과를 그대로 적용하는 것은 한계가 있다. 이에 통계학자들은 다차원자료의 구조 탐색을 위해 여러 가지 간접적인 방법을 동원하였다. 본 논문에서는 기존의 방법들을 정리해보고 여기에 조정변수를 사용하는 새로운 방법을 추가하여 제시하였으며 이러한 방법들의 효율성을 실제의 예를 통해 보여 주고 있다.

  • PDF

생물통계의 현황 (토론)

  • 백운붕
    • Journal of the Korean Statistical Society
    • /
    • 제20권
    • /
    • pp.92-93
    • /
    • 1991
  • "생물통계의 현황" 논문을 보고 우리나라에서의 의학, 독성학분야에서의 통계학의 활용은 아직도 미흡한 것으로 느껴집니다. 솔직히 말해서 통계적 방법을 충분히 소화하여 세련되게 응용하고 있지는 못하지만, 그런대로 통계적 방법을 사용하고 있구나 하는 정도로 느껴져 안타까운 심정을 가지게 됩니다. 여기에는 통계전문가들에게도 책임이 있습니다. 지금 의학자, 독성학자, 그리고 통계전문가가 당당히 각자의 의견을 내세우고 토론할 수 있는 상황에 우리의 실정이 놓여 있지 않습니다. 이것은 양쪽에 모두 책임과 문제가 있는 것입니다.가 있는 것입니다.

  • PDF

韓國統計의 現況과 將來 - 統計와 電算

  • 허문열
    • Journal of the Korean Statistical Society
    • /
    • 제10권
    • /
    • pp.77-80
    • /
    • 1981
  • 통계적 방법론이 실용성(적용성)을 상실할 때 수학과 다른 점이 없을 것이고 방법론이 실용성을 가진 훌륭한 이론이라 할지라도 계산이 불가능하다면 이는 호화로운 자동차를 가지고 있으면서 연료가 없어 운영치 못하는 것과 다를 바가 없겠다. 이제 한국통계학회가 창립 10주년을 맞아 발돋음 단계에 접어들 시점에서 그동안 특히 부진하고 미비했던 전산통계(혹은 계산통계 statistical computing) 분야에 대해 통계인들 사이에 과거, 현재와 그리고 미래의 나아갈 방향에 대해 의견을 교환하게 됨은 뜻깊은 의의가 있다고 하겠다.

  • PDF

군집수의 예측에 관한 방법의 제안 및 비교 (A Comparative Study of Determining the Number of Clusters with a Method Proposed)

  • 채성산;임남규
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.329-341
    • /
    • 2005
  • 군집방법의 비교시 사용되는 Rand(1971)의 $C_k$, k = 2, 3, . . ., N-1 통계량에 대한 점근 결과를 이용하여 자료에 존재하는 군집수를 예측하는 방법을 제안하였다. 제안된 방법과 $C_k$ 통계량의 변화 형태에 따라 군집수를 예측하는 Chae와 Warde(1991)와 허명회와 이용구(2004)의 방법을 비교하기 위하여 모의실험을 하였다. 현실적인 문제를 고려하여 실제자료에 대해서는 계속적인 재표본의 형성을 위하여 붓스트랩방법을 사용하였다.