• 제목/요약/키워드: 웹 통계

검색결과 403건 처리시간 0.021초

병행적 혼합조사의 모드효과 분석 (Mode effects in concurrent mixed-mode surveys)

  • 백지선;민경아
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.787-806
    • /
    • 2016
  • 사회환경 변화와 정보기술 발전에 따라 한 조사에 다양한 조사모드(survey mode)를 활용하는 혼합조사(mixed-mode survey)가 확대되고 있으며, 포함오차 축소, 비용절감, 응답률 향상 등의 장점을 가진다. 그러나 혼합조사는 선택효과와 측정효과가 혼재된 모드효과 발생으로 조사품질에 대한 우려가 있다. 통계개발원은 이러한 혼합조사의 모드효과를 파악하기 위하여 2014년에 병행적 혼합모드 시험조사를 수행하였다. 본 연구는 시험조사 자료에 대해 자기기입식 종이조사와 웹조사 간 모드효과를 선택효과와 측정효과로 분리하여 계량적으로 분석하였다. 선택계층의 효과를 분리하였을 때, 조사항목에 따라 과대 또는 과소 응답하는 측정효과가 존재하는 것을 확인하였다.

웹 이용자를 위한 통계 메타데이터: 통계정보 제공사이트의 메타데이터 제공 수준 평가 사례 연구 (Statistical Metadata for Users: A Case Study on the Level of Metadata Provision on Statistical Agency Websites)

  • 오정선
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.161-179
    • /
    • 2007
  • 디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다. 일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, http://www.bls.gov/) 및 the Energy Information Administration (EIA, http://eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어, 이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

인터넷 응용 서비스의 통계에 근거한 트래픽 분석 (Traffic Analysis of Statistics based on Internet Application Services)

  • 정태수;최진섭;정중수;김정태;김대영
    • 한국정보통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.995-1003
    • /
    • 2004
  • 오늘날 인터넷의 백본 발달과 더불어 수많은 응용 서비스들이 사용되고 있다. 이러한 응용 서비스는 인터넷 초기 출현 시에는 웹, 파일전달, 이메일 등의 well-known 포트를 사용한 서비스가 주축을 형성하였다. 그러나 최근 인터넷의 폭발적인 사용과 다양한 컨텐츠의 요구로 unwell-known 포트를 사용한 서비스가 매우 많이 등장하였다. 인터넷 트래픽을 모니터링하여 (un)well-known 포트를 사용하는 패킷의 PDU 정보의 분석 후, 응용 서비스의 유형 및 통계 정보를 구하는 기법은 트래픽 분석자에게 매우 유용한 정보이다. 본 논문에서는 우선 TCP와 UDP 위에서 동작하는 (un)well-known 포트를 사용하는 패킷들의 통계 정보를 ethereal에서 제시된 netflow 및 tcpdump 기법으로 수집하여, 사용빈도가 높은 포트의 응용 서비스 제시와 동작과정을 분석하였다. 이후 분석된 응용 서비스의 면밀한 통계를 위해 원시 데이터 트래픽을 수집하는 에이전트와 에이전트로부터 전달받은 트래픽을 BNF(Backus-Naur Form) 기법을 활용하여 서버에 적용하는 과정을 제안하였다. 또한 제안된 과정을 안동대학교 네트워크 환경에 적용하여 인터넷 트래픽 서비스 유형과 웅용 서비스의 면밀한 통계 결과를 제시하여 트래픽 분석자에게 매우 유용한 정보를 제공하였다.

수학과 학습 부진아를 위한 웹기반 진단평가 시스템의 개발 및 적용 (Development of Web based Diagnosis Evaluation System for Slow-learning Students in Elementary School Mathematics)

  • 이종배;한규정
    • 정보교육학회논문지
    • /
    • 제12권3호
    • /
    • pp.275-282
    • /
    • 2008
  • 수학과에서 학습자는 학습을 하기 전에 선수학습을 제대로 이수하지 못했을 경우 다음 학습에 곤란을 겪는다. 학습 부진아에 대한 개별적인 지도는 교육현장에서 반드시 해결해야 할 필연적인 과제이나 일선 학급 담임에게만 그 책임을 지우는 문제를 해결하기 위해 본 연구를 실시하였다. 본 연구에서는 웹기반 진단평가 시스템을 개발 및 적용하여 학습 부진아들의 학습 결손을 여부를 진단 평가 시스템을 통해 진단하고 누적된 학습 결손을 처치하여 본 학습에 도움을 주고자 하였다. 연구대상은 연구자가 근무하는 학교의 수학 기초학습 부진아 10명을 선정하였으며 수와 연산 영역을 중심으로 진단평가 시스템을 적용하였다. 그 결과 학습 부진아의 학력 향상 및 흥미를 높이는데 효과적임을 알 수 있었으며 통계처리는 F-검증(일원분산 분석)을 통해 검증한 결과 유의한 차이가 있음을 통계적으로 검증되었다.

  • PDF

Data Dictionary 기반의 R Programming을 통한 비정형 Text Mining Algorithm 연구 (A study on unstructured text mining algorithm through R programming based on data dictionary)

  • 이종화;이현규
    • 한국산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.113-124
    • /
    • 2015
  • 미리 선언된 구조를 이용하여 수집 저장된 정형적 데이터와는 달리 웹 2.0의 시대에서 일반 사용자들이 평상시에 사용하는 자연어 형태로 작성된 비정형 데이터 분석은 과거보다 훨씬 더 넓은 응용범위를 가지고 있다. 데이터 양이 폭발적으로 증가하고 있다는 특성뿐 만 아니라 인간의 감성이 그대로 표현된 특성을 가진 텍스트에서 의미 있는 정보를 추출하는 빅데이터 분석 기법을 텍스트마이닝(Text Mining)이라 하며 본 연구는 이를 주제로 하고 있다. 본 연구를 위해 오픈 소스인 통계분석용 소프트웨어 R 프로그램을 이용하였으며, 비정형 텍스트 문서를 웹 환경에서 수집, 저장, 전처리, 분석 작업과 시각화(Frequency Analysis, Cluster Analysis, Word Cloud, Social Network Analysis)작업 등의 과정에 관한 알고리즘 구현을 연구하였다. 특히, 연구자의 연구 영역 분석에 초점을 더욱 높이기 위해 Data Dictionary를 참조한 키워드 추출 기법을 사용하였다. 실제 사례에 적용한 R은 다양한 OS 구동, 일반적 언어와의 인터페이스 지원 등 통계 분석용 소프트웨어로써 매우 유용하다는 점을 발견할 수 있었다.

인터넷 문서빈도를 통해 본 도시순위규모에 관한 연구 -미국 10만 이상의 인구를 갖는 도시들을 사례로- (Rank-Size Distribution with Web Document Frequency of City Name : Case study with U.S incorporated places of 100,000 or more population)

  • 홍일영
    • 한국지역지리학회지
    • /
    • 제13권3호
    • /
    • pp.290-300
    • /
    • 2007
  • 본 연구는 인터넷 문서상에 나타나는 도시 지명의 문서 빈도를 통계량으로 도시규모에 대한 분석을 실시하였다. 검색어가 갖는 의미상의 차이에 따른 조건과 검색의 범위를 제약하면서 나타나는 유의적인 차이점들에 대해 분석하였고, 도시규모분포의 상관계수에 대한 분석을 통해 인구와 문서빈도와의 차이점을 분석하였다. 각 도시의 인구와 문서빈도와 상관관계 분석에서는 검색어의 종류를 보다 공간적의 의미로 제약할수록 더 높은 상관관계가 나타났고, 문서의 종류는 상용, 네트워크, 기관의 경우에 있어서 높은 상관관계가 나타났다. 그리고 인구와 문서빈도의 통계량을 이용한 군집분석을 통해서, 인구에 비해 더 많은 혹은 낮은 문서빈도를 보이는 도시들을 파악하였다. 이와 같은 분석은 웹 문서라는 정보통신사회 속에서 반영되는 각 도시의 특성을 분석하는 새로운 방안을 제시한다는 점에서 큰 의미를 갖는다고 할 수 있다.

  • PDF

과학 기술 문헌 분석을 위한 기계학습 기반 범용 전문용어 인식 시스템 (Terminology Recognition System based on Machine Learning for Scientific Document Analysis)

  • 최윤수;송사광;전홍우;정창후;최성필
    • 정보처리학회논문지D
    • /
    • 제18D권5호
    • /
    • pp.329-338
    • /
    • 2011
  • 문헌에서의 전문용어 인식 연구는 정보검색, 정보추출, 시맨틱 웹, 질의응답 분야 등의 연구를 위한 선행 연구로서, 지금까지 대부분 특정 분야, 특히 생의학 분야에서 집중되어 연구되어 왔다. 그러나 기존 연구들이 특정 도메인 또는 문헌 내부 통계 정보를 활용함으로써 범용적인 전문용어 인식에 한계점을 보여 왔기 때문에, 본 연구에서는 웹 검색 결과와 사전, 후보용어의 문형 특징 등을 활용하는 기계 학습 기반 범용 전문용어 인식 방법을 제안하였다. 제안한 방법을 문헌의 지역 통계 정보를 사용하는 방법(C-value)과 비교 실험하여 80.8%의 F-값으로 6.5%의 성능향상을 보였다. 다양한 응집도 자질들을 접목한 두 번째 실험에서는 Normalized Google Distance 방법과 접목한 방식이 F-값 81.8%의 성능으로 최고의 성능을 나타냈다. 기계 학습 방법으로는 로지스틱 회귀분석, C4.5, SVMs 등을 적용하였는데, 일반적으로 이진 분류에 좋은 성능을 보이는 SVMs과 로지스틱 회귀분석 방법보다 결정 트리 방식의 C4.5가 전반적으로 좋은 성능을 보였다.

MicroArray의 직관적 시각적 분석을 위한 웹 기반 분석 도구 (Web-based microarray analysis using the virtual chip viewer and bioconductor.)

  • 이승원;박준형;김현진;강병철;박희경;김인주;김철민
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.198-201
    • /
    • 2005
  • DNA microarray 칩은 신약 개발, 유전적 질환 진단, Bio-molecular 상호작용 연구, 유전자의 기능연구 등 폭넓게 사용되고 있다. 이 논문은 cDNA mimcroarray 데이터를 분석하기 위한 웹형태의 시스템 개발에 대한 내용을 다룬다. 하나의 cDNA microarray에는 수 백에서 수 만개의 유전자가 심어져 있으며, 데이터를 분석할 때 대량의 데이터와 다양한 형태의 오류로 인해서 데이터간의 차이를 보정하는 분석 도구와 통계적 기법들이 사용되어야 한다. 본 논문에서는 가상 칩 뷰어를 이용하여 실제 microarray 데이터의 foreground intensity에서 백그라운드의 intensity를 제거하여 일반화된 칩 이미지를 생성한다. 이 가상 칩 뷰어는 여러 가지 필터효과와 서로 다른 두 형광의 차이를 조정하는 global normalization 기법을 사용하여 발현 유전자 분석을 시각적으로 할 수 있고, 중복된 마이크로어레이 칩 데이터를 통하여 시간이 많이 걸리는 분석전 칩의 유효성을 검토할 수 있다. 칩 데이터의 normalization을 위한 통계 방법으로 R 통계 도구와 linear 모델을 사용하여 microarray 칩의 유전자 발현 양상을 분석한다. 통계적 방법을 사용하지 않은 데이터를 추출, 이 데이터의 패턴 그래프 그리고 발현 레벨을 분류하여 마이크로어레이의 각 스팟의 유효성 검토의 정확성을 높였다. 이 시스템은 칩의 유효성 검토, 스팟의 유효성 검토, 유전자 선정에 대해 분석의 용이성과 정확성을 높일 수 있었다.

  • PDF

집수역 규모 무인기상관측망을 위한 실황자료 표출시스템 구축 (Implementation of a Real-time Data Display System for a Catchment Scale Automated Weather Observation Network)

  • 정명룡;김진희;문영일;윤진일
    • 한국농림기상학회지
    • /
    • 제15권4호
    • /
    • pp.304-311
    • /
    • 2013
  • 악양기상관측망을 대상으로 소형 서버 기반의 기상자료 실시간 표출시스템을 구축하였다. 시스템은 기상관측장비로부터 실시간으로 수집되는 1분간격의 기상자료를 DB로 구축하는 데이터수집 단계와 최대, 최소, 평균, 적산 등의 통계처리에 의해 10분, 1시간, 1일간격의 기상자료를 생성하는 데이터통계 단계, 데이터수집과 통계처리 단계에서 수집된 DB정보를 활용하여 웹서비스 형태로 자료를 보여주는 정보서비스 단계로 각각 구성하였다. DB에 수집된 AWS 기상실황자료는 웹페이지에서 1개 지점, 전체지점, 분석자료의 형태로 서비스하며, 원하는 기간에 대한 기상요소를 사용자가 선택하여 다운로드 받을 수 있도록 구축하였다. 1개 지점에 대한 악양 AWS 정보서비스 페이지에서는 선택한 AWS지점에 대해 시계열 변화추이를 살펴볼 수 있으며, 전체지점에 대한 페이지에서는 악양면 내 고도와 지형특성에 따라 달라지는 기상반응을 지점별로 비교분석 할 수 있도록 서비스를 제공한다. 일별 분석자료 페이지는 하루 동안 수집된 1분 간격 데이터를 요소별로 통계처리하여 테이블 형태로 보여주도록 구성하였다.

건설 PMIS 품질이 사용의도 및 사용자 만족도에 미치는 영향 (Effect of PMIS Quality on Intention to Use and User Satisfaction)

  • 성민우;김가람;이슬기;유정호
    • 한국건축시공학회지
    • /
    • 제12권1호
    • /
    • pp.122-132
    • /
    • 2012
  • IT발전의 따른 산업분야의 정보시스템은 기업 또는 프로젝트의 생산성 향상과 전략적 경쟁우위를 점하게 하는 필수적 지원도구 중 하나로 인식되고 있다. 이러한 정보시스템의 효과를 극대화하기 위해서는 정보시스템의 성과에 영향을 미치는 성공요인들을 규명하는 과정이 필요하다. 왜냐하면, 이러한 성공요인을 활용하여 IS의 성과달성 또는 성공여부를 예측하거나 또는 성공에 이르는 메커니즘을 규명할 수 있기 때문이다. 하지만, 우리나라에서 건설프로젝트 참여자의 의사가 반영된 웹 기반 PMIS의 성공모델에 대한 연구는 미흡한 실정이며, 따라서 웹 기반 PMIS의 성과달성 또는 성공 메커니즘 역시 아직 규명되지 않은 상태이다. 따라서 본 연구의 목적은 기존 연구에서 널리 활용되고 있는 DeLone and McLean의 수정된 IS 성공모델[5]에 근거하여, 웹 기반 PMIS가 국내 건설프로젝트에서 국내 건설기술자에 의해 활용되는 상황에서, 웹 기반 PMIS의 성공요인이 사용자 사용의도와 만족도 어떠한 영향을 미치는가를 분석하는 것이다. 분석을 위한 건설 PMIS의 성공요인은 연구자의 선행연구에서 타당성 및 신뢰성이 검증된 을 항목을 활용하였으며. 건설 PMIS의 성공변수는 사용의도 및 사용자 만족도로 설정하여 기존 정보시스템 성공모델에 관한 문헌고찰을 통해 평가항목을 구성하였다. 실제 PMIS의 사용자인 시공사, 사업관리자를 대상으로 설문조사를 실시하였으며 이렇게 수집된 자료들로 통계프로그램인 SPSS 12.0을 활용하여 다중회귀분석을 통해 건설 사업에서 웹기반 PMIS의 성공요인과 사용의도, 사용자 만족도간의 영향관계를 분석하고 시사점을 도출하였다. 이 연구에서 제시하는 웹 기반 PMIS 성공모델을 통해 검증된 성공요인은 시스템 평가와 성공 예측 등에 활용 가능하며, 연구 결과 제시되는 시사점들은 향후 보다 설명력 높은 성공모델 구축의 방향 설정에 기여할 것이다.