• Title/Summary/Keyword: 통계 분석 데이터

Search Result 2,487, Processing Time 0.043 seconds

전자저널 관리를 위한 이용통계의 효과적 활용 방안 (Toward the Effective Utilization of Usage Statistics for the Management of Electronic Journals)

  • 김성진
    • 정보관리연구
    • /
    • 제41권4호
    • /
    • pp.69-91
    • /
    • 2010
  • 제한된 예산, 고가의 패키지 구독비, 출판사 주도의 라이선스 협상 등의 불리한 환경에서 자관의 실정에 맞는 전자저널을 구성하기 위해 도서관은 전자저널 이용데이터를 수집하고 분석해야 한다. 본 연구는 전자저널 이용통계 연구 동향 및 COUNTER 3판에 근거한 이용통계 제공 현황을 살펴보고 현장에서 쉽게 활용 가능한 이용통계 분석의 가이드라인을 제시하고자 하였다. 현재 제공되는 이용통계 보고서를 기반으로 분석할 수 있는 핵심 이용통계치로 저널별 원문이용도, 저널이용률, 원문이용단가, 고이용군, 저이용군을 제안함으로써 전자저널 관리를 위한 이용통계의 효과적인 활용 방안을 다루었다.

창업연구 실증연구 분석방법론

  • 이일한
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2017년도 춘계학술대회
    • /
    • pp.17-17
    • /
    • 2017
  • 구조방정식모델(Structural Equation Modeling: SEM)은 변수들 간의 인관관계 및 상관관계를 검증하기 위한 통계기법으로 사회학 및 심리학 분야에서 개발되었지만 현재는 경영학, 광고학, 교육학, 생물학, 체육학, 의학, 정치학 등 여러 학문분야에서 광범위하게 사용되고 있다. Amos는 기본적으로 그래픽(Amos graphics)과 베이직(Amos basic)을 제공하기 때문에 정확한 프로그램의 작성이나 행렬에 대한 지식이 없는 초보자들도 아이콘을 이용하여 복잡한 연구모델이나 다중집단분석모델을 분석할 수 있다. PLS(Partial Least Square)는 모형 추정과정에서 발생하는 잔차 또는 예측오차를 최소화하여 예측력을 극대화하기 위한 프로그램이며, 즉, PLS-SEM는 표본 수가 적고 자료가 정규분포를 보이지 않거나 조형지표 모델이거나 복잡한 연구모델 분석에 유용하다. 최근 빅데이터의 열풍으로 자료들을 분석을 위한 도구로 R이 실무 현장에서 인기를 끌고 있다. R은 통계 프로그래밍 언어이자 오픈 소프트웨어 환경으로 통계, 그래픽, 데이터마이닝 등의 다양하고 방대한 양의 패키지들을 지원한다. R에서 제공되는 패키지들이 오픈 소스이고 선형 및 비선형 모델링, 고전적인 통계분석, 시 계열 분석, 분류 및 군집분석 등의 다양한 통계 패키지들을 제공한다는 측면에서 R은 실무는 물론 학문적인 측면에서도, 특히 통계를 기반으로 실증분석을 수행하는 사회과학연구들에서 중요한 역할을 할 수 있을 것으로 기대된다.

  • PDF

빅데이터 기반 스마트 통합 모니터링 및 분석 시스템 (A System of Smart Integrated Monitoring and Analysis Based on Big Data)

  • 이상운;이정규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.106-109
    • /
    • 2015
  • ICT 기술이 급속하게 발전함에 따라 수없이 많은 기술이 등장하고 정착되고 안정화되고 있는 상황에서 빅데이터 이슈는 매우 중요하다. 이러한 변화에 빠르게 대응하는 개인이나 기업에게 엄청난 새로운 기회와 부가가치 창출을 제공을 부여해 주고 있다. 현재 방송분야에서는 빅데이터 기술이 콘텐츠 서비스 분야에서 활발히 적용되고 있으며 그 영역이 점차 확대되고 있는 추세이다. 이에 본 논문은 디지털 방송 시스템을 구성하고 있는 다양한 기기에서 발생되는 장애나 이벤트를 빅데이터 분석을 통해 통합관제 모니터링, 통계 및 분석을 통하여 처리할 수 있는 시스템을 제안한다. 제안한 시스템은 방송 인프라 통합 관리, 실시간 이벤트 검색, 장애 분석 및 리포팅 기능을 제공함으로써 문제점을 신속히 파악하여 안정적인 방송 운영을 지원하도록 한다. 또한 각종 방송 장비들의 로그 정보를 수집하여 서비스 상태 및 작업 통계를 통한 시스템의 가용성을 평가할 수 있도록 한다.

  • PDF

영평균 정규화와 PCA를 이용한 회귀 신경망의 성능개선 (Performance Improvement of Regression Neural Networks by Using PCA and Zero-Mean Normalization)

  • 박용수;조용현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.515-518
    • /
    • 2001
  • 본 논문에서는 전처리단계로 영평균 정규화 기법과 주요성분분석 기법을 도입하여 다층신경망을 이용한 고신뢰성의 회귀분석 모델을 제안한다. 영평균 정규화 기법은 데이터의 1차적 통계성을 고려하여 알고리즘을 간략화시키며, 주요성분분석 기법은 입력 데이터의 2차적 통계성을 고려하여 독립인 특징들의 집합으로 변환시켜 학습데이터의 차원을 감소시킬 수 있어 고차원의 학습데이터에 따른 회귀분석 모델의 제약을 해결할 수 있었다. 제안된 기법의 신경망을 3개의 독립변수를 가진 암모니아 제조공정문제와 10개의 독립변수를 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 단순정규화나 PCA를 적용하지 않는 경우보다 제안된 기법의 학습속도와 회귀성능이 더욱 더 우수함을 확인할 수 있었다.

  • PDF

교육행정정보시스템(NEIS) 통계자료의 효율적 활용을 위한 방안 연구 (A Research for Efficient Use of Statistics in National Education Information System)

  • 손지성;나홍석;김창헌;백두권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.439-442
    • /
    • 2010
  • 교육행정정보시스템에서 제공하는 통계자료는 광범위한 데이터를 기반으로 학교행정 지원 및 교육 정책 수립의 기초가 되는 자료로 중요한 역할을 하지만, 고도화된 설계 과정 없이 행정정보처리 수준에서 제공되는 경우가 많아 일선업무에 적극적으로 활용되지 못하고 있다. 본 연구에서는 교육행정정보시스템 내에서 제공되는 각종 통계자료에 대한 현황 분석과 함께 활용 방안에 대한 요구분석을 진행하였으며, 이를 기반으로 통계자료의 효과적인 활용을 위한 제도적, 정책적 측면의 개선 방안을 도출하였다. 연구의 결과가 교육행정정보시스템에서 처리되는 데이터에 대한 전반적인 만족도 및 개선방안 수립에 도움이 될 것으로 기대한다.

  • PDF

시각적 군집분석에 대한 전략 (Strategy for Visual Clustering)

  • 허문열
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.177-190
    • /
    • 2001
  • 전통적으로 많이 사용하는 군집분석의 방법들은 개체간의 거리를 고려하여 이들을 분류해 내는 것이며, 따라서 거리 측정 방법에 따라 여러 형태의 군집분석 방법이 나타나게 된다. 어떤 방법을 적용하던 간에 그 결과는 고정된 수치로써 나타난다. 다차원 자료의 구조파악이 몇 개의 수치로 나타나게 되면 어쩔 수 없이 정보의 손실이 발생하게 된다. 이를 보완하기 위해 시각적 매체를 동원하여 다차원 자료의 구조를 파악하는 연구가 있었으며, 이를 시각적 군집분석이라고 명명하고 있다. 본 연구에서는 시각적 군집분석에 대한 기본적 개념과 이를 위한 통계 도형의 활용, 구현방법 등에 대해 살펴보기로 한다.

  • PDF

cDNA 마이크로어레이 데이터의 분석과 관리 시스템: cMAMS (cDNA Microarray data Analysis and Management System: cMAMS)

  • 김상배;김효미;이은정;김영진;박정선;박윤주;정호열;고인송
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.247-249
    • /
    • 2004
  • 마이크로어레이 기술은 근래에 개발된 신기술로써 동시에 수천-수만 개의 유전자 발현을 측정할 수 있어 다양한 생물학적 연구에 이용되고 있다. 여러 단계의 실험 과정과 이를 통해 얻은 다량의 데이터를 처리하기 위해서는 이를 효율적으로 관리. 저장, 분석할 수 있는 통할 정보 관리 시스템을 필요로 한다. 현재 외국에서는 몇몇 관리시스템이 개발되어 있고. 국내에서도 WEMA 등이 있지만 아직 데이터 관리부분에 기능이 치우쳐 있다. 따라서 우리는 복잡한 자료구조를 가지는 마이크로어레이의 실험 정보와 각 단계별 처리 정보 등을 사용자의 관점에서 효과적이고 체계적으로 관리할 수 있고, 데이터 정규화 및 다양한 통계적 분석 기능을 갖춰 불필요한 시간과 비용을 줄임으로써 마이크로어레이 연구에 도움을 주고자 통합 분석관리 시스템 cMAMS (cDNA Microarray Analysis and Management System)를 개발하였다. 웹 기반으로 구현된 cMAMS는 데이터를 저장, 관리하는 부분과 데이터를 분석하는 부분, 그리고 모든 관련 점보가 저장되는 데이터베이스 부분으로 구성되어 있다 데이터관리부분에서는 WEMA의 계층적 데이터구조론 도입해 관리의 효율성을 높이고 시스템의 이용자를 시스템운영자, 프로젝트관리자, 일반사용자로 구분하여 데이터 접근을 제한함으로써 보안성을 높였다. 통계처리 언어 R로 구현된 데이터분석 부분은 7 단계의 다양한 분석(전처리 정규화, 가시화, 군집분석. 판별분석, 특이적 발현 유전자 선뿐, 마이크로어레이 간의 상판분석)이 가능하도록 구현하였고, 분석결과는 데이터베이스에 저장되어 추후에 검토 및 연구자간의 공유가 가능하도록 하였다. 데이터베이스는 실험정보가 저장된 데이터베이스, 분석결과가 저장된 데이터베이스, 그리고 유전자 정보 탐색을 위한 데이터베이스로 분류해 데이터를 효율적으로 관리할 수 있게 하였다. 본 시스템은 LiNUX를 운영체계로 하고 데이터베이스는 MYSQL로 하여 JSP, Perl. 통계처리 언어인 R로 구현되었다.

  • PDF

거주지 분화에 대한 공간통계학적 접근 (II): 국지적 공간 분리성 측도를 이용한 탐색적 공간데이터 분석 (A Spatial Statistical Approach to Residential Differentiation (II): Exploratory Spatial Data Analysis Using a Local Spatial Separation Measure)

  • 이상일
    • 대한지리학회지
    • /
    • 제43권1호
    • /
    • pp.134-153
    • /
    • 2008
  • 이 논문의 주된 목적은 국지적 공간 분리성 측도를 이용한 탐색적 공간데이터 분석을 통해 거주지 분화 연구에서 공간통계학적 접근이 가지는 의의를 논증하는 것이다. 탐색적 공간데이터 분석은 공간 데이터를 다양한 과학적 지도학적 시각화 방식을 통해 탐색함으로써 패턴을 발견해 내고, 의미 있는 가설을 수립하며, 더 나아가 공간 데이터에 대한 통계학적 모델을 평가하는 것을 주목적으로 한다. 이 연구는 국지 통계량에 기반한 탐색적 공간데이터 분석이 구체적인 연구 수행에서 실질적인 도움을 줄 수 있다는 믿음에 기반을 두고 진행된 것이다. 중요한 결과는 다음과 같다. 첫째, 이미 개발된 전역적 공간 분리성 측도로부터 국지적 공간 분리성 측도를 도출하였다. 둘째, 두 가지 유의성 검정을 위한 가정, 즉 총체적 랜덤화 가정과 조건적 랜덤화 가정에 기반한 가설검정 방법을 제시하였다 셋째, 측도와 유의성 검정을 바탕으로 한 탐색적 공간데이터 분석 기법으로 '공간 분리성 산포도 지도'와 '공간 분리성 이례치 지도'를 제시하였다. 부가적으로 각 인구 집단 별 집중도에 대한 표준화 지표도 제시되었다. 넷째, 개발된 기법을 우리나라 7대 도시의 고학력 집단과 저학력 집단간 거주지 분화에 적용한 결과, 특히, 이변량 공간적 클러스터와 공간적 특이점을 확인하는 데 유용성이 있는 것으로 드러났다.

지역분석을 위한 웹 기반 통계GIS 연구 (A Study on the Statistical GIS for Regional Analysis)

  • 박기호;이양원
    • Spatial Information Research
    • /
    • 제9권2호
    • /
    • pp.239-261
    • /
    • 2001
  • 우리 나라 국가지정통계자료는 대부분 행정구역을 기초단위로 하는 지리/지역정보로서 계량적 지역분석기법을 통해서 그 가치가 더해진다. 본 연구는 지역분석을 위한 통계정보 및 통계지도 서비스 시스템의 한 선도적 모델을 제시하는데 그 목적을 둔다. 본 연구에서는 서울시를 사례로 하여 인구주택 총조사 및 사업체기초통계 원시자료 등을 재 집계하여 지역통계 데이터베이스를 구축하였다. 통계GIS의 핵심 지역분석모듈은 사회경제 자료분석에서 활용의 빈도가 높은 지역구조 및 격차 분석, 공간 분산분석, 상관분석, 회귀 및 잔차분석, 공간적 자기상관분석 등으로 구성되었다. 시스템 설계는 지역통계 데이터베이스와 지역분석기법 모듈, 그리고 통계지고를 웹 환경에서 통합하기 위해 어플리케이션 서버를 포함한 다양한 정보기반기술을 채택하여 이루어졌다. 지역분석을 위한 입출력 과정에서 대화형 통계지도가 사용된다. 본 연구를 통해 제안된 통계 GIS의 특징은 미리 저장된 데이터와 분석기능이 사용자와의 양방향 웹 인터페이스를 통해 제한 없이 확장될 수 있다는 점이다. 사용자의 요구에 따라 분석변수의 자유로운 변형과 합성이 연산자 구문해석기를 통해 가능하고, 이를 바탕으로 새로운 지역분석 알고리즘의 구현이 실시간으로 가능하다. 또한 데이터 측면에서는 사용자가 업로드한 자료를 잠정적으로 시스템에 통합하여 확장된 가상 데이터베이스를 만들고 이에 대해 여러 분석을 수행할 수 있다. 웹 기반 통계GIS 모델의 초기평가를 통해 각종 지역통해자료로부터 주문형 통계지도의 작성과 유통이 동시에 가능함이 확인되었다.

  • PDF

문장 길이가 한영 통계기반 기계번역에 미치는 영향 분석 (Empirical Impact Analysis of Sentence Length on Statistical Machine Translation)

  • 조희영;서형원;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.199-203
    • /
    • 2007
  • 본 논문에서는 한영 통계기반 기계번역에서 한국어 문장 길이의 변화에 따른 번역 성능의 변화를 분석하고자 한다. 일반적으로 통계기반 기계번역은 정렬기법을 이용하는데 문장의 길이가 길수록 많은 변형(distortion)이 이루어진다. 특히 한국어와 영어처럼 어순이 매우 다를 경우, 문장 길이의 변화에 따라 그 변형이 더욱 심할 수 있다. 본 논문에서는 이러한 성질이 통계기반 기계번역에 어떠한 영향을 주는지를 실험적으로 살펴보고자 한다. 본 논문에서 비교적 잘 정렬된 203,310개의 문장을 학습데이터로 사용하였고, 세종 병렬 말뭉치로부터 89,309개의 문장을 추출하여 실험데이터로 사용하였다. 실험데이터는 한국어 문장의 길이에 따라 5구간($1{\sim}4,\;5{\sim}8,\;9{\sim}13,\;14{\sim}19,\;20{\sim}n$ 개)로 나뉘었다. 각 구간은 가능한 문장의 수가 비슷하도록 하였으며, 17,126, 18,507, 20,336, 17,884, 15,456개의 문장이 포함되었다. 데이터들은 모두 어절단위로 토큰을 나누었다. 본 논문에서는 한영 번역을 중심으로 평가되었다. 첫 번째 구간에서 가장 좋은 성능인 0.0621 BLEU를 보였으며, 마지막 구간에서 가장 좋지 않은 0.0251 BLEU를 보였다. 이는 문장의 길이가 길수록 변역 성능이 좋지 않음을 알 수 있었다. 문장이 길수록 구가 길어지고 구간의 수식이 복잡해지므로 번역의 성능은 점차 떨어진다. 이것을 볼 때, 구번역을 먼저 한 후, 다시 문장 번역을 한다면 좀 더 높은 기계번역의 성능을 기대할 수 있을 것이다.

  • PDF