• 제목/요약/키워드: 연관관계분석

검색결과 2,093건 처리시간 0.028초

빅데이터 연구 논문의 주제 분야 연관관계 분석: 동시 인용 관계를 적용하여 (Subject Association Analysis of Big Data Studies: Using Co-citation Networks)

  • 곽철완
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.13-32
    • /
    • 2018
  • 본 연구의 목적은 빅데이터 연구 논문의 주제 분야 간의 연관관계를 분석하는데 있다. 동시 인용관계를 적용하여 분석 대상의 주제 분야를 추출하였으며, R 프로그램의 Apriori 알고리즘을 이용하여 연관관계의 규칙을 분석하고, arulesViz 패키지를 사용하여 시각화하였다. 연구 결과 22개 주제 분야가 추출되었는데, 이들 주제 분야는 3가지 군집으로 구분되었다. 주제 분야의 연관관계 유형을 분석한 결과, 연관관계의 복잡성에 따라 '전문형', '일반형', '확대형'으로 구분되었다. 전문형에는 문헌정보학, 신문방송학 등이 포함되었고, 일반형에는 정치외교학, 무역학, 관광학 등이 포함되었고, 확대형에는 기타인문학, 사회과학일반, 관광학일반 등이 포함되었다. 이 연관관계는 빅데이터 연구자가 한 주제분야를 인용할 때 관계가 있는 다른 주제 분야를 인용하는 경향을 보여주는 것으로, 도서관에서 학술정보서비스를 위해 연관관계를 활용한 서비스를 고려해야 할 필요가 있다.

일부 농촌 성인을 대상으로 한 고혈압과 식이섭취와의 관계에 관한 연구 (A Study on Relationship between Hypertension and Dietary Intake in a Rural Adult Population)

  • 고운영;김정순
    • Journal of Preventive Medicine and Public Health
    • /
    • 제30권4호
    • /
    • pp.729-740
    • /
    • 1997
  • 고혈압과 영양소 섭취와의 관계를 분석하기 위하여 춘천시 남면과 사북면의 10개리에 거주하는 30세 이상 성인을 대상으로 1995년 7월$\sim$8월, 1996년 6월에 혈압측정 및 24시간 회상법을 이용한 식이조사를 시행하여 남자 250명, 여자 297명을 대상으로 분석하였다. 혈압과 영양소 섭취와의 관련성을 분석한 결과를 요약하면 아래와 같다. 1. 평균 수축기 혈압과 영양소 섭취와의 상관관계 분석에서 유의한 상관관계를 보인 영양소는 남성에서 단백질 에너지(%)였다$(\gamma=0.16)$. 여성에서는 유의한 상관 관계를 보여주지 않았다. 2. 평균 이완기 혈압과의 상관관계 분석시 남성에서 단백질 밀도와 단백질 에너지(%)가 강한 양의 상관관계를(p<0.01)보여주었으며, 칼슘 밀도(calcium density)와 에너지 보정 단백질도 유의한 양의 상관관계를 보여주었다. 여성에서는 유의한 상관관계를 보인 영양소는 없었다. 3. 탄수화물과 나트륨을 제외한 영양소 섭취량은 전체적으로 고혈압군에서 높았으나 유의한 차이는 보이지 않았다. 4. 다중선형회귀분석(multiple linear regression analysis)에서 남성의 경우 영양소 밀도를 이용한 모델에서는 평균 이완기 혈압만이 단백질 밀도와 유의한 양의 연관성을 보여주었다. 에너지 보정 영양소를 이용한 모델에서는 평균 이완기 혈압과 에너지 보정 단백질만이 유의한 양의 연관성을, 총 열량은 음의 연관성을 보여주었다. 여성의 경우는 평균 수축기 및 이완기 혈압과 유의한 연관성을 보여주는 영양소는 없었다. 5. 고혈압과 영양소와의 관계를 성, 연령, 체질량 지수, 가족력을 보정하고 선형중회귀로짓분석을 이용하여 분석시 영양소 밀도를 이용한 모델에서는 단백질 밀도가 강한 양의 연관성을(Odds ratio=3.18), 지방밀도는 유의한 양의 연관성을(Odds ratio=1.94)을, 나트륨 밀도는 유의한 음의 연관성을 보여주었다(Odds ratio=0.73). 에너지 보정 영양소를 이용한 모델에서는 에너지 보정 단백질이 유의한 양의 연관성을 보여주었다(Odds ratio=1.01). 본 연구는 단면조사를 통하여 혈압과 영양소와의 상관관계 분석과 고혈압군과 정상혈압군의 영양소 섭취의 차이를 분석하여 영양소섭취와 고혈압과의 연관성을 보고자 하였는데 적대적인 영양소 섭취량보다는, 같은 에너지 섭취수준에서 단백질과 지방 섭취가 상대적으로 많은 경우가 양의 연관성을 보였고, 나트륨 섭취가 상대적으로 적은 경우가 음의 연관성을 보였다.

  • PDF

침입경보 축약을 통한 규칙기반 연관관계 분석기 설계 (Design of a Rule-Based Correlation Analyzer through Reducing Intrusion Alerts)

  • 이성호;김민수;노봉남;서정택;최대식;박응기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.1091-1094
    • /
    • 2004
  • 전통적인 호스트 기반 침입탐지시스템과 네트워크 기반 침입탐지시스템은 각각 로그 데이터나 패킷 정보에서 단일 공격을 탐지하고 침입경보를 생성한다. 그러므로, 기존의 침입탐지시스템들은 침입경보간의 상호 연관성에 대한 정보가 부족하게 되고, 다수의 거짓 침입경보를 발생시킨다. 이를 해결하기 위해, 본 논문에서는 추론 규칙을 이용하는 침입경보 연관관계 시스템을 제안한다. 제안한 시스템은 침입경보 수집기, 침입경보 전처리기, 침입경보 연관관계 분석기로 구성되어 있다. 침입경보 수집기는 각 침입탐지시스템으로부터 필터링 과정을 거쳐 전송된 침입경보를 받아 침입경보 데이터베이스에 저장한다. 침입경보 전처리기는 불필요한 침입경보를 줄임으로써 침입경보 연관관계 분석의 효율성을 높인다. 마지막으로, 침입경보 연관관계 분석기는 추론 규칙을 이용하여 침입경보간의 상호연관성을 파악한다.

  • PDF

테이블 연관관계 도출을 통한 데이터베이스스 워크로드 분석 (Database Workload Analysis Based on Table Relationships)

  • 김민수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.303-306
    • /
    • 2006
  • 데이터베이스 시스템을 효율적으로 운영하기 위하여 데이터베이스 관리자는 시스템의 자원 사용과 응용 프로그램에 의한 워크 로드의 특징을 알아야 한다. 워크 로드 분석을 위해 테이블, 리소스, 튜닝 방법론 등 여러 연구가 진행되어 왔으나 워크 로드를 형성하는 역할이 특정 테이블에만 집중되어 있는 현상에 대해서는 연구된 적이 없었다. 본 논문에서는 운영 시스템의 테이블 간의 연관 관계를 도출해 보고 연관 관계를 가지는 테이블 들이 워크 로드에 참여하는 유형과 횟수를 분석하는 워크 로드 분석 도구를 제안하고 대형 CRM 분석 시스템에 적용하여 데이터베이스 시스템의 워크로드를 분석해 본다.

  • PDF

Java 코드 분석기법을 이용한 UML 클래스 다이어그램 생성 방법 (Building a UML class diagram using Java code analysis techniques)

  • 한무희;김경수;김현수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.133-135
    • /
    • 2003
  • 본 연구에서는 자바 코드로부터 UML 클래스 다이어그램을 추출하는 역공학방법을 제시하였다. 파서를 이용하여 자바 코드로부터 AST를 생성하고 이를 순회하면서 클래스다이어그램 생성에 필요한 정보를 추출하였다. 이를 위해 구조정보와 관계정보를 정의하였는데, 구조정보에서는 클래스 몸체를 구성하는 정보를 표현하였다. 관계정보에서는 클래스들 간의 연관관계를 결정하기 위해 필요한 정보를 표현하였으며, 얻어진 관계정보를 통해 연관관계를 유추하는 방법을 제시하였다. 특히 클래스들간의 연관관계를 추출하기 위한 규칙들을 정의하고, 이를 통해 얻어진 관계정보를 이용하여 연관관계를 유출하는 과정을 설명하였다.

  • PDF

기술연관분석의 정보통신산업에의 응용사례 (An Application of Technology-product Relevance Analysis to Telecommunication Equipment Industry)

  • 지경용
    • 전자통신동향분석
    • /
    • 제12권2호통권44호
    • /
    • pp.64-78
    • /
    • 1997
  • 종래의 산업연관분석은 산업과 기술의 관계에 대한 명확한 해답을 줄 수 없었다. 그러나 OECD에서 최초로 연구한 기술연관분석은 산업과 기술의 관계를 경제학적으로 설명함으로써 기술에 대한 경제정책적 응용을 가능하게 하였다. 본 고는 일본과학기술정보센터(Japanese Information Center for Science and Technology:JICST)의 자료에 기초하여 기술연관분석을 응용한 일본의 연구사례로서 앞으로 그 활용이 기대되고 있다.

지역별 발생집중 화물량 추정을 위한 산업연관분석의 Nonsurvey법 개발에 관한 연구 (Development of Nonsurvey Method of Input-Output Analysis for Production and Attraction Freight Flow Estimation According to Region)

  • AN, Sihyoung;IIDA, Katuhiro;MORI, Yasuo
    • 대한교통학회지
    • /
    • 제16권1호
    • /
    • pp.79-98
    • /
    • 1998
  • 교통계획의 수립은 사람과 화물의 이동상태에 대한 파악으로부터 시작되며 화물이동상태를 파악 하기 위한 가장 기본적인 데이터는 지역별 발생집중 화물량일 것이다. 이러한 지역별 발생집중 화물량의 추계방법중 추계의 간편성과 경제상황변화의 반영이 용이하다는 점에서, 최근 학자들의 상당한 주목 을 받으며 연구되고 있는 것이 산업연관분석을 응용한 물류해석방법이다. 그러나 이방법은 대상지역의 산업연관표를 기본 data로 하기 때문에 해당지역의 산업연관표의 존재 여부에 따라서 그 적용범위가 제한된다. 이러한 문제점을 해결하기 위해서 연구되고 있는 방법이 Nonsurvey법이다. Nonsurvey법은 대 지역의 산업연관표로부터 그 지역에 포함된 소지역의 산업연관표를 여러 가지 보조적인 데이터를 이용해 서 간접적으로 추계하는 방법이다. 본연구에서는 이러한 Nonsurvey법의 하나로서 대지역의 산업연관표 와 지역분해된 각 소지역의 산업부문별 생산량만을 이용해서 각 소지역의 발생집중화물량을 추계하는 방법을 제안했다. 그리고 일본의 긴키(Kinki)지역과 이에 속하는 4부현을 대상으로 본연구의 방법으로 추계된 이출입양과 실제의 산업연관표상의 이출입량을 비교.분석함으로써 본 연구의 방법에 대한 검증을 실시했다. 본 연구에서 제아한 지역별 발생집중 화물량 추계방법의 특징은 다음과 같다. 첫째, 대지역내 각 소지역간의 이출입량이 분기계수라고 하는 산업관계표의 산업관계표의 행방향의 합에 대한 비율을 사용함으로서 간단히 추계가능 하다. 둘째, 추계된 소지역의 산업관계표는 대지역에 대한 시스템전체의 정합성이 유지된다. 셋째 분해되는 소지역의 수에 관계없이 각소지역의 이출입양에 대한 추계가 가능하다.

  • PDF

우리나라 R&D 관련 산업과 정보통신산업 연관관계 분석 (An Analysis of Co-relations of R&D-related Industry and IT Industry)

  • 조병선;조상섭
    • 전자통신동향분석
    • /
    • 제22권4호통권106호
    • /
    • pp.183-191
    • /
    • 2007
  • 본 연구에서는 최근에 빠르게 성장하고 있는 R&D 관련 산업의 국민경제적 위치와 타산업과의 연관관계를 파악함으로써, R&D 관련 산업의 중요성과 앞으로의 방향을 제시하기 위하여 최근 한국은행에서 발행한 2000년도와 2003년도의 산업연관분석자료를 이용하여, R&D 관련 산업구조와 정보통신산업과의 연관관계를 파악하였다. 연구결과 2000년도에 비하여 2003년도의 산업연관분석에 따를 경우에 R&D 관련 산업의 생산활동 증가는 정보통신산업의 생산 및 부가가치활동에 보다 낮은 영향을 미치는 것으로 나타났으며, 이는 정보통신산업에 대한 R&D 관련 산업의 영향력이 약간 낮아지는 산업구조를 보여주기 때문에 정보통신산업 안에서 R&D 정책과 정보통신산업 밖에서 실시하는 R&D 정책에 대한 고려 및 효과측정이 동시에 이루어져야 할 필요성을 제시하는 것으로, 보다 국가 전체적이고 체계적인 R&D 정책적 고려가 필요함을 보여 주었다.

구조적 학술용어사전 구축에 있어서 지역명의 개념적 특성에 따른 관계 속성 기술에 관한 연구 (A Study on Describing Relational Properties of Terms in Geographical Categories According to Conceptual Characteristics for Construction of Structured Glossary)

  • 임보람
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.95-98
    • /
    • 2014
  • 본 연구는 지역명 범주에 속하는 용어들의 개념적 특성을 분석하고, 이를 토대로 다른 범주와의 관련도를 파악하여 지역명 범주 용어들을 중심으로 관계 속성들 사이의 논리적 연관성을 부여할 수 있는 모형 도출에 기반이 되는 기초 연구이다. 지역명 범주 용어 중 국가명에 한정하여 분석한 결과, 국가명 개념 속성 중심으로는 계층 구조 관계의 지역명 범주 용어들끼리 연관이 높으며, 전체 범주 용어들의 개념 속성 중심으로는 지역명 범주 용어가 지리적 위치로서의 의미로 주로 쓰이나, 행위의 주체 또는 객체의 의미나 시대의 개념으로도 많이 활용됨을 알 수 있었다. 국가명이 참조되는 개념 속성과 연관되어 활용되는 관계 속성의 경우의 일부는 참조하는 주요 개념 범주와 연관 관계를 토대로 논리적 의미 관계를 생각해볼 수 있는 것으로 나타났다.

  • PDF

미세먼지와 진료과목의 상관관계 분석을 통한 연관성 예측 방법 (Association Prediction Method Using Correlation Analysis between Fine Dust and Medical Subjects)

  • 임명진;김선미;신주현
    • 스마트미디어저널
    • /
    • 제7권3호
    • /
    • pp.22-28
    • /
    • 2018
  • 미세먼지 등 다양한 원인으로 한국의 대기 오염 문제가 점점 심해지고 있다. 대기 오염 문제가 심해짐에 따라 많은 사람들이 미세먼지에 대한 관심과 건강에 대한 불안이 높아지고 있다. 따라서 미세먼지가 미치는 영향과 어떤 질환과의 상관관계가 있는 지에 대한 다양한 연구가 진행되고 있다. 하지만 단순히 미세먼지가 호흡기 및 심혈관 질환, 고혈압 그리고 당뇨병과 같은 특정 질환과의 관계가 있다고 분석하고 있다. 이에 본 논문에서는 진료내역정보 공공데이터를 활용하여 2016년도 월별 진료횟수가 가장 높은 진료과목 10개를 추출하고 피어슨 상관계수를 사용하여 미세먼지가 어떤 진료과목과 관계가 있는지 분석한다. 그리고 더 세분화하여 미세먼지와 성별과 연령대에 따른 진료과목과의 상관관계를 분석한다. 미세먼지와 진료과목이 가장 강한 양의 상관관계인 여성-중년군은 2011년부터 2015년까지의 상관관계를 분석하고 회귀 분석을 통해 연관성 계수를 추출하여 미세 먼지 농도에 따른 진료과목과의 연관성 예측 방법을 제안한다.