• 제목/요약/키워드: 이차 데이터 분석

검색결과 105건 처리시간 0.025초

공간 데이터베이스에서 질의 결과 크기 추정을 위한 공간 분할 (Spatial Partitioning for Query Result Size Estimation in Spatial Databases)

  • 황환규
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.23-32
    • /
    • 2004
  • 질의 최적화기의 중요 기능 중에 하나는 질의가 주어졌을 때 질의 조건을 만족하는 입력 레코드의 개수를 추정하는 일이다. 관계 데이터베이스와 마찬가지로 공간 데이터베이스에서 질의 결과 크기 추정은 입력 데이터 공간을 버켓으로 불리는 작은 영역으로 분할한 후 분할된 영역에 대해서 질의 결과 ■기를 추정한다. 추정의 정확도는 작은 영역으로 분할할 때 근사 계산한 데이터와 실제 데이터의 차이에 의해서 결정되며 이것은 공간 분할을 어떻게 분할하는가에 달려 있다. 기존의 방법은 일차원에 많이 사용되는 데이터의 범위를 균일하게 하는 너비 균등 방법과 빈도수의 합을 일정하게 하는 높이 균등 방법을 공간상의 이차원에 적용한 면적 균등 분할과 개수 균등 분할 방법에 기초를 두고 있다. 본 논문에서 제안한 방법은 공간을 분할할 때 데이터의 범위와 빈도수의 곱을 면적으로 나타낸 후 면적 값의 차이가 가장 큰 순서로 버켓을 정하는 방법으로 데이터 범위와 빈도수를 동시에 고려하여 최적의 버켓을 결정한다. 본 논문에서는 제안한 방법과 기존의 방법을 실제 데이터와 인위데이터를 사용하여 질의 크기, 버켓수, 데이터 개수, 데이터 크기의 변화에 대해서 질의 결과 추정에 대한 정확도를 비교, 분석하여 제안한 방법의 성능 우수성을 확인한다.

단백질 구조 예측을 위한 서열 연관 규칙 탐사 (Discovering Sequence Association Rules for Protein Structure Prediction)

  • 김정자;이도헌;백윤주
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.553-560
    • /
    • 2001
  • 바이오정보학(bioinformatic)은 생물학 분야 특히 분자 수준의 유전체 연구에서 발생하는 데이터를 저장, 관리, 분석하여 실험 프로젝트를 지원함은 물론, 기능 예측 및 조절에 대한 실험 설계를 가능하게 하는 제반 컴퓨터 기술을 의미한다. 유전체 연구의 다양한 접근 방식 중 단백체학(proteomics)는 유전체의 최종 산물인 단백질을 직접적으로 다룬다는 측면에서 그 효용성에 대해 많은 기대를 모으고 있다. 본 논문에서는 단백질의 기능을 결정하는 가장 중요한 요소 중 하나인 단백질의 구조를 예측하기 위한 데이터 마이닝 기법을 제안한다. 단백질의 일차 구조인 아미노산 서열에 타나나는 부서열간의 연관성이 해당 단백질의 이차 혹은 삼차 구조를 결정하는 중요한 단서임을 설명하고, 아미노산 부서열간의 연관성을 표현하기 위한 모델로서 서열 연관 규직을 정의한다. 서열 연관 규칙의 유용성을 평가하기 위한 지지도와 신뢰도를 새롭게 정의하고, 주어진 단백질 집단으로부터 유용한 서열 연관 규칙을 발견하기 위한 기법을 제안한다. 아울러, SWISS-PROT 단백질 데이터베이스로부터 입수한 단백질 서열 데이터를 이용하여 제안한 기법의 성능을 평가한다.

  • PDF

독서가 자기효능감과 다문화수용성에 미치는 영향 분석 - 다변량 잠재성장모형을 적용하여 - (The Impact of Reading on Self-Efficacy and Multicultural Acceptance: Using Multi-variate Latent Growth Model)

  • 박성재
    • 한국도서관정보학회지
    • /
    • 제53권4호
    • /
    • pp.293-318
    • /
    • 2022
  • 본 연구의 목적은 독서가 자기효능감과 다문화수용성에 어떠한 영향을 미치는지를 분석하는 것이다. 영향관계를 분석하기 위해서 한국교육고용패널 II 데이터를 활용하였다. 잠재성장모형을 적용하여 관심변인인 독서와 자기효능감, 다문화수용성의 성장궤적을 분석하고 독서에 영향을 미치는 요인과 세 변인간의 영향관계를 다변량 잠재성장모형을 적용하여 분석하였다. 분석결과, 고등학교 2학년 학생들의 독서량과 자기효능감, 다문화수용성은 시간이 지남에 따라 감소하는 것으로 나타났다. 다음으로 독서량의 초기값은 자기효능감과 다문화수용성 초기값과 정(+)적 영향 관계를 보였다. 마지막으로 독서량 초기값은 자기효능감을 매개로 다문화수용성 초기값과 변화율에 영향을 미쳤고 이는 통계적으로 유의했다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

직류전위차법 자료에 대한 통계적 자료분석 (Statistical analysis of direct current potential drop data)

  • 이정희;이우동
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.139-146
    • /
    • 2010
  • 비파괴검사방법 중 직류전위차법은 표면균열 측정에 유효한 수단으로 알려져 있다. 이차원 표면 균열을 가진 시험편에서 전류입출력점사이의 거리가 직류전위차에 미치는 영향을 알아보는 실험을 실시하여 자료를 얻었다. 이 자료로부터 전위차 값은 일정 전위차계측점사이의 거리에 있어 전류입출력점사이의 거리가 증가함에 따라 반비례적으로 감소하고, 노치의 길이에 비례하고 있었다. 이 실험에서 관찰된 자료를 통계적 모형에 적합시키고, 적합된 모형에서 전위차에 영향을 주는 유의한 변수를 알아보는 것은 비파괴검사에서 중요하다고 할 수 있다. 본 연구에서는 관찰된 자료를 적절하게 설명할 수 있는 통계적 모형을 제안하고, 제안된 모형에서 유의한 독립변수를 찾아보는 것이 목적이다.

서울의 온도 패턴 변화 (Change of temperature patterns in Seoul)

  • 장학진;주용성
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권1호
    • /
    • pp.89-96
    • /
    • 2009
  • 이 논문에서 우리는 1961년부터 2008년 사이의 서울지역 온도변화를 스펙트럴 이분산성 모델을 이용하여 연구하였다. 제안한 모델에서 평균 함수는 계절효과를 주기함수를 이용하여 설명하였고, 온도의 전체적인 상승을 이차 회귀 스플라인 곡선을 이용하여 설명하였다. 분산함수 또한 분산의 계절성을 설명하기 위하여 주기함수를 사용하였다. 우리는 연평균온도가 과거 48년 동안 약 1.5도 가량 증가했음을 알 수 있었다. 연평균온도의 상승은 겨울 온도가 상승하는 것에 기인하는 것이었고, 이는 연중 온도변화의 진폭이 줄어들게 만들었다.

  • PDF

드론 센서를 시드로 활용한 MQ 기반 서명 기법의 변수 생성 방안 (A Study on the Method of Creating Variables for MQ-based Signature Schemes Using a Drone Sensor as a Seed)

  • 조성민;홍은기;김애영;서승현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.204-207
    • /
    • 2018
  • IoT 기기 및 드론의 사용자 인증 및 기기 인증을 위해 RSA, ECDSA 등의 여러 전자서명 기법이 기본적으로 사용되고 있다. 그러나 양자 컴퓨터의 개발에 따라 Shor 알고리즘을 이용한 기존 암호 알고리즘의 공격이 가능해지고, 그에 따라 기존 암호 알고리즘의 보안성이 취약해지는 문제가 있다. 따라서 양자 내성 암호를 활용한 보안 체계의 필요성이 대두되고 있는 가운데, 본 논문에서는 양자 내성 암호인 다변수 이차식 기반의 전자서명 기법 중 Rainbow를 드론에 최적화하여 구현하기 위한 방안을 검토 및 분석하고자 한다. 그러나 기존의 Rainbow에서 사용하는 openssl 등의 오픈소스 암호 라이브러리는 PC에 맞춰 설계되었기 때문에 드론에서 난수를 생성할 때 적용이 어려운 점이 있다. 드론에는 각종 센서들이 내장되어 있으며, 센서 데이터들은 난수성을 보장하기에 용이하다. 따라서 드론의 각종 센서들을 시드로 활용하며, XOR 보정기를 통해 난수성을 해치지 않으면서 드론에서 난수를 생성할 수 있는 방안을 제안해 보고자 한다.

화성 Mawrth Vallis 지역에서 관찰되는 파쇄 패턴의 성질 (The Nature of the Fracture Patterns Observed at Mawrth Vallis, Mars)

  • 이차복
    • 한국지형학회지
    • /
    • 제19권2호
    • /
    • pp.145-159
    • /
    • 2012
  • 화성 Mawrth Vallis지역의 점토광물을 함유한 층에서 관찰되는 파쇄 패턴의 성인을 파악하기 위해 HiRISE 영상데이터를 활용하여 분석하였다. 함유된 점토광물의 종류에 따라 지표에서 관찰되는 파쇄 패턴에 차이가 나타나는데 논트로나이트를 주로 함유한 지표의 경우 파쇄 패턴이 불규칙적이고 침식을 심하게 받은 상태이나, 몬모릴로나이트를 주로 함유한 층의 지표에는 크기와 형태가 비교적 일관성을 가지는 폴리곤 패턴이 잘 발달되어있다. 이들 폴리곤 파쇄 패턴의 성질은 점토광물 함유층에 따라 달리 해석되는데, 논트로나이트 함유층의 경우 대부분 하중 제거로 인해 발생한 것으로 보이며, 몬모릴로나이트 함유층의 지표에 발달한 파쇄 패턴은 건조 균열로 인해 발생한 것으로 추정된다.

동작 속성에 따른 정서 차원 분석 (A study of affective circumplex model on gesture property)

  • 유상;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1379-1386
    • /
    • 2006
  • 전자우편이나 문자 메세지를 이용할 때 겪는 불편함 중 하나는 상대방이나 기계에 정서 정보를 전달하기 어렵다는 점이다. 정서 정보를 메시지에 싣기 위해서는 컴퓨터나 디지털 기기가 정서를 인식하거나 사용자가 정서를 입력해야 한다. 기존의 정서 인식 방법은 생리적, 신체적 측정치를 이용하는 것인데, 이 경우 측정을 위한 별도의 장비가 필요하고 현재 자신의 정서 상태와 다른 정서를 표현할 수 없다는 단점이 있다. 특히 소형 모바일 기기를 이용할 때 다른 측정 장치를 사용하는 것은 더욱 어렵다. 이런 문제를 해결하기 위해 모바일 기기를 사용하는 환경에서 사용자가 원하는 정서를 기계에 입력하기 위해 동작을 이용하려는 연구가 진행되었다(Fargerberg, Stahl, & Hook, 2003). 본 연구에서는 Laban Movement Analysis에서 동작을 구성하는 다섯 요소 중 노력(effort)과 모양(shape) 요소를 재구성하여, 방향성 차원, 무게감 차원, 시간감 차원으로 동작을 구분하고 총 20개의 동작을 선정하였다. 또한 한덕웅과 강혜자(2000)가 수집한 834개 정서 어휘를 평정하여 동작을 통해 표현하고 전달되기 쉬운 정서 어휘 50개를 선택하였다. 최종 실험에서 참가자들은 20개의 동작에 대해 50개의 정서 어휘를 평정하고 데이터는 범주형 주성분분석을 이용하여 분석하였다. 분석 결과 Russell(1980)의 이차원 정서 구조 모형에서 각성 수준 차원은 동작의 무게감과 시간감 차원과 관련이 있는 것으로 나타났다. 강하고 빠른 동작일수록 각성 수준이 높은 정서가 나타났다. 또한 동작의 방향성 차원은 정서의 종류와 관련이 있는 것으로 드러났다. 직선 움직임은 높은 각성 수준의 부정적 정서와, 흔듦 움직임은 불안 및 초조와, 원형 움직임은 즐거운 정서와 관련이 있는 것으로 나타났다. 이는 동작을 통하여 정서 정보를 효과적으로 전달할 수 있음을 보여주었고, 동작과 정서를 연관 짓기 위해 방향성 차원과 무게감 차원 그리고 시간감 차원을 고려할 필요가 있음을 시사한다.

  • PDF

혈중 비타민 E 수준과 알레르기 비염 : 국민건강영양조사 제7기 3차년도 자료 분석 (Serum Vitamin E levels and Allergic Rhinitis : Analysis of the KNHANES VII-3)

  • 이소나;최혜선
    • 산업융합연구
    • /
    • 제18권5호
    • /
    • pp.62-69
    • /
    • 2020
  • 본 연구의 목적은 한국인의 혈중 비타민 E 수준과 알레르기 비염의 위험도를 파악하기 위함이다. 연구방법은 국민건강영양조사 제7기 3차년도(2018) 빅데이터를 활용한 이차분석 연구이다. 자료분석은 SPSS 25 프로그램을 사용하여 복합표본 빈도와 백분율, 복합표본 교차분석, t-test, ANOVA 그리고 Odds ratio를 실시하였다. 연구결과, 우리나라 10세 이상 혈중 비타민 E 수준는 평균 12.60mg/L이었고, 의사로부터 알레르기 비염을 진단받은 사람은 15.9%였다. 연구 대상자의 혈중 비타민 E 수준이 낮을수록 알레르기 비염 유병은 유의하게 높은 것으로 나타났다(β=-0.05, p=.013). 따라서 한국인의 알레르기 비염 예방 및 관리를 위해서는 혈중 비타민 E 모니터링 및 비타민 E 를 포함한 항산화제에 대한 연구를 지속적으로 해야 할 것이다.