• 제목/요약/키워드: 순위상관계수

검색결과 116건 처리시간 0.024초

상관계수의 안전한 다자간 계산 (Secure Multi-Party Computation of Correlation Coefficients)

  • 홍선경;김상필;임효상;문양세
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.799-809
    • /
    • 2014
  • 본 논문에서는 분산 컴퓨팅 환경에서 데이터 제공자들이 각자 소유한 데이터의 프라이버시는 보호하면서도 피어슨(Pearson) 상관계수와 스피어만(Spearman)의 순위상관계수를 안전하게 계산하는 해결책을 각각 제안한다. 분산 컴퓨팅 환경에서 마이닝(또는 데이터 분석)을 수행하기 위해서는 원본 데이터를 상대방에게 제공해야 한다. 그러나, 원본 데이터는 민감한 정보를 포함하는 경우가 많고, 이때 데이터 제공자(소유자)는 프라이버시 보호를 이유로 정확한 값을 직접 노출하기를 원하지 않는다. 본 논문에서는 분산 컴퓨팅 환경의 데이터 제공자들이 각자 소유한 데이터는 상대방에게 공개하지 않으면서 상관관계를 계산하는 문제, 즉 안전한 상관관계 계산(SCC: Secure Correlation Computation) 문제를 정형적으로 정의한다. 그리고, 임의 행렬 기반 안전한 스칼라 곱을 사용하여 피어슨 상관계수와 순위상관계수에 대한 SCC 문제를 해결하는 방법을 각각 제안한다. 제안한 해결책이 바르게 수행함을 보이기 위해, 정확성과 안전성을 정리로 제시하고 증명한다. 또한, 실험을 통해 제안한 기법이 수행 시간 측면에서도 실용적인 방법임을 보인다.

한국 및 미국기업의 재무비율과 PER와의 관계에 관한 비교연구

  • 김상기
    • 재무관리논총
    • /
    • 제3권2호
    • /
    • pp.97-123
    • /
    • 1996
  • 본 논문은 한국기업 및 미국기업에 있어 재무비율과 주가수익비율의 관계가 어떠한가를 살펴 보고자 하는데 그 목적이 있다. 이를 위하여 한국 증권거래소에 상장된 한국기업들과 미국 뉴욕증권거래소에 상장된 미국기업들을 대상으로 하여 화학업, 금속업, 건설업, 음식료업, 섬유의복업의 5개 업종으로 구분하여 스피어만의 순위상관계수를 산출하여 분석을 행하였다. 분석결과 한국기업의 경우 성장성 관련비율중 일부 및 수익성관련비율의 경우 순위상관계수가 높게 나타났으며, 미국기업의 경우 모든 채무비율의 순위상관계수가 매우 낮게 나타났다. 따라서 주가수익비율(PER)이 주식투자 결정시 유용한 기준이라는 가정하에 다음과 같은 결론을 도출할 수 있다. "한국기업의 경우 성장성관련비율중 일부와 수익성관련비율은 주식투자 결정시 유용한 기분이나 미국기업의 경우는 주식투자시 재무비율을 이용하는 방법은 적절치 못하다"

  • PDF

DEA 모형의 변별력 평가에 관한 연구 (A Study on Discrimination Evaluation of DEA Models)

  • 박만희
    • 한국콘텐츠학회논문지
    • /
    • 제17권1호
    • /
    • pp.201-212
    • /
    • 2017
  • 본 연구에서는 변동계수를 이용하여 DEA 모형의 변별력 평가에 적용할 수 있는 새로운 평가기준을 제시하였다. 변별력 평가를 위해 기존 연구에서 제시한 중요도와 본 연구에서 제안한 변동계수를 이용하여 변별력을 분석하였다. 다양한 DEA 모형들 중 변별력 평가를 위해 CCR-DEA, BCC-DEA, entropy, bootstrap, super efficiency, cross efficiency DEA 모형을 선정하고 실증분석을 실시하였다. 모형들의 순위상관관계를 파악하기 위해서 CCR 모형과 BCC 모형의 효율성 값과 entropy, bootstrap, super efficiency, cross efficiency 모형의 효율성 값들 간에 순위상관분석을 실시하였다. 본 연구를 통해 도출된 연구결과를 요약하면 다음과 같다. 첫째, 중요도와 변동계수를 이용한 모형들의 변별력 순위가 동일한 것으로 분석되어 변동계수를 DEA 모형의 변별력 평가기준으로 이용할 수 있다는 것이다. 둘째, 본 연구의 실증분석 결과에 따르면 4개 모형 중 super efficiency 모형이 변별력이 가장 높은 것으로 분석되었다. 셋째, CCR 모형과 순위상관관계가 가장 높은 모형은 super efficiency 모형으로 나타났고, BCC 모형과 순위상관관계가 가장 높은 모형도 super efficiency 모형으로 분석되었다.

홍수 취약성 평가를 위한 그룹 의사결정 접근법 (Group Decision Making Approach to Flood Vulnerability Assessment)

  • 김영규;정은성;이길성;김연주
    • 한국수자원학회논문집
    • /
    • 제46권2호
    • /
    • pp.99-109
    • /
    • 2013
  • 유역 환경에 대한 복잡성의 증가는 단일 의사결정자들이 의사결정문제의 모든 부분을 고려하는 것을 점점 더 불가능하게 만들기 때문에 불확실성은 더욱 증가하게 된다. 따라서 본 연구는 그룹의사결정기법을 사용하여 우리나라 공간적인 홍수 취약성을 정량화하는 접근법을 제시하였다. 개인의 선호도를 분석하기위해 Fuzzy TOPSIS를 사용하였고 개인선호도의 통합을 위해 Borda count, Condorcet 그리고 Copeland 방법을 사용하였다. 마지막으로 도출된 결과를 Fuzzy TOPSIS 및 TOPSIS의 결과와 비교하였고 스피어만 순위상관계수와 켄달의 순위상관계수, Emond와 Mason이 제시한 순위상관분석을 이용하여 순위의 일치성을 검토하였다. 그 결과 일부 지역의 취약성 순위가 큰 폭으로 역전되는 현상을 보였다. 그룹의사결정 개념을 반영하여 지역별 취약성을 산정할 경우 우선순위의 변동이 클 수 있으므로 홍수 취약성 산정시 본 연구에서 제시된 모델을 고려할 필요가 있다.

회귀나무에서 변수선택 편의에 관한 연구

  • 김민호;김진흠
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.263-268
    • /
    • 2003
  • Breiman, Friedman, Olshen and Stone(1984)의 전체탐색법에 의한 회귀나무는 상대적으로 많은 분리가 가능한 변수로 분리기준이 정해지는 편의 현상을 갖고 있다. 본 연구에서는 이런 문제점을 해결할 수 있는 알고리즘을 제안하여 변수선택편의가 없는 회귀나무를 만들고자 한다. 제안하는 알고리즘은 노드의 분리변수를 선택하는 단계와 그 선택된 변수에 의해 이진분리를 위한 분리점을 찾는 단계로 구성되어 있다. 예측변수 중에서 목표변수와 가장 밀접하게 연관된 예측변수는 예측변수의 자료의 종류에 따라 스피어만의 순위상관계수에 의한 검정 혹은 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 가장 통계적으로 유의한 변수로 선택하였고, 선택된 변수에만 Breiman et al.(1984)의 전체선택법을 적용하여 분리점을 결정하였다. 모의실험을 통해 변수선택편의, 변수선택력 , 그리고 평균제곱오차 측면에서 Breiman et al. (1984)의 CART(Classification and Regression Trees)와 제안한 알고리즘을 서로 비교하였다. 또한, 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

  • PDF

에너지 데이터의 순위상관계수 기반 건물 내 오작동 기기 탐지 (Rank Correlation Coefficient of Energy Data for Identification of Abnormal Sensors in Buildings)

  • 김나언;정시현;장보연;김종권
    • 정보과학회 논문지
    • /
    • 제44권4호
    • /
    • pp.417-422
    • /
    • 2017
  • 비정상행위 탐지는 데이터로부터 특징을 추출하여 정상 행위 모델을 만들어, 이 정상 모델로부터 얼마나 벗어나 있는 가를 찾아내어 탐지하는 기법이다. 즉, 특정 기기가 생성하는 데이터를 기반으로 기기의 오류를 탐지하거나 사회망 데이터에서의 사용자 행위 변화를 찾아내어 비정상행위를 탐지하는 데 활용할 수 있다. 본 논문에서는 순위 상관 계수를 이용하여 건물 내의 기기의 비정상적인 데이터를 탐지하고자 한다. 에너지 절약 문제에 대한 관심이 높아짐에 따라 에너지를 효율적으로 사용하기 위해 여러방법들이 제안되었다. IT 기술의 발달과 더불어 공조 시스템(HVAC)이 건물에 도입되어 활용되고 있으며, 이 시스템을 통하여 에너지 소비의 문제점을 찾고 에너지를 효율적으로 관리할 수 있다. 따라서 본 논문은 공조 시스템에 속한 각 기기간의 순위 관계 변화를 관찰함으로써 이상 현상 탐지의 효율성을 높이는 방법을 제안하며, 사회망 데이터 내에서의 비정상행위 탐지 가능성도 함께 제안한다.

Diagnodent를 사용한 우식진단법의 검사자내 신뢰도에 관한 연구 (INTERRATER RELIABILITY OF CARIES DIAGNOSIS BY DIAGNODENT)

  • 이광희
    • 대한소아치과학회지
    • /
    • 제27권1호
    • /
    • pp.40-44
    • /
    • 2000
  • 연구목적은 새로운 레이저형광측정기술을 응용한 휴대용 우식진단기구인 Diagnodent를 사용한 우식진단법의 검사자내 신뢰도를 분석하는 것이었다. 발거된 사람 대구치와 소구치를 대상으로 열구를 3회, 평활면을 5회 반복 검사하였다. 측정치들의 평균치간 차이의 유의성을 t-검사로 검정하였고 측정치들간의 상관성을 Pearson 상관계수와 Spearman 순위상관계수로 산출하였으며 척도 신뢰도분석으로 검사자내 신뢰도를 분석하였다. 연구성적에서, 열구측정치들 간에 유의한 차이는 없었으나, 평활면측정치들간에는 10개 조합 중 2개에서 유의한 차이가 있었다(P<0.05). 그러나, Pearson 상관과 Spearman 순위상관은 모두 상관계수 0.9 이상의 유의한 상관성을 나타내었고(P<0.01), 신뢰도의 값은 열구측정에서 0.9980 내지 0.9981로, 평활면측정에서 0.9992로 산출되었다. Diagnodent를 사용한 우식진단법은 생체외에서 한 검사자가 반복 검사를 시행하였을 때 완전한 일치에 가까운 재현도, 곧 매우 높은 검사자내 신뢰도를 가지고 있는 것으로 나타났다.

  • PDF

산업기술분야 학술지 이용에 관한 연구 (A Study on the Usage of Industry & Technology Joumals)

  • 김석영;황혜경
    • 정보관리연구
    • /
    • 제31권4호
    • /
    • pp.13-49
    • /
    • 2000
  • 본 연구는 산업기술정보원이 보유하고 있는 산업기술분야 학술지 이용에 관한 것이다. 학술지 이용 연구의 대상은 1995년부터 1999년까지 과거 5년간 복사 이용된 통계를 분석하였다. 분석 결과, 학술지 장서의 19%가 전체 복사 요구의 93%를 충족하였다. 그리고 본 연구를 통하여 학술지 이용 패턴도 파악되었다. 학문 주제분야별 분석 결과는 화학 및 화학공학 분야가 가장 빈도가 높은 것으로 나타났다. 학술지 복사빈도 순위와 SCI 순위와의 비교 결과, 복사빈도 순위와 SCI 인용빈도 순위와는 상관성이 있었으나, 영향계수 순위와는 상관성이 없는 것으로 나타났다.

  • PDF

변수선택 편향이 없는 회귀나무를 만들기 위한 알고리즘 (Regression Trees with. Unbiased Variable Selection)

  • 김진흠;김민호
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.459-473
    • /
    • 2004
  • 본 논문에서는 Breiman 등(1984)의 전체탐색법이 갖고 있는 변수선택 편향을 극복할 수 있는 알고리즘을 제안하였다. 제안한 알고리즘은 노드의 분리 변수를 선택하는 단계와 그 선택된 변수에 대해서만 이진분리를 위한 분리점을 찾는 단계로 나뉘어져 있다. 예측변수가 연속형 일 때는 스피어만의 순위상관계수에 의한 검정을 수행하고, 범주형일 때는 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 통계적으로 가장 유의한 변수를 분리변수로 선택하였고 Breiman 등(1984)의 전체탐색법을 그 변수에만 적용하여 노드의 분리기준을 정하였다 모의실험 연구를 통해 Breiman등(19히)의 CART와 제안한 알고리즘을 변수선택 편의, 변수선택력파 평균제곱오차 측면에서 서로 비교하였다. 아울러 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

NAVER DATA LAB 데이터 기반 과거 한반도 홍수에 대한 대중 인지도 취약성 평가 (2011-2018) (NAVER Data Lab data-based Assessment of National Awareness Vulnerability of Past Floods over the Korean Peninsula (2011-2018))

  • 이은미;유영욱;정영훈;감종훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.59-59
    • /
    • 2023
  • 기후변화로 인한 집중호우와 홍수는 하천의 범람, 내수침수 등을 일으킨다. 최근 발생한 2022년9월 태풍 '힌남노'는 포항시 10명의 인명 피해와 1조 7000억원의 재산 피해로 막대한 피해를 야기시켰다. 본 연구는 2011년부터 2018년까지 시군구 단위의 행정구역별 홍수 기간 강우량, 피해액, 홍수 지역의 인구 자료를 NAVER DATA LAB(2016년부터 자료 제공) '홍수' 검색량 데이터와 비교 분석하였다. 본 연구에서는 다량의 강우량 또는 높은 피해액이 발생한 시기에 홍수 검색량이 낮았던 지역을 홍수에 대한 대중 인지도가 취약한 지역으로 정의하였다. '홍수' 검색량과 강우량, 피해액, 홍수 지역 인구와의 상관관계를 분석한 결과, 강우량과 인구는 각각 0.86, 0.81의 높은 상관계수를 보인 반면, 피해액은 0.52로 상대적으로 낮은 상관관계를 보였다. 2016-2018년 특/광역시단위 분석 결과, 총 17번의 홍수 발생 중 '인천광역시'와 '세종특별시'에서 피해액 규모가 각각 2, 3순위로 높았던 반면 홍수 인지도는 각각 6, 11순위로 홍수 인지도가 취약한 지역으로 평가되었다. 도 단위 평가 시, 총 34번의 홍수 발생 중 '강원도'와 '경상북도'에서 피해액 규모 3순위, 강우량 10순위 일 때, 홍수 인지도는 27순위로 홍수 인지도가 취약한 지역으로 평가되었다. 다중 선형회귀 기법을 통해 2016년부터의 데이터를 기반으로 모델을 훈련하여 2016년 이전의 '홍수' 검색량 예측 자료를 재생산하였다. 2011-2015년 특/광역시 중심의 평가에서, 총 25번의 홍수 발생 중 부산광역시에서 피해액 규모가 1순위, 강우량이 2순위로 높았던 반면 홍수 인지도는 6순위로 홍수인지도가 취약한 지역으로 평가되었다. 도 단위 평가 시, 총 50번의 홍수 발생 중 '충청남도'와 '경기도'에서 피해액 규모가 3순위일 때 홍수 인지도가 7순위로 홍수 인지도가 취약한 지역으로 평가되었다. 본 연구는 물리·사회시스템의 빅데이터를 분석하여, 사회수문학적 접근 방식으로 홍수에 대한 사회적 취약성을 새롭게 제시하며 사회과학과 수자원 분야의 융합연구 필요성을 강조하였다.

  • PDF