• 제목/요약/키워드: 빈도수 분석

검색결과 5,837건 처리시간 0.04초

한강유역에 대한 강우지역빈도해석의 적용성 연구 (Application of Rainfall frequency Analysis in Han River Basin)

  • 허준행;이영석;남우성;김경덕
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 학술발표회
    • /
    • pp.168-172
    • /
    • 2004
  • 본 연구에서는 지점빈도해석의 단점을 보완하기 위해 지역화의 개념을 사용한 지역빈도해석을 수행하였다. 지점빈도해석은 수문자료의 관측기간이 짧은 경우 정확도에 문제를 발생시킬 수 있으므로 지점 내 충분한 수의 자료 확보가 선행되어야 하나, 우리나라의 경우 지점별로 자료수가 많지 않기 때문에 지역빈도해석을 통해서 보다 정확하고 안정적인 확률수문량을 산정할 수 있다. 본 연구에서는 한강유역의 강우자료 선별을 통해서 신뢰성 있는 자료를 구축한 후, Regional Shape Estimation법과 Index Flood법을 사용한 지역빈도해석을 각각 실시하여 지점빈도해석을 시행한 결과와 비교 분석하였다. 그 결과, 한강유역의의 경우 Regional Shape Estimation 법보다 Index Flood 법이 약간 우수하게 나타났으며, 이질성이 내포되어 있는 경우라도 지점빈도해석보다는 지역빈도해석 기법이 우수하게 나타났다. 국내의 경우와 같이 관측 자료기간이 짧은 경우에는 지점빈도해석 기법보다는 지역빈도해석 기법을 적용하는 것이 보다 신뢰할 수 있는 확률수문량을 도출할 수 있을 것으로 판단된다.

  • PDF

언어네트워크분석을 통한 국내 문화정책 연구동향 분석(2008-2017) (An Analysis of Cultural Policy-related Studies' Trend in Korea using Semantic Network Analysis(2008-2017))

  • 박양우
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.371-382
    • /
    • 2017
  • 본 연구는 콘텐츠산업정책을 포괄하는 문화정책에 대한 학술적 연구의 동향을 알고자 언어네트워크분석을 통해 국내의 가장 대표적인 문화정책 분야 전문학술지인 '문화정책논총'에 수록된 186편의 논문 주제어 832개를 대상으로 분석을 시도하였다. 시간적 범위는 한국연구재단 한국학술지인용색인 홈페이지(www.kci.go.kr)에 수록되어 있는 2008년 10월부터 2017년 1월까지로 하였다. 언어네트워크 분석은 주제어 빈도수, 밀도분석과 중심성을 지표로 분석하였으며, 이를 바탕으로 Netdraw 프로그램에 의한 시각화를 시도하였다. 언어네트워크분석 결과 가장 많은 빈도수를 기록한 주제어는 '문화'였고, '문화정책/행정', '문화산업/문화콘텐츠', '정책'이 최다의 빈도수를 기록한 그룹에 포함되었다. 빈도수가 높은 '문화정책/행정'과 '문화산업/문화콘텐츠'는 대부분의 중심성에서 우위를 차지했으나, 매개중심성은 낮아 다른 주제어들과의 중매 역할에는 한계를 드러냈다.

Copula 함수 기반의 이변량 가뭄빈도 해석 (Bivariate drought frequency analysis using copula function)

  • 이정주;김하영;권문혁;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.309-309
    • /
    • 2022
  • 특정 극치사상 자료에 대한 특성 분석 시 수문자료에 대한 빈도해석은 일반적으로 단일 확률 변수를 기준으로 이루어지는 단변량 해석 방법이 활용된다. 그러나 두 가지 이상의 변량이 서로 상관성을 가지는 경우 다변량 빈도해석이 요구되며, 이를 단변량으로 해석하는 경우 재현기간의 과소추정 등의 문제점이 발생할 수 있다. 최근 이러한 점을 개선하기 위하여 다변량 빈도해석에 관한 연구가 지속적으로 진행되고 있다(Kwon and Lall, 2016; Vaziri et al., 2018). 특히, 가뭄의 경우, 강도(intensity)뿐만 아니라 지속기간, 심도도 매우 중요한 인자로 고려되고 있다. 특히, 가뭄지속기간과 심도의 경우 두 인자 간의 상관성이 매우 크기 때문에 단변량(univariate) 가뭄빈도해석 보다 다변량으로(multivariate) 가뭄빈도해석을 수행하는 것이 가뭄위험도 평가 측면에서 유리하다고 알려져 있다(Shiau and Shen, 2001; Kim et al., 2017). 따라서 이 둘을 결합한 빈도 해석을 위해 Copula Function을 이용한 다변량 빈도 해석에 관한 연구들이 활발히 진행되고 있다. 홍수의 경우 지속시간별 연최대강수량 계열을 이용한 빈도해석 과정이 지침으로 정립되어 수자원 설계 실무에서 활용되고 있으나, 가뭄은 실무에서 활용할 수 있는 지침 및 분석 도구가 없는 실정이다. 이에 환경부와 국가가뭄정보분석센터에서는 '20년도에 단변량 가뭄빈도 해석을 위한 프로그램을 제작·배포하였다. 본 연구에서는 가뭄의 특성을 대변하는 상관도 높은 두 인자인 가뭄 심도(severity)와 가뭄 지속기간(duration)이라는 두 가지 특성을 함께 고려해 이변량(bivariate) 가뭄 빈도를 해석할 수 있는 도구를 개발하는 것을 목표로, 다양한 확률분포형을 이용한 최적 주변 확률분포형 선정과 최신 Copula Function들을 이용한 최적 결합확률분포 추정을 통해 신뢰도 높은 2변량 가뭄빈도 해석을 수행할 수 있는 프로그램을 제작하였으며, 테스트 버전 배포 등을 거쳐 누구나 사용할 수 있도록 공개할 예정이다.

  • PDF

인공신경망 군집분석을 이용한 지역빈도해석에 관한 연구 - 한강유역을 중심으로 (Regional Frequency Analysis using the Artificial Neural Network Method - the Han River Basin)

  • 안현준;김성훈;신홍준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.300-300
    • /
    • 2016
  • 지점빈도해석은 해당 지점에서 기록된 수문자료를 바탕으로 확률론적 방법을 이용하여 해당 지역의 수문학적 현상을 해석하는 방법이다. 최근 이상 기후현상을 통해 극치 사상이 발생하고 있다. 이러한 극치 사상은 지점빈도해석을 이용하여 확률수문량을 추정하는데 많은 영향을 미친다. 특히 해당 지점의 표본 크기가 작을수록 이러한 영향은 좀 더 크게 반영 될 수 있다. 반면 지역빈도해석은 지점의 표본 수가 적거나 수문자료의 수집이 불가능한 미계측지점인 경우, 해당 지점과 수문학적으로 동질하다고 여겨지는 주변 지점들의 자료를 확보하여 확률수문량을 추정함으로써 상대적으로 지점빈도해석 보다 roubst한 추정값을 얻을 수 있다. 따라서 최근 확률수문량 산정 기법으로 지역빈도해석 방법에 관한 관심이 높아지고 있는 실정이다. 지역구분은 지역빈도해석이 지점빈도해석과 구분 될 수 있는 큰 특징이고 지역구분 결과 따라 지역의 표본 크기가 결정되기 때문에 수문학적으로 동질한 지역을 나누는 방법은 매우 중요하다고 볼 수 있다. 본 연구에서는 한강유역을 대상으로 인공신경망을 이용한 군집분석을 수행하고 구분된 지역을 이용하여 지역빈도 해석을 수행하였다.

  • PDF

조선왕조실록 분석을 위한 단어 빈도수 기반 빅 데이터 분석 (Word Frequency-Based Big Data Analysis for the Annals of the Joseon Dynasty)

  • 변영일;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.707-709
    • /
    • 2022
  • 조선왕조실록은 조선왕조가 태조부터 철종까지 이르기까지 472년간의 역사를 편찬한 사서이다. 조선왕조실록은 국보 제 151호로 중요한 기록유산이지만 내용이 방대하여 분석함에 있어 어려움이 따른다. 따라서 조선왕조실록의 모든 내용을 분석하기 보다는 중요한 단어들을 추출하여 분석해야 할 필요가 있다. 본 논문에서는 웹 크롤링을 통하여 조선왕조실록 웹페이지의 본문에서 단어를 추출하고 단어의 빈도수에 따라 정렬한 데이터를 기반으로 번역된 조선왕조실록의 본문을 분석하는 방법을 제안한다. 본 연구는 조선왕조실록의 세종 부분만을 추출하여 단어의 빈도수에 따라 중요도를 분석하였다.

  • PDF

비매개변수적 Kernel Function을 이용한 지역빈도해석 (Regional Frequency Analysis using Nonparametric Kernel Function)

  • 문영일;오태석;김종석;정민수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1492-1496
    • /
    • 2006
  • 수공구조물의 설계에 있어 가중 중요한 변수 중에 하나가 확률 강우량이다. 우리나라의 경우 매개변수적인 지점빈도해석을 통해 확률 강우량을 산정하고 있으나, 최근 들어 지점별 관측자료의 부족으로 인한 지역빈도해석을 수행하여 확률강우량을 산정하고 있는 실정이다. Index Flood 기법이나 L-moment 기법과 같은 기존의 지역빈도해석은 여러 관측 지점에서 관측된 강우자료를 이용하여 매년최대 시간강우량 자료를 추출하여 동질성 분석을 통해 이질성이 없는 것으로 분석된 연최대 강우량을 빈도해석 하여 확률 강우량을 결정한다. 그러나 이와 같은 지역빈도해석은 매개변수적 지점빈도해석과 마찬가지로 적합도 검정에 통과한 다수의 분포형이 선정되는 경우에 어떤 분포형을 사용하느냐 하는 문제점이 발생할 수 있다. 그리고 선정된 여러 강우 관측 지점의 연최대 강우량 자료에 모두 동일한 확률 분포형을 이용하므로 선정된 확률 분포형이 모든 지점의 강우 자료와 적합하지 못할 가능성을 내포하고 있으며, 또한 수문자료가 여러가지 요인으로 인하여 복합분포(mixed distribution)형태를 가질 때, 매개변수적 해석방법으로는 다중 첨두를 갖는 확률밀도함수를 해석하는데는 여러 가지 어려움이 따른다. 따라서 이러한 매개변수적 확률분포형을 이용한 빈도해석의 문제점을 해결할 수 있는 비매개변수적 빈도해석이 하나의 대안으로 제시될 수 있다. 본 연구에서는 강우자료의 선별을 통해 신뢰성 있는 자료를 구축하고, 기존의 매개변수를 갖는 확률 분포형을 이용한 지역빈도해석을 적용하여 확률 강우량을 산정하였다. 그리고 동질성분석을 통해 선정된 강우자료에 대해 비매개변수적 지역빈도해석을 적용하여 확률 강우량을 산정하고 각각의 방법에 대한 빈도해석 결과를 비교하여 확률강우량 해석에 있어 하나의 대안을 제시하고자 한다.X>${\mu}_{max,A}$는 최대암모니아 섭취률을 이용하여 구한 결과 $0.65d^{-1}$로 나타났다.EX>$60%{\sim}87%$가 수심 10m 이내에 분포하였고, 녹조강과 남조강이 우점하는 하절기에는 5m 이내에 주로 분포하였다. 취수탑 지점의 수심이 연중 $25{\sim}35m$를 유지하는 H호의 경우 간헐식 폭기장치를 가동하는 기간은 물론 그 외 기간에도 취수구의 심도를 표층 10m 이하로 유지 할 경우 전체 조류 유입량을 60% 이상 저감할 수 있을 것으로 조사되었다.심볼 및 색채 디자인 등의 작업이 수반되어야 하며, 이들을 고려한 인터넷용 GIS기본도를 신규 제작한다. 상습침수지구와 관련된 각종 GIS데이타와 각 기관이 보유하고 있는 공공정보 가운데 공간정보와 연계되어야 하는 자료를 인터넷 GIS를 이용하여 효율적으로 관리하기 위해서는 단계별 구축전략이 필요하다. 따라서 본 논문에서는 인터넷 GIS를 이용하여 상습침수구역관련 정보를 검색, 처리 및 분석할 수 있는 상습침수 구역 종합정보화 시스템을 구축토록 하였다.N, 항목에서 보 상류가 높게 나타났으나, 철거되지 않은 검전보나 안양대교보에 비해 그 차이가 크지 않은 것으로 나타났다.의 기상변화가 자발성 기흉 발생에 영향을 미친다고 추론할 수 있었다. 향후 본 연구에서 추론된 기상변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수 있는 거래전

  • PDF

IRFP-tree(Intersection Rule Based FP-tree): 메모리 효율성을 향상시키기 위해 교집합 규칙 기반의 패러다임을 적용한 FP-tree (IRFP-tree: Intersection Rule Based FP-tree)

  • 이정훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.155-164
    • /
    • 2016
  • 대용량 데이터베이스의 빈도패턴 분석을 위해 기존의 Apriori 방식의 단점을 보완할 수 있는 새로운 트리 기반의 빈도 패턴 분석 알고리즘이 최근 다양하게 연구되고 있다. 그 중 FP-tree는 이러한 빈도 패턴을 분석하기 위해 빈도 패턴을 표현하는 트리 구조로 단 두 번의 전체 데이터베이스 스캔을 통해 빠르게 트리를 구성할 수 있으며 FP-grwoth를 통해 빈도 패턴을 분석할 수 있다. 이처럼 빈도 패턴 트리의 노드 수는 트리 자체의 메모리 할당량과도 연관이 있지만 그 후 growth의 메모리 자원 소비 및 처리 속도에도 영향을 미치게 된다. 따라서 빈도 패턴 트리의 노드 수의 감소는 트리 자체뿐만 아니라 빈도 패턴 분석에 있어서도 매우 중요하다. 하지만 FP-tree는 전체 아이템 수 라는 고정된 기준 문제로 인해 충분한 노드 수의 압축률을 갖지 못하고 있다. 본 논문에서는 이러한 FP-tree의 문제를 보완하여 좀 더 노드 수를 감소시킬 수 있도록 교집합 규칙이라는 새로운 패러다임을 적용한 빈도 패턴 트리인 IRFP-tree를 제시하고 실험을 통해 그 성능에 대해 증명하였다.

다변량 분석 기법을 활용한 동질 지역 구분 (Identification of Homogeneous Regions based on Multivariate Techniques)

  • 남우성;김태순;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1568-1572
    • /
    • 2007
  • 지역빈도해석은 우리나라와 같이 자료 기간이 짧은 경우 지점빈도해석보다 더 정확한 확률강우량을 산정할 수 있는 기법이다. 지역빈도해석을 통한 확률강우량 산정 결과는 수문학적으로 동질한 지역의 구분 결과에 따라 달라진다. 지역을 구분할 때에는 강우에 영향을 미치는 다양한 변수들이 사용될 수 있다. 변수의 유형과 개수가 지역 구분의 효율성을 좌우하기 때문에 활용 가능한 모든 변수들의 정보를 요약할 수 있는 변수들을 선택하는 것이 지역 구분의 효율성 면에서 유리하다고 할 수 있다. 이런 면에서 지역 구분의 효율성을 증대시킬 목적으로 다변량 분석 기법이 활용될 수 있다. 본 연구에서는 주성분 분석, 요인 분석, Procrustes analysis와 같은 다변량 분석 기법을 활용하여 42개의 강우 관련 변수들을 33개의 변수로 줄일 수 있었다. 분석 결과 변수 개수 감소로 인한 정보 손실은 크지 않은 것으로 나타났다. 따라서 이러한 기법에 의한 변수 차원의 축소는 지역 구분의 효율성 향상에 기여할 수 있는 것으로 판단된다. 선정된 변수들을 바탕으로 군집해석을 수행하여 지역을 구분하였고, L-모멘트에 근거한 이질성척도(H)를 활용하여 구분된 지역의 동질성을 검토하였다. 또한 L-모멘트에 근거한 적합성 척도(Z)를 적용하여 구분된 지역에 적합한 확률분포형을 선정하였고, 선정된 적정 확률분포형을 바탕으로 각 지역에 대한 성장 곡선(growth curve)을 유도하였다.

  • PDF

빅데이터 로그분석을 통한 식품영양정보 선호도 분석 (Determining Food Nutrition Information Preference Through Big Data Log Analysis)

  • 송하나;이해정;이헌주
    • 한국식품위생안전성학회지
    • /
    • 제38권5호
    • /
    • pp.402-408
    • /
    • 2023
  • 국내 소비자들의 식품 영양성분에 대한 관심이 계속적으로 증가하고 있지만 영양성분과 관련된 식품의 소비자 선호도 분석 연구는 부족한 실정이다. 본 연구는 대국민 정보 서비스인 식품영양성분 데이터베이스 플랫폼에 수집된 빅데이터의 로그분석을 수행하여 소비자들이 영양학적 측면에서 관심을 가지는 식품에 대한 선호도 결과를 제시하였다. 수집 기간은 2020년 1월부터 2022년 12월까지의 3개년으로 설정하여 총 2,243,168건의 식품명 검색어가 수집되었으며, 식품명을 병합하여 품목대표 식품명으로 가공하였다. 분석도구는 R프로그램을 이용하였으며, 영양정보를 확인하고자 하는 식품명의 검색 빈도를 전체 기간 및 계절별로 분석하였다. 전체 기간 동안 빈도수 분석 결과, 한국인이 일반적으로 자주 섭취하는 쌀밥, 닭고기, 달걀의 빈도수가 가장 높았다. 계절성에 따른 선호도 분석 결과, 봄과 여름에는 대체적으로 국물이 없고 뜨겁지 않은 음식의 빈도수가 높았으며, 가을과 겨울에는 국물이 있고 따뜻한 음식의 빈도수가 높았다. 또한, 외식업체에서 계절식품으로 판매하는 냉면, 콩국수 등과 같은 식품의 빈도수도 계절성을 가지는 것으로 확인되었다. 이러한 결과는 소비자들이 일반적으로 자주 섭취하는 식품의 영양정보에 관심을 가지는 패턴을 확인할 수 있었으며, 소비 트렌드와 간접적인 연관성을 가진다는 점에서 외식업계에서 계절별 마케팅 전략 수립 시 기초 자료로 활용될 수 있을 것으로 기대된다.

극치수문자료의 경향성 분석 개념 및 비정상성 빈도해석 (Concept of Trend Analysis of Hydrologic Extreme Variables and Nonstationary Frequency Analysis)

  • 이정주;권현한;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1448-1452
    • /
    • 2010
  • 최근 기상변동성 증가 및 기후변화 영향으로 수문순환과정이 과거와는 다른 양상으로 전개되고 있으며 전반적으로 극치사상의 빈도 및 강도의 증가현상이 지배적이다. 이러한 영향을 정량적으로 검토하기 위해서 경향성분석 방법 등이 도입되어 극치수문사상의 변동경향을 평가하는데 이용되고 있다. 대표적인 방법으로 선형회귀분석, Mann-Kendall 경향성 분석 등이 있으나 기본적인 가정(assumption)의 제약으로 극치수문자료 계열의 특성을 효과적으로 분석하는데 무리가 있다. 대표적이고 일반적으로 적용되는 선형회귀분석의 경우 자료가 정규분포(normal distribution)의 특성을 가질 때 유효한 방법으로서 극치수문자료와 같이 Heavy Tail를 가지는 분포특성을 표현하는 데는 무리가 따른다. 이밖에도 기존 선형회귀분석을 극치수문자료에 적용할 경우 추정된 결과를 수자원설계의 관심사항인 빈도해석 등에 직접적으로 연계시켜 해석할 수 없는 단점이 있다. 이는 자료계열의 분포특성을 정규분포로 가정하기 때문에 발생하는 문제로서 극치수문자료계열의 분포 특성을 반영할 수 있는 방법론의 개발이 필요하다. 본 연구에서는 이러한 점을 개선하기 위해서 극치분포(extreme distribution)를 선형회귀분석에 적용하는 비정상성빈도해석(nonstationary frequency analysis) 방법론의 개념을 제시하고자 한다. 비정상성빈도해석을 위해서 Bayesian 기법이 도입되며 Bayesian 기법의 특성상 관련변수들이 사후분포(posterior distribution)로 귀결되기 때문에 경향성에 대한 정량적이고 확률적인 분석이 가능한 장점이 있다. 본 연구를 통해 개발된 방법론은 국내외 주요 강수지점에 대해서 적용되며 경향성, 분포특성, 빈도별 강수량에 대한 체계적인 분석이 이루어진다.

  • PDF