• 제목/요약/키워드: IDF 관계

검색결과 54건 처리시간 0.022초

제한적 강우-지속기간 자료를 이용한 실용적 IDF 관계식의 유도 (A Practical Approach Determining an IDF formula with Limited Rainfall-Duration Data Availability)

  • 성기원
    • 한국수자원학회논문집
    • /
    • 제41권6호
    • /
    • pp.587-595
    • /
    • 2008
  • 지속기간별 강우자료의 보유연한이 충분하지 않은 지역에도 실용적인 적용이 가능한 IDF 관계식을 유도하였다. 이 관계식은 두개의 모형변수와 재현기간으로 구성된 근사식으로서, 지속기간별 강우자료를 통합하고 정규화 하는 변환과정을 통하여 통계적으로 유도되었다. 강우자료의 변환을 위하여 Kruskal-Wallis 통계량과 Manly 변환을 적용하였는데 이 결과 해석적으로 간단한 형식의 IDF 관계식을 얻을 수 있었다. 특히 보유 자료의 수가 제한된 경우 주로 발생하는 짧은 지속기간의 강우강도가 긴 지속기간의 강우강도에 비하여 작아지는 이상 현상을 완화할 수 있는 특징을 보여주었다. 실무적으로 혼란을 주고 있는 산청과 영천의 강우자료에서 발생하는 이상 현상을 처리하기 위하여 제안된 방법론을 적용한 결과 만족스러운 결과를 보여주었다.

공통 Phrase의 관계 그래프와 Suffix Tree 문서 모델을 이용한 문서 군집화 기법 (Document Clustering with Relational Graph Of Common Phrase and Suffix Tree Document Model)

  • 조윤호;이상근
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.142-151
    • /
    • 2009
  • 기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.

관측자료로 구축한 IDF곡선 (Construction of IDF curves on the basis of observation)

  • 강형석;백경록
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.55-55
    • /
    • 2022
  • 수공구조물을 설계하고 수자원 관리 정책을 수립하기 위해 일반적으로 IDF (Intensity-Duration-Frequency) 곡선을 활용한다. 통상 IDF 곡선은 연최대치계열을 통계적으로 분석하여 재현빈도 마다의 적절한 강우강도를 추정하여 결정한다. 신뢰할 수 있는 결과를 산출하기 위해 최소 30년 이상의 정상 강우자료의 통계분석이 권장되나, 긴 재현기간의 최대강우강도는 본질적으로 확률분포 함수로부터 추정한 값이라는 한계가 있다. 한편, 우리나라에서 종관기상관측을 통해 고해상도의 지상관측 강수자료가 장기간 누적되어 관측자료로부터 직접 최대강우강도-지속시간 사이의 관계식을 도출할 수 있게 되었다. 따라서, 실무에서 널리 사용되고 있는 '홍수량 산정 표준 지침'의 확률강우 분석 결과를 오랫동안 관측된 강우자료에서 찾은 최대강우강도와의 비교가 가능해졌다. 본 연구에서는 우리나라에서 50년 이상 강우가 관측된 24개의 지점에 대해 최대강우강도-지속기간 관계식을 분석하였다. 이 결과를 바탕으로 통계적으로 추정한 IDF 곡선이 실제 관측자료에서 나타난 최대강우강도를 얼마나 정확하게 추정하는지 검증해 보았다.

  • PDF

시간 규모 증대에 따른 최대강우강도 변화 (How maximum rainfall intensity varies as the time scale grows?)

  • 강형석;백경록
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.101-101
    • /
    • 2022
  • IDF (Intensity-Duration-Frequency) 곡선에서 익숙하다시피 강우지속시간과 최대강우강도는 반비례한다. 그동안 이러한 관계를 살펴보는 것은 대개 수십 시간의 규모에 그쳤다. 이 연구에서는 과연 시계열에서 시간 규모를 계속 증가시키면서 해당 시간 동안의 최대강우강도가 어떻게 변하는지를 살펴보았다. 가능한 장기간의 강수관측이 이루어진 우리나라 24개 지점을 대상으로 시간 규모를 최장 한 세기까지 키우면서 최대강우강도의 변화를 분석하였다. 작은 시간 규모에서는 그 관계가 멱함수를 따르지만, 시간 규모가 점차 늘어나면서 최대강우강도는 설계 목적의 지속시간 범위에서 결정된 멱함수 또는 기존 IDF 곡선으로부터 외삽하기 어려워진다. 이러한 변화는 점차 정상 연강수량으로 점근하는 결과를 가져온다. 분석된 결과를 토대로 연 단위를 초과하는 지속시간에 걸친 최대강우강도의 감쇄를 적절하게 표현할 수 있는 함수식을 제시하였다.

  • PDF

2-포아송 모형을 이용한 한글 주제어 선정에 관한 연구 (A Study on the Applicability of 2-Poisson Model for Selecting Korean Subject Words)

  • 정영미;최대식
    • 정보관리학회지
    • /
    • 제17권1호
    • /
    • pp.129-148
    • /
    • 2000
  • 최근 구축된 한글 실험문헌 집단을 대상으로 2-포아송 모형의 Z값의 주제어 식별력을 측정하였으며, 역문헌빈도와 2 포아송 모형간의 상관관계를 분석하였다. 이를 위해 Z와 수정 $\beta$값 및 IDF와 수정 TF.IDF 가중치를 하위 실험집단별로 각기 산출, 비교하였다. 실험 결과 Z값의 주제어 선정능력은 3개의 하위 실험집단 가운데 과학기술분야에서만 확인되었다. 2-포아송 모형의 Z값과 역문헌빈도 가중치간의 상관관계 분석에서는 전문(full text)인 여성학분야 실험집단에 비해 초록 및 신문기사와 같이 단문(short text)으로 구성된 과학기술분야 및 일반사회 분야 실험집단에서 상관관계가 더 크게 나타 났다.

  • PDF

연관 관계와 TF*IDF를 이용한 검색 결과 Re-Ranking (Re-ranking for Search result using association relationship and TF*IDF)

  • 이정훈;전서현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.349-352
    • /
    • 2010
  • 질의를 이용한 정보 검색 기술에서 단어 의미의 모호성에 의해 사용자가 검색 하고자 하는 주제 이외의 문서 까지 검색되고 있다. 이러한 문제는 모바일기기의 검색 환경에서 두드러진다. 모바일에서의 검색은 문서의 로딩속도가 느리며 작은 화면에 의해 스크롤이 잦다. 그러므로 원하는 검색 결과가 검색 첫 페이지 이외에 위치하거나, 또는 페이지 하단에 위치할 경우 검색 결과를 확인하는 대에 많은 시간과 노력이 필요하다. 이러한 문제를 해결하기위해선 단어 의미의 모호성을 해결하고 사용자가 검색하고자하는 주제의 검색결과를 검색 상위에 위치시킬 수 있는 방법을 필요로 한다. 이 연구에서는 연관 단어 추출과 TF*IDF를 이용하여, 검색결과를 re-ranking하는 방법을 제시한다.

  • PDF

모포마 분포를 적용한 분단위 강우강도-지속시간-재현기간 관계의 유도 (Derivation of Minutely Rainfall Intensity-Duration-Frequency Relationships by Applying the Moupfouma Distribution)

  • 유철상;박창열;김경준;전경수
    • 한국수자원학회논문집
    • /
    • 제40권8호
    • /
    • pp.643-654
    • /
    • 2007
  • 본 연구에서는 도로나 도시유역에서와 같은 소유역의 배수시스템에서 적정량의 설계 규모를 결정하기 위해 지속시간 10분 이하의 강우강도-지속시간-재현기간 관계를 유도할 수 있는 방안을 제시하고 검토하였다. 본 연구에서 제시하는 방법은 모포마 분포에 근거한 것이며, 그 적용성을 서울지점 자료에 대한 적용을 통해 확인하였다 본 연구의 결과를 정리하면 다음과 같다. (1) 1분단위 강우자료를 이용하여 빈도해석을 수행한 결과 기존 건설교통부 (2000)에 의해 제시된 강우강도식은 분단위로 외삽할 수 없음을 확인하였다. (2) 60분 집성자료를 모포마 분포에 적용하여 추정한 지속시간별 분단위 연최대치 강우계열은 관측된 분단위 연최대치 강우계열의 특성을 적절히 설명할 수 있는 것으로 파악되었다. (3) 60분 집성자료와 시단위 강우자료를 이용하여 모포마 분포에 적용한 IDF 관계의 차이는 미미한 것으로 나타났다.

의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템 (TF-IDF Based Association Rule Analysis System for Medical Data)

  • 박호식;이민수;황성진;오상윤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권3호
    • /
    • pp.145-154
    • /
    • 2016
  • u-Health에 대한 관심과 IT 기술의 발전에 따라 의료 정보를 적극적으로 활용하고자 하는 요구가 커지고 있으며, 이에 대해 텍스트 형태의 의료 정보 데이터에 연관규칙 기법을 적용하여 질병과 증상과의 관계를 추론하는 시스템에 대한 연구들이 이루어지고 있다. 그러나 일반적인 연관규칙 기법을 의료 정보 데이터에 그대로 적용할 경우, 이전에는 새로운 연관규칙들보다 일반적이며 의미없는 연관규칙들이 많이 생성되는 문제가 발생한다. 또한 필터링으로 인해 빈번하게 함께 발생하지는 않지만 의학적으로 의미있는 항목들의 연관 규칙을 발견할 수 없다는 한계점을 가지게 된다. 본 논문에서는 의료데이터 특성을 고려하여 빈번한 항목과 빈번하지 않지만 의학적으로 의미 있는 항목들을 대상으로 연관규칙을 구성하여 의료 전문가의 의사 결정에 도움을 주기 위한 시스템을 제안한다. 제안 시스템은 의료 기록 데이터에서 용어들을 TF-IDF기반으로 가중치를 부여하고 기존 FP-Growth 알고리즘을 확장하여 TF-IDF 가중치를 고려한 빈번하게 발생하거나 빈번하지 않지만 의미 있는 연관규칙을 구성한다. 특정 질의 데이터가 입력되면 해당 데이터에 나타난 연관 규칙들의 유사도를 의학분야 온톨로지를 이용하여 평가하여 해당 데이터의 내용과 관련된 후보 질병들을 추론한다. 추론된 후보 질병명은 의료 전문가에게 의사 결정의 참고 자료로 제공된다. 실제 임상 진료 및 처방 기록 데이터에 대해 제안 시스템을 적용해 본 결과, 본 제안 시스템을 통해 도출한 연관 규칙이 기존 FP-Growth 알고리즘을 적용했을 때 보다 더 구체적인 질병과 증상과의 관계들을 포함함을 확인할 수 있었다. 또한 본 제안 시스템은 자유형식의 의료 및 병리데이터를 마이닝하고 후보 질병들을 가중치 기반으로 보여주므로, 의료 기록 정보로부터 질병 관련 새로운 정보를 획득하고 의료진의 의사 결정에 도움을 주는 시스템으로 활용될 수 있다.

소셜네트워크 기반의 콘텐츠 추천 방법 (Contents Recommendation Method Based on Social Network)

  • ;손종수;정인정
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.279-290
    • /
    • 2011
  • 최근 웹 및 웹 콘텐츠의 양이 폭발적으로 증가함에 따라서 콘텐츠 추천 시스템(CRS, Contents Recommendation System)은 최근 중요한 이슈로 대두되었다. 이에 따라, 콘텐츠 추천 시스템에 대한 콘텐츠 추천 방법(CRM, Contents Recommendation Method)이 꾸준히 연구 및 소개되어 왔다. 그러나 전통적인 CRM들은 콘텐츠 생성자의 위상이 중요하게 여겨지는 웹 2.0 환경에서 활용하는데 부족함이 있다. 본 논문에서는 연결 정도 중심성 분석(Degree of centrality) 및 TF-IDF를 활용하여 양질의 콘텐츠를 추천하는 방법을 제안한다. 이를 위하여 본 논문에서는 RSS와 FOAF를 수집하여 TF-IDF와 연결 정도 중심성을 각각 분석한다. 그리고 분석된 두 값을 이용하여 콘텐츠를 추천한다. 본 논문에서 제안한 방법을 검증하기 위하여 우리는 시스템을 구현하였으며 콘텐츠 추천 결과를 보인다. 본 논문에서 제안한 방법을 사용하면 입력된 질의어에 대해 사용자와 콘텐츠의 관계를 분석하고 이를 통해 적절한 콘텐츠를 추출할 수 있다. 그리고 본 논문에서 제안한 방법을 통해 구축한 시스템은 전통적인 콘텐츠 추천 시스템과 달리 소셜네트워크에서 콘텐츠 생산자에 대한 중요도가 반영됨으로 보다 신뢰성이 있는 결과를 얻을 수있다.

Brassica 쌈샐러드 채소류의 일반성분과 식이섬유소에 관한 연구 (The Composition of Dietary Fiber on Brassica Vegetables)

  • 김대진;김지민;홍상식
    • 한국식품영양과학회지
    • /
    • 제33권4호
    • /
    • pp.700-704
    • /
    • 2004
  • 십자화과 쌈샐러드 9종류에 관한 일반성 분과 구조탄수화물인 식이섬유소류(DFi, TDF, IDF, SDF, NDF, ADF, ADL, CHO, hemicellulose)를 측정하였다. 건물 기준으로 이들 쌈샐러드는 단백질과 조지방 함량이 2∼3배 높았으며 조회분의 경우 7배 가량 곡류보다 높았다. TDF 함유량에 있어서 비타민이 24.26%로 낮았으나 청경채가 47.33%였다. IDF는 비타민이 17.75%로 낮았으며 뉴그린이 26.81%로 높았으나 SDF는 뉴그린이 3.20%로 낮았고 청경채가 23.45%로 매우 높았다. 이들 십자화과 채소류의 상관관계는 TDF와 SDF간에는 Y=0.93X+22.62(r=0.89, p<0.01), TDF와 ADF간에는 Y=0.97X+11.04(r=0.85, p<0.01), TDF와 ADL간의 Y=1.00X+25.47(r=0.72, p<0.05)로 유의한 상관을 나타내었다. 따라서 십자화과 채소류는 화학적방법에 의한 ADF, ADL분석을 통해 TDF의 추정이 가능함이 확인되었다.