• 제목/요약/키워드: 유사도 계수

검색결과 1,785건 처리시간 0.032초

문헌 클러스터링을 위한 유사계수간의 연관성 측정 (A Measurement of Relationship among Similarity Coefficients for Document Clustering)

  • 한승희;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.25-28
    • /
    • 1999
  • 자동분류나 정보검색에 주로 이용되는 문헌 클러스터링에서는 문헌간의 유사성을 측정하기 위해 다양한 유사계수를 이용하는데, 모든 유사계수가 동일한 클러스터링 결과를 가져오는 것은 아니다. 본고에서는 50건의 신문기사를 대상으로 SPSS 통계 패키지를 이용하여 다양한 유사계수에 각각 달라지는 문헌 클러스터링의 결과를 살펴본 후, 유사계수간의 연관성을 측정하였다.

  • PDF

비평형 유사이송 모의를 위한 적응거리계수 산정 공식 비교 (Comparison of adaptation length coefficient equations for nonequilibrium sediment transport simulation)

  • 정안철;김성원;안현욱;장창래;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.76-76
    • /
    • 2018
  • 하천에서의 유사이송과 하상변동을 분석하는 대표적인 방법으로는 현장에서 유사량이나 하상고를 측정하여 분석하는 실측에 의한 방법, 수리모형 실험과 수치모형을 이용하는 방법이 있다. 이 중에서 실측에 의한 방법은 시간과 비용의 한계로 수치해석모형을 이용한 연구가 많이 이루어 지고 있다. 현재까지 개발된 다양한 하상변동 수치모형들은 유사이송 상태를 평형 유사이송 상태를 가정하고 개발되어 왔다. 평형 유사이송은 흐름과 하상재료 등의 조건이 발생시킬 수 있는 유사이송능력과 실제 유사이송률이 동일하다고 가정하는 것이다. 그러나, 실제 유사이송에서는 흐름 및 지형 등의 변화에 따라서 지속적으로 새롭게 형성되는 유사이송능력에 실제 유사이송률이 빠르게 도달하지 못하면서 유사이송능력과 유사이송률 사이에 시 공간의 격차가 발생하게 된다. 이러한 상황을 비평형 유사이송이라고 하며 지속적인 하상 상승 및 저하가 발생하는 구간, 댐과 같은 구조물에 의해서 유사의 연속성이 차단되는 구간, 하상재료가 불연속한 구간 등에서 주로 발생하는 것으로 알려져 있다. 비평형 유사이송을 수학적으로 모의하기 위한 대표적인 방법에는 적응거리계수와 회복계수를 이용하는 방법이 있다. 위의 계수들은 흐름 및 하상 특성을 이용하여 공간에 대한 유사이송의 지체현상을 고려하는 방법으로 이를 산정하기 위한 다양한 공식들이 제시되고 있다. 그러나, 각 공식들에 의해서 제시되는 값에 많은 차이가 있는 것으로 알려져 있다. 본 연구에서는 실내실험과 수치실험을 통해서 평형/비평형 유사이송 및 집중형/분포형 적응거리계수를 고려한 모의 결과를 비교하였으며, 적응거리계수 산정공식에 따른 비평형 유사이송 모의 결과를 비교하였다. 본 연구에서 적용한 실내실험에 대해서는 평형 유사이송보다는 비평형 유사이송을 고려한 경우와 비평형 유사이송 공식을 이용하여 적응거리계수를 분포형 매개변수로 이용하는 경우가 실제 하상변동 모의 결과에 더 근접한 수치실험 결과를 제공하는 것으로 나타났다.

  • PDF

SWAT 모형의 하천 유사량 모의에 대한 문제점 분석 (Analysis of Sediment Out Problem in SWAT Modeling)

  • 최용훈;양동석;박상준;박운지;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.417-417
    • /
    • 2021
  • 복합 토지이용 유역의 수문 모형에서 중요한 것은 큰 강우량이 발생하는 시점에서의 유출량과 유사량이다. SWAT 모형도 이와 같은 부분이 중요한 요소로 작용하는데 이는 모형의 평가가 실측값에 대한 예측값의 결정계수(Coefficient of determination, r2) 또는 Nash-Sutcliffe efficiency(NSE)와 같이 큰 값의 영향이 큰 지수들로 모형의 적합성을 평가하기 때문이다. 수질오염총량제와 같이 유역에서 발생하는 총량을 평가할 때는 강우로 인해 발생하는 유출과 수질뿐만 아니라 평시에 유출에 대한 수질도 중요한 부분이 될 수 있으나 모형의 평가에서 반영되기 어려우므로 실측값과 매우 다른 경향을 나타내는 경우가 많다. SWAT 모형에서는 하천 유사량에 사용되는 계수가 모든 상황에 일괄적으로 적용되기 때문에 과대 평가되는 경향이 있다. 본 연구에서는 SWAT 모형의 비강우시 하천 유사량 모의에 대한 부분이 강우시 하천 유사량에 미치는 영향을 분석하였다. SWAT 모형에서 하천 유출량과 관련된 계수를 확정하고, 하천 유사량과 보정에 사용되는 변수 중에서 prf 계수를 평시와 강우시 다른 계수 적용하여 하천 유사량 변화에 대한 SWAT 모형의 반응을 확인하였다. 지표면 유출과 관련된 변수는 변화하지 않으므로 하천에 유입되는 유사량은 항상 같다고 가정하면, 특정 강우 조건에서의 하천 유사량은 변화하지 않아야 하지만 SWAT 모형에서는 평시 유사량에 따라 달라지는 경향이 나타났다. 이는 평시 prf 계수가 낮아질 때 하천을 통해 유역 밖으로 배출되는 유사량이 감소하였기 때문에 특정 강우 조건에서 유사량이 달라진 것으로 해석될 수 있다. 또한 현재 SWAT 모형은 지표면 유출로 유입되는 유사량 일부가 퇴적되기 때문에 평시에 실제보다 높은 농도로 예측되는 경향도 나타났다. 이러한 문제들을 해결하기 위하여 지표면 유출로 발생하는 유사의 하천 퇴적량을 최소화하고, prf 계수를 강우반응에 대해 변동성을 부여하는 등 비강우시에도 실측과 비슷한 수준의 유사량이 모의 될 수 있도록 SWAT 모형을 개선하고 있다.

  • PDF

유사계수에 따른 전역적 질의확장 검색 성능 비교 (Comparing the Performance of Global Query Expansion according to Similarity Measures)

  • 이재윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.526-528
    • /
    • 2003
  • 공기빈도를 이용한 전역적 질의확장 검색에서 공기유사도를 판정하는데 이용되는 유사계수의 특성에 따른 질의확장 성능을 비교해보았다. 먼저 각 유사계수의 통계적인 특성을 말뭉치와 검색실험 문서집단을 대상으로 살펴본 결과 코사인 계수, 자카드 계수는 고빈도어 선호경향을 보이고 상호정보량과 율의 Y는 저빈도어 선호경향을 보이는 것으로 나타났다. 질의확장 검색실험에서는 고빈도어 선호경향을 가진 유사계수에 비해서 저빈도어 선호경향을 가진 유사계수률 이용할 때 더 종은 성능이 나타났다. 특히 율의 Y는 질의어의 DF가 1에 가깝게 매우 낮을 때 다른 유사계수와 달리 고빈도어를 선호함으로써 항상 저빈도어를 선호하는 상호정보량에 비해서 질의확장 검색에 유리함을 알 수가 있었다.

  • PDF

내성천 유역의 강우-유출-토양침식-유사이송 모의를 위한 분포형 모형의 민감도 분석 및 매개변수 평가 (Sensitivity Analysis and Parameter Evaluation of a Distributed Model for Rainfall-Runoff-Soil Erosion-Sediment Transport Modeling in the Naesung Stream Watershed)

  • 정원준;지운
    • 한국수자원학회논문집
    • /
    • 제47권12호
    • /
    • pp.1121-1134
    • /
    • 2014
  • 유사발생 잠재성 및 토양침식으로 인한 유사발생 위험성이 높은 것으로 평가된 내성천유역을 대상으로 강우-유출-토양침식-유사이송으로 이어지는 유역단위의 분포형 모형을 구축하였으며 유출과 유사농도 모의 결과에 주요한 영향을 미치는 조도계수 및 투수계수의 민감도 분석을 실시하였다. 모의결과, 내성천유역의 토지 피복이 숲인 지역의 조도계수를 0.4에서 0.45로 변경하여 지표수 유출 유속을 감소시킴으로써 향석 지점에서의 유출곡선에 미치는 영향을 분석하였으나 유출수문곡선의 변화에 영향을 미치지 않는 것으로 나타났으며 평균 유사농도 값과 유사농도의 범위에 있어서도 모의 결과가 근소하게 증가하나 유의한 변화는 없는 것으로 나타났다. 투수계수에 대한 민감도 분석 결과, 투수계수 값을 저감 시킬수록 총 유출량 및 첨두 유출량은 점차 증가하는 것으로 나타났다. 유사농도 모의의 경우에도 투수계수를 저감시킬수록 모든 지점에서 평균 유사농도 및 유량에 따른 유사농도 범위가 증가하였으며, 향석 지점의 경우 투수계수를 50% 저감하였을 때 유사 농도 모의 값이 유량-유사량 관계식에 의해 계산된 값과 가장 근사한 것으로 나타났다.

OPAC에서 자동분류 열람을 위한 계층 클러스터링 연구 (Hierarchic Document Clustering in OPAC)

  • 노정순
    • 정보관리학회지
    • /
    • 제21권1호
    • /
    • pp.93-117
    • /
    • 2004
  • 본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

다차원 명암도 증감 기반 효율적인 영상정합 (An Efficient Image Registration Based on Multidimensional Intensity Fluctuation)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제22권3호
    • /
    • pp.287-293
    • /
    • 2012
  • 본 논문에서는 영상의 다차원 명암도 증감에 기반을 둔 유사도 측정에 의한 효율적인 영상정합 방법을 제안하였다. 여기서 다차원 명암도는 영상의 4방향을 고려한 유사성 판정으로 영상이 가지는 속성을 더욱 더 많이 반영하기 위함이고, 명암도 증감은 인접 픽셀간의 밝기변화를 고려함으로써 좀 더 포괄적으로 유사성을 측정하기 위함이다. 또한 측정된 4방향 각각의 명암도 증감에 대한 정규상호상관계수를 구하고, 그 각각에 바탕을 둔 전체 정규상호상관계수, 각 방향의 상관계수에 대한 산술평균과 단순 곱 및 최대값으로 정규화된 상관계수의 산술평균과 단순 곱으로 정의된 유사도 계수로 각각 정합을 측정하였다. 제안된 방법을 22개의 243*243 픽셀 얼굴영상과 9개의 500*500 픽셀 인물영상을 대상으로 각각 실험한 결과, 영상의 속성을 잘 반영한 우수한 정합성능이 있음을 확인하였다. 특히 각 방향의 상관계수에 대한 산술평균 유사도가 가장 우수한 신뢰성을 가지는 정합척도임을 알 수 있었다.

이변량 반복측정자료에서 가중일치상관계수의 추정

  • 강보경;김규성
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.261-266
    • /
    • 2000
  • 이변량 반복측정자료에서 Chinchilli 등(1996)이 제안한 가중일치상관계수는 두 변수의 일치성을 나타내는 측도이다. 기존에 제안된 가중일치상관계수 추정법은 변동효과 및 측정오차의 분산성분을 각각 최소제곱법으로 비편향 추정하여 구하는 것이다. 본 연구에서는 반복측정자료의 주변 우도함수를 설정한 후, 우도함수에 기초한 분산성분을 구하여 가중일치상관계수를 추정하는 방법을 제안한다. 이때, 각 분산성분은 유사/의사 우도함수 및 사후 분포에서 반복시행을 통하여 구해진다.

  • PDF

GRM의 매개변수 민감도 분석 (Sensitive Analysis of GRM Parameter)

  • 최윤석;김경탁
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1114-1118
    • /
    • 2010
  • 본 연구에서는 HyGIS(Hydro Geographic Information System) 환경에서 구동되는 물리적 분포형 모형인 GRM(Grid based Rainfall-runoff Model) 모형(HyGIS-GRM)에서 사용자에 의해 추정되는 주요 매개변수인 초기포화도, 하도 최소경사, 하도 조도계수에 대한 민감도를 분석하고, 모형의 보정을 위한 각 매개변수의 추정 과정을 고찰하였다. 매개변수 민감도 평가는 초기포화도, 하도 최소경사, 하도 조도계수를 대상으로 각각을 기준 값에서 ${\pm}2%$ 간격으로 ${\pm}10%$까지 변화시킨 후 이를 유출모의에 적용하고, 첨두유량, 첨두시간 및 총유출량의 변화를 검토하였다. 민감도 분석 결과 초기포화도는 첨두유량, 첨두시간 및 총유출량에 대해서 모두 가장 민감한 것으로 평가되었다. 하도 조도계수는 첨두시간에 대해서는 초기포화도와 유사한 민감도를 나타내었으며, 첨두유량과 총유출량에 대해서는 상대적으로 작은 민감도를 나타내었다. 하도 최소경사는 첨두시간에 대해서는 초기포화도 및 하도 조도계수와 유사한 민감도를 나타내었으며, 첨두유량에 대해서는 하도 조도계수와 유사한 민감도를 나타내었다. 그러나 총유출량에 대해서는 민감도가 매우 작은 것으로 평가되었다.

  • PDF

Applying Different Similarity Measures based on Jaccard Index in Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.47-53
    • /
    • 2021
  • 희소한 평가 데이터는 사용자들 간의 신뢰할만한 유사도 산출을 저해하기 때문에 추천 시스템을 위한 메모리 기반의 협력 필터링 기법의 성능을 저하시킨다. 기존 연구의 많은 결과물은 이 데이터 희소성 문제를 해결하기 위해 개발되었으며, 가장 단순하고 대표적인 업적은 자카드 계수를 활용하는 방법들이다. 이 계수는 두 사용자의 공통 평가 항목수를 반영하며, 그들 간의 유사도를 보다 정확하게 계산하기 위해 전통적인 유사도 척도와 통합된다. 그러나, 그러한 통합은 데이터 희소성의 정도를 고려하지 않은 매우 단순한 방법이다. 본 연구는 두 사용자의 자카드 계수값에 의거하여 다른 유사도 척도를 적용하는 새로운 아이디어를 제시한다. 제안 방법에서 사용하는 파라미터의 최적값을 구하기 위하여 성능 실험을 진행하였고, 다른 관련된 방법들과 비교 평가하였다. 결과로서, 제안 방법은 예측 정확도와 추천 정확도에 있어서 가장 우수하거나 대등한 성능을 보였다.