• 제목/요약/키워드: 가중치 기법

검색결과 1,640건 처리시간 0.029초

엔트로피 가중치 기법을 적용한 밭 가뭄 취약성 분석 (Field Drought Vulnerability Analysis Using Entropy Weighting Technique)

  • 신형진;이규민;이재남;정기문;하창용;이규상
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.300-300
    • /
    • 2022
  • 가뭄 취약성은 다양한 평가 요소가 반영되는 다기준 구성으로 개념화될 수 있으며 관련하여 수반되는 영향을 집계하여 측정해야 하므로 여러 변수가 제공하는 정보를 통합해야 한다. 따라서 가뭄 취약성 평가의 일반적인 절차에는 (1) 고려할 변수 선택, (2) 가중치 체계 정의 및 (3) 변수 집계가 포함된다. 여기서 가중치 산정은 평가결과에 막대한 영향을 미칠 수 있는 중요한 과정이다. 각 평가 요소는 내재된 의미가 다르기 때문에 모두 동일한 가중치를 가지고 있다고 가정 할 수 없다. 따라서 각 평가 요소별로 영향력을 가늠하는 가중치를 찾는 것이 다기준 평가에서 주요한 연구 분야이다. 본 연구에서는 밭 가뭄 취약성 평가를 위한 평가 요소의 자료로부터 각 요소를 통계적 기법으로 분석하여 평가 결과에 반영함으로써 주관적인 가중치를 적용하는 평가기법에 따른 편향 가능성을 해소하고자 한다. 객관적 가중치 산정기법인 Entropy, PCA 기법을 적용하였다. 평가 결과는 가중치 산정기법에 따라 차이가 발생하였으며 특히 Entropy 가중치의 경우, 다른 방법에 비하여 차이가 많이 나타났으며 이 같은 차이는 Entropy 가중치 산정기법상 정보의 변화량이 많은 평가인자에 과도한 가중치가 반영된 결과로 판단된다. 본 연구에서 제시한 밭 가뭄과 연관되는 지표를 적용하여 가뭄취약성을 평가하는 방안은 각 지역에 내재된 밭 가뭄취약정도를 파악하여 사전에 대응하기 위한 정책 수립 등에 기여할 수 있다.

  • PDF

용어가중치 결합이 검색 효율성에 미치는 영향 연구 (The Impact of Combining Term Wights on Retrieval Effectiveness)

  • 최성환;정영미
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문에서는 데이터 결합 영역에서 문서값을 정규화 하는 기법과 결합함수에 따라 용어가중치 결합이 검색성능에 어떤 영향을 미치는가를 분석하였으며, 특히 용어가중치 결합이 실질적으로 효율적인가를 성능 향상률 측면과 검색시스템의 효율성 측면에서 검증하고, 성능이 향상된 용어가중치 결합의 특징을 분석하였다. 실헙결과 대부분의 장어가중치 결합은 문서값 정규화 기법과 실험집단에 관계없이 높은 성능 향상률을 보이지 않았다. 특히 단일가중치고 높은 검색성능을 보였던 상위 가중치 알고리즘들은 다른 가중치 알고리즘과 결합할 경우 두드러진 성능 향상률을 보이지 않았다. 검색시스템의 효율성 측면에서 용어가중치 결합을 평가한 결과 문헌 내 단어빈도를 최대단어 빈도로 정규화한 가중치 알고리즘이 코사인 정규화 기법을 적용한 가중치 알고리즘들과 결합될 때 5개 실험집안에서 최적 단일가중치 보다 2% 이상 높은 성능을 보였다. 이는 서로 다른 특성을 지니는 용어가중치 알고리즘들이 장단점을 보완하여 검색성능을 향상시킨 수 있다는 것을 의미한다. 그러나 용어가중치 결합의 효율성은 컬렉션과 가중치 알고리즘의 특성에 의존적이었으며, 비록 각 용어가중치 결합의 성능이 높게 나타날지라도 최적의 성능을 보인 달일가중치와 비교하면 그 성능 차이가 미미하거나 낮아서 대부분의 용어가중치 결합이 실질적으로 효과적이지 못하였다.

  • PDF

스트림 데이터에서 동적 가중치를 이용한 순차 패턴 탐사 기법 (A Sequential Pattern Mining based on Dynamic Weight in Data Stream)

  • 최필선;김환;김대인;황부현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권2호
    • /
    • pp.137-144
    • /
    • 2013
  • 순차 패턴 탐사 기법은 순서를 갖는 패턴들의 집합 중에 빈발하게 발생하는 패턴을 탐사하는 기법이다. 순차 패턴 탐사 분야 중에 동적 가중치 순차 패턴 탐사는 가중치가 시간에 따라 변화하는 컴퓨팅 환경에 적용 가능한 탐사 기법으로 동적인 가중치 변화를 탐색 과정에 적용하여 다양한 환경에서 활용 가능하다. 이 논문에서는 다양한 순차 데이터가 들어오는 스트림 환경에서 동적 가중치를 적용하여 빈발한 이벤트들을 탐사하는 새로운 순차 패턴 탐사 기법을 제안한다. 제안하는 기법은 시간 순서에 의한 상대적인 동적 가중치를 사용하여 탐색해야 하는 후보 패턴을 줄여주고 해시 구조를 통한 데이터 입출력으로 빈발한 순차 패턴을 빠르게 탐사할 수 있다. 이 기법을 사용하면 기존 가중치를 적용하는 방식보다 메모리 사용과 처리 시간을 줄여줘 매우 효율적이다. 제안하는 기법은 다른 가중치 순차 패턴 탐사 기법과의 비교를 통해 동적 가중치 탐사 기법의 중요성을 보인다.

동적 가중치를 이용한 효율적인 순차 패턴 탐사 기법 (Efficient Mining of Dynamic Weighted Sequential Patterns)

  • 최필선;강동현;김환;김대인;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1365-1368
    • /
    • 2012
  • 순차 패턴 탐사 기법은 순서를 갖는 패턴들의 집합 중에 빈발하게 발생하는 패턴을 찾아내는 기법이다. 순차 패턴 탐사 분야 중에 동적 가중치 순차 패턴 탐사는 가중치가 시간에 따라 변화하는 컴퓨팅 환경에 적용하는 마이닝 기법으로 동적인 중요도 변화를 마이닝에 적용하여 다양한 환경에서 활용 가능하다. 이 논문에서는 다양한 순차 데이터에서 동적 가중치를 적용하여 순차 패턴을 탐사하는 새로운 시퀀스 데이터 마이닝 기법에 대하여 제안한다. 제안하는 기법은 시간 순서에 의한 상대적인 동적 가중치를 사용하여 탐색해야 하는 후보 패턴을 줄여줄 수 있어 빈발한 시퀀스 패턴을 빠르게 찾을 수 있다. 이 기법을 사용하면 기존 가중치를 적용하는 방식보다 메모리 사용과 처리 시간을 줄여줘 매우 효율적이다.

환경 빅데이터 이슈 분석을 위한 용어 가중치 기법 비교 (Comparison of Term-Weighting Schemes for Environmental Big Data Analysis)

  • 김정진;정한석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.236-236
    • /
    • 2021
  • 최근 텍스트와 같은 비정형 데이터의 생성 속도가 급격하게 증가함에 따라, 이를 분석하기 위한 기술들의 필요성이 커지고 있다. 텍스트 마이닝은 자연어 처리기술을 사용하여 비정형 텍스트를 정형화하고, 문서에서 가치있는 정보를 획득할 수 있는 기법 중 하나이다. 텍스트 마이닝 기법은 일반적으로 각각의 분서별로 특정 용어의 사용 빈도를 나타내는 문서-용어 빈도행렬을 사용하여 용어의 중요도를 나타내고, 다양한 연구 분야에서 이를 활용하고 있다. 하지만, 문서-용어 빈도 행렬에서 나타내는 용어들의 빈도들은 문서들의 차별성과 그에 따른 용어들의 중요도를 나타내기 어렵기때문에, 용어 가중치를 적용하여 문서가 가지고 있는 특징을 분류하는 방법이 필수적이다. 다양한 용어 가중치를 적용하는 방법들이 개발되어 적용되고 있지만, 환경 분야에서는 용어 가중치 기법 적용에 따른 효율성 평가 연구가 미비한 상황이다. 또한, 환경 이슈 분석의 경우 단순히 문서들에 특징을 파악하고 주어진 문서들을 분류하기보다, 시간적 분포도에 따른 각 문서의 특징을 반영하는 것도 상대적으로 중요하다. 따라서, 본 연구에서는 텍스트 마이닝을 이용하여 2015-2020년의 서울지역 환경뉴스 데이터를 사용하여 환경 이슈 분석에 적합한 용어 가중치 기법들을 비교분석하였다. 용어 가중치 기법으로는 TF-IDF (Term frequency-inverse document frquency), BM25, TF-IGM (TF-inverse gravity moment), TF-IDF-ICSDF (TF-IDF-inverse classs space density frequency)를 적용하였다. 본 연구를 통해 환경문서 및 개체 분류에 대한 최적화된 용어 가중치 기법을 제시하고, 서울지역의 환경 이슈와 관련된 핵심어 추출정보를 제공하고자 한다.

  • PDF

홍수위험도 평가인자의 가중치 추정 (Estimation of Weights for Flood Vulnerability Indicators)

  • 이규민;정은성;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.415-415
    • /
    • 2012
  • 유역의 홍수위험도를 평가하기 위하여 선행 연구로서 DPSIR framework를 적용한 인자를 선정하였다. 이때 인자의 범위를 사회적, 경제적, 환경적 분야로 구분하고 각 분야에 대하여 홍수로 인하여 야기되는 유역의 다양한 영향요소를 포함하여 인자를 선정하였다. 본 연구에서는 이를 대상으로 각 인자의 가중치를 선정하기 위하여 패널식 조사연구기법인 Delphi 방법을 적용하였다. Delphi 기법은 델파이 절차가 반복되는 동안 조사 참여자에게 전회의 조사 결과, 즉 통계적 집단 반응을 피드백하며 참여자는 이를 참고하여 자신의 판단을 수정 보완 할 수 있는 방법이다. 따라서 1차 설문조사를 통하여 각 패널은 홍수위험도 평가 인자에 대해서 주관적인 가중치를 선정하고 이를 분석한 결과를 피드백 받아 참고한 후 2차 설문조사에 응하여 가중치를 재선정하게 된다. 조사에 참여할 패널의 선정은 수자원분야의 전문가를 대상으로 하였다. 또한 각 인자에 대한 가중치를 수집하는 방법을 다양하게 설정하여 기법에 따른 영향을 검토하였다. 수집기법은 상대적 가중치 결정법 중에서 가장 많이 사용되는 순위법과 직접입력법, 절대적인 기준에 대한 가중치를 수집하기 위하여 Fuzzy 가중치 입력법을 사용하였으며 이 때 각 인자가 소속되는 분야와 DPSIR framework 요소에 대해서도 별도로 가중치를 수집하여 최종적인 인자의 가중치를 결정하였다. 본 연구는 추가 연구를 통해 남한강에 적용되며 인자의 자료는 문헌조사, 통계자료 조사 및 수리학적 수치모형 등의 분석을 통해 수집될 예정이다. 이를 통하여 사회, 경제, 문화, 환경적인 측면을 고려한 인자들을 반영한 하천의 구간별 상대적 홍수취약도를 정량적으로 제시할 수 있으며 하천 구간별 치수관리 우선순위를 결정하는데 적극적으로 활용될 수 있다.

  • PDF

조사 유형 및 복합명사 인식에 의한 용어 가중치 부여 기법 (Term Weighting Method by Postposition and Compound Noun Recognition)

  • 강승식;이하규;손소현;홍기채;문병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.196-198
    • /
    • 2001
  • 문서의 내용을 대표하는 용어를 추출하기 위해 일반적으로 영어에서는 명사구를 색인하는 기법을 사용하지만 주제어 추출의 관점에서 영어의 명사구가 한국어의 복합명사에 해당하기 때문에 한국어에서는 복합명사 색인 기법을 중요시하고 있다. 본 논문에서는 한글 문서에서 추출된 용어의 가중치를 결정하기 위하여 경험적인 방법에 따라 가중치를 계산하는 방법을 제안한다. 구체적인 가중치 계산 방법으로 용어 자체의 특성에 의한 가중치를 부여한 후에, 복합명사의 경계를 인식하여 띄어쓴 복합명사의 가중치를 조절하고, 다시 용어의 조사 유형에 따라 가중치를 재계산하는 방법을 제안한다. 신문기사에 대한 실험결과에 의하면 제안한 방법이 단순 출현빈도에 의한 주제어 추출 기법보다 정확도가 더 높았다.

  • PDF

혼합 가중치를 적용한 보강토 옹벽의 상태평가항목 가중치 평가 (Weighting Value Evaluation of Condition Assessment Item in Reinforced Earth Retaining Walls by Applying Hybrid Weighting Technique)

  • 이형도;원정훈;성주현
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제21권5호
    • /
    • pp.83-93
    • /
    • 2017
  • 본 연구에서는 보강토 옹벽 점검 자료를 바탕으로 보강토 옹벽의 상태평가항목의 가중치를 새롭게 제안하고 결함점수 및 결함지수를 제안하였다. 161개소의 보강토 옹벽의 점검결과를 근거로 다중회귀분석과 엔트로피 기법을 이용하여 상태평가항목별 가중치를 산정하였으며, 또한 전문가를 대상으로 AHP 기법을 활용하여 평가항목별 가중치를 산정하였다. 각 기법에서 도출된 가중치를 활용하여 혼한 가중치를 제안하였으며, 제안 가중치를 토대로 결함점수 및 결함지수를 제안하여 기존 161개소 현장에 적용하여 현재의 가중치와 제안 가중치에 의한 현장별 위험도 순위를 비교 분석하였다. 다중회귀분석, AHP 기법, 엔트로피 기법을 활용하여 분석한 결과 상태평가항목의 가중치 순위가 변동이 컸으며, 현재 상태평가항목의 가중치와 달리 가중치 순위의 중복은 발생하지 않았다. 특히, 다중회귀분석 결과에서는 특정 상태평가항목이 전체 가중치의 70% 이상을 차지하는 결과가 도출되었다. 제안한 혼합 가중치를 기존 보강토 옹벽 데이터에 적용한 결과, 상태평가항목의 가중치 중복은 발생하지 않았으며, 대상 보강토 옹벽 161 개소 중 16 개소의 위험도 순위 상승과 31 개소의 위험도 하락이 발생하였다.

피벗 역문헌빈도 가중치 기법에 대한 연구 (A Study on the Pivoted Inverse Document Frequency Weighting Method)

  • 이재윤
    • 정보관리학회지
    • /
    • 제20권4호통권50호
    • /
    • pp.233-248
    • /
    • 2003
  • 역문헌빈도 가중치 기법은 문헌 집단에서 출현빈도가 낮을수록 색인어의 중요도가 높다는 가정에 근거하고 있다. 그런데 이는 중간빈도어를 중요하게 여기는 여타 이론과는 일치하지 않는 것이다. 이 연구에서는 저빈도어보다 중간빈도어가 더 중요하다는 가정에 근거하여 역문헌빈도 가중치 공식을 수정한 피벗 역문헌번도 가중치 기법을 제안하였다. 제안된 기법을 검증하기 위해서 세 실험집단을 대상으로 검색실험을 수행한 결과, 피벗 역문헌빈도 가중치기법이 역문헌빈도 가중치 기법에 비해서 특히 검색결과 상위에서의 성능을 향상시키는 것으로 나타났다.

용어 가중치부여 기법을 이용한 로치오 분류기의 성능 향상에 관한 연구 (A Study on the Performance Improvement of Rocchio Classifier with Term Weighting Methods)

  • 김판준
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.211-233
    • /
    • 2008
  • 로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부석 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.