• 제목/요약/키워드: 가중치

검색결과 5,196건 처리시간 0.04초

용어가중치 결합이 검색 효율성에 미치는 영향 연구 (The Impact of Combining Term Wights on Retrieval Effectiveness)

  • 최성환;정영미
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문에서는 데이터 결합 영역에서 문서값을 정규화 하는 기법과 결합함수에 따라 용어가중치 결합이 검색성능에 어떤 영향을 미치는가를 분석하였으며, 특히 용어가중치 결합이 실질적으로 효율적인가를 성능 향상률 측면과 검색시스템의 효율성 측면에서 검증하고, 성능이 향상된 용어가중치 결합의 특징을 분석하였다. 실헙결과 대부분의 장어가중치 결합은 문서값 정규화 기법과 실험집단에 관계없이 높은 성능 향상률을 보이지 않았다. 특히 단일가중치고 높은 검색성능을 보였던 상위 가중치 알고리즘들은 다른 가중치 알고리즘과 결합할 경우 두드러진 성능 향상률을 보이지 않았다. 검색시스템의 효율성 측면에서 용어가중치 결합을 평가한 결과 문헌 내 단어빈도를 최대단어 빈도로 정규화한 가중치 알고리즘이 코사인 정규화 기법을 적용한 가중치 알고리즘들과 결합될 때 5개 실험집안에서 최적 단일가중치 보다 2% 이상 높은 성능을 보였다. 이는 서로 다른 특성을 지니는 용어가중치 알고리즘들이 장단점을 보완하여 검색성능을 향상시킨 수 있다는 것을 의미한다. 그러나 용어가중치 결합의 효율성은 컬렉션과 가중치 알고리즘의 특성에 의존적이었으며, 비록 각 용어가중치 결합의 성능이 높게 나타날지라도 최적의 성능을 보인 달일가중치와 비교하면 그 성능 차이가 미미하거나 낮아서 대부분의 용어가중치 결합이 실질적으로 효과적이지 못하였다.

  • PDF

퍼지 가중치 평균 분류기를 위한 통계적 정보 기반의 가중치 설정 방안 (Weight Adjustment Methods Based on Statistical Information for Fuzzy Weighted Mean Classifiers)

  • 신상호;조재현;우영운
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.25-30
    • /
    • 2009
  • 패턴 인식에서 분류기 모형으로 많이 사용되는 퍼지 가중치 평균 분류기는 가중치를 적절히 설정함으로써 뛰어난 분류 성능을 얻을 수 있다는 장점이 있다. 그러나 일반적으로 가중치는 인식 문제 분야의 특성이나 해당 전문가의 지식이나 주관적 경험을 기반으로 설정되므로 설정된 가중치의 일관성과 객관성을 보장하기가 어려운 문제점을 갖고 있다. 따라서 이 논문에서는 퍼지 가중치 평균 분류기의 가중치를 설정하기 위한 객관적 기준을 제시하기 위하여 특징값들 간의 통계적 정보를 이용한 가중치 설정 기법들을 제안하였다. 제안한 기법들을 이용하여 UCI machine learning repository 사이트에서 제공되는 표준 데이터들 중의 하나인 Iris 데이터 세트를 이용하여 실험하고 그 결과를 비교, 분석하였다.

  • PDF

XML 태그 분류에 따른 가중치 결정 (The eight decision which it follows in XML tag classification)

  • 정혜진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.703-706
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

  • PDF

EBP 신경망 학습에서의 동적 초기 가중치 선택에 관한 연구 (A Study on Analysis of Dynamic Generation of Initial Weights in EBP Learning)

  • 김태훈;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.35-38
    • /
    • 2006
  • 다층 퍼셉트론(MLP) 학습 이론인 오류 역전파 알고리즘은 델타룰과 최급 하강법을 사용하기 때문에 학습시 많은 시간이 소요된다는 단점을 가지고 있다. 때문에 신경망에서의 잘못된 초기 가중치 선택은 오류 역전파 알고리즘을 사용하는 신경망에서의 현격한 학습 성능저하를 발생시키게 된다. 본 논문에서는 학습시 오류 역전파 알고리즘의 수렴시간을 개선하기 위한 신경망의 동적 초기 가중치 선택 알고리즘을 제안한다. 이 알고리즘은 학습전 기존의 선택 가중치와 모든 가중치가 1.0 또는 -1.0 값을 가지는 가중치 집합에서 가중치 변동률을 선측정하여 이들 중 가장 변동률이 큰 경우를 초기 가중치 집합으로 선정하게 된다. 즉, 초기의 가중치 변동률을 차후 성능을 판단하는 지표로 사용하여 잘못된 가중치 선택으로 인한 최악의 학습효율의 가능성을 배제시키고 다층 신경망의 학습특성상 평균 이상의 학습효율을 보장하는 초기 가중치 선택방법이다.

  • PDF

자연언어 질의 문장의 용어 가중치 부여 기법 (Term Weighting Method for Natural Language Query Sentence)

  • 강승식;이하규;손소현;문병주;홍기채
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

엔트로피 가중치 기법을 적용한 밭 가뭄 취약성 분석 (Field Drought Vulnerability Analysis Using Entropy Weighting Technique)

  • 신형진;이규민;이재남;정기문;하창용;이규상
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.300-300
    • /
    • 2022
  • 가뭄 취약성은 다양한 평가 요소가 반영되는 다기준 구성으로 개념화될 수 있으며 관련하여 수반되는 영향을 집계하여 측정해야 하므로 여러 변수가 제공하는 정보를 통합해야 한다. 따라서 가뭄 취약성 평가의 일반적인 절차에는 (1) 고려할 변수 선택, (2) 가중치 체계 정의 및 (3) 변수 집계가 포함된다. 여기서 가중치 산정은 평가결과에 막대한 영향을 미칠 수 있는 중요한 과정이다. 각 평가 요소는 내재된 의미가 다르기 때문에 모두 동일한 가중치를 가지고 있다고 가정 할 수 없다. 따라서 각 평가 요소별로 영향력을 가늠하는 가중치를 찾는 것이 다기준 평가에서 주요한 연구 분야이다. 본 연구에서는 밭 가뭄 취약성 평가를 위한 평가 요소의 자료로부터 각 요소를 통계적 기법으로 분석하여 평가 결과에 반영함으로써 주관적인 가중치를 적용하는 평가기법에 따른 편향 가능성을 해소하고자 한다. 객관적 가중치 산정기법인 Entropy, PCA 기법을 적용하였다. 평가 결과는 가중치 산정기법에 따라 차이가 발생하였으며 특히 Entropy 가중치의 경우, 다른 방법에 비하여 차이가 많이 나타났으며 이 같은 차이는 Entropy 가중치 산정기법상 정보의 변화량이 많은 평가인자에 과도한 가중치가 반영된 결과로 판단된다. 본 연구에서 제시한 밭 가뭄과 연관되는 지표를 적용하여 가뭄취약성을 평가하는 방안은 각 지역에 내재된 밭 가뭄취약정도를 파악하여 사전에 대응하기 위한 정책 수립 등에 기여할 수 있다.

  • PDF

가중 8진트리를 이용한 가중치 지역에 대한 최적경로설정 (3D Path-Planning for Weighted-Regions by Weighted-Octree Method)

  • 임상석;이창규;황주영;박규호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.440-442
    • /
    • 1999
  • 본 논문에서는 가중치 3차원 공간을 가중치 8진트리를 이용하여 나타낸다. 가중치 8진트리는 가중치 영역을 계층적으로 나타내고 용이하게 분해능을 조절할 수 있게 한다. 즉 높은 가중치를 갖는 공간은 세밀하게 분해하고 낮은 가중치를 갖는 공간은 성길하게 분해하여 최적의 경로설정을 바른 시간에 할 수 있도록 한다. 이러한 8진트리를 바탕으로 하여 최적 경로 설정하는 종합틀(Framework)을 제시하고 실험을 통하여 그 결과를 제시한다.

  • PDF

한국어 정보검색에서의 복합명사 가중치 부여 방법 및 평가 (Weighting Methods and their Evaluations for Compound Nouns in Korean Text Retrieval)

  • 김지영;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.157-162
    • /
    • 2001
  • 한국어의 경우 띄어쓰기의 자유로움과 명사들이 비교적 자유롭게 결합하여 새로운 복합명사(compound noun)를 형성한다. 따라서, 정보검색에서 복합명사를 적절하게 처리하게 되면 검색 효율을 향상시킬 수 있다. 본 논문에서는 질의에 포함된 단일명사, 복합명사, 그리고 복합명사를 이루는 구성명사의 적절한 가중치 부여 방법에 대하여 기술한다. 일반적인 tf*idf가중치 방법은 문서 내 빈도수(tf)만을 강조하여 문서 내 발생빈도가 낮은 복합명사의 경우 낮은 가중치를 갖는다. 반대로, 역문헌 빈도수(idf)로 인해 복합명사가 단일명사보다 높은 가중치를 갖게 되면 단일명사의 가중치를 지나치게 떨어뜨려 검색 성능을 저하시킨다. 이런 문제를 해결하기 위해서 복합명사의 통계적인 특성을 고려하고, 복합명사를 이루는 구성명사의 적절한 가중치 사용과 tf*idf 변화 범위에 따른 파라메터를 이용하였다. 결과적으로 본 논문에서는 질의 색인어의 종류에 따라 가중치를 달리 부여함으로써 검색 성능을 향상시킬 수 있는 가중치 부여 방법을 제시하고 검증 실험을 통해 유효성을 제시했다는 점에서 그 의의가 있다고 하겠다.

  • PDF

퍼지 집합의 소속함수에 대한 가중치 함수와 비퍼지화에서의 적용 (Weight Function on the Fuzzy Set membership and its Application to the Defuzzification)

  • 정성원;이광형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.331-333
    • /
    • 2001
  • 본 논문에서는 퍼지집합의 소속함수에 대한 가중치 함수를 제안한다. 제안하는 가중치 함수는 퍼지집합의 소속함수에 곱해지는 형태로서 적용되어지며, 이것은 소속함수에 대한 사용자의 선호도를 의미한다. 제안하는 가중치 함수의 개념은 기본적으로 소속함수를 사용하는 어떤 퍼지 집합의 응용에서도 적용될 수 있을 것으로 보이나, 본 논문에서는 그 중 한가지 경우로 비퍼지화 방법을 적용 대상으로 선택하였다. 제안하는 가중치 함수가 비퍼지화 방법에 있어서 가지는 의미를 보이며, 기존의 비퍼지화 방법들에서 이러한 가중치 함수의 개념이 어떻게 적용되어 왔는지를 보인다. 또한 기존의 비퍼지화 방법들이 개녀멩 적용되지 않은 형태의 가중치 함수를 선택하여, 비퍼지화 방법에 특정 가중치 함수를 적용하였을 때의 특성 변화를 보인다. 이러한 일반적인 형태의 가중치 함수를 퍼지집합의 소속함수에 적용함으로서, 다양한 형태의 선호도를 퍼지집합의 형태에 반영할 수 있을 것으로 보인다.

  • PDF

홍수위험도 평가인자의 가중치 추정 (Estimation of Weights for Flood Vulnerability Indicators)

  • 이규민;정은성;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.415-415
    • /
    • 2012
  • 유역의 홍수위험도를 평가하기 위하여 선행 연구로서 DPSIR framework를 적용한 인자를 선정하였다. 이때 인자의 범위를 사회적, 경제적, 환경적 분야로 구분하고 각 분야에 대하여 홍수로 인하여 야기되는 유역의 다양한 영향요소를 포함하여 인자를 선정하였다. 본 연구에서는 이를 대상으로 각 인자의 가중치를 선정하기 위하여 패널식 조사연구기법인 Delphi 방법을 적용하였다. Delphi 기법은 델파이 절차가 반복되는 동안 조사 참여자에게 전회의 조사 결과, 즉 통계적 집단 반응을 피드백하며 참여자는 이를 참고하여 자신의 판단을 수정 보완 할 수 있는 방법이다. 따라서 1차 설문조사를 통하여 각 패널은 홍수위험도 평가 인자에 대해서 주관적인 가중치를 선정하고 이를 분석한 결과를 피드백 받아 참고한 후 2차 설문조사에 응하여 가중치를 재선정하게 된다. 조사에 참여할 패널의 선정은 수자원분야의 전문가를 대상으로 하였다. 또한 각 인자에 대한 가중치를 수집하는 방법을 다양하게 설정하여 기법에 따른 영향을 검토하였다. 수집기법은 상대적 가중치 결정법 중에서 가장 많이 사용되는 순위법과 직접입력법, 절대적인 기준에 대한 가중치를 수집하기 위하여 Fuzzy 가중치 입력법을 사용하였으며 이 때 각 인자가 소속되는 분야와 DPSIR framework 요소에 대해서도 별도로 가중치를 수집하여 최종적인 인자의 가중치를 결정하였다. 본 연구는 추가 연구를 통해 남한강에 적용되며 인자의 자료는 문헌조사, 통계자료 조사 및 수리학적 수치모형 등의 분석을 통해 수집될 예정이다. 이를 통하여 사회, 경제, 문화, 환경적인 측면을 고려한 인자들을 반영한 하천의 구간별 상대적 홍수취약도를 정량적으로 제시할 수 있으며 하천 구간별 치수관리 우선순위를 결정하는데 적극적으로 활용될 수 있다.

  • PDF