• 제목/요약/키워드: Weighting Schemes

검색결과 60건 처리시간 0.021초

용어 가중치부여 기법을 이용한 로치오 분류기의 성능 향상에 관한 연구 (A Study on the Performance Improvement of Rocchio Classifier with Term Weighting Methods)

  • 김판준
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.211-233
    • /
    • 2008
  • 로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부석 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

CONVERGENCE OF MULTISPLITTING METHODS WITH DIFFERENT WEIGHTING SCHEMES

  • Oh, Se-Young;Yun, Jae-Heon;Han, Yu-Du
    • Journal of applied mathematics & informatics
    • /
    • 제30권3_4호
    • /
    • pp.593-602
    • /
    • 2012
  • In this paper, we first introduce a special type of multisplitting method with different weighting scheme, and then we provide convergence results of multisplitting methods with different weighting schemes corresponding to both the AOR-like multisplitting and the SSOR-like multisplitting.

다중 가중치 기법을 이용한 검색 효과의 개선 (Improving Retrieval Effectiveness with Multiple Weighting Schemes)

  • 이준호
    • 정보관리학회지
    • /
    • 제12권2호
    • /
    • pp.213-223
    • /
    • 1995
  • 질의 또는 문서에 대한 상이한 표현 방법 또는 상이한 검색 기법은 서로 다른 집합의 문서들을 검색함이 알려져 왔다. 최근 이러한 특성을 이용하여 다양한 표현 방법 또는 검색 기법을 결합함으로써 보다 높은 검색 효과를 얻을 수 있음이 입증되었다. 본 논문에서는 질의와 문서에 대한 하나의 표현과 하나의 검색 기법하에서 서로 다른 특성을 갖는 가중치 기법을 결합함으로써 보다 높은 검색 효과를 얻을 수 있음을 기술한다. 문서의 형태를 분류하고 가중치 기법의 특성을 기술한 후, 이를 기반으로 하여 서로 다른 특성을 갖는 가중치 기법은 서로 다른 형태의 문서를 검색함을 설명한다. 또한 실험을 통하여 서로 다른 특성을 갖는 가중치 기법을 결합함으로써 보다 높은 검색 효과를 얻을 수 있음을 입증한다.

  • PDF

위상 일치와 가변 지수 감쇠 가중치 부여 방법이 적용된 가상 저음 시스템 (Phase-matched Harmonic Generation and Variable Slope Exponential Weighting for Virtual Bass System)

  • 문현기;박영철;황영수
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.889-898
    • /
    • 2016
  • 가상 저음 시스템은 기본 주파수 성분의 배음을 생성하여 스피커의 저역 재생 대역을 확장하는 방법으로 소형 스피커에 널리 사용된다. 가상 저음 시스템의 주관적인 성능은 배음의 가중치 부여 방법과 관련이 높기 때문에, 기존 연구에서는 지수 감쇠 가중치 부여 방법과 음색 매칭 방법 등 다양한 가중치 부여 방법이 제안되었다. 그러나 생성한 배음과 기존 신호간의 위상을 맞추지 않을 경우 정확한 가중치 부여가 불가능하다. 본 논문에서는 기존 가중치 부여 방법의 한계점을 분석하고 이를 개선한 가중치 부여 방법을 제안하였다. 제안한 방법은 생성한 배음의 위상을 기존신호의 위상과 일치시키고, 기본 주파수에 따라 배음 가중치를 가변적으로 부여하는 방법이다. 기존 가상 저음 시스템과 객관 및 주관 비교 평가를 수행한 결과, 위상 일치 방법은 자연스럽고 효과적인 저역강화에 필수적임을 확인하였으며, 제안한 배음 가중치 부여 방법은 제한된 상황에서 기존 가중치 부여 방법보다 효과적임을 확인하였다.

Latent Semantic Analysis Approach for Document Summarization Based on Word Embeddings

  • Al-Sabahi, Kamal;Zuping, Zhang;Kang, Yang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권1호
    • /
    • pp.254-276
    • /
    • 2019
  • Since the amount of information on the internet is growing rapidly, it is not easy for a user to find relevant information for his/her query. To tackle this issue, the researchers are paying much attention to Document Summarization. The key point in any successful document summarizer is a good document representation. The traditional approaches based on word overlapping mostly fail to produce that kind of representation. Word embedding has shown good performance allowing words to match on a semantic level. Naively concatenating word embeddings makes common words dominant which in turn diminish the representation quality. In this paper, we employ word embeddings to improve the weighting schemes for calculating the Latent Semantic Analysis input matrix. Two embedding-based weighting schemes are proposed and then combined to calculate the values of this matrix. They are modified versions of the augment weight and the entropy frequency that combine the strength of traditional weighting schemes and word embedding. The proposed approach is evaluated on three English datasets, DUC 2002, DUC 2004 and Multilingual 2015 Single-document Summarization. Experimental results on the three datasets show that the proposed model achieved competitive performance compared to the state-of-the-art leading to a conclusion that it provides a better document representation and a better document summary as a result.

기존 도로교의 내진성능향상 방법 선정을 위한 가중치 평가기법 (Weighting-Factored Evaluation Method for Determination of Seismic Retrofitting Schemes for Existing Bridges)

  • 하동호;이지훈;박광순;이용재
    • 한국지진공학회논문집
    • /
    • 제11권3호
    • /
    • pp.43-52
    • /
    • 2007
  • 본 논문에서는 기존 도로교의 합리적이고 일관적인 내진성능향상 방법 선정을 위한 가중치 평가기법을 제안하였다. 한반도의 증가하는 지진위험도를 반영하여, 현재 기존교량의 내진성능향상 작업이 다양한 공법을 이용하여 진행 중이나 최적의 공법을 선정하기 위한 적절한 판단기준이 부재한 형편이다. 이에 제안한 기존가중치 평가기법은 구조적 적합성, 경제성, 환경적 영향, 시공성, 유지관리 측면의 다섯 가지 영향인자의 가중치를 부여하여 최적의 내진 보강방안을 선정하는 방법이다. 제안된 가중치 평가기법을 공용중인 도로교 160개교에 적용한 결과 최고점수는 실제 최종 보강방안과 대부분 일치하여 적절한 가중치로 설정되었다고 판단된다. 제안하는 방법을 기존교량의 내진 보강방안 선정 시에 활용한다면, 사회적 비용을 최소화하는 보다 합리적이고 일관적인 보강이 가능할 것이다.

MB-OFDM UWB 시스템을 위한 반송파 및 샘플링 주파수 오프셋 결합 추정 기법 (Joint Estimation Schemes of Carrier and Sampling Frequency Offsets for MB-OFDM UWB Systems)

  • 조창훈;양석철;신요안
    • 한국통신학회논문지
    • /
    • 제30권10C호
    • /
    • pp.965-975
    • /
    • 2005
  • 본 논문에서는 향후 초고속 W-PAN(Wireless Personal Area Network)을 위한 유력한 전송 기술로서 각광받고 있는 MB-OFDM UWB(Multi-Band Orthogonal Frequency Division Multiplexing Ultra Wide Band) 시스템의 동기화를 위한 효과적인 반송파 및 샘플링 주파수 오프셋 결합 추정 기법을 제시하고 성능을 평가하였다. 이를 위해 PLCP(Physical Layer Convergence Procedure) 프리앰블 내의 채널 추정 시퀀스를 이용하고 MB-OFDM UWB 시스템 기술 규격 및 주파수 운용 방식을 고려하였으며, 반송파와 샘플링 주파수 오프셋을 결합 추정하는 방법으로서 먼저 샘플링 주파수 오프셋을 추정하고 추정된 샘플링 주파수 오프셋을 이용하여 반송파 주파수 오프셋을 추정하는 방식을 적용하였다. 또한 추정된 오프셋 값들의 신뢰도 향상을 위해 각 과정에서 가중치 기반의 주파수 오프셋 추정 기법을 사용하였다. IEEE 802.15 Task Group 3a에서 제공하는 4가지 UWB 실내 채널 모델을 이용한 모의실험 결과, 각 부채널에서의 수신 신호 평균 전력을 반영하는 제안된 간단한 형태의 가중치 기반 추정 기법의 성능이 채널의 주파수 응답을 사용하여 완벽한 채널 추정을 필요로 하는 이상적인 방법에 비해 훨씬 낮은 복잡도로 유사한 성능을 얻을 수 있음을 확인 하였다.

문서 분류를 위한 용어 가중치 기법 비교 (Comparison of term weighting schemes for document classification)

  • 정호영;신상민;최용석
    • 응용통계연구
    • /
    • 제32권2호
    • /
    • pp.265-276
    • /
    • 2019
  • 문서-용어 빈도행렬은 텍스트 마이닝에서 분석하고자 하는 개체 정보를 가지고 있는 일반적인 자료 형태이다. 본 연구에서 문서 분류를 위해 문서-용어 빈도행렬에 적용되는 기존의 용어 가중치인 TF-IDF를 소개한다. 추가하여 최근에 알려진 용어 가중치인 TF-IDF-ICSDF와 TF-IGM의 정의와 장단점을 소개하고 비교한다. 또한 문서 분류 분석의 질을 높이기 위해 핵심어를 추출하는 방법을 제시하고자 한다. 추출된 핵심어를 바탕으로 문서 분류에 있어서 가장 많이 활용된 기계학습 알고리즘 중에서 서포트 벡터 머신을 이용하였다. 본 연구에서 소개한 용어 가중치들의 성능을 비교하기 위하여 정확률, 재현율, F1-점수와 같은 성능 지표들을 이용하였다. 그 결과 TF-IGM 방법이 모두 높은 성능 지표를 보였고, 텍스트를 분류하는데 있어 최적화 된 방법으로 나타났다.

순위가 있는 가중치 평균 방법에서 일정한 수준의 결합력을 갖는 가중치 함수의 성질 및 다기준의사결정 문제에의 활용 (The Ordered Weighted Averaging (OWA) Operator Weighting Functions with Constant Value of Orness and Application to the Multiple Criteria Decision Making Problems)

  • 안병석
    • Asia pacific journal of information systems
    • /
    • 제16권1호
    • /
    • pp.85-101
    • /
    • 2006
  • Actual type of aggregation performed by an ordered weighted averaging (OWA) operator heavily depends upon the weighting vector. A number of approaches have been suggested for obtaining the associated weights. In this paper, we present analytic forms of OWA operator weighting functions, each of which has such properties as rank-based weights and constant value of orness, irrespective of number of objectives aggregated. Specifically, we propose four analytic forms of OWA weighting functions that can be positioned at 0.25, 0.334, 0.667, and 0.75 on the orness scale. The merits for using these weights over other weighting schemes can be mentioned in a couple of ways. Firstiy, we can efficiently utilize the analytic forms of weighting functions without solving complicated mathematical programs once the degree of orness is specified a priori by decision maker. Secondly, combined with well-known OWA operator weights such as max, min, and average, any weighting vectors, having a desired value of orness and being independent of the number of objectives, can be generated. This can be accomplished by convex combinations of predetermined weighting functions having constant values of orness. Finally, in terms of a measure of dispersion, newly generated weighting vectors show just a few discrepancies with weights generated by maximum entropy OWA.

EXTENSION OF AUSMPW+ SCHEME FOR TWO-FLUID MODEL

  • Park, Jin Seok;Kim, Chongam
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제17권3호
    • /
    • pp.209-219
    • /
    • 2013
  • The present paper deals with the extension of AUSMPW+ scheme into two-fluid model for multiphase flow. AUSMPW+ scheme is the improvement of a single-phase AUSM+ scheme by designing pressure-based weighting functions to prevent oscillations near a wall and shock instability after a strong shock. Recently, Kitamura and Liou assessed a family of AUSM-type schemes with two-fluid model governing equations [K. Kitamura and M.-S. Liou, Comparative study of AUSM-Family schemes in compressible multi-phase flow simulations, ICCFD7-3702 (2012)]. It was observed that the direct application of the single-phase AUSMPW+ did not provide satisfactory results for most of numerical test cases, which motivates the current study. It turns out that, by designing pressure-based weighting functions, which play a key role in controlling numerical diffusion for two-fluid model, problems reported in can be overcome. Various numerical experiments validate the proposed modification of AUSMPW+ scheme is accurate and robust to solve multiphase flow within the framework of two-fluid model.