• Title/Summary/Keyword: 가중치법

Search Result 604, Processing Time 0.029 seconds

A Research on Enhancement of Text Categorization Performance by using Okapi BM25 Word Weight Method (Okapi BM25 단어 가중치법 적용을 통한 문서 범주화의 성능 향상)

  • Lee, Yong-Hun;Lee, Sang-Bum
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.12
    • /
    • pp.5089-5096
    • /
    • 2010
  • Text categorization is one of important features in information searching system which classifies documents according to some criteria. The general method of categorization performs the classification of the target documents by eliciting important index words and providing the weight on them. Therefore, the effectiveness of algorithm is so important since performance and correctness of text categorization totally depends on such algorithm. In this paper, an enhanced method for text categorization by improving word weighting technique is introduced. A method called Okapi BM25 has been proved its effectiveness from some information retrieval engines. We applied Okapi BM25 and showed its good performance in the categorization. Various other words weights methods are compared: TF-IDF, TF-ICF and TF-ISF. The target documents used for this experiment is Reuter-21578, and SVM and KNN algorithms are used. Finally, modified Okapi BM25 shows the most excellent performance.

Estimation of Missing Rainfall Data Considering Spatio-Temporal Variation Using Radar Data (레이더 자료를 이용한 시공간적 변동성을 고려한 강우의 결측치 추정)

  • Song, Chang-U;Song, Chang-Joon;Kim, Byeong-Sik;Kim, Soo-Jun;Kim, Hung-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2010.05a
    • /
    • pp.1196-1200
    • /
    • 2010
  • 본 논문에서는 지점 강우의 결측치를 추정하기 위해 전통적인 통계학적 내삽기법을 이용한 역거리가중치법(IDWM), 역지수가중치법(IEWM), 상관계수가중치법(CCWM)과 패턴 인식의 일종인 인공신경망(ANN)기법 그리고 시공간적 강우분포의 측정이 가능한 레이더 자료를 이용해 결측치를 추정하여 각각의 방법을 비교하였다. 임진강 유역의 15개 지상관측소를 대상으로 교차검정(Cross validation) 분석을 실시해 본 결과, CCWM 방법과 ANN기법에 의한 RMSE가 0.46~1.79의 범위를 보였고, 보정레이더를 이용하여 결측치를 추정한 경우RMSE가 0.05~2.26의 범위를 보여 기존의 전통적 결측치 추정방법보다 실측치에 가까운 결과를 보였다. 이는 레이더자료가 지점 강우자료와는 달리 강우의 시공간적 변동성을 고려한 공간분포의 정보를 지니고 있기 때문인 것으로 판단된다.

  • PDF

Estimation of Weights for Flood Vulnerability Indicators (홍수위험도 평가인자의 가중치 추정)

  • Lee, Gyu-Min;Chung, Eun-Sung;Jun, Kyung-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.415-415
    • /
    • 2012
  • 유역의 홍수위험도를 평가하기 위하여 선행 연구로서 DPSIR framework를 적용한 인자를 선정하였다. 이때 인자의 범위를 사회적, 경제적, 환경적 분야로 구분하고 각 분야에 대하여 홍수로 인하여 야기되는 유역의 다양한 영향요소를 포함하여 인자를 선정하였다. 본 연구에서는 이를 대상으로 각 인자의 가중치를 선정하기 위하여 패널식 조사연구기법인 Delphi 방법을 적용하였다. Delphi 기법은 델파이 절차가 반복되는 동안 조사 참여자에게 전회의 조사 결과, 즉 통계적 집단 반응을 피드백하며 참여자는 이를 참고하여 자신의 판단을 수정 보완 할 수 있는 방법이다. 따라서 1차 설문조사를 통하여 각 패널은 홍수위험도 평가 인자에 대해서 주관적인 가중치를 선정하고 이를 분석한 결과를 피드백 받아 참고한 후 2차 설문조사에 응하여 가중치를 재선정하게 된다. 조사에 참여할 패널의 선정은 수자원분야의 전문가를 대상으로 하였다. 또한 각 인자에 대한 가중치를 수집하는 방법을 다양하게 설정하여 기법에 따른 영향을 검토하였다. 수집기법은 상대적 가중치 결정법 중에서 가장 많이 사용되는 순위법과 직접입력법, 절대적인 기준에 대한 가중치를 수집하기 위하여 Fuzzy 가중치 입력법을 사용하였으며 이 때 각 인자가 소속되는 분야와 DPSIR framework 요소에 대해서도 별도로 가중치를 수집하여 최종적인 인자의 가중치를 결정하였다. 본 연구는 추가 연구를 통해 남한강에 적용되며 인자의 자료는 문헌조사, 통계자료 조사 및 수리학적 수치모형 등의 분석을 통해 수집될 예정이다. 이를 통하여 사회, 경제, 문화, 환경적인 측면을 고려한 인자들을 반영한 하천의 구간별 상대적 홍수취약도를 정량적으로 제시할 수 있으며 하천 구간별 치수관리 우선순위를 결정하는데 적극적으로 활용될 수 있다.

  • PDF

A Study on Weighted Spectral Subtraction Using Adaptive Threshold In Car Noise Environment (차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구)

  • 전선도
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.185-188
    • /
    • 1998
  • 실제의 음성 인식 및 음성 통신 등의 음성 처리 시스템에서는 음성 신호를 손상시키는 배경 잡음 신호의 존재로 그 성능이 많이 저하된다. 특히 차량 내와 같은 잡음이 극심한 상황에서는 전처리 부분에서 이러한 잡음을 제거시켜 주어야한다. 본 연구는 자동차 내의 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성 정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 추정하는 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법 사용의 전제 조건은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재한다. 이러한 이유에서 본 연구는 잡은 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화하는 차감법을 제안한다. 이러한 방법은 추정된 잡음 신호의 변화율을 이용하여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 정용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

A Study on Weighted Spectral Subtraction Using Adaptive Threshold in Car Noise Environment (차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구)

  • 전선도;강철호;김종찬;김순협
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.8
    • /
    • pp.73-77
    • /
    • 1998
  • 본 연구는 자동차내 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재 한다. 이러한 이유는 본 연구는 잡음 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화시키는 차감법을 제안한다. 이 방법은 추정된 잡음 신호의 변화율을 이용하 여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 적용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

The Comparison of Estimation Methods for the Missing Rainfall Data with spatio-temporal Variability (시공간적 변동성을 고려한 강우의 결측치 추정 방법의 비교)

  • Kim, Byung-Sik;Noh, Hui-Seong;Kim, Hung-Soo
    • Journal of Wetlands Research
    • /
    • v.13 no.2
    • /
    • pp.189-197
    • /
    • 2011
  • This paper reviewed application of data-driven method, distance-weighted method(IDWM, IEWM, CCWM, ANN), and radar data method estimated of missing raifall data. To evaluate these methods, statistics was compared using radar and station rainfall data from Imjin-river basin. The range of RMSE values calculated for CCWM, ANN was 1.4 to 1.79mm, and the range of RMSE values estimated data used for radar rainfall data was 0.05 to 2.26mm. Spatial characteristics is considered to Radar rainfall data rather than station rainfall data. Result suggest that estimated data used for radar data can impove estimation of missing raifall data.

Determining of Weighting Factor for Two-Point Interpolation Filters (2-점 보간법 필터에서의 가중치 결정)

  • Ha, Mi Ryeong;Yoo, Hoon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.11a
    • /
    • pp.217-219
    • /
    • 2013
  • 본 논문은 다양한 값의 가중치간 적용한 두 포인트 보간 필터를 제안한다. 기존 방법은 선행 보간 필터에 변형 함수와 가중치를 적용한 일반선행 보간 공식을 이용해 영상의 화질을 향상시켰지만 제안된 보간법은 일반 선형 보간 공식에 가중치 값을 다양하게 적용하여 2 점 보간법에서 실질적인 가중치 결정을 제공한다. 실험 결과에서는 제안된 방법이 기존 보간법보다 더 우수한 성능을 보여주는 것을 알 수 있다.

  • PDF

RMS-AV 검파 방식과 가전기기 적용에 대한 고려

  • Kim, In-Seok;Jo, Hui-Gon;An, Hui-Seong
    • The Proceeding of the Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.22 no.1
    • /
    • pp.52-62
    • /
    • 2011
  • 본고에서는 최근 디지털 통신 시스템에 대한 국제 표준으로 도입된 RMS-AV 가중치 측정법을 CISPR F쪽으로의 도입 문제가 거론되는 상황에서 현존하는 가중치 측정법에 관련된 기본적인 내용을 검토하고, 참고문헌 [13]에서 제시하였던 방법을 이용하여 와인 냉장고와 두 종류의 전기 드릴에 대하여 RMS-AV 가중치 측정법을 전도성 방출 특성과 복사성 방출 특성을 AM 방송 송출시, 방송 중단 시, 차폐 실내 등의 다양한 환경에서 측정하여 EMI 수신기에서 적용되고 있는 가중치를 실험적으로 비교하였다. 비교 결과, 다양한 가중치 측정법이 동일한 결과를 제시하지 못하여 RMS-AV 측정법이 CISPR F쪽으로의 도입은 좀 더 연구가 필요한 주제로 판단되었고, 결론 부분에서 RMS-AV 측정법에 대한 여러 가지 문제점을 고려해 보았다.

Adaptive Linear Interpolation Using the New Distance Weight and Local Patterns (새로운 거리 가중치와 지역적 패턴을 고려한 적응적 선형보간법)

  • Kim, Tae-Yang;Jeon, Yeong-Gyun;Jeong, Je-Chang
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.31 no.12C
    • /
    • pp.1184-1193
    • /
    • 2006
  • Image interpolation has been widely used and studied in the various fields of image processing. There are many approaches of varying complexity and robustness. In this paper, a new distance weight is proposed for the conventional linear interpolation. In comparison with the conventional linear weight, the new distance weight uses a quadratic or cubic polynomial equation to reflect that the interpolated value should be influenced more by the value of closer pixels in an input image. In this paper, the new adaptive linear (NAL) interpolation, which considers patterns near the interpolated value, is also proposed. This algorithm requires a pattern weight, which is used to determine the ratio of reflection on local patterns, to obtain an interpolated image that exhibits better quality at various magnification factors (MF). In the computer simulation, not only did the NAL interpolation exhibit much lower computational complexity than conventional bicubic interpolation, it also improved peak signal-to-noise ratios (PSNR).

A Study on the Effect of the Relation-by-Item of the Computer Audit to the Quantification (전산감리의 항목별 연관관계가 계량화에 미치는 영향에 관한 연구)

  • 신승중;김현수
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.435-444
    • /
    • 1999
  • 현재까지 연구되고 있던 정보보호관련분야의 계량화방법을 좀 더 다른 방법으로 접근하여, 정보시스템 환경 하에서 보안 및 관리 운영 평가 지수에 계량화하여 1차 집단과 2차 집단간의 차이를 연구하였다. 정보화 관련항목에 대하여 빈도 분석을 적용함으로서 군별, 항목별 분류를 통한 항목 비례 가중치법을 산출하였다. 또한, 선지정 가중치법을 이용하여, 보호지수와 관리운용지수에 따른 상관관계를 조사하여 안전관리 지수를 계량화하였다.

  • PDF