• 제목/요약/키워드: weighted similarity

검색결과 129건 처리시간 0.023초

도합유사도를 이용한 한국어 문서요약 시스템 (A Korean Text Summarization System Using Aggregate Similarity)

  • 김재훈;김준홍
    • 인지과학
    • /
    • 제12권1_2호
    • /
    • pp.35-42
    • /
    • 2001
  • 본 논문에서 문서는 문서관계도라고 하는 가중치 그래프로 표현된다. 노드는 문서의 구성요소인 문장을 명사벡터로 표현하고, 링크는 노드들 간의 의미적인 관계를 표현하며 의미적 유사도를 가중치로 가지고 있다. 한 노드의 인접한 노드를 사이의 유사도 합을 도합유사도라고 하며, 이를 문서에서 문장의 중요도로 간주한다. 본 논문에서는도합유사도를 이용한 한국어 문서요약 시스템을 기술한다. 실험에 사용된 평가용 요약문서는 정보처리관련 분야에서 수집된 논문 100편과 KORDIC에서 구축한 신문기사 105건을 이용하였다. 문서요약 시스템에 의해서 생상된 요약문서와 크기가 본문의 20%이고 평가용 요약문서가 논문(서론과 결론)일 경우, 재현율과 정확률은 각각 46.6%와 76.9%를 보였으며, 또한 평가용 요약문서가 신문기사일 경우, 재현율과 정확률은 각각 30.5%과 42.3%를 보였다.

  • PDF

워드넷을 이용한 문서내에서 단어 사이의 의미적 유사도 측정 (Semantic Similarity Measures Between Words within a Document using WordNet)

  • 강석훈;박종민
    • 한국산학기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.7718-7728
    • /
    • 2015
  • 단어 사이의 의미적 유사성은 많은 분야에 적용 될 수 있다. 예를 들면 컴퓨터 언어학, 인공지능, 정보처리 분야이다. 본 논문에서 우리는 단어 사이의 의미적 유사성을 측정하는 문서 내의 단어 가중치 적용 방법을 제시한다. 이 방법은 워드넷의 간선의 거리와 깊이를 고려한다. 그리고 문서 내의 정보를 기반으로 단어 사이의 의미적 유사성을 구한다. 문서 내의 정보는 단어의 빈도수와 단어의 의미 빈도수를 사용한다. 문서 내에서 단어 마다 단어 빈도수와 의미 빈도수를 통해 각 단어의 가중치를 구한다. 본 방법은 단어 사이의 거리, 깊이, 그리고 문서 내의 단어 가중치 3가지를 혼합한 유사도 측정 방법이다. 실험을 통하여 기존의 다른 방법과 성능을 비교하였다. 그 결과 기존 방법에 대비하여 성능의 향상을 가져왔다. 이를 통해 문서 내에서 단어의 가중치를 문서 마다 구할 수 있다. 단순한 최단거리 기반의 방법들과 깊이를 고려한 기존의 방법들은, 정보에 대한 특성을 제대로 표현하지 못했거나 다른 정보를 제대로 융합하지 못했다. 본 논문에서는 최단거리와 깊이 그리고 문서 내에서 단어의 정보량까지 고려하였고, 성능의 개선을 보였다.

DWW 알고리즘을 적용한 고속 가중 FDNN의 설계 (Design of high speed weighted FDNN applied DWW algorithm)

  • 이철희;변오성;문성룡
    • 전자공학회논문지C
    • /
    • 제35C권7호
    • /
    • pp.101-108
    • /
    • 1998
  • In this paper, after we got to realized FDNN (fuzzy decision neural network) applied the quantization triangularity fuzzy function to DBNN(decision based neural network) of a hierarchical structure for image process, we could esign hardware of the realized FDNN. Also it is normalized the standard image and the input image as the same size. We are applied DWW algorithm which selected the closest value with finding similarity of an interval image by this distance to FDNN. So we could calulated in terms of distance to weight of pixel which composed two image and eliminated the nise of image, minimized the lost of information, obtained the optimal information. It is designed hardware of high speed weighted FDNN using COMPASS tool. Aslo, the total circuit is realized as gates of 61,000 and could show to superiority of FDNN using the simulation.

  • PDF

프로토타입 R/F 흉부 디지털 단층영상합성장치 시스템에서 잘림 아티팩트 감소를 위한 가중 정규화 접근법에 대한 연구 (Truncation Artifact Reduction Using Weighted Normalization Method in Prototype R/F Chest Digital Tomosynthesis (CDT) System)

  • 손준영;최성훈;이동훈;김희중
    • 한국방사선학회논문지
    • /
    • 제13권1호
    • /
    • pp.111-118
    • /
    • 2019
  • 흉부 디지털 단층영상합성장치는 기존 DR의 낮은 깊이 해상도, CT의 높은 피폭선량 문제를 해결할 수 있는 획기적인 영상장치로 대두되고 있다. 그러나 제한된 스캔 각도로 인해 프로젝션이 X 선 소스 동작 방향으로 흉부를 완전히 포함 할 수 없어 재구성 된 슬라이스의 위, 아래 방향 경계를 따라 강도의 불연속성이 발생하게 되는데 이러한 현상을 잘림 아티팩트 (Truncation artifact)라고 한다. 이 연구의 목적은 가중 정규화 접근법을 사용하여 잘림 아티팩트를 줄이고 리스템에서 개발한 프로토 타입 흉부 디지털 단층영상합성장치 시스템에 대한 이 접근법의 성능을 평가하는 것이다. 이 시스템의 source-to-image distance는 1100 mm 이고 X 선원의 회전 중심은 검출기 표면에서 100mm 위로 설정되었다. LUNGMAN 팬텀을 사용하여 ${\pm}20^{\circ}$의 투영 뷰를 $1^{\circ}$ 간격으로 41장을 얻은 후, filtered back projection 알고리즘으로 재구성했다. 정량적 평가를 위하여 시뮬레이션을 이용하여 기준영상을 재구성 후 peak signal to noise ratio와 structure similarity index 값을 평가하였으며 실제 실험 데이터를 이용하여 mean value of specific direction 값을 평가하였다. 시뮬레이션 결과로 아티팩트 보정 전 일반적인 filtered back projection 알고리즘으로 재구성 한 영상과 비교하여 peak signal to noise ratio값과 structure similarity index값 모두 각각 증가하였으며, 실제 실험 재구성 영상의 mean value of specific direction 결과는 아티팩트의 영향이 감소됨을 확인할 수 있었다. 결론적으로, 가중 정규화 방법은 잘림 아티팩트를 줄임으로써 진단의 어려움을 발생시키는 가능성을 개선시킬 수 있는 방법으로 사료된다.

고의서에 나타난 경혈과 병증의 연관성 측정 및 시각화 - 침구자생경 분석 예를 중심으로 - (Measure of the Associations of Accupoints and Pathologies Documented in the Classical Acupuncture Literature)

  • 오준호
    • Korean Journal of Acupuncture
    • /
    • 제33권1호
    • /
    • pp.18-32
    • /
    • 2016
  • Objectives : This study aims to analyze the co-occurrence of pathological symptoms and corresponding acupoints as documented by the comprehensive acupuncture and moxibustion records in the classical texts of Far East traditional medicine as an aid to a more efficient understanding of the tacit treatment principles of ancient physicians. Methods : The Classic of Nourishing Life with Acupuncture and Moxibustion(Zhenjiu Zisheng Jing; hereinafter ZZJ) was selected as the primary reference book for the analysis. The pathology-acupoint co-occurrence analysis was performed by applying 4 values of vector space measures(weighted Euclidean distance, Euclidean distance, $Cram\acute{e}r^{\prime}s$ V and Canberra distance), which measure the distance between the observed and expected co-occurrence counts, and 3 values of probabilistic measures(association strength, Fisher's exact test and Jaccard similarity), which measure the probability of observed co-occurrences. Results : The treatment records contained in ZZJ were preprocessed, which yielded 4162 pathology-acupoint sets. Co-occurrence was performed applying 7 different analysis variables, followed by a prediction simulation. The prediction simulation results revealed the Weighted Euclidean distance had the highest prediction rate with 24.32%, followed by Canberra distance(23.14%) and association strength(21.29%). Conclusions : The weighted Euclidean distance among the vector space measures and the association strength among the probabilistic measures were verified to be the most efficient analysis methods in analyzing the correlation between acupoints and pathologies found in the classical medical texts.

도심지역 LTE 측위를 위한 Fingerprinting 기법의 W-KNN Correlation 기술에 따른 성능 분석 (Performance Analysis of Fingerprinting Method for LTE Positioning according to W-KNN Correlation Techniques in Urban Area)

  • 권재욱;조성윤
    • 한국전자통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1059-1068
    • /
    • 2021
  • 도심지역에서 GPS(Global Positioning System)/GNSS(Global Navigation Satellite System) 신호는 건물과 같은 구조물에 의해 차단되거나 왜곡되어 위치추정에 한계가 존재한다. 이 문제를 보완하기 위해 본 논문에서는 LTE 신호의 RSRP(Reference Signal Received Power) 정보를 사용한 Fingerprinting 기법으로 측위를 수행하고자 한다. Fingerprinting의 측위 단계에서 많이 사용되는 W-KNN(Weighted - K Nearest Neighbors) 기법은 Correlation 시 사용되는 유사도 거리 계산 방법과 가중치 적용 방법 등에 따라 다른 측위 성능의 결과를 생성한다. 본 논문에서는 Correlation 시 사용되는 기법들에 따른 Fingerprinting 측위 성능을 실 데이터 기반으로 비교 분석하고자 한다.

A Heuristic Methodology for Fault Diagnosis using Statistical Patterns

  • Kwon, Young-il;Song, Suh-ill
    • 품질경영학회지
    • /
    • 제21권2호
    • /
    • pp.17-26
    • /
    • 1993
  • Process fault diagnosis is a complicated matter because quality control problems can result from a variety of causes. These causes include problems with electrical components, mechanical components, human errors, job justification errors, and air conditioning influences. In order to make the system run smoothly with minimum delay, it is necessary to suggest heuristic remedies for the detected faults. Hence, this paper describes a heuristic methodology of fault diagnosis that is performed using statistical patterns generated by quality characteristics The proposed methodology is described briefly as follows: If a sample pattern generated by random variables is similar to the number of prototype patterns, the sample pattern may be matched by any prototype pattern among them to be resembled. This concept is based on the similarity between a sample pattern and the matched prototype pattern. The similarity is calculated as the weighted average of squared deviation, which is expressed as the difference between the relative values of standard normal distribution to be transformed by the observed values of quality characteristics in a sample pattern and the critical values of the corresponding ones in a matched prototype pattern.

  • PDF

바코드 신호의 강인한 복원 (Robust Restoration of Barcode Signals)

  • 이한아;이정태
    • 전기학회논문지
    • /
    • 제56권10호
    • /
    • pp.1859-1864
    • /
    • 2007
  • Existing barcode signal restoration algorithms are not robust to unmodeled outliers that may exist in scanned barcode images due to scratches, dirts, etc. In this paper, we describe a robust barcode signal restoration algorithm that uses the hybrid $L_1-L_2$ norm as a similarity measure. To optimze the similarity measure, we propose a modified iterative reweighted least squares algorithm based on the one step minimization of a quadratic surrogate function. In the simulations and experiments with barcode images, the proposed method showed better robustness than the conventional MSE based method. In addition, the proposed method converged quickly during optimization process.

An Inference Similarity-based Federated Learning Framework for Enhancing Collaborative Perception in Autonomous Driving

  • Zilong Jin;Chi Zhang;Lejun Zhang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권5호
    • /
    • pp.1223-1237
    • /
    • 2024
  • Autonomous vehicles use onboard sensors to sense the surrounding environment. In complex autonomous driving scenarios, the detection and recognition capabilities are constrained, which may result in serious accidents. An efficient way to enhance the detection and recognition capabilities is establishing collaborations with the neighbor vehicles. However, the collaborations introduce additional challenges in terms of the data heterogeneity, communication cost, and data privacy. In this paper, a novel personalized federated learning framework is proposed for addressing the challenges and enabling efficient collaborations in autonomous driving environment. For obtaining a global model, vehicles perform local training and transmit logits to a central unit instead of the entire model, and thus the communication cost is minimized, and the data privacy is protected. Then, the inference similarity is derived for capturing the characteristics of data heterogeneity. The vehicles are divided into clusters based on the inference similarity and a weighted aggregation is performed within a cluster. Finally, the vehicles download the corresponding aggregated global model and train a personalized model which is personalized for the cluster that has similar data distribution, so that accuracy is not affected by heterogeneous data. Experimental results demonstrate significant advantages of our proposed method in improving the efficiency of collaborative perception and reducing communication cost.

An Interval Valued Bidirectional Approximate Reasoning Method Based on Similarity Measure

  • Chun, Myung-Geun
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 The Third Asian Fuzzy Systems Symposium
    • /
    • pp.579-584
    • /
    • 1998
  • In this work, we present a method to deal with the interval valued decision making systems. First, we propose a new type of equality measure based on the Ordered Weighted Averaging (OWA) operator. The proposed equality measure has a structure to render the extreme values of the measure by choosing a suitable weighting vector of the OWA operator. From this property, we derive a bidirectional fuzzy inference network which can be applied for the decisionmaking systems requiring the inverval valued decisions.

  • PDF