• 제목/요약/키워드: Centroid vector

검색결과 43건 처리시간 0.018초

Modifying linearly non-separable support vector machine binary classifier to account for the centroid mean vector

  • Mubarak Al-Shukeili;Ronald Wesonga
    • Communications for Statistical Applications and Methods
    • /
    • 제30권3호
    • /
    • pp.245-258
    • /
    • 2023
  • This study proposes a modification to the objective function of the support vector machine for the linearly non-separable case of a binary classifier yi ∈ {-1, 1}. The modification takes into account the position of each data item xi from its corresponding class centroid. The resulting optimization function involves the centroid mean vector, and the spread of data besides the support vectors, which should be minimized by the choice of hyper-plane β. Theoretical assumptions have been tested to derive an optimal separable hyperplane that yields the minimal misclassification rate. The proposed method has been evaluated using simulation studies and real-life COVID-19 patient outcome hospitalization data. Results show that the proposed method performs better than the classical linear SVM classifier as the sample size increases and is preferred in the presence of correlations among predictors as well as among extreme values.

중심 벡터에 기반한 신문 기사 요약 (Summarization of News Articles Based on Centroid Vector)

  • 김권양
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.382-385
    • /
    • 2007
  • 본 논문은 "X라는 인물은 누구인가?"와 같은 질의어가 주어질 때, X라는 인물에 대한 나이, 직업, 학력 또는 특정 사건에서 X라는 인물의 역할에 대한 정보를 기술하는 문장을 인식하고 추출함으로써 해당 인물에 대한 신문 기사 내용을 요약하는 방법을 제시한다. 질의어 용어에 대해 가능한 많은 관련 문장을 추출하기 위하여 중심 벡터에 기반한 통계적 방법을 적용하였으며, 정확도와 재현율 성능을 개선하기 위해 위키피디어 같은 외부 지식을 사용한 중심 단어의 개선된 가중치 측도를 적용하였다. 실험 대상인 전자신문 말뭉치 상에서 출현 빈도수가 큰 20 인의 IT 인물에 대해 제안한 방법이 개선된 성능을 보임을 알 수 있었다.

  • PDF

Centroid 위치벡터를 이용한 영상 검색 기법 (A Centroid-based Image Retrieval Scheme Using Centroid Situation Vector)

  • 방상배;남재열;최재각
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.126-135
    • /
    • 2002
  • 영상은 색상, 형태, 위치, 질감 같은 다양한 특성을 갖고 있기 때문에 하나의 특성만을 이용하여 일괄적으로 영상을 검색할 경우, 만족할 만한 검색효율을 얻기가 어렵다. 특히, 대용량의 영상 데이터베이스일수록 그 같은 현상은 빈번하게 일어나기 때문에 기존의 내용 기반 영상 검색 시스템들은 대부분 하나 이상의 특성을 이용하여 검색효율 향상을 죄하고 있다. 본 논문에서는 Centroid 위치벡터를 이용하여 영상 내의 색상 정보뿐만 아니라, 특정 색상에 대한 위치정보를 고려하는 기법을 제안한다. 질의영상의 한 색상에 대해 Centroid 위치벡터를 추출하고 비교영상의 같은 색상의 Centroid 위치벡터와의 거리를 비교하여 그 거리가 짧을수록 각 색상의 위치 유사도를 높게 책정하는 방식을 제안한다. 제안된 검색 기법은 기존의 색상 분포만을 이용하는 검색 기법에 비해, 원근 처리된 영상에 강인하고, 회전되거나 뒤집힌 영상의 변별력이 향상되었다. 또한, 제안된 방식은 색상정보와 위치정보의 추출을 이원화시키지 않고 동시에 추출함으로써 계산량을 줄이고, 효율적인 색인 파일을 생성하여 검색속도를 향상시켰다.

Definition Sentences Recognition Based on Definition Centroid

  • 김권양
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.813-818
    • /
    • 2007
  • This paper is concerned with the problem of recognizing definition sentences. Given a definition question like "Who is the person X?", we are to retrieve the definition sentences which capture descriptive information correspond variously to a person's age, occupation, of some role a person played in an event from the collection of news articles. In order to retrieve as many relevant sentences for the definition question as possible, we adopt a centroid based statistical approach which has been applied in summarization of multiple documents. To improve the precision and recall performance, the weight measure of centroid words is supplemented by using external knowledge resource such as Wikipedia and redundant candidate sentences are removed from candidate definitions. We see some improvements obtained by our approach over the baseline for 20 IT persons who have high document frequency.

점진적 중심 갱신을 이용한 deep support vector data description 기반의 온라인 비정상 탐지 알고리즘 (Online anomaly detection algorithm based on deep support vector data description using incremental centroid update)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.199-209
    • /
    • 2022
  • 일반적인 비정상 탐지 알고리즘은 사전 데이터를 이용하여 학습된다. 따라서 시간에 따른 정상 데이터의 특징이 변화되는 경우에 기존의 배치 학습 기반 알고리즘의 성능 저하가 불가피하다. 본 논문에서는 정상 데이터의 점진적 특징 변화를 고려할 수 있는 온라인 비정상 탐지 알고리즘을 제안한다. 제안하는 알고리즘은 단일 클래스 분류 모델에 기반하며 오프라인 및 온라인 단계의 학습 과정을 포함한다. 제안된 알고리즘의 오프라인 학습 단계에서는 사전 데이터가 잠재 공간의 중심에 근접하도록 학습하고, 이후 온라인 학습단계에서는 신규 데이터에 의한 점진적 잠재 공간의 중심을 갱신하고, 갱신된 중심을 기준으로 계속 학습을 진행한다. 공개된 수중 음향 데이터를 이용한 실험결과 제안된 온라인 비정상 탐지 알고리즘은 점진적 중심 갱신 및 학습을 위해 단지 2 % 정도의 추가 학습시간이 소요되는 것으로 확인되었다. 반면에 시변 정상데이터가 수신되는 경우에 오프라인 학습 모델과 비교하여 19.10 % 개선된 Area Under the receiver operating characteristic Curve(AUC) 성능을 보였다.

Morphological Feature Extraction of Microorganisms Using Image Processing

  • Kim Hak-Kyeong;Jeong Nam-Su;Kim Sang-Bong;Lee Myung-Suk
    • Fisheries and Aquatic Sciences
    • /
    • 제4권1호
    • /
    • pp.1-9
    • /
    • 2001
  • This paper describes a procedure extracting feature vector of a target cell more precisely in the case of identifying specified cell. The classification of object type is based on feature vector such as area, complexity, centroid, rotation angle, effective diameter, perimeter, width and height of the object So, the feature vector plays very important role in classifying objects. Because the feature vectors is affected by noises and holes, it is necessary to remove noises contaminated in original image to get feature vector extraction exactly. In this paper, we propose the following method to do to get feature vector extraction exactly. First, by Otsu's optimal threshold selection method and morphological filters such as cleaning, filling and opening filters, we separate objects from background an get rid of isolated particles. After the labeling step by 4-adjacent neighborhood, the labeled image is filtered by the area filter. From this area-filtered image, feature vector such as area, complexity, centroid, rotation angle, effective diameter, the perimeter based on chain code and the width and height based on rotation matrix are extracted. To prove the effectiveness, the proposed method is applied for yeast Zygosaccharomyces rouxn. It is also shown that the experimental results from the proposed method is more efficient in measuring feature vectors than from only Otsu's optimal threshold detection method.

  • PDF

Ear Recognition by Major Axis and Complex Vector Manipulation

  • Su, Ching-Liang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1650-1669
    • /
    • 2017
  • In this study, each pixel in an ear is used as a centroid to generate a cake. Subsequently the major axis length of this cake is computed and obtained. This obtained major axis length serves as a feature to recognize an ear. Later, the ear hole is used as a centroid and a 16-circle template is generated to extract the major axis lengths of the ear. The 16-circle template extracted signals are used to recognize an ear. In the next step, a ring-to-line mapping technique is used to map these major axis lengths to several straight-line signals. Next, the complex plane vector computing technique is used to determine the similarity of these major axis lengths, whereby a solution to the image-rotating problem is achieved. The aforementioned extracted signals are also compared to the ones that are extracted from its neighboring pixels, whereby solving the image-shifting problem. The algorithm developed in this study can precisely identify an ear image by solving the image rotation and image shifting problems.

준감독 학습 알고리즘을 위한 능동적 레이블 데이터 선택 (Active Selection of Label Data for Semi-Supervised Learning Algorithm)

  • 한지호;박은해;박동철;이윤식;민수영
    • 전기전자학회논문지
    • /
    • 제17권3호
    • /
    • pp.254-259
    • /
    • 2013
  • 본 논문에서는 준감독 학습 알고리즘(Semi-Supervised Learning Algorithm)의 학습데이터에 필요한 소수의 레이블 데이터를 능동적으로 선택하기 위한 무감독경쟁학습 알고리즘인 VCNN(Vector Centroid Neural Network)을 제안한다. 준감독 학습 알고리즘에서 레이블 데이터의 선택은 학습 결과 큰 영향을 미치고, 레이블 데이터를 선택하는데 있어 많은 비용과 전문적인 지식이 필요하다. 본 논문에서 능동적이고 효율적인 레이블 데이터 선택을 검증하기 위하여 UCI database 와 caltech dataset 을 이용하여 실험한 결과, 기존의 레이블 데이터 선택 방법과 비교하여 안정된 분류 결과와 최소의 오차율을 나타냈다.

신경망에 의한 테두리를 보존하는 영상압축 (Edge Preserving Image Compression with Weighted Centroid Neural Network)

  • 박동철;우영준
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1946-1952
    • /
    • 1999
  • 무지도 경쟁학습을 이용하여 압축된 영상의 복원 후에 나타나는 테두리부분의 손상을 최소화하기 위한 영상압축 방법이 제안되었다. 제안된 영상압축방법은 영상데이터에서 테두리부분에 해당하는 데이터의 기하학적인 특징을 이용하는데, 영상데이터의 통계학적인 특성을 함께 이용하여 기존의 Centroid Neural Network을 일반화시키는 무지도 경쟁학습에 의하여 자동적으로 더욱 많은 code vector를 테두리부분에 배정함으로서 압축된 영상의 복원 후에 나타나는 테두리부분의 손상을 초소화하게 한다. 실험 결과, 기존의 SOM, M-SOM, M/R-CNN등과 비교하여 제안된 방법에 의해 압축된 영상의 복원된 테두리 부분에서 PSNR이 약 2dbv정도 향상된 결과를 보여줄 수 있었다.

  • PDF

Bhattacharyya 커널을 적용한 Centroid Neural Network (Centroid Neural Network with Bhattacharyya Kernel)

  • 이송재;박동철
    • 한국통신학회논문지
    • /
    • 제32권9C호
    • /
    • pp.861-866
    • /
    • 2007
  • 본 논문은 가우시안 확률분포함수 (Gaussian Probability Distribution Function) 데이터 군집화를 위해 중심신경망 (Centroid Neural Network, CNN)에 Bhattacharyya 커널을 적용한 군집화 알고리즘 (Bhattacharyya Kernel based CNN, BK-CNN)을 제안한다. 제안된 BK-CNN은 무감독 알고리즘인 중심신경망을 기반으로 하고 있으며, 커널 방법을 이용하여 데이터를 특징공간에서 투영한다. 입력공간의 비선형 문제를 선형적으로 해결하기 위해 제안한 커널 방법인데, 확률분포 사이의 거리측정을 위해 Bhattacharyya 거리를 이용한 커널방법을 사용하였다. 제안된 BK-CNN을 영상데이터 분류의 문제에 적용했을 때, 제안된 BK-CNN 알고리즘이 Bhattacharyya 커널을 적용한 k-means, 자기조직지도(Self-Organizing Map)와 중심 신경망등의 기존 알고리즘보다 1.7% - 4.3%의 평균 분류정확도 향상을 가져옴을 확인할 수 있었다.