• 제목/요약/키워드: Support Vectors

검색결과 169건 처리시간 0.03초

Text Classification Using Parallel Word-level and Character-level Embeddings in Convolutional Neural Networks

  • Geonu Kim;Jungyeon Jang;Juwon Lee;Kitae Kim;Woonyoung Yeo;Jong Woo Kim
    • Asia pacific journal of information systems
    • /
    • 제29권4호
    • /
    • pp.771-788
    • /
    • 2019
  • Deep learning techniques such as Convolutional Neural Networks (CNNs) and Recurrent Neural Networks (RNNs) show superior performance in text classification than traditional approaches such as Support Vector Machines (SVMs) and Naïve Bayesian approaches. When using CNNs for text classification tasks, word embedding or character embedding is a step to transform words or characters to fixed size vectors before feeding them into convolutional layers. In this paper, we propose a parallel word-level and character-level embedding approach in CNNs for text classification. The proposed approach can capture word-level and character-level patterns concurrently in CNNs. To show the usefulness of proposed approach, we perform experiments with two English and three Korean text datasets. The experimental results show that character-level embedding works better in Korean and word-level embedding performs well in English. Also the experimental results reveal that the proposed approach provides better performance than traditional CNNs with word-level embedding or character-level embedding in both Korean and English documents. From more detail investigation, we find that the proposed approach tends to perform better when there is relatively small amount of data comparing to the traditional embedding approaches.

제한된 자원을 갖는 장치에서 효과적인 얼굴 인증 방법 (An Effective Face Authentication Method for Resource - Constrained Devices)

  • 이경희;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1233-1245
    • /
    • 2004
  • 사용자를 인증하는데 생체인식(biometrics)을 사용하는 것은 보안성과 편리성에서 우수함에도 불구하고, 생체 정보를 사용하는 전형적인 인증 알고리즘은 스마트카드(smart cards)와 같은 자원이 한정된 장치에서는 실행되지 못할 수도 있다. 따라서, 제한된 자원을 갖는 장치에서 생체인식 과정이 수행되기 위해서는 적은 메모리와 처리 능력을 요구하는 가벼운 인증 알고리즘의 개발이 필요하다. 또한 생물학적 특징들 중에서 얼굴에 의한 인증은 인간에게 보다 친숙하고 얼굴 영상 획득이 비강제성을 띤다는 점에서 사용하기 가장 편리한 생체인식 기술이다. 본 논문에서는 생체인식 기술 연구의 일환으로 새로운 얼굴 인중 알고리즘을 제안한다. 이 얼굴 인증 알고리즘은 두 가지 면에서 새로운 특성을 갖는다. 그 하나는 유전자 알고리즘(GA: Genetic Algorithms) 에 의해 추출된 특징 집합(feature set)을 입력벡터로 사용하는 Support Vector Machines(SVM)을 얼굴인증에 이용함으로써 메모리 요구량을 감소시킨다는 것이다. 다른 하나는, 필요에 따라 특징 집합의 크기 조절에 대한 시스템 파라미터를 조절함으로써, 인식률은 다소 감소하더라도 인증 과정에 필요한 메모리양을 더욱 더 감소시킬 수 있다는 것이다. 이러한 특성은 메모리양이 한정된 장치에서 얼굴 인중 알고리즘을 수행할 수 있게 하는 데 상당히 효과적이다. 다양한 변화가 있는 얼굴 데이터베이스들에 대하여 실험한 결과, GA에 의해 선택된 식별력이 우수한 특징들을 SVM의 입력벡터로 사용하는 제안한 얼굴 인증 알고리즘이, GA에 의한 특징 선택 과정이 없는 알고리즘보다 정확성과 메모리 요구량에서 우수한 성능을 보임을 알 수 있다. 또한 시스템 파라미터의 변경 실험에 의해 선택될 특징의 개수가 조절될 수 있음을 보인다.

SVM기반의 선택적 주의집중을 이용한 중첩 패턴 인식 (Recognition of Superimposed Patterns with Selective Attention based on SVM)

  • 배규찬;박형민;오상훈;최용선;이수영
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.123-136
    • /
    • 2005
  • 본 논문에서는 신경회로망보다 우수한 성능을 보이는 학습 이론인 SVM을 기반으로, 인간의 인지 과학에서 많은 연구가 이루어지고 있는 선택적 주의집중을 응용한 중첩 패턴 인식 시스템을 제안한다. 제안된 선택적 주의집중 모델은 SVM의 입력단에 주의집중층을 추가하여 SVM의 입력을 직접 변화시키는 학습을 하며 선택적 필터의 기능을 수행한다. 주의집중의 핵심은 학습을 멈추는 적절한 시점을 찾는 것과 그 시점에서 결과를 판단하는 주의집중 척도를 정의하는 것이다. 지지벡터는 주변에 존재하는 패턴들을 대표하는 표본이므로 입력 패턴이 초기상태일 때 주의집중을 하고자 하는 클래스의 가장 가까운 지지벡터를 기준으로 그 지지벡터와의 거리가 최소가 되었을 때 주의집중을 멈추는 것이 적절하다. 일반적인 주의집중을 적용하면 주의집중 척도를 정의하기가 난해해지기 때문에 변형된 입력이 원래 입력의 범위를 넘지 않는다는 제약조건을 추가하여 사용할 수 있는 정보의 폭을 넓히고 새로운 척도를 정의하였다. 이때 사용한 정보는 변형된 입력과 원래 입력의 유클리드 거리, SVM의 출력, 초기상태에 가장 가까웠던 히든뉴런의 출력값이다. 인식 실험을 위해 USPS 숫자 데이터를 사용하여 45개의 조합으로 중첩시켰으며, 주의집중을 적용시켰을 때 단일 SVM보다 인식 성능이 월등히 우수함을 확인하였고, 또한 제한된 주의집중을 사용하였을 때 일반적 주의집중을 이용하는 것 보다 성능이 더 뛰어났음을 확인하였다.

강성 외장형 신장기(Rigid External Distractor)를 이용한 중안면부의 골신장술 (DISTRACTION OSTEOGENESIS OF THE MIDFACE WITH A RIGID EXTERNAL DISTRACTOR (RED))

  • 오정환
    • Journal of the Korean Association of Oral and Maxillofacial Surgeons
    • /
    • 제28권2호
    • /
    • pp.161-164
    • /
    • 2002
  • Le Fort III 골절단술 후 강성 외장형 신장기를 이용한 중안면부 골신장술은 적은 합병증으로 골편의 많은 전방 이동이 가능하고, 술후에도 신장 축방향을 조절할 수 있는 장점을 가지고 있으며, 견인 철선을 비외측부 안면 피부를 관통하여 견인하는 방법은 견인력이 회전 중심 가까이에 전달되며, 견인장치가 저작시에도 방해가 되지 않는 장점을 가지고 있는 유용한 방법이다. 본과에서는 두개안면부 저성장을 가진 환자에서 Le Fort III 골절단술 후 피부를 관통하여 견인하는 강성 외장형 신장기를 이용하여 적은 합병증으로 매우 심미적인 결과를 얻을 수 있었다. 중안면부의 골신장술을 이용한 치료법은 아직 장기적인 추적 조사가 필요하지만 많은 합병증을 유발하고 골편의 이동량이 제한되는 기존의 골절단술과 소형 금속판을 이용한 골접합술을 대체할 수 있는 유용한 방법으로 생각된다.

패치 특징 코어세트 기반의 흉부 X-Ray 영상에서의 병변 유무 감지 (Leision Detection in Chest X-ray Images based on Coreset of Patch Feature)

  • 김현빈;전준철
    • 인터넷정보학회논문지
    • /
    • 제23권3호
    • /
    • pp.35-45
    • /
    • 2022
  • 현대에도 일부 소외된 지역에서는 의료 인력의 부족으로 인해 위·중증 환자에 대한 치료가 지연되는 경우가 많다. 의료 데이터에 대한 분석을 자동화하여 의료 서비스의 접근성 문제 및 의료 인력 부족을 해소하고자 하는 연구가 계속되고 있다. 컴퓨터 비전 기반의 진료 자동화는 훈련 목적에 대한 데이터 수집 및 라벨링 작업에서 많은 비용이 요구된다. 이러한 점은 희귀질환이나 시각적으로 뚜렷하게 정의하기 어려운 병리적 특징 및 기전을 구분하는 작업에서 두드러진다. 이상 탐지는 비지도 학습 전략을 채택함으로써 데이터 수집 비용을 크게 절감할 수 있는 방법으로 주목된다. 본 논문에서는 기존의 이상 탐지 기법들을 기반으로, 흉부 X-RAY 영상에 대해 이상 탐지를 수행하는 방법을 다음과 같이 제안한다. (1) 최적 해상도로 샘플링된 의료 영상의 색상 범위를 정규화한다. (2) 무병변 영상으로부터 패치 단위로 구분된 중간 수준 특징 집합을 추출하여 그 중 높은 표현력을 가진 일부 특징 벡터들을 선정한다. (3) 최근접 이웃 탐색 알고리즘을 기반으로 미리 선정된 무병변(정상) 특징 벡터들과의 차이를 측정한다. 본 논문에서는 PA 방식으로 촬영된 흉부 X-RAY 영상들에 대한 제안 시스템의 이상 탐지 성능을 세부 조건에 따라 상세히 측정하여 제시한다. PadChest 데이터세트로부터 추출한 서브세트에 대해 0.705 분류 AUROC를 보임으로써 의료 영상에 대한 이상 탐지 적용의 효과를 입증하였다. 제안 시스템은 의료 기관의 임상 진단 워크플로우를 개선하는 데에 유용하게 사용될 수 있으며, 의료 서비스 접근성이 낮은 지역에서의 조기 진단을 효율적으로 지원할 수 있다.

센서드리프트 판별을 위한 통계적 탐지기술 고찰 (Statistical Techniques to Detect Sensor Drifts)

  • 서인용;신호철;박문규;김성준
    • 한국시뮬레이션학회논문지
    • /
    • 제18권3호
    • /
    • pp.103-112
    • /
    • 2009
  • 원자력발전소에서 센서의 주기적 교정은 안전운전을 위해 꼭 필요하다. 그러나 실제 드리프트가 발생하여 교정을 요하는 센서는 약 2% 미만이다. 또한, 센서의 작동 상태를 매 핵연료 주기마다 수행하는 것은 고장 혹은 드리프트가 발생한 센서를 최대 18개월까지 감지하지 못한 채 운전할 위험이 있다. 원전의 안전운전 및 불필요한 교정을 줄이기 위해 센서의 상시 교정 감시가 필요하다. 이를 위해 주성분 분석과 Support Vector Regression(SVR)을 이용한 PCSVR 알고리즘을 개발하였고, 고리원전 3호기의 출력증발 데이터를 이용하여 검증하였다. 주성분분석은 선형변환을 통한 입력공간의 축소 및 노이즈 제거 효과를 나타내며, AASVR은 해석학적 및 기계학적 모델로 모델링하기 힘든 복잡계를 쉽게 나타낼 수 있는 장점이 있다. SVR의 세가지 파라미터는 반응표면분석법에 의해 최적화하였다. 센서의 고장탐지를 위해 모델 출력의 잔차를 슈하르트 관리도, EWMA, CUSUM 및 일반화우도비검정(GLRT)을 통해 그 결과를 비교하였다. 미세한 드리프트에 대해 CUSUM과 GLRT가 우수한 결과를 보였다. 개발된 알고리즘은 수출형 원전 APR1000 설계시 적용가능 할 것으로 판단된다.

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.

적응적 탐색기반 움직임 추정을 사용한 프레임 율 변환 알고리즘 (Frame Rate Conversion Algorithm Using Adaptive Search-based Motion Estimation)

  • 김영덕;장준영;강문기
    • 대한전자공학회논문지SP
    • /
    • 제46권3호
    • /
    • pp.18-27
    • /
    • 2009
  • 본 논문에서는 적응적 탐색기반 움직임 추정을 사용한 프레임 율 변환(FRC : Frame Rate Conversion) 알고리즘을 제안한다. 제안된 움직임 추정은 회귀탐색, 삼 단계탐색(3-SS : 3-Step Search), 그리고 단일예측탐색을 복합적으로 사용하며, 이 세 가지 탐색기법 중 블록 별 영역 특성에 가장 적합한 탐색 기법을 적용한다. 이러한 적응적 탐색방법을 적용함으로써 계산 량의 증가를 억제하면서 움직임 추정의 정확도를 향상시킨다. 이를 위해 제안된 기법에서는 시간적 예측을 통해 영상전체를 블록 별 움직임 종류에 따라 3가지 영역으로 분할한다. 제안된 움직임 추정기법을 사용한 프레임 율 변환 알고리즘은 기존 알고리즘에 비해 주관적 및 객관적인 면에서 모두 뛰어난 결과를 보임을 실험을 통해 확인 할 수 있다.

GPS 측지망 조정을 통한 국가기준점 성과의 상시 산정 체계에 관한 연구 (A Study on Continuous Management Strategy or Published Coordinates of National Geodetic Control Points using GPS Network Adjustment)

  • 정광호;이흥규
    • 한국측량학회지
    • /
    • 제29권4호
    • /
    • pp.367-380
    • /
    • 2011
  • 본 논문에서는 지각판 운동 지진과 같은 급격한 지각변동을 고려한 국가기준점의 상시적 성과 산정 체계 수립에 관한 연구를 수행하였다. 이를 위하여 GPS 기준점의 국내 현황 및 최근 국가기준점의 재정비가 이루어진 국외 사례 조사로부터 시사점을 도출하고 GPS 상시관측점으로 이루어진 위성기준점망과 6,900 여점으로 이루어진 단일 GPS 망으로 단순화된 국가기준점의 계층 구조를 제안하였다. 또한, 초고정밀 다중기선해석과 정규방정식의 누적에 의한 연속조정을 통한 단계별 위성기준점의 성과 산정 절차 및 다중 세션 조정에 의한 단일 GPS 기준망의 성과 산정 방안을 제시하였다. 또한, 시험 조정망을 구성하여 조정계산을 실시하고 결과 분석을 통해 상시적 성과산정의 필요성과 제안한 성과산정 방법 및 절차의 타당성 등을 평가하였다.

The extension of the largest generalized-eigenvalue based distance metric Dij1) in arbitrary feature spaces to classify composite data points

  • Daoud, Mosaab
    • Genomics & Informatics
    • /
    • 제17권4호
    • /
    • pp.39.1-39.20
    • /
    • 2019
  • Analyzing patterns in data points embedded in linear and non-linear feature spaces is considered as one of the common research problems among different research areas, for example: data mining, machine learning, pattern recognition, and multivariate analysis. In this paper, data points are heterogeneous sets of biosequences (composite data points). A composite data point is a set of ordinary data points (e.g., set of feature vectors). We theoretically extend the derivation of the largest generalized eigenvalue-based distance metric Dij1) in any linear and non-linear feature spaces. We prove that Dij1) is a metric under any linear and non-linear feature transformation function. We show the sufficiency and efficiency of using the decision rule $\bar{{\delta}}_{{\Xi}i}$(i.e., mean of Dij1)) in classification of heterogeneous sets of biosequences compared with the decision rules min𝚵iand median𝚵i. We analyze the impact of linear and non-linear transformation functions on classifying/clustering collections of heterogeneous sets of biosequences. The impact of the length of a sequence in a heterogeneous sequence-set generated by simulation on the classification and clustering results in linear and non-linear feature spaces is empirically shown in this paper. We propose a new concept: the limiting dispersion map of the existing clusters in heterogeneous sets of biosequences embedded in linear and nonlinear feature spaces, which is based on the limiting distribution of nucleotide compositions estimated from real data sets. Finally, the empirical conclusions and the scientific evidences are deduced from the experiments to support the theoretical side stated in this paper.