• 제목/요약/키워드: 분류기 알고리즘

검색결과 597건 처리시간 0.03초

Rum-Length code를 이용한 제약없이 쓰여진 한글 필기체 주소열 분할 (An Approach to Segmentation of Address Strings of unconstrained handwritten Hangul using Run-Length Code)

  • 김경환;윤정석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권11호
    • /
    • pp.813-821
    • /
    • 2001
  • 대부분의 문자 인식기들이 인식대상영상이 인식단위로 분할되어있다는 가정아래 개발되고 있으나, 실제 필기한글의 분할에 대한 연구는 미미한 실정이다. 본 논문은 Run-length code를 이용한 능동적인 한글 분할방법을 제시한다. 전처리와 인식단위 분할에 응용할 수 있는, 한글의 구조적 특성을 반영한, 기울기 보정 알고리즘을 제안하고, 필기자들이 일반적인 필기 습관과 한글이 갖는 2차원 구조의 특성을 반영하면서 문자의 접촉점을 적극적으로 찾아내기 위한 기초 함수들과 접촉점들의 분류 방법을 제시한다. 임의의 필기자로부터 수집한 필기 한글 주소열 데이터를 이용해 수행한 실험을 통해, 초과분할을 포함하여, 88.2%의 접촉 문자들을 분리할 수 있었다.

  • PDF

궤도천이 및 자세제어 시스템의 연구개발 동향과 전망 (Recent Progress in R&D and Prospect of Divert and Attitude Control System(DACS))

  • 김성수;허환일
    • 한국추진공학회지
    • /
    • 제16권6호
    • /
    • pp.62-72
    • /
    • 2012
  • 우주 비행체와 유도 미사일에 적용되는 궤도천이 및 자세제어 시스템(이하 DACS)은 비행체의 궤도를 천이시키거나 미세한 자세 제어를 수행하게 된다. DACS를 개발하기 위해서는 추력변화 최대화를 위한 핀틀/노즐의 형상 조합, 핀틀 구동력 최소화를 위한 공력하중 저감, 다축 제어 알고리즘에 대한 연구가 중요하다. 본 논문에서는 이러한 DACS 시스템에 대한 소개와 분류, 국내외 연구 개발 동향에 대해 살펴보고 향후 연구 개발 전망을 제시하였다.

Wav2vec을 이용한 오디오 음성 기반의 파킨슨병 진단 (Diagnosis of Parkinson's disease based on audio voice using wav2vec)

  • 윤희진
    • 디지털융복합연구
    • /
    • 제19권12호
    • /
    • pp.353-358
    • /
    • 2021
  • 노년기에 접어들면서 알츠하이머 다음으로 흔한 퇴행성 뇌 질환은 파킨슨병이다. 파킨슨병의 증상은 손 떨림, 행동의 느려짐, 인지기능의 저하 등 일상생활의 삶의 질을 저하시키는 요인이 된다. 파킨슨병은 조기진단을 통하여 병의 진행 속도를 늦출 수 있는 질환이다. 파킨슨병의 조기진단을 위해 오디오 음성 파일 입력으로 wav2vec을 이용하여 특징을 추출하고 딥러닝(ANN)으로 파킨슨병의 유무를 진단하는 알고리즘을 구현하였다. 오디오 음성 파일을 이용하여 파킨슨병을 진단하는 실험 결과 정확도는 97.47%로 나타났다. 기존의 뉴럴네트워크를 이용하여 파킨슨병을 진단하는 결과보다 좋은 결과를 나타냈다. 오디오 음성 파일을 wav2vec 이용으로 간단하게 실험을 과정을 줄일 수 있었으며, 실험 결과 향상된 결과를 얻을 수 있었다.

시각장애인 예술 문화 향유 확장을 위한 시각 정보 촉각 변환 디스플레이 (Visual Information Tactile Transformation Display to Expand the Enjoyment of Art and Culture for the Blind)

  • 이상돈;이주현;황재형;황현정;이재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.996-997
    • /
    • 2023
  • 시각 장애인들의 시각 정보에 대한 낮은 접근성은 문화, 예술 활동에 큰 제약을 가져다 주고 있다. 실제로 시각 장애인 중 약 절반 이상이 문화, 여가생활에 만족하지 못한다고 답하였고 전시회, 미술품 감상 또는 관람 활동은 약 5%만이[1] 참여하고 있는 것으로 나타났다. 이러한 한계를 극복하기 위해 시각이라는 감각의 한계를 뛰어넘어 시각 미디어를 즐길 수 있게 하는 서비스를 제작하였고, 이는 크게 웹서비스인 web view editor와 물리적인 촉각 디스플레이로 구성된다. 시각 미디어인 이미지는 8×8로 나눠 각 영역을 OpenCV 라이브러리와 K-means clustering 알고리즘을 이용하여 9 level로 분류시키고, 구분된 level에 맞게 cell의 높낮이 차이를 두기 위하여 Arduino를 통한 회전-선형 변환기를 제작했다. Arduino의 PWM 기능을 이용해 모터의 속도와 방향을 제어하며, 각 모터의 드라이버는 Arduino와 연결되어 있어 모터의 회전을 제어하게 했다. 결과적으로 본 연구에서는 cell의 높낮이 차이를 9 level로 구분하여 시각 정보를 촉각으로 수용할 수 있는 장치를 제작하였고, 이 장치를 통해 기존의 시각 장애인들이 문화 생활을 쉽게 향유하고 이를 바탕으로 창의성과 상상력을 증대시켜 더욱 밀접하게 사회와 연결되고 소통 할 수 있는 기회의 초석이 되기를 기대하는 바이다.

페로몬 트랩 영상에서 해충 검출을 위한 객체 분할 (Object Segmentation for Detection of Moths in the Pheromone Trap Images)

  • 김태우;조태경
    • 한국산학기술학회논문지
    • /
    • 제18권12호
    • /
    • pp.157-163
    • /
    • 2017
  • 객체 분할 방식은 객체를 먼저 분할한 후, 검출된 객체에 대해 해충 검출 알고리즘을 적용하므로 해충 개체를 검출하는 데 필요한 처리 비용이 줄어드는 장점이 있다. 본 논문에서는 페로몬 트랩 영상에서 해충 검출을 위한 객체 분할 방법을 제안한다. 제안한 방법은 전처리, 문턱치 처리, 형태학적 필터링, 레이블링 처리로 구성된다. 이들 과정 중 문턱치 처리는 객체 분할의 성능을 좌우하는 매우 중요한 처리 과정이다. 제안한 방법은 문턱치 처리 과정에서 해충 영상의 국소적 특성을 반영하므로 매우 정교한 문턱치 처리를 할 수 있다. 과수원에 설치된 페로몬 트랩에서 수집된 복숭아심식나방 영상에 대해 Otsu의 방법의 전역적 방식과 국소적 방식, 그리고 제안한 방법으로 처리한 결과, 제안한 방법이 조명과 배경의 특성을 잘 반영함을 알 수 있었다. 페로몬 트랩에 수집된 복숭아심식나방 영상에 대해 객체 분할과 개체 분류를 수행하였다. 개체 분류는 SVM 분류기로 학습하여 사용하였다. 실험에서 제안한 방법으로 10개의 해충 영상에 대해 복숭아심식나방 검출 결과 95%의 평균 검출율을 보임으로써 과수원의 복숭아심식나방의 개체 모니터링 방법으로서 효과적임을 보였다.

타이어 분류 코드의 효율적 인식을 위한 MCBP망 (MCBP Neural Netwoek for Effcient Recognition of Tire Claddification Code)

  • 구건서;오해석
    • 한국정보처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.465-482
    • /
    • 1997
  • 본 논문은 타이어에 각인된 타이어 분류 코드인(DOT(Department of Transportation) 코드 인식 처리를 위해 타이어 문자를 영상 처리한 후 신명망을 이용하여 인식 시스템을 구축한 것이다. 타이어에 각인된 문자부분을 영상 처리시, 타이어 표면에 각인된 문자가 조명에 민감한 반응을 보일 뿐아니라 난반사로 인한 문자 경계선이 왜곡되는 현상과 인접한 두 개의 문자가 한 레이블을 갖는 현상이 발생된다. 따라서 본 논문에서는 이러한 특성을 고려한 타이어 영상 처리 알고리즘을 제안하여 실헝을 통해 유효성을 증명하였다. 또한 타이어분류 코드인DOT 코드를 효율적으로 인식하기 위해 인식기를 다중 연결한 MCBP(Multi-Chained BackPropogation)망을 제안하였다. MCBP망에서는 타이어 개별 문자영역에 대한 X, Y축 투영 값을 추출하여 문자 영역 분류를 위한 특징 값과 가로, 세로 7$\times$8 정규화를 이용한 개별 문자의 특징을 추출하여 인식 처리한다. 본 논문에서는 MCBP망에 의해 인식된 결과와 DOT 코드 데이터 베이스를 비교 처리하는 후처리를 통해서 오인식율을 3% 줄였다. 학습 및 인식 결과는 단일 역전파망에 비해 학습시간에서는 60%의 개선과 효과를 얻었으며, 인식율은 90%에서 95%로 향상었다. 또한 후처리까지 포함하면 전체 인식율을 98%까지 증가되는 높은 인식율을 얻을 수 있었다.

  • PDF

소셜미디어 감성분석을 위한 베이지안 속성 선택과 분류에 대한 연구 (Investigating the Performance of Bayesian-based Feature Selection and Classification Approach to Social Media Sentiment Analysis)

  • 강창민;어균선;이건창
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.1-19
    • /
    • 2022
  • 온라인 사용자들이 소셜 미디어상에 올린 온라인 리뷰 속 숨겨진 감정을 분석하는 감성분석은 소셜미디어의 확산에 힘입어 많은 관심을 받고 있다. 본 연구는 기존 연구들과 차별화된 방법으로 감성분석을 시도하기 위하여 베이지안 네트워크에 기반한 감성 분석 모델을 제안한다. 모델에는 MBFS(Markov Blanket-based Feature Selection)가 속성 선택 기법으로 사용된다. MBFS의 성과를 실증적으로 증명하기 위하여 소셜미디어인 Yelp의 리뷰 데이터를 활용하였다. 벤치마킹 속성 선택 기법으로는 상관관계기반 속성 선택, 정보획득 속성 선택, 획득비율 속성 선택을 사용하였다. 한편, 해당 속성선택방법을 토대로 4개의 머신러닝 알고리즘을 이용하여 분류성과를 비교하였다. 나아가 MBFS로 선택된 속성들 간 인과관계를 확인하고자 베이지안 네트워크를 통해 What-if 분석을 실시하였다. 본 연구에서 택한 머신러닝 분류기는 베이지안 네트워크 기반의 TAN (Tree Augmented Naive Bayes), NB (Naive Bayes), S-Spouses(Sons & Spouses), A-markov (Augmented Markov Blanket)이다. 성과분석 결과 본 연구에서 제안한 MBFS 방법이 정확도, 정밀도, F1점수 측면에서 벤치마킹 방법보다 더 우수한 성과를 나타내었다.

Radial Basis 함수를 이용한 동적 - 단기 전력수요예측 모형의 개발 (The Development of Dynamic Forecasting Model for Short Term Power Demand using Radial Basis Function Network)

  • 민준영;조형기
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1749-1758
    • /
    • 1997
  • 전력수요의 예측은 예측기간에 따라 중장기 전력수요 예측과 단기 부하 예측으로 구분할 수 있다. 기존의 단기 부하예측은 주로 역전파 알고리즘(back propagation algorithm)다층퍼셉트론을 이용하여 예측을 하였으나 이는 학습시간이 많이 걸릴 뿐만 아니라 학습도중에 지역최소점(local minima)에 빠져 학습이 계속되지 못한다는 문제가 있다. 본 논문은 이러한 역전파 알고리즘의 문제점을 해결할 수 있는 방법으로 Radial Basis 함수(Radial Basis Function)를 이용하여 동적 단기부하 예측 모형을 제안한다. Radial Basis 함수는 하나의 은닉층(hidden layer)을 갖고 있으며, 전방향(feed-forward)학습을 한다는 특징이 있다. 본 논문에서 제안한 단기 부하 예측모형은 학습을 하기 위하여 시간대별 부하량을 클러스터링 하고, 이 클러스터의 중심값을 Radial Basis 함수의 은닉층으로 하여 학습을 한 다음 예측하고자 하는 패턴을 한 단위로 하여 시단대별로 예측하였다. 기존의 연구에서의 클러스터링 방법으로는 통계학의 K-Means 방법이나 Kohonen의 LVQ(Learning Vector Quantization)을 주로 이용하였으나 본 논문에서는 패턴의 분류에 있어서 다른 알고리즘보다 편차가 작은 Pal, et. al.의 GLVQ(Generalized LVQ) 알고리즘을 이용하였다. 본 논문에서 이용한 데이타는 1995년 3월 1일-3일, 6월 1일-3일, 7월 1일-3일, 9월 1일-3일, 11월 1일-3일의 72시간 데이타를 입력하여 월별 4일의 24시간의 예측시간으로 예측하였다. 실험결과 월별 1일과 3일까지의 학습데이타로 1시간 후의 부하량을 24시간동안 예측한 결과 1.3795%의 평균 오차율로 예측하였다.

  • PDF

서베일런스에서 Adaptive Boosting을 이용한 실시간 헤드 트래킹 (Real-Time Head Tracking using Adaptive Boosting in Surveillance)

  • 강성관;이정현
    • 디지털융복합연구
    • /
    • 제11권2호
    • /
    • pp.243-248
    • /
    • 2013
  • 본 논문에서는 복잡한 배경에서의 사람의 머리 추적에 있어서 효과적인 Adaptive Boosting에 의한 방법을 제안한다. 하나의 특징 추출 방법은 사람의 머리를 모델링하기에는 부족하다. 따라서 본 연구에서는 여러 가지 특징 추출 방법을 병행하여 정확한 머리 검출을 시도하였다. 머리 영상의 특징 추출은 sub-region과 Haar 웨이블릿 변환(Haar wavelet transform)을 이용하였다. Sub-region은 머리의 지역적인 특징을 나타내고, Haar 웨이블릿 변환은 얼굴의 주파수 특성을 나타내기 때문에 이들을 이용하여 특징을 추출하면 효과적인 모델링이 가능해 진다. 실시간으로 입력되는 영상에서 사람의 머리를 추적하기 위하여 제안하는 방법에서는 3가지 형태의 Harr-wavelet 특징을 AdaBoosting 알고리즘으로 학습한 후 결과를 이용하였다. 원래 AdaBoosting 알고리즘은 학습시간이 매우 길며 학습데이터가 변하면 다시 학습을 수행해야 하는 단점이 존재한다. 이 단점을 극복하기 위하여 제안하는 방법에서는 캐스케이드를 이용한 AdaBoosting의 효율적인 학습방법을 제안한다. 이 방법은 머리 영상에 대한 학습시간은 감소시키며, 학습데이터의 변화에도 효율적으로 대처할 수 있다. 이 방법은 학습과정을 레벨별로 분리한 후 중요도가 높은 학습데이터를 다음 단계에 반복적으로 적용시킨다. 제안하는 방법이 적은 학습 시간과 학습 데이터를 사용해서 우수한 성능을 가지는 분류기를 생성하였다. 또한, 이 방법은 다양한 머리데이터를 가진 실시간 영상데이터에 적용한 결과 다양한 머리를 정확하게 검출 및 추적하였다.

신경망과 Mean-shift를 이용한 눈 추적 (Eye Tracking Using Neural Network and Mean-shift)

  • 강신국;김경태;신윤희;김나연;김은이
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.56-63
    • /
    • 2007
  • 본 논문은 신경망 (neural network: NN)과 mean-shift알고리즘을 이용하여 복잡한 배경에서 사용자의 눈을 정확히 추출하고 추적할 수 있는 눈 추적 시스템을 제안한다. 머리의 움직임에 강건한 시스템을 개발하기 위해서 먼저 피부색 모델과 연결 성분분석을 이용하여 얼굴영역을 추출한다. 그 다음 신경망기반의 텍스처 분류기를 이용하여 얼굴 영역(face region)을 눈 영역(eye region)과 비눈 영역(non-eye region)으로 구분함으로써 눈을 찾는다. 이러한 눈 검출 방법은 안경의 착용 유무에 상관없이 사용자의 눈 영역을 정확히 검출 할 수 있게 한다. 일단 눈 영역이 찾아지면 이후 프레임에서의 눈 영역은 mean-shift알고리즘에 의해 정확하게 추적된다. 제안된 시스템의 효율성을 검증하기 위해서 제안된 시스템은 눈의 움직임을 이용한 인터페이스 시스템에 적용되었고, 이 인터페이스를 이용한 'aliens game'이 구현되었다. 25명의 사용자에 대해 실험한 결과는 제안된 시스템이 보다 편리하고 친숙한 인터페이스로 활용될 수 있다는 것을 보여주었으며, 또한 $320{\times}240$ 크기의 영상을 초당 30프레임의 빠른 속도로 처리함으로써 실시간 시스템에 적용될 수 있음을 보여주었다.