• 제목/요약/키워드: LDA algorithm

검색결과 157건 처리시간 0.025초

주성분 분석법과 선형판별 분석법을 이용한 최적화된 방사형 기저 함수 신경회로망 분류기의 설계 (Design of Optimized Radial Basis Function Neural Networks Classifier with the Aid of Principal Component Analysis and Linear Discriminant Analysis)

  • 김욱동;오성권
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.735-740
    • /
    • 2012
  • 본 연구에서는 주성분 분석법 및 선형 판별 분석법을 이용한 다항식 방사형 기저 함수 신경회로망 분류기의 설계 방법론을 소개한다. 주성분 분석법과 선형판별 분석법을 사용하여 주어진 데이터의 정보 손실을 최소화한 특징데이터를 생성하고 이를 다항식 방사형 기저함수 신경회로망의 입력데이터로 사용한다. 방사형 기저 함수 신경회로망의 은닉층은 FCM 클러스터링 알고리즘으로 구성되며 연결가중치는 1차 선형식을 사용하였다. 최적의 분류기 설계를 위해서 최근에 제안된 Artificial Bee Colony(ABC) 최적화 알고리즘을 사용하여 구조 및 파라미터를 동조하였다. ABC 알고리즘을 통해 주성분 분석법과 선형판별 분석법의 고유벡터의 수 및 FCM 클러스터링 알고리즘의 퍼지화 계수등의 파라미터를 동조한다. 제안된 분류기는 대표적인 Machine Learning(ML) 데이터를 사용하여 성능을 평가하며 기존 분류기와 성능을 비교한다.

교통 표지판 자동 인식에 관한 연구 (Study of Traffic Sign Auto-Recognition)

  • 권만준
    • 한국산학기술학회논문지
    • /
    • 제15권9호
    • /
    • pp.5446-5451
    • /
    • 2014
  • 내비게이션 단말기에 사용되는 전자지도 제작이 수작업으로 이루어지고 있어 오기가 발생할 수 있기 때문에, 본 논문에서는 내비게이션 정보의 요소로 다루어지는 교통 표지판에 대한 오프라인 자동 인식에 대해 제안하였다. 컴퓨터 비전과 패턴 인식 응용 분야로 2차원 얼굴 인식 분야에 널리 활용되고 있는 주성분분석기법(PCA)과 선형판별분석기법(LDA)을 이용하여 교통표지판을 인식하고자 한다. 먼저 PCA를 이용하여 높은 차원의 2차원 이미지 데이터를 저차원의 특징 벡터영역으로 투영을 시킨다. PCA로부터 구해진 저차원의 특징 벡터를 이용하여 LDA로 분산 매트릭스들 간에 최대가 되고 하고, 분산 매트릭스 내에서는 최소가 되도록 하였다. 실제 도로 환경에서 추출된 교통 신호판의 대부분을 제안된 알고리즘에 의해서 특징 벡터를 40개 이상 사용하였을 경우 92.3%이상의 높은 인식률을 보임을 확인하였다.

잡음환경에서의 음성인식을 위한 변이특성을 고려한 파라메터 (Parameter Considering Variance Property for Speech Recognition in Noisy Environment)

  • 박진영;이광석;고시영;허강인
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.469-472
    • /
    • 2005
  • 본 논문에서는 음석인식 시스템을 구현함에 있어서 잡음의 영향에 강인한 특성을 가지는 효과적인 음성특징 파라미터에 대해 제안한다. ASR(Automatic Speech Recognition)에 사용되는 가장 기본적인 파라미터인 MFCC와 DCT를 이용한 DCTCs를 기본적인 파라미터로 설정하였다. 또한, 음성의 변이구간에 대한 정보를 가지도록 Cepstrum을 재구성한 delta-Cepstrum, delta-delta-Cepstrum 파라미터를 제안하고, HMM을 이용하여 인식성능을 비교하였다. 그리고 각각의 파라미터의 차원을 축소하기 위해 LDA 알고리즘을 적용하고 이에 대한 인식성능을 비교하였다. 실험결과 다양한 조건의 잡은 환경에서 기존의 파라미터보다 LDA를 이용하여 차원 축소된 delta-delta-Cepstrum 파라미터가 향상된 인식성능을 나타내었다.

  • PDF

적외선 거리 센서 깊이이미지를 이용한 얼굴 인식 알고리즘 평가 (Evaluation of Depth Image of IR Range Sensor with Face Recognition Algorithms)

  • 권기현
    • 한국산학기술학회논문지
    • /
    • 제13권8호
    • /
    • pp.3666-3671
    • /
    • 2012
  • 적외선 거리 센서를 사용하여 취득한 깊이이미지(depth image)에 대하여 잘 알려진 얼굴인식 알고리즘을 수행하여 깊이이미지 응용에 적용가능성을 평가한다. 아울러, 기존의 얼굴인식이 정확도 측면에서만 강조를 해온 측면이 있는데 이렇게 하면 실제 환경에서 적용할 때 문제점을 제대로 평가하기 어렵다. 본 연구에서는 RGB 이미지와 깊이 이미지들에 대해 잘 알려진 얼굴 인식 알고리즘 (PCA, LDA, ICA, SVM)을 적용하여 얼굴인식 정확도뿐만 아니라 처리 속도, 사용 메모리 그리고 저장 공간에 대한 정보를 구해 이미지 유형과 각 알고리즘에 따른 전반적인 성능을 구하였다. 처리 결과 깊이이미지와 컬러 색인된 깊이이미지는 컬러이미지에 비해 각각 30% ~ 40% 정도 파일 크기가 작음에도 전반적인 성능에서 컬러이미지와 마찬가지로 우수한 결과를 보였으며, LDA는 SVM 다음으로 정확도도 우수하고 훈련시간과 훈련 소요메모리도 양호하고 테스트시간과 테스트 소요 메모리도 낮아 우수한 성능을 보였다.

국내 마이데이터 태동과 데이터 거래에 관한 잠재적 주제 분석 (Study on Potential Topics of the MyData and Data Transactions Using LDA Topic Modeling)

  • 조지연;이봉규
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.221-229
    • /
    • 2022
  • 최근 마이데이터 사업이 본격화됨에 따라 개인데이터 활용에 관한 관심은 더욱 증가하고 있다. 그러나 마이데이터에 관한 연구들은 아직까지 초기 단계로서, 법·제도적 논의에 집중되어 있으며 종합적인 시각에서 마이데이터를 조망한 연구는 부족한 상황이다. 이에 본 연구는 데이터거래에 관한 논의가 본격화된 2018년부터 현시점까지의 뉴스를 분석하여 사회적 논의가 형성한 잠재적 주제를 분석하고자 하였다. LDA 토픽모델링 기법을 통한 뉴스데이터 분석을 통하여 마이데이터 기반 금융혁신, 마이데이터 사업자 지위 및 허가, 데이터 관련 법 개정, 안전한 데이터 활용, 데이터 경제활성화 정책, 사업자의 전략 등 6개의 잠재적 주제를 도출하여 제시하였다. 본 연구는 마이데이터 태동과 함께 나타난 사회적 이슈를 종합적으로 조망하고 관련 논의의 공백을 도출하여 시사점을 제시한 의의가 있다. 향후 연구에서는 마이데이터 서비스 개시 이후의 변화를 파악하고, 마이데이터 산업별 심도깊은 연구를 통하여 구체적인 시사점을 제공하길 기대한다.

BART 기반 문서 요약을 통한 토픽 모델링 성능 향상 (Performance Improvement of Topic Modeling using BART based Document Summarization)

  • 김은수;유현;정경용
    • 인터넷정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.27-33
    • /
    • 2024
  • 정보의 증가 속에서 학문 연구의 환경은 지속적으로 변화하고 있으며, 이에 따라 대량의 문서를 효과적으로 분석하는 방법의 필요성이 대두된다. 본 연구에서는 BART(Bidirectional and Auto-Regressive Transformers) 기반의 문서 요약 모델을 사용하여 텍스트를 정제하여 핵심 내용을 추출하고, 이를 LDA(Latent Dirichlet Allocation) 알고리즘을 통한 토픽 모델링의 성능 향상 방법을 제시한다. 이는 문서 요약을 통해 LDA 토픽 모델링의 성능과 효율성을 향상시키는 접근법을 제안하고 실험을 통해 검증한다. 실험 결과, 논문 데이터를 요약하는 BART 기반 모델은 Rouge-1, Rouge-2, Rouge-L 성능 평가에서 각각 0.5819, 0.4384, 0.5038의 F1-Score를 나타내어 원문의 중요 정보를 포착하고 있음을 보인다. 또한, 요약된 문서를 사용한 토픽 모델링은 Perplexity 지표를 통한 성능 비교에서 원문을 사용한 토픽 모델링의 경우보다 약 8.08% 더 높은 성능을 보인다. 이는 토픽 모델링 과정에서 데이터 처리량의 감소와 효율성 향상에 기여한다.

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

  • 권오륜;민경필;전준철
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.19-32
    • /
    • 2007
  • 본 논문에서는 실시간 얼굴인증 시스템의 구축을 위한 LVQ 신경망 기반의 새로운 얼굴 인식 방법을 제안한다. 기존의 연구에서 PCA, LDA 변환이 많이 적용되며 신경망을 결합한 형태가 제안되고 있지만 신경망 학습 시간이 오래 걸리는 단점을 가지고 있다. LVQ 신경망은 학습 시간이 짧고 클래스간의 분리도를 최대화할 수 있는 교사학습방법이다. 따라서, 본 논문에서 제안된 방법은 동영상으로부터 실시간으로 입력되는 얼굴영상을 PCA와 LDA변환을 순차적으로 적용하여 부분공간상의 변환된 특징벡터로부터 LVQ 신경망의 학습을 통하여 얼굴을 인식한다. 외부조명의 영향에 강건한 인식시스템을 구축하기 위하여 얼굴검출 단계에서 검출된 얼굴영역은 밝기값의 최대-최소 정규화 방법에 의해 보정된 정규화 영상을 생성한다. 정규화된 얼굴영상은 PCA와 LDA 변환을 통해 부분공간상의 특징벡터로 변환된다. 변환된 훈련 데이터로부터 LVQ 신경망의 초기 중심 벡터를 결정하고 신경망의 학습률 향상을 위해 K-Means 클러스터링 알고리즘을 적용하며, 초기 중심 벡터를 이용하여 LVQ2 학습 방법에 의해 학습된 중심벡터는 클래스의 대표 벡터가 된다. 결국 각 클래스의 대표 벡터로부터 입력 영상의 특징벡터간의 유클리디언 거리 비교법을 적용하여 얼굴 인식을 수행한다. ORL 데이터베이스를 이용한 정지 영상에 대한 인식과 실시간으로 입력되는 영상에 대한 인식 등 두 가지 형태의 영상을 기반으로 실험한 결과 두 경우에 모두 제안된 방법이 기존의 인식 방법보다 인식률에서 우수함을 입증할 수 있었다.

  • PDF

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

생체 인식에서 치아 영상의 이용에 관한 연구 (Study on Using Teeth Images in Biometrics)

  • 김태우;조태경;이민수
    • 한국산학기술학회논문지
    • /
    • 제7권2호
    • /
    • pp.200-205
    • /
    • 2006
  • 본 논문은 치아의 전치교합(anterior occlusion)과 후치교합(posterior occlusion) 상태에서 획득된 치아 영상에 대하여 BMME와 LDA에 기반한 개인 인식 방법을 제안한다. 이 방법은 전치교합과 후치교합 상태의 치아 영상에서 치아 영역 추출, BMME, 패턴 인식 과정으로 구성된다. 이들 두 치아교합은 영상에서 일관된 자세의 치아 영상을 얻을 수 있도록 하며, BMME는 패턴 인식 과정에서 정합 오차를 줄이도록 해 준다. 치아는 딱딱하므로 치아영상을 사용하면 영상 획득 시 변형되지 않기 때문에 유용하다. 제안된 방법은 20명을 대상으로 개인 인증을 위한 치아인식 실험에서 성공적이었으며, 멀티 모달(multi-modal) 인증 시스템에 기여할 수 있음을 보였다.

  • PDF

토픽모델링을 활용한 무역분야 연구동향 분석 (A Study on the Research Trends in Int'l Trade Using Topic modeling)

  • 이지훈;김정숙
    • 무역학회지
    • /
    • 제45권3호
    • /
    • pp.55-69
    • /
    • 2020
  • This study examines the research trends and knowledge structure of international trade studies using topic modeling method, which is one of the main methodologies of text mining. We collected and analyzed English abstracts of 1,868 papers of three Korean major journals in the area of international trade from 2003 to 2019. We used the Latent Dirichlet Allocation(LDA), an unsupervised machine learning algorithm to extract the latent topics from the large quantity of research abstracts. 20 topics are identified without any prior human judgement. The topics reveal topographical maps of research in international trade and are representative and meaningful in the sense that most of them correspond to previously established sub-topics in trade studies. Then we conducted a regression analysis on the document-topic distributions generated by LDA to identify hot and cold topics. We discovered 2 hot topics(internationalization capacity and performance of export companies, economic effect of trade) and 2 cold topics(exchange rate and current account, trade finance). Trade studies are characterized as a interdisciplinary study of three agendas(i.e. international economy, International Business, trade practice), and 20 topics identified can be grouped into these 3 agendas. From the estimated results of the study, we find that the Korean government's active pursuit of FTA and consequent necessity of capacity building in Korean export firms lie behind the popularity of topic selection by the Korean researchers in the area of int'l trade.