• 제목/요약/키워드: Latent class classification

검색결과 23건 처리시간 0.022초

Two-stage Deep Learning Model with LSTM-based Autoencoder and CNN for Crop Classification Using Multi-temporal Remote Sensing Images

  • Kwak, Geun-Ho;Park, No-Wook
    • 대한원격탐사학회지
    • /
    • 제37권4호
    • /
    • pp.719-731
    • /
    • 2021
  • This study proposes a two-stage hybrid classification model for crop classification using multi-temporal remote sensing images; the model combines feature embedding by using an autoencoder (AE) with a convolutional neural network (CNN) classifier to fully utilize features including informative temporal and spatial signatures. Long short-term memory (LSTM)-based AE (LAE) is fine-tuned using class label information to extract latent features that contain less noise and useful temporal signatures. The CNN classifier is then applied to effectively account for the spatial characteristics of the extracted latent features. A crop classification experiment with multi-temporal unmanned aerial vehicle images is conducted to illustrate the potential application of the proposed hybrid model. The classification performance of the proposed model is compared with various combinations of conventional deep learning models (CNN, LSTM, and convolutional LSTM) and different inputs (original multi-temporal images and features from stacked AE). From the crop classification experiment, the best classification accuracy was achieved by the proposed model that utilized the latent features by fine-tuned LAE as input for the CNN classifier. The latent features that contain useful temporal signatures and are less noisy could increase the class separability between crops with similar spectral signatures, thereby leading to superior classification accuracy. The experimental results demonstrate the importance of effective feature extraction and the potential of the proposed classification model for crop classification using multi-temporal remote sensing images.

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

중학생들의 수학 흥미와 성취도의 종단적 변화에 따른 잠재집단 분류 및 영향요인 탐색: 다변량 성장혼합모형을 이용하여 (Classification of latent classes and analysis of influencing factors on longitudinal changes in middle school students' mathematics interest and achievement: Using multivariate growth mixture model)

  • 김래영;한수연
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제63권1호
    • /
    • pp.19-33
    • /
    • 2024
  • 본 연구는 중학생들의 수학 흥미와 성취도의 종단적인 변화 양상을 알아보기 위해 경기교육종단연구 4-6차년도 데이터를 분석하였다. 다변량 성장혼합모형을 이용하여 분석한 결과 학생들의 수학 흥미와 성취도의 변화 양상에 이질적인 특성이 존재함을 확인하였고, 종단적인 변화 양상에 따라 학생들을 4개의 잠재집단으로 구분하였다. 학생들은 흥미와 성취도가 모두 낮은 저수준 유형, 모두 높은 고수준 유형, 학년이 올라감에 따라 증가하는 중수준-증가 유형, 학년이 올라감에 따라 감소하는 중수준-감소 유형으로 구분되었으며, 유형마다 흥미와 성취도의 종단적인 변화 양상이 다르게 나타나는 것을 확인하였다. 또한, 다변량 성장혼합모형의 초기값과 기울기 사이의 상관관계를 분석한 결과, 수학 흥미와 성취도는 초기값뿐 아니라 변화율에 있어서도 서로 긍정적인 영향이 있는 것으로 나타났다. 잠재집단의 결정에 영향을 미치는 요인을 개인, 수업방식, 가정 변인으로 나누어 그 영향력을 살펴보았고, 학생의 교육포부와 사교육 시간은 수학 흥미 및 성취도에 긍정적인 영향을 미치며 선행학습의 경우 그 정도에 따라 영향력이 달라지는 양상을 확인하였다. 학생이 인식한 수업방식의 경우, 교수자 중심 수업은 흥미와 성취도가 높은 집단에 속할 확률을 높이고, 학습자 중심 수업은 흥미와 성취도가 낮은 집단에 속할 확률을 높이는 것으로 나타났다. 본 연구는 다변량 성장혼합모형을 통해 수학교육에서 흥미와 성취도를 비롯한 다양한 특성에 대한 학생들의 변화 양상을 분석하는 새로운 방법을 제시하였다는 점에서 의의가 있다.

잠재프로파일분석을 통한 임금근로자의 위험요인 노출 유형분류 및 영향요인 검증 (Classifying Latent Profiles in the Exposure to Hazard Factors of Salaried Employees)

  • 이은진;홍세희
    • 한국산업보건학회지
    • /
    • 제31권3호
    • /
    • pp.237-254
    • /
    • 2021
  • Objectives: This study aims to classify the latent profiles in the exposure to hazard factors of salaried employees and test the determinants. Methods: Latent profile analysis(LPA) was conducted using data from the fifth Korean Working Conditions Survey(KWCS). 30,050 of salaried employees were the subjects of this study. After classifying the employees, multinomial logistic regression was used to test the determinants. Results: Salaried employees were classified with three latent profiles based on the exposure to the hazard factors. Employees included in class 1(32.8%) tend to experience low level of physical hazard factors, moderate level of psychological hazard factors, and high level of office work hazard factors. Employees included in class 2(61.8%) tend to be exposed to the moderate to high level of physical hazard factors, moderate to low level of psychological hazard factors, and low level of office work hazard factors. Employees included in class 3(5.4%) tend to experience high level of psychological and physical hazard factors, and moderate level of office work hazard factors. After classification, the demographic, health-, and employment-related variables were tested. Conclusions: This study clarified the features of each class, and proved that employees in class 3 are quite hazardous in that they are exposed to physical and psychological hazard factors much more frequently than other employees. Thus, this study can be used in predicting the high-risk employees and taking preemptive measures for preventing industrial accidents.

New Inference for a Multiclass Gaussian Process Classification Model using a Variational Bayesian EM Algorithm and Laplace Approximation

  • Cho, Wanhyun;Kim, Sangkyoon;Park, Soonyoung
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제4권4호
    • /
    • pp.202-208
    • /
    • 2015
  • In this study, we propose a new inference algorithm for a multiclass Gaussian process classification model using a variational EM framework and the Laplace approximation (LA) technique. This is performed in two steps, called expectation and maximization. First, in the expectation step (E-step), using Bayes' theorem and the LA technique, we derive the approximate posterior distribution of the latent function, indicating the possibility that each observation belongs to a certain class in the Gaussian process classification model. In the maximization step, we compute the maximum likelihood estimators for hyper-parameters of a covariance matrix necessary to define the prior distribution of the latent function by using the posterior distribution derived in the E-step. These steps iteratively repeat until a convergence condition is satisfied. Moreover, we conducted the experiments by using synthetic data and Iris data in order to verify the performance of the proposed algorithm. Experimental results reveal that the proposed algorithm shows good performance on these datasets.

중·장년 성인의 정당한 세상에 대한 믿음과 사회계층에 따른 잠재집단의 진로발달 특성 (Career Developmental Characteristic in Latent Classes based on Belief in a Just World and Social class of Middle-aged adult)

  • 김도현;장진이
    • 한국노년학
    • /
    • 제41권4호
    • /
    • pp.567-586
    • /
    • 2021
  • 이 연구는 중·장년 성인의 정당한 세상에 대한 믿음(Belief in a Just World; BJW)과 사회계층의 조합에 따라 어떤 잠재집단이 나타나는지 탐색하고, 각 집단에서 진로전환, 소명의식, 일의 의미에서 차이가 있는지와 그리고 어떤 특징을 가지는지 알아보고자 하였다. 이를 위해 온·오프라인 설문을 통해 이직을 경험한 중·장년층 224명을 대상으로 연구를 진행하였다. 잠재프로파일 분석 결과, BJW와 사회계층의 수준 조합에 따라 총 5개의 잠재집단이 분류되었으며, 각각 '상대적 자기만족'집단, '사회만족'집단, '상대적 박탈감'집단, '공정성 신뢰'집단, '공정성 불신'집단으로 명명하였다. 다음으로 잠재집단에 따라 진로전환, 소명의식, 일의 의미에서 차이가 있는지 살펴보기 위해 다변량 분산분석(MANOVA)을 실시하였고, 그 결과 잠재집단별로 유의한 차이가 있었다. 마지막으로 인구통계학적 특성과 '괜찮은 일 경험'이 잠재집단 분류에 영향을 미치는지 살펴보기 위하여 다항 로지스틱 회귀분석을 실시하였다. 그 결과 '괜찮은 일 경험'을 할수록 BJW와 사회계층이 높은 집단에 속할 확률이 높았다. 이러한 연구 결과를 바탕으로 중·장년층의 진로상담에서 BJW와 사회계층을 고려한 상담전략에 대해 논의 하였고, 본 연구의 의의와 제한점을 밝혔다.

케모메트릭 방법과 결합된 레이저 유도 플라즈마 분광법을 적용한 유류 지문의 법의학적 분류 연구 (Forensic Classification of Latent Fingerprints Applying Laser-induced Plasma Spectroscopy Combined with Chemometric Methods)

  • 양준호;여재익
    • 한국광학회지
    • /
    • 제31권3호
    • /
    • pp.125-133
    • /
    • 2020
  • 본 논문에서는 다변량 분석법과 결합된 레이저 유도 플라즈마 분광법을 사용하여 겹친 유류 지문을 분리하는 혁신적인 방법을 연구하였다. LIPS는 겹친 유류 지문의 화학 성분에 대한 데이터뿐 아니라 실시간 분석 및 고속 스캐닝이 가능한 분광법이다. 레이저 유도 플라즈마 분광법을 통해 도출된 스펙트럼은 적절한 다변량 분석이 적용되어 법의학적 분류와 겹친 유류 지문의 재구성에 유용한 화학적 성분을 제공한다. 본 연구에서는 LIPS 스펙트럼에서 4가지의 유류 지문을 분류하기 위하여, 주성분 분석 방식과 부분 최소 제곱 회귀 분석을 사용하였다. 제안된 방법은 SIMCA 및 PLS-DA와 같은 구별 방식을 사용하여 4개의 유류 지문의 분류를 성공적으로 입증하였다. 본 연구의 결과는 대략 85% 이상의 정확도를 가졌으며, external validation 실험에서도 분류의 가능함을 보였다. 최종적으로, 125 ㎛의 공간 간격으로 레이저 스캐닝 분석을 통한 겹친 유류 지문의 2차원 형태의 분리가 가능함을 입증하였다.

A New Latent Class Model for Analysis of Purchasing and Browsing Histories on EC Sites

  • Goto, Masayuki;Mikawa, Kenta;Hirasawa, Shigeichi;Kobayashi, Manabu;Suko, Tota;Horii, Shunsuke
    • Industrial Engineering and Management Systems
    • /
    • 제14권4호
    • /
    • pp.335-346
    • /
    • 2015
  • The electronic commerce site (EC site) has become an important marketing channel where consumers can purchase many kinds of products; their access logs, including purchase records and browsing histories, are saved in the EC sites' databases. These log data can be utilized for the purpose of web marketing. The customers who purchase many product items are good customers, whereas the other customers, who do not purchase many items, must not be good customers even if they browse many items. If the attributes of good customers and those of other customers are clarified, such information is valuable as input for making a new marketing strategy. Regarding the product items, the characteristics of good items that are bought by many users are valuable information. It is necessary to construct a method to efficiently analyze such characteristics. This paper proposes a new latent class model to analyze both purchasing and browsing histories to make latent item and user clusters. By applying the proposal, an example of data analysis on an EC site is demonstrated. Through the clusters obtained by the proposed latent class model and the classification rule by the decision tree model, new findings are extracted from the data of purchasing and browsing histories.

잠재프로파일 분석을 이용한 대학생활 만족유형 분류 및 영향요인 분석 (Analysis of Student's Satisfaction Types of the Campus-Life and Affecting Factors using Latent Profile Analysis)

  • 유호준;길혜지;나민주
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.482-491
    • /
    • 2022
  • 본 연구는 대학생의 대학생활 만족유형을 분류하고 그 영향요인을 분석하는 데 목적이 있다. 이를 위해 도지역 소재한 A 국립대학 재학생을 대상으로 매년 실시되는 대학생활 및 교육경험 실태조사 자료를 활용하였다. 그리고 잠재프로파일 분석을 실시하여 유형을 분류하고 각 유형 분류에 영향을 미치는 요인을 파악하기 위해 다항 로지스틱 회귀분석을 실시하였다. 분석결과, 대학생의 대학생활 및 교육경험 만족에 대한 잠재프로파일은 4개의 집단 즉, '평균 만족형(44.4%)', '수업 만족형(42.5%)', '최고 만족형(3.2%)', '관계 만족형(9.9%)'으로 분류되었다. 그리고 평균 만족형을 참조집단으로 하여 나머지 3개 유형으로의 분류에 영향을 미치는 요인을 탐색한 결과 성별, 학년, 입학전형, GPA 성적등급 모든 유의한 영향을 미치는 것으로 나타났다. 이러한 결과를 바탕으로, 본 연구는 대학 차원에서 학생맞춤형교육, 학생지원정책을 기획 및 추진하는 데 시사점을 제시하였다.

의료정보 이용의 잠재적 유형에 따른 의료서비스 특성분석 (Analysis of the characteristics of medical service depending on the latent classification of medical information)

  • 안창희
    • 한국병원경영학회지
    • /
    • 제17권3호
    • /
    • pp.57-82
    • /
    • 2012
  • The primary purpose of this study is to examine consumers'probing actions to see what information sources consumers search for medical information when there are diverse medical service information channels, and classify consumers by information source. Its secondary purpose is to understand trust of information and attitude toward information by consumer type, value of medical service, satisfaction with medical service, and word-of-mouth intention. This study will concretely identify information utilization patterns of medical consumers, and explain the unique characteristics and behavior of segmented types of medical consumers. The significance of this study lies in the search for ways to establish information channels trusted by consumers for building an efficient medical service market in the future. The results of this study show that consumers were classified by the latent class analysis(LCA) into 5 types: low-level information seekers, word-of-mouth information seekers, mass media information seekers, digital information seekers and diverse information seekers. The reliability of information sources by type of medical consumer was statistically significant, and in the analysis of differences in consumer attitude, there was a statistically significant difference in cognitive responses. The value of medical service was statistically significant in health recovery and medical service word-of-mouth intention.

  • PDF