• 제목/요약/키워드: LDA Model

검색결과 166건 처리시간 0.028초

커뮤니티 기반 Q&A서비스에서의 질의 할당을 위한 이용자의 관심 토픽 분석에 관한 연구 (A Study on Mapping Users' Topic Interest for Question Routing for Community-based Q&A Service)

  • 박종도
    • 정보관리학회지
    • /
    • 제32권3호
    • /
    • pp.397-412
    • /
    • 2015
  • 본 연구에서는 커뮤니티 기반 질의응답 서비스에서의 질의할당을 위하여, 해당 커뮤니티에 축적된 질의응답 데이터 세트를 이용하여 해당 카테고리내의 토픽을 분석하고 이를 바탕으로 해당 토픽에 관심을 가지는 이용자의 관심 토픽을 분석하고자 하였다. 특정 카테고리 내의 토픽을 분석하기 위해서 LDA기법을 사용하였고 이를 이용하여 이용자의 관심 토픽을 모델링하였다. 나아가, 커뮤니티에 새롭게 유입되는 질의에 대한 토픽을 분석한 후, 이를 바탕으로 해당 토픽에 대해 관심을 가지고 있는 이용자를 추천하기 위한 일련의 방법들을 실험하였다.

Interval Type-2 RBF 신경회로망 기반 CT 기법을 이용한 강인한 얼굴인식 패턴 분류기 설계 (Design of Robust Face Recognition Pattern Classifier Using Interval Type-2 RBF Neural Networks Based on Census Transform Method)

  • 진용탁;오성권
    • 전기학회논문지
    • /
    • 제64권5호
    • /
    • pp.755-765
    • /
    • 2015
  • This paper is concerned with Interval Type-2 Radial Basis Function Neural Network classifier realized with the aid of Census Transform(CT) and (2D)2LDA methods. CT is considered to improve performance of face recognition in a variety of illumination variations. (2D)2LDA is applied to transform high dimensional image into low-dimensional image which is used as input data to the proposed pattern classifier. Receptive fields in hidden layer are formed as interval type-2 membership function. We use the coefficients of linear polynomial function as the connection weights of the proposed networks, and the coefficients and their ensuing spreads are learned through Conjugate Gradient Method(CGM). Moreover, the parameters such as fuzzification coefficient and the number of input variables are optimized by Artificial Bee Colony(ABC). In order to evaluate the performance of the proposed classifier, Yale B dataset which consists of images obtained under diverse state of illumination environment is applied. We show that the results of the proposed model have much more superb performance and robust characteristic than those reported in the previous studies.

Evolutionary Computing Driven Extreme Learning Machine for Objected Oriented Software Aging Prediction

  • Ahamad, Shahanawaj
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.232-240
    • /
    • 2022
  • To fulfill user expectations, the rapid evolution of software techniques and approaches has necessitated reliable and flawless software operations. Aging prediction in the software under operation is becoming a basic and unavoidable requirement for ensuring the systems' availability, reliability, and operations. In this paper, an improved evolutionary computing-driven extreme learning scheme (ECD-ELM) has been suggested for object-oriented software aging prediction. To perform aging prediction, we employed a variety of metrics, including program size, McCube complexity metrics, Halstead metrics, runtime failure event metrics, and some unique aging-related metrics (ARM). In our suggested paradigm, extracting OOP software metrics is done after pre-processing, which includes outlier detection and normalization. This technique improved our proposed system's ability to deal with instances with unbalanced biases and metrics. Further, different dimensional reduction and feature selection algorithms such as principal component analysis (PCA), linear discriminant analysis (LDA), and T-Test analysis have been applied. We have suggested a single hidden layer multi-feed forward neural network (SL-MFNN) based ELM, where an adaptive genetic algorithm (AGA) has been applied to estimate the weight and bias parameters for ELM learning. Unlike the traditional neural networks model, the implementation of GA-based ELM with LDA feature selection has outperformed other aging prediction approaches in terms of prediction accuracy, precision, recall, and F-measure. The results affirm that the implementation of outlier detection, normalization of imbalanced metrics, LDA-based feature selection, and GA-based ELM can be the reliable solution for object-oriented software aging prediction.

연구동향 탐색을 통한 전통시장 활성화 방안 연구 (Research on Ways to Revitalize Traditional Markets by Exploring Research Trends)

  • Choon-Ho LEE;Hoe-Chang YANG
    • 융합경영연구
    • /
    • 제11권4호
    • /
    • pp.53-63
    • /
    • 2023
  • Purpose: The purpose of this study is to examine the research trends in the papers published by Korean researchers related to traditional markets, to check what topics have been studied, and to make various suggestions for research directions and effective ways to revitalize traditional markets. Research design, data and methodology: To this end, this study conducted word frequency analysis, co-occurrence frequency analysis, BERTopic, LDA, dynamic topic modeling and OLS regression analysis using Python 3.7 on the English abstracts of a total of 502 papers extracted through ScienceON. Results: As a result of word frequency analysis and co-occurrence frequency analysis, it was found that studies related to traditional markets have been conducted not only on factors related to customers, but also on traditional market merchants and government policies, and the degree of service, quality, and satisfaction perceived by customers using traditional markets. Through BERTopic and LDA, three topics such as 'Traditional market safety management' were identified, and among them, it was found that 'Traditional market safety management' is relatively less attention by researchers. Conclusions: The results of this study suggest that future research on the revitalization of traditional markets should be conducted from a specific consulting perspective along with the establishment of various data, a causal model study from various perspectives such as the characteristics of merchants as well as consumers, and an integrated and convergent approach to policy formulation by the government and local governments.

Improvement of recommendation system using attribute-based opinion mining of online customer reviews

  • Misun Lee;Hyunchul Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.259-266
    • /
    • 2023
  • 본 논문에서는 속성기반 오피니언 마이닝(ABOM)을 적용한 협업 필터링의 정확도 성능을 개선할 수 있는 알고리즘을 제안한다. 실험을 위해 국내 스마트폰 사용자의 스마트폰 앱에 대한 총 1,227건의 온라인 소비자 리뷰 데이터가 분석에 사용되었다. KKMA(꼬꼬마)분석기를 이용하여 형태소 분석 및 KOSAC를 사용하여 감성어 분석 후 LDA 토픽 모델링을 사용하여 속성 추출한 가중치 값을 부여한 리뷰별로 토픽 모델링 결과를 이용하여 협업필터링의 평점과 감성스코어의 평점을 합산한 평균값 정확도 오차를 계산한 통계모형 성능 평가인 MAE, MAPE, RMSE를 사용하였다. 실험을 통해 추천 알고리즘 중 전통적인 협업필터링과 LDA 속성 추출과 감성분석을 결합한 속성기반 오피니언 마이닝(Aspect-Based Opinion Mining, ABOM) 기법을 결합하여 온라인 고객의 앱 평점(APP_Score) 대한 정확도를 예측하였다. 분석 결과 전통적인 협업필터링을 구현한 평점의 정확도 보다 속성기반 오피니언 마이닝 CF를 적용한 평점의 예측 정확도가 더 우수한 것으로 나타났다.

Empirical Comparison of Word Similarity Measures Based on Co-Occurrence, Context, and a Vector Space Model

  • Kadowaki, Natsuki;Kishida, Kazuaki
    • Journal of Information Science Theory and Practice
    • /
    • 제8권2호
    • /
    • pp.6-17
    • /
    • 2020
  • Word similarity is often measured to enhance system performance in the information retrieval field and other related areas. This paper reports on an experimental comparison of values for word similarity measures that were computed based on 50 intentionally selected words from a Reuters corpus. There were three targets, including (1) co-occurrence-based similarity measures (for which a co-occurrence frequency is counted as the number of documents or sentences), (2) context-based distributional similarity measures obtained from a latent Dirichlet allocation (LDA), nonnegative matrix factorization (NMF), and Word2Vec algorithm, and (3) similarity measures computed from the tf-idf weights of each word according to a vector space model (VSM). Here, a Pearson correlation coefficient for a pair of VSM-based similarity measures and co-occurrence-based similarity measures according to the number of documents was highest. Group-average agglomerative hierarchical clustering was also applied to similarity matrices computed by individual measures. An evaluation of the cluster sets according to an answer set revealed that VSM- and LDA-based similarity measures performed best.

Enhancing Music Recommendation Systems Through Emotion Recognition and User Behavior Analysis

  • Qi Zhang
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.177-187
    • /
    • 2024
  • 요약 배경: 기존 음악 추천 시스템은 가사의 의도된 감정과 사용자가 실제로 느끼는 감정 사이의 불일치를 충분히 고려하지 않았다. 모델: 본 연구에서는 LDA 모델을 활용하여 가사와 사용자 댓글의 주제 벡터를 생성하고, 시간 감쇠 효과와 재생 횟수를 반영한 사용자 행동 궤적과 통계 특성을 결합하여 사용자 선호도 모델을 구축했다. 결과: 실증 분석 결과, 제안 모델이 가사만 활용한 기존 모델보다 높은 정확도로 음악을 추천했다. 시사점: 본 연구는 감정 인식과 사용자 행동 분석을 통합하여 개인화된 음악 추천 시스템을 개선하는 새로운 방법론을 제시한다.

Feasibility of a Linear Diode Array Detector for Commissioning of a Radiotherapy Planning System

  • Seung Mo Hong;Uiseob Lee;Sung-woo Kim;Youngmoon Goh;Min-Jae Park;Chiyoung Jeong;Jungwon Kwak;Byungchul Cho
    • 한국의학물리학회지:의학물리
    • /
    • 제34권1호
    • /
    • pp.1-9
    • /
    • 2023
  • Purpose: Although ionization chambers are widely used to measure beam commissioning data, point-by-point measurements of all the profiles with various field size and depths are time-consuming tasks. As an alternative, we investigated the feasibility of a linear diode array for commissioning a treatment planning system. Methods: The beam data of a Varian TrueBeam® radiotherapy system at 6 and 10 MV with/without a flattening filter were measured for commissioning of an Eclipse Analytical Anisotropic Algorithm (AAA) ver.15.6. All of the necessary beam data were measured using an IBA CC13 ionization chamber and validated against Varian "Golden Beam" data. After validation, the measured CC13 profiles were used for commissioning the Eclipse AAA (AAACC13). In addition, an IBA LDA-99SC linear diode array detector was used to measure all of the beam profiles and for commissioning a separate model (AAALDA99). Finally, the AAACC13 and AAALDA99 dose calculations for each of the 10 clinical plans were compared. Results: The agreement of the CC13 profiles with the Varian Golden Beam data was confirmed within 1% except in the penumbral region, where ≤2% of a discrepancy related to machine-specific jaw calibration was observed. Since the volume was larger for the CC13 chamber than for the LDA-99SC chamber, the penumbra widths were larger in the CC13 profiles, resulting in ≤5% differences. However, after beam modeling, the penumbral widths agreed within 0.1 mm. Finally the AAALDA99 and AAACC13 dose distributions agreed within 1% for all voxels inside the body for the 10 clinical plans. Conclusions: In conclusion, the LDA-99SC diode array detector was found to be accurate and efficient for measuring photon beam profiles to commission treatment planning systems.

의미적 의존 링크 토픽 모델을 이용한 생물학 약어 중의성 해소 (Semantic Dependency Link Topic Model for Biomedical Acronym Disambiguation)

  • 김선호;윤준태;서정연
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.652-665
    • /
    • 2014
  • 생물학 도메인은 약어 표현이 빈번하며, 실제로 문서에서 중요한 의미를 지니는 개체명들이 약어로 표현되는 경우가 많다. 본 연구에서는 토픽과 링크 정보를 이용하여 약어 중의성을 해결하고 동일한 의미를 가지는 다양한 형태의 약어 원형들(variant forms)에 대한 그룹핑을 시도한다. 이를 위하여 LDA(latent Dirichlet allocation) 기반 의미적 의존 링크 토픽 모델(semantic dependency topic model)을 제안한다. 해당 모델은 생성 모델(generative model)의 일종으로 문서 집합의 각 문서에 등장하는 단어들은 문서에서 발생하는 토픽 분포와 토픽 당 단어 분포에 의해 생성되어 있는 것으로 가정하고, 관측 가능한 문서 집합의 단어들로부터 문서에 내재된 숨어있는 토픽 구조를 추론하여 단어 생성과 토픽 파라미터를 연결시킨다. 본 연구에서는 토픽 정보 외에 단어들 사이에 존재하는 의미적 의존성(semantic dependency)을 링크로 정의하고, 단어 간에 존재하는 링크 정보, 특히 원형과 문장에서 공기하는 단어들 사이의 링크를 파라미터화하여 중의성 해결에 이용하였다. 결과적으로 주어진 문서에 등장하는 약어에 대해 가장 가능성 있는 원형은 해당 모델을 이용하여 추론된 단어-토픽, 문서-토픽, 단어-링크 확률에 의해서 결정된다. 제안하는 모델은 MEDLINE 초록으로부터 Entrez 인터페이스를 이용해 22개의 약어 집합과 186개의 가능한 약어 원형을 이용하여 질의를 생성하고, 이를 이용해 검색된 문서들을 대상으로 학습과 테스트에 이용하였다. 실험은, 주어진 문서에 등장하는 해당 약어에 대한 원형이 무엇인지 예측하는 방식으로 98.3%의 정확률의 높은 성능을 보였다.

Analyzing the Factors of Gentrification After Gradual Everyday Recovery

  • Yoon-Ah Song;Jeongeun Song;ZoonKy Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.175-186
    • /
    • 2023
  • 본 연구는 단계적 일상회복 이후 상권 회복세와 함께 임대료가 급상승한 시점에 주목하여 젠트리피케이션 분석 모형을 구축하고 그 특징을 살펴보는 것이 목적이다. 최근 국내에서는 팬데믹 이후 거리두기의 영향으로 대규모 상권보다는 소규모 상권이 형성되었다. 바로 핫플레이스라고 알려진 골목상권이다. 핫플레이스는 다양한 미디어와 사회관계망서비스를 통해 집객효과를 누리며 인기를 끌고 있다. 그에 따라 유동인구가 증가하면서 상권이 활성화 되고 임대료가 급상승하는 현상이 발생하고 있다. 하지만 소상공인의 경우 임대료 급상승은 매출 증가로도 감당하지 못해 해당 지역을 이탈하는 젠트리피케이션 현상으로 이어질 수 있다. 따라서 본 연구에서는 상권이 다시 활성화되면서 임대료가 급상승하는 시점을 찾아 그 이전과 이후를 분석하고자 한다. 먼저 젠트리피케이션에 관련하여 언급되는 토픽을 탐색하기 위해 텍스트 데이터를 수집한 후 LDA 토픽 모델링을 실시한다. 이를 참고하여 상권 단위로 데이터를 수집하고 젠트리피케이션 분석 모형을 구축한 다음 특징을 분석한다. 팬데믹으로 상권이 침체된 이후 재활성화 되고 있는 시점에 본 모형을 통한 젠트리피케이션 분석이 소상공인 정책에 기여할 수 있기를 바란다.