• 제목/요약/키워드: Singular Decomposition

검색결과 399건 처리시간 0.026초

Personalized Size Recommender System for Online Apparel Shopping: A Collaborative Filtering Approach

  • Dongwon Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.39-48
    • /
    • 2023
  • 본 연구는 의류의 디자인 간 치수의 불일치와 비표준화로 인해 온라인 구매 시 발생하는 치수 선택의 오류 문제를 해결할 수 있는 방안을 제시하기 위해 수행되었다. 본 논문은 구매자에게 개인화된 치수를 제시할 수 있는 기계 학습 기반 추천 시스템의 구현 방안을 다루고 있다. 온라인 상거래로부터 발생된 구매 데이터를 사용하여 비음수 행렬 분해(NMF), 특이값 행렬 분해(SVD), k-최근접 이웃(KNN), 공동 클러스터링(Co-Clustering) 등 여러 검증된 협업 필터링 알고리즘을 훈련하였고, 이들 간에 성능을 비교하였다. 연구 결과, 비음수 행렬 분해 (NMF) 알고리즘이 다른 알고리즘들보다 뛰어난 성능을 보임을 확인할 수 있었다. 동일한 계정을 사용하는 여러 구매자가 포함되는 구매 데이터의 특성에도 불구하고, 제안 모형은 충분한 정확도를 보였다. 본 연구의 결과는 치수 선택의 오류로 인한 반품률을 감소하고 전자상거래 플랫폼에서의 고객 경험을 향상시키는 데 기여할 것으로 기대된다.

Multi-environment Trial Analysis for Yield-related Traits of Early Maturing Korean Rice Cultivars

  • Seung Young Lee;Hyun-Sook Lee;Chang-Min Lee;Su-Kyung Ha;Youngjun Mo;Ji-Ung Jeung
    • 한국작물학회:학술대회논문집
    • /
    • 한국작물학회 2022년도 추계학술대회
    • /
    • pp.252-252
    • /
    • 2022
  • Genotype-by-environment interaction (GEI) refers to the comparative response of genotypes to different environments conditions. Thus, understanding GEI is a fundamental component for selecting superior genotypes for breeding programs. The significance of utilizing early maturing cultivars not only provides flexibility in planting dates, but also serves as an effective strategy to reduce methane emission from the paddy fields. In this study, we conducted multi-environment trials (METs) to evaluate yield-related traits such as culm length, panicle length, panicle number, spikelet per plant, and thousand grain weight. A total of eighty-one Korean commercial rice cultivars categorized as early maturing cultivars, were cultivated in three regions, two planting seasons for two years. The genotype main effect plus genotype-by-environment interaction (GGE) biplot analysis of yield-related traits and grain yield explained 70.02-91.24% of genotype plus GEI variation, and exhibited various patterns of mega-environment delineation, discriminating ability, representativeness, and genotype rankings across the planting seasons and environments. Moreover, simultaneous selection using weighted average of absolute scores from the singular value decomposition (WAASB) and multi-trait stability index (MTSI) revealed six highly recommended genotypes with high stability and crop productivity. The winning genotypes under specific environment can be utilized as useful genetic materials to develop regional specialty cultivars, and recommended genotypes can be used as elite climate-resilient parents to improve yield-potential and reduce methane emission as part to accomplish carbon-neutrality.

  • PDF

주성분 분석을 통한 선박 기관 상태의 차수 축소 모델링 (Reduced Order Modeling of Marine Engine Status by Principal Component Analysis)

  • 이승범;서정화;김동환;한상민;김관우;정성욱;유병우
    • 대한조선학회논문집
    • /
    • 제61권1호
    • /
    • pp.8-18
    • /
    • 2024
  • The present study concerns reduced order modeling of a marine diesel engine, which can be used for outlier detection in status monitoring and carbon intensity index calculation. Principal Component Analysis (PCA) is introduced for the reduced order modeling, focusing on the feasibility of detecting and treating nonlinear variables. By cross-correlation, it is found that there are seven non-linear data channels among 23 data channels, i.e., fuel mode, exhaust gas temperature after the turbocharger, and cylinder coolant temperatures. The dataset is handled so that the mean is located at the nominal continuous rating. Polynomial presentation of the dataset is also applied to reflect the linearity between the engine speed and other channels. The first principal mode shows strong effects of linearity of the most data channels to show the linearity of the system. The non-linear variables are effectively explained by other modes. second mode concerns the temperature of the cylinder cooling water, which shows small correlation with other variables. The third and fourth modes correlates the fuel mode and turbocharger exhaust gas temperature, which have inferior linearity to other channels. PCA is proven to be applicable to data given in binary type of fuel mode selection, as well as numerical type data.

오믹스 자료를 이용한 정준방법 비교 (A comparison study of canonical methods: Application to -Omics data)

  • 이승수;민은정
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.157-176
    • /
    • 2024
  • 생명현상의 복잡한 시스템에 대한 이해를 위한 융합분석의 중요성이 점점 커지고 있다. 하나의 연구대상을 다양한 관점에서 관찰하여 얻게 되는 여러 데이터의 융합분석은 통해 좀 더 대상에 대한 깊은 이해를 가능하게 한다. 본 연구에서는 그중에서도 특히 하나의 샘플에서 두개의 고차원 데이터가 생성된 경우 다룰 수 있는 분석인 공관성분석과 정준상관분석을 비교하였다. 정준상관분석의 경우 고차원 데이터를 다룰 수 없는 단점이 있기에, 해당 문제를 극복하기 위하여 능형상수를 이용하는 방법(CCA-ridge)과 각 데이터의 공분산행렬을 항등행렬로 가정하여 벌점화 특이값분해를 이용한 방법(CCA-PMD) 두 가지를 고려하였으며 각 방법을 NCI60 세포주 패널에서 얻은 RNA 시퀀싱 데이터와 단백질 시퀀싱 데이터 분석에 적용하였다. 그 결과 정준상관분석의 경우 두 정준변수간의 상관관계에 좀 더 집중하는 반면 공관성분석은 각 데이터의 선형조합간의 상관관계뿐 아니라 각 선형조합의 변동성을 함께 고려함을 확인할 수 있었다. 또한 공관성분석의 경우 여러가지의 가중치행렬을 고려하여 그 결과값을 비교하고 중요 시사점을 도출하였다.

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

뇌종양의 등급분류를 위한 관류 자기공명영상을 이용한 투과성영상(Permeability Map)의 유용성 평가 (Usefulness of Permeability Map by Perfusion MRI of Brain Tumor the Grade Assessment)

  • 배성진;이영주;장혁원
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제32권3호
    • /
    • pp.325-334
    • /
    • 2009
  • 목 적 : 관류 자기공명영상(perfusion MRI)을 이용하여 대뇌(cerebral)에서 혈액뇌장벽의 파괴로 인하여 조영제가 혈관내에서 조직으로 빠져 나가는 투과성과 상대적 뇌혈류량을 영상화 해보고, 이 영상을 이용하여 구한 투과성비와 상대적 뇌혈류량비가 종양의 악성등급 평가와 감별진단에 어떠한 유용성이 있는지 알아보고자 하였다. 대상 및 방법 : 영상의학진단과 병리조직검사로 진단된 29명을 대상으로 뇌종양이 포함된 550(11 silce $\times$ 50 image)관류 자기공명영상을 3T기기에 장착된 프로그램으로 상대적 뇌혈류량을 영상화 하였고, 다른 한 방법은 개인 컴퓨터에 영상을 전송 후 IDL 6.2 프로그램을 이용하여 상대적 뇌혈류량(relative cerebral blood volume-reformulated singular value decomposition, rCBV-rSVD)과 투과성을 영상화 하였다. 그 영상을 이용하여 동일한 관심영역으로 화소별 평균 신호강도를 정량적(quantitative analysis)으로 측정하여 비모수적 통계인 Kruskal-wallis test를 통해 뇌종양별로 평균비교 분석을 하였다. 결과 : 상대적 뇌혈류량영상과 투과성영상을 이용하여 동일한 관심영역으로 정상부위와 종양부위의 정량적으로 분석한 상대적 뇌혈류량 비 와 (3T 기기자체 분석한 값, IDL 6.2로 분석한 값) 투과성비에서 고등급 성상세포종(n=4)의 경우 (14.75, 19.25) 13.13, 저등급 성상세포종(n=5) (14.80, 15.90) 11.60, 아세포종(n=5) (10.90, 18.60) 22.00, 전이성 뇌종양(n=6) (11.00, 15.08) 22.33, 수막종(n=6) (18.58, 7.67) 5.58, 핍돌기 신경교종(n=3) (23.33, 16.33) 15.67로 나타났다. 결론 : 종양별로 상대적 혈류량영상을 이용하여 측정한 상대적 뇌혈류량 비는 등급을 분류하기에 용이하지 않았지만, 투과성영상으로 측정한 투과성비는 종양 악성정도가 높을수록 높은 것으로 나타나 종양의 등급 평가와 감별진단에 유용하였다.

  • PDF

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.

잡음 파워 스펙트럼 밀도 추정을 이용한 서로소 배열과 프로퍼게이터 기법 기반의 향상된 도래각 추정 기법 (Improved Direction of Arrival Estimation Based on Coprime Array and Propagator Method by Noise Power Spectral Density Estimation)

  • 변부근;유도식
    • 한국항행학회논문지
    • /
    • 제20권4호
    • /
    • pp.367-373
    • /
    • 2016
  • 우리는 도래각 (DoA; direction of arrival) 추정 방법 중 하나인 서로소 배열 기반의 프로퍼게이터 방법을 개선시키는 알고리즘을 제안한다. 서로소 배열 기반의 프로퍼게이터 방법은 특이값 분해없이 도래각을 추정하는 방법으로 서로소 배열 기반의 MUSIC에 비하여 현저히 낮은 복잡도를 지녔으나, 다소 저하된 도래각 추정 성능을 보인다. 우리는 이러한 성능 저하의 원인 중 하나로 잡음의 파워 스펙트럼 밀도를 포함하고 있는 신호의 자기상관행렬의 대각 성분이 사용되고 있지 않음에 있음을 파악하고, 잡음의 파워 스펙트럼 밀도가 장기간에 걸쳐 추정이 가능하다는 사실에 착안하여 신호의 자기상관행렬의 대각 성분을 사용하는 도래각 추정 방법을 제안한다. 우리는 시뮬레이션을 통해 우리가 제안한 방법이 기존의 서로소 배열 기반의 프로퍼게이터 방법보다 연산량을 4배정도 증가시키지만 탐지확률 95% 기준 하에 신호대 잡음비를 1.5dB, 도래각 분해능을 $0.7^{\circ}$ 만큼 개선시켜 그 성능이 서로소 배열 기반의 MUSIC에 보다 근접함을 관찰한다.

감마나이프 시상하핵파괴술에서 목표물 위치측정을 위한 렉셀 감마플랜 능력의 조사 (Investigation of Leksell GammaPlan's ability for target localizations in Gamma Knife Subthalamotomy)

  • 허병익
    • 한국방사선학회논문지
    • /
    • 제13권7호
    • /
    • pp.901-907
    • /
    • 2019
  • 이 연구의 목적은 기능성 질환의 감마나이프 시상하핵파괴술(또는 담창구파괴술, 시상파괴술)에서 렉셀 감마플랜의 표적 위치측정의 능력을 평가하는 것이다. 렉셀 감마플랜의 위치 설정의 정확성을 평가하기 위해 본원에서 뇌심부 자극술 수술을 받은 10명의 환자에 대해 렉셀 감마플랜(또는 렉셀 써지플랜)과 저자의 알고리즘에 의해 계산된 표적 좌표들의 차이 Δr가 평가 되었다. Δr는 0.0244663 mm에서 0.107961 mm까지 범위의 값을 가졌다. Δr의 평균은 0.054398 mm이었다. 또한 정위 공간과 뇌지도 공간 두 좌표계 사이의 위치 관계를 결정하기 위하여 좌표변환 행렬을 매스매티카(Mathematica)의 의사역행렬 또는 특이값 분해를 사용하여 계산하였다. 정교한 정위틀 장착에도 불구하고 요(yaw)는 -3.44739 도에서 1.82243 도, 피치(pitch)는 -4.57212 도에서 0.692063 도, 롤(roll)은 -6.38239 도에서 7.21426 도까지의 정렬 불량(misalignment)이 나타났다. 결론적으로, 사내 알고리즘을 사용하여 감마나이프 플랫폼에서 렉셀 감마플랜(또는 렉셀 써지플랜)의 위치 설정에 대한 정확도를 확인함으로써 뇌심부 자극술에 금기 사항이 있는 개인이나 노인과 같이 종래 수술에 고위험으로 간주되는 환자에 대한 난치성 운동이상 질환의 대체 치료법으로 안전과 효능을 가진 감마나이프 시상하핵파괴술(또는 담창구파괴술, 시상파괴술)이 추천된다. 향후 기능성 질환의 표적 위치측정을 위해 제안된 알고리즘은 여러 감마나이프 센터의 운동이상 질환 치료에 기여할 것이라 사료된다.

LSA모형에서 다의어 의미의 표상 (Representation of ambiguous word in Latent Semantic Analysis)

  • 이태헌;김청택
    • 인지과학
    • /
    • 제15권2호
    • /
    • pp.23-31
    • /
    • 2004
  • 잠재의미분석은 단어 의미를 동일한 맥락 (문장/문서) 하에서 동시에 제시되는 단어들의 공기성(co-occurence)으로 정의한다. 이 분석에서 한 단어는 맥락들을 대표하는 측들로 구성된 다차원 상의 한 점으로 표상 되며, 단어 의미는 각 단어가 맥락 속에서 등장한 빈도로 정의된다. 이 다차원 의미공간은 SVD를 통하여 차원이 축소되어 추상된 의미를 표상 한다. 이 연구는 다의어의 표상이 가능하도록 LSA를 발전시켰다. 제안된 LSA는 축에 대한 해석이 가능하도록 축의 회전을 도입하였으며 다의어 표상을 가능하게 하였다. 시뮬레이션에서는, 먼저 LSA에 의해 산출된 단어-맥락 빈도표에서 다의어를 포함하고 있는 문서들만을 재 수집한 다음 문서들을 다의어 의미별로 분류하였다. 두 번째 단계에서는 다의어의 특정의미에 대한 표상을 분류된 단어-맥락 빈도표에서 비해당 의미에 대한 맥락들을 제거한 후 LSA를 적용하여 구성하였다. 시뮬레이션 결과는 다의어의 의미들을 LSA가 표상 할 수 있음을 보여주었다. 이는 축회전을 포함한 LSA가 다의어 다중의미를 표상 할 수 있고 실용적인 측면에서 웹검색 엔진에도 적용될 수 있음을 시사한다.

  • PDF