• Title/Summary/Keyword: Sparsity

Search Result 333, Processing Time 0.029 seconds

A Personalized Movie Recommendation System Based On Personal Sentiment and Collaborative Filtering (개인의 감정과 협업필터링을 이용한 개인화 영화 추천 시스템)

  • Kim, Sun-Ho;Park, Doo-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1176-1178
    • /
    • 2013
  • 협업 필터링(Collaborative Filtering)이란 많은 사용자들로부터 얻은 기호정보(taste information)에 따라 사용자들의 관심사들을 자동적으로 예측하여, 아이템에 대한 목표 사용자의 선호도와 다른 사용자의 선호도를 비교 분석하여 목표 사용자가 좋아할 만한 아이템을 추천하는 기법이다. 그러나 협업 필터링 기법은 고객 정보와 평가 정보가 충분히 많아야 정확성이 높은 추천 결과가 나타난다. 본 논문에서는 영화를 한 번도 평가하지 않은 사용자들에게 영화를 추천 해주기 위한 즉, 협업 필터링의 희박성 문제(Sparsity Problem)를 해결하기 위한 한 가지 방법으로 개인의 감정 정보를 이용하여 문제를 해결하는 방법을 소개한다.

High-dimensional linear discriminant analysis with moderately clipped LASSO

  • Chang, Jaeho;Moon, Haeseong;Kwon, Sunghoon
    • Communications for Statistical Applications and Methods
    • /
    • v.28 no.1
    • /
    • pp.21-37
    • /
    • 2021
  • There is a direct connection between linear discriminant analysis (LDA) and linear regression since the direction vector of the LDA can be obtained by the least square estimation. The connection motivates the penalized LDA when the model is high-dimensional where the number of predictive variables is larger than the sample size. In this paper, we study the penalized LDA for a class of penalties, called the moderately clipped LASSO (MCL), which interpolates between the least absolute shrinkage and selection operator (LASSO) and minimax concave penalty. We prove that the MCL penalized LDA correctly identifies the sparsity of the Bayes direction vector with probability tending to one, which is supported by better finite sample performance than LASSO based on concrete numerical studies.

Massive MIMO Channel Estimation Algorithm Based on Weighted Compressed Sensing

  • Lv, Zhiguo;Wang, Weijing
    • Journal of Information Processing Systems
    • /
    • v.17 no.6
    • /
    • pp.1083-1096
    • /
    • 2021
  • Compressed sensing-based matching pursuit algorithms can estimate the sparse channel of massive multiple input multiple-output systems with short pilot sequences. Although they have the advantages of low computational complexity and low pilot overhead, their accuracy remains insufficient. Simply multiplying the weight value and the estimated channel obtained in different iterations can only improve the accuracy of channel estimation under conditions of low signal-to-noise ratio (SNR), whereas it degrades accuracy under conditions of high SNR. To address this issue, an improved weighted matching pursuit algorithm is proposed, which obtains a suitable weight value uop by training the channel data. The step of the weight value increasing with successive iterations is calculated according to the sparsity of the channel and uop. Adjusting the weight value adaptively over the iterations can further improve the accuracy of estimation. The results of simulations conducted to evaluate the proposed algorithm show that it exhibits improved performance in terms of accuracy compared to previous methods under conditions of both high and low SNR.

Optical Signal Sampling Based on Compressive Sensing with Adjustable Compression Ratio

  • Zhou, Hongbo;Li, Runcheng;Chi, Hao
    • Current Optics and Photonics
    • /
    • v.6 no.3
    • /
    • pp.288-296
    • /
    • 2022
  • We propose and experimentally demonstrate a novel photonic compressive sensing (CS) scheme for acquiring sparse radio frequency signals with adjustable compression ratio in this paper. The sparse signal to be measured and a pseudo-random binary sequence are modulated on consecutively connected chirped pulses. The modulated pulses are compressed into short pulses after propagating through a dispersive element. A programmable optical filter based on spatial light modulator is used to realize spectral segmentation and demultiplexing. After spectral segmentation, the compressed pulses are transformed into several sub-pulses and each of them corresponds to a measurement in CS. The major advantage of the proposed scheme lies in its adjustable compression ratio, which enables the system adaptive to the sparse signals with variable sparsity levels and bandwidths. Experimental demonstration and further simulation results are presented to verify the feasibility and potential of the approach.

HiCORE: Hi-C Analysis for Identification of Core Chromatin Looping Regions with Higher Resolution

  • Lee, Hongwoo;Seo, Pil Joon
    • Molecules and Cells
    • /
    • v.44 no.12
    • /
    • pp.883-892
    • /
    • 2021
  • Genome-wide chromosome conformation capture (3C)-based high-throughput sequencing (Hi-C) has enabled identification of genome-wide chromatin loops. Because the Hi-C map with restriction fragment resolution is intrinsically associated with sparsity and stochastic noise, Hi-C data are usually binned at particular intervals; however, the binning method has limited reliability, especially at high resolution. Here, we describe a new method called HiCORE, which provides simple pipelines and algorithms to overcome the limitations of single-layered binning and predict core chromatin regions with three-dimensional physical interactions. In this approach, multiple layers of binning with slightly shifted genome coverage are generated, and interacting bins at each layer are integrated to infer narrower regions of chromatin interactions. HiCORE predicts chromatin looping regions with higher resolution, both in human and Arabidopsis genomes, and contributes to the identification of the precise positions of potential genomic elements in an unbiased manner.

Sparsity Increases Uncertainty Estimation in Deep Ensemble

  • Dorjsembe, Uyanga;Lee, Ju Hong;Choi, Bumghi;Song, Jae Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.373-376
    • /
    • 2021
  • Deep neural networks have achieved almost human-level results in various tasks and have become popular in the broad artificial intelligence domains. Uncertainty estimation is an on-demand task caused by the black-box point estimation behavior of deep learning. The deep ensemble provides increased accuracy and estimated uncertainty; however, linearly increasing the size makes the deep ensemble unfeasible for memory-intensive tasks. To address this problem, we used model pruning and quantization with a deep ensemble and analyzed the effect in the context of uncertainty metrics. We empirically showed that the ensemble members' disagreement increases with pruning, making models sparser by zeroing irrelevant parameters. Increased disagreement implies increased uncertainty, which helps in making more robust predictions. Accordingly, an energy-efficient compressed deep ensemble is appropriate for memory-intensive and uncertainty-aware tasks.

Consideration upon Importance of Metadata Extraction for a Hyper-Personalized Recommender System on Unsupervised Learning (비지도 학습 기반 초개인화 추천 서비스를 위한 메타데이터 추출의 중요성 고찰)

  • Paik, Juryon;Ko, Kwang-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.19-22
    • /
    • 2022
  • 서비스 관점에서 구축되는 추천 시스템의 성능은 얼마나 효율적인 추천 모델을 적용하여 심층적으로 설계되었는가에 좌우된다고도 볼 수 있다. 특히, 추천 시스템의 초개인화는 세계적인 추세로 1~2년 전부터 구글, 아마존, 알리바바 등의 데이터 플랫폼 강자들이 경쟁적으로 딥 러닝 기반의 알고리즘을 개발, 자신들의 추천 서비스에 적용하고 있다. 본 연구는 갈수록 고도화되는 추천 시스템으로 인해 발생하는 여러 문제들 중 사용자 또는 서비스 정보가 부족하여 계속적으로 발생하고 있는 Cold-start 문제와 추천할 서비스와 사용자는 지속적으로 늘어나지만 실제로 사용자가 소비하게 되는 서비스의 비율은 현저하게 감소하는 데이터 희소성 문제 (Sparsity Problem)에 대한 솔루션을 모색하는 알고리즘 관점에서 연구하고자 한다. 본 논문은 첫 단계로, 적용하는 메타데이터에 따라 추천 결과의 정확성이 얼마나 차이가 나는지를 보이고 딥러닝 비지도학습 방식을 메타데이터 선정 및 추출에 적용하여 실시간으로 변화하는 소비자의 실제 생활 패턴 및 니즈를 예측해야 하는 필요성에 대해서 기술하고자 한다.

  • PDF

Research of LOCA-Based Approach Applied to Users' Preferences on Items in Different Domains (상이한 아이템에 대한 사용자 선호도 활용 LOCA 접근 방법 연구)

  • Paik, Juryon;Ko, Kwang-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.59-60
    • /
    • 2022
  • 갈수록 개인화되어 가는 추천시스템은 다양한 모델에 의해 그 성능이 향상되고 있으며 최근 추세는 다른 분야와 마찬가지로 딥러닝 기반 모델을 적용하여 추천 품질을 향상하고 있다. 그러나 대다수의 추천시스템은 하나의 도메인에서 개별적으로 사용될 뿐, 유사도메인이나 상이한 도메인이나 모두 다른 도메인에서의 사용자 성향이나 아이템 유사성을 거의 또는 전혀 고려하지 않고 있다. 이는 추천결과의 sparsity와 cold-start 문제를 더 악화시키는 원인이 된다. 본 논문은 다양한 딥러닝 모델 적용 추천 모델 중 오토인코더 모델을 지역특화 협업에 적용한 모델을 간략하게 소개하고 해당 모델을 상이한 도메인 간의 적용하기 위한 첫 단계로 손실함수 부분에 대해 개념적으로 설명하고자 한다.

  • PDF

A Study on Modeling of Sparse Tensor Accelerators (Sparse Tensor 가속기의 모델링에 관한 연구 동향)

  • Whoi Ree, Ha;Yunheung, Paek
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.336-338
    • /
    • 2023
  • Sparse한 데이터가 딥러닝에 자주 사용됨에 따라 다양한 sparse 텐서 가속기들이 연구되고 있다. 하지만 이런 sparse 텐서 가속기들은 특수 하드웨어 모듈을 채용하고 있고, 다양한 구조로 되어 있다. 또한, 가속기들의 효율성이 데이터의 sparsity에 따라 달라지기 때문에 서로의 직접적인 비교도 힘들다. 따라서 이 문제들을 해결하기 위해, sparse 텐서 가속기들을 모델링하여 서로를 비교하려는 연구들이 존재하며, 이 논문에서는 이에 관한 연구 동향을 서술하였다.

Evaluating the Performance of Hypergraph Embedding Methods According to Hypergraph Sparsity (하이퍼그래프 희소성에 따른 하이퍼그래프 임베딩 방법 성능 평가)

  • So-Bin Jung;David Y. Kang;Sang-Wook Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.641-643
    • /
    • 2024
  • 실세계에서는 두개 이상의 객체들이 서로 관계를 맺고있다. 단 두 객체 간의 관계만 표현하는 그래프와는 달리 여러 객체들 간의 관계를 표현하는 하이퍼그래프는 그룹 상호작용을 잘 표현할 수 있다. 이러한 강점으로 하이퍼그래프를 활용한 응용들이 많이 제안되고 있다. 하이퍼그래프 임베딩은 하이퍼그래프의 구조를 이용하여 노드를 저차원 벡터로 표현하는 방법이다. 이렇게 표현된 벡터들은 노드 분류, 커뮤니티 탐지, 링크예측 등 광범위한 응용에 활용된다. 하지만 하이퍼그래프는 그래프보다 희소성 문제가 훨씬 더 심해 데이터 셋의 희소성이 하이퍼그래프 임베딩 방법의 성능에 큰 영향을 미칠 수 있다. 따라서, 본 논문에서는 희소성에 따른 하이퍼그래프 임베딩 방법들의 성능을 분석하고자 한다. 우리는 8 개의 실세계 데이터셋을 이용한 실험을 통해 데이터가 희소할수록 하이퍼그래프 임베딩 방법들의 성능이 감소하는 것을 확인하였다.