• 제목/요약/키워드: data factorization

검색결과 122건 처리시간 0.026초

Multi-Program 벤치마크를 이용한 대칭구조 Multiprocessor의 성능평가와 분석 (Performance Evaluation and Analysis of Symmetric Multiprocessor using Multi-Program Benchmarks)

  • 정태경
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.645-651
    • /
    • 2006
  • 본 논문은 컴퓨터 시스템의 성능평가와 분석을 대칭구조의 멀티프로세서를 실행할 수 있는 시뮬레이터를 사용하여 살펴보았으며 또한 시스템 분석을 하는데 있어서 멀티프로세서를 위한 멀티프로그램 벤치마크의 집합체인 SPLASH-2를 이행하여 대칭구조의 운영체제 IRIX5.3 탑재한 멀티프로세서의 행위범위의 연구를 수행하기 위하여 멀티프로세서의 시스템 분석을 실시 하였다. 또한 대칭구조의 멀티프로세서의 구조와 평가방법을 보다 유효하게 하기 위해서 멀티프로세서의 확장성을 functionality-based 소프트웨어인 SimOS를 가지고 증명하였으며 본 논문을 통하여 멀티프로그램 벤치마크인 RADIX 정렬 알고리즘이나 Cholesky 인수분해 알고리즘을 이용하여 로칼 인스트럭션과 로칼 데이터 사이에서의 멀티프로세서의 Cache miss의 수 와 Stall 시간을 동시에 검사하였다.

천음속 압축기 동익을 지나는 삼차원 유동의 수치해석 (Numerical Calculation of Three-Dimensional F1ow through A Transonic Compressor Rotor)

  • 이용갑;김광용
    • 대한기계학회논문집B
    • /
    • 제25권10호
    • /
    • pp.1384-1391
    • /
    • 2001
  • Three-dimensional flow analysis is implemented to investigate the flow through transonic axial-flow compressor rotor(NASA R67) and to evaluate the performances of Abid's low-Reynolds-number k-$\omega$ and Baldwin-Lomax turbulence models. A finite volume method is used fur spatial discretization. The equations are solved implicitly in time by the use of approximate factorization. The upwind difference scheme is used for inviscid terms and viscous terms are approximated with central difference. The flux-difference-splitting method of Roe is used to obtain fluxes at the cell faces. Numerical analysis is performed near peak efficiency and near stall. The results are compared with the experimental data for NASA R67 rotor. Blade-to-Blade Mach number distributions are compared to confirm the accuracy of the code. From the results, it is concluded that Abid'k-$\omega$ model is better for the calculation of flow rate and efficiency than Baldwin-Lomax model. But, the predictions for Mach number and shock structure are almost the same.

입경 분포 원인 분석 및 PM2.5 밀도 추정 -Part II (Source Analysis of Size Distribution and Density Estimation in PM2.5 -Part II)

  • 배민석;박다정;이정훈;안준영;이영재
    • 한국대기환경학회지
    • /
    • 제32권2호
    • /
    • pp.158-166
    • /
    • 2016
  • To characterize the features of particle apparent density, continuous measurements of particle number size distributions from optical particle sizer (OPS) and 24 hr integrated particle mass concentrations from filter based sampler were conducted at the National institute of environmental research NamBu Supersite (NNBS, $35.22^{\circ}N$, $126.84^{\circ}E$) in Gwangju for 16 days from Nov. 4 in 2014. Source apportionment model was carried out by applying Positive Matrix Factorization (PMF) to particle size distribution data. Three different distributions related to primary and secondary sources were investigated by the diurnal patterns of identified factors. Density estimated by gaussian model has been calculated as $1.69g/cm^3$ with 95% confidence bounds ($1.57{\sim}1.81g/cm^3$).

아파치 스파크에서의 PARAFAC 분해 기반 텐서 재구성을 이용한 추천 시스템 (PARAFAC Tensor Reconstruction for Recommender System based on Apache Spark)

  • 임어진;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제22권4호
    • /
    • pp.443-454
    • /
    • 2019
  • In recent years, there has been active research on a recommender system that considers three or more inputs in addition to users and goods, making it a multi-dimensional array, also known as a tensor. The main issue with using tensor is that there are a lot of missing values, making it sparse. In order to solve this, the tensor can be shrunk using the tensor decomposition algorithm into a lower dimensional array called a factor matrix. Then, the tensor is reconstructed by calculating factor matrices to fill original empty cells with predicted values. This is called tensor reconstruction. In this paper, we propose a user-based Top-K recommender system by normalized PARAFAC tensor reconstruction. This method involves factorization of a tensor into factor matrices and reconstructs the tensor again. Before decomposition, the original tensor is normalized based on each dimension to reduce overfitting. Using the real world dataset, this paper shows the processing of a large amount of data and implements a recommender system based on Apache Spark. In addition, this study has confirmed that the recommender performance is improved through normalization of the tensor.

채용정보 분석을 통한 비즈니스 직무 스펙 연구 (Research on Business Job Specification through Employment Information Analysis)

  • 이종화;이현규
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권1호
    • /
    • pp.271-287
    • /
    • 2022
  • Purpose This research aims to study the changes in recruitment needed for the growth and survival of companies in the rapidly changing industry. In particular, we built a real company's worklist accounting for the rapidly advancing data-driven digital transformation, and presented the capabilities and conditions required for work. Design/methodology/approach we selected 37 jobs based on NCS to develop the employment search requirements by analyzing the business characteristics and work capabilities of the industry and company. The business specification indicators were converted into a matrix through the TF-IDF process, and the NMF algorithm is used to extract the features of each document. Also, the cosine distance measurement method is utilized to determine the similarity of the job specification conditions. Findings Companies tended to prefer "IT competency," which is a specification related to computer use and certification, and "experience competency," which is a specification for experience and internship. In addition, 'foreign language competency' was additionally preferred depending on the job. This analysis and development of job requirements would not only help companies to find the talents but also be useful for the jobseekers to easily decide the priority of their specification activities.

SIMD 구조를 갖는 프로세서에서 FFT 연산 가속화 (Acceleration of FFT on a SIMD Processor)

  • 이주영;홍용근;이현석
    • 전자공학회논문지
    • /
    • 제52권2호
    • /
    • pp.97-105
    • /
    • 2015
  • 이 논문은 SIMD 구조를 갖는 프로세서에서 FFT 연산을 효과적으로 처리하는 방법에 대한 것이다. FFT는 디지털 신호처리 분야에서 널리 사용되는 범용 알고리즘으로 이의 효과적인 처리는 성능 향상에 있어서 매우 중요하다. Bruun 알고리즘은 반복적인 인수분해를 통해 구현되는 FFT 알고리즘으로, 널리 사용되는 Cooley-Tukey 알고리즘에 비해 복소수 곱셈이 아닌 실수 곱셈으로 대부분의 동작을 수행하는 장점을 가지고 있으나, SIMD 프로세서에서 구현하는 데는 벡터 데이터의 정렬 형태가 복잡하고 연산에 필요한 계수들을 저장할 메모리를 더 필요로 하는 단점이 있다. 실험 결과에 따르면 길이 1024인 FFT 연산을 SIMD 프로세서에서 수행하는데 있어서 Bruun 알고리즘은 Cooley-Tukey 알고리즘에 비해서 약 1.2배의 더 높은 처리성능을 보이지만, 약 4 배 더 큰 데이터 메모리를 필요로 한다. 따라서 데이터 메모리에 대한 제약이 큰 경우가 아니라면 SIMD 프로세서에서 Bruun 알고리즘이 FFT 연산에 적합하다.

대규모 구조해석을 위한 보조기억장치 활용 선형 직접해법 (An Out of Core Linear Direct Solution Method for Large Scale Structural Analysis)

  • 김민기;김승조
    • 한국항공우주학회지
    • /
    • 제42권6호
    • /
    • pp.445-452
    • /
    • 2014
  • 본 논문은 제한된 계산 자원을 가진 환경에서 대규모 구조해석을 위해 고안된 보조기억장치를 활용하는 선형 직접해법에 대해 논의한다. 대용량 구조해석은 많은 기억공간과 계산량을 요구하기에 계산 자원이 부족할 경우 보조기억장치를 활용하는 해법을 개발할 필요가 있다. 본 연구는 한정된 주기억장치의 활용성을 극대화하고 상대적으로 느린 보조기억장치 저장량을 최소화하는 다중프론트 해법의 알고리즘을 소개한다. 구조해석 문제의 대칭성을 활용한 스택 공간 사용 기법과 역순 스택 자료 구조, 데이터 블록 크기에 따른 선택적 저장 기법과 데이터 복원 기법을 제시하였다. 본문에서 논의된 방법들을 적용한 다중프론트 해법이 여러 성능비교 문제에서 더 나은 계산 성능을 보임을 확인할 수 있다.

비이진 내재적 피드백 자료를 위한 변형된 베이지안 개인화 순위 방법 (Modified Bayesian personalized ranking for non-binary implicit feedback)

  • 김동우;이은령
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.1015-1025
    • /
    • 2017
  • 베이지안개인화순위(Bayesian personalized ranking) 방법은 내재적 피드백 자료를 분석하는 최첨단 추천시스템 통계기법 중 하나이다. 하지만, 기존의 베이지안개인화순위 방법은 내재적 피드백 자료를 변환한 이진 자료만을 고려하기 때문에 정보의 손실이 있을 수 있다는 단점이 있다. 이를 해결하기 위해 본 논문에서는 내재적 피드백 자료의 수치적 크기에 기반한 확실함의 정도(level of confidence)를 고려하는 변형베이지안개인화순위 방법을 제안한다. 제안한 방법은 기존 방법처럼 상품간의 개인선호도에 관한 직관적인 확률모형 구조를 여전히 지니면서 내재적 피드백의 수치적 크기를 확실함의 정도로 반영할 수 있다는 점에서 유용하다. 또한 제안한 변형 베이지안개인화순위 방법을 수치적으로 구현하기 위해 확률그라디언트하강(stochastic gradient descent) 기법에 기반한 계산 알고리즘을 제시한다. 마지막으로, 스팀 비디오 게임 실제 데이터 분석을 통하여 기존방법에 비해 우수한 성능을 입증한다.

TI-73 계산기를 활용한 초등 5학년 수학 영재 학급의 수업 분석 (An Analysis of Using TI-73 Calculator for the 5th Grade Students in an Elementary Math Gifted Class)

  • 강영란
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제16권3호
    • /
    • pp.315-331
    • /
    • 2013
  • 본 연구는 포항시에 소재하는 초등학교 5학년 수학 영재 학급 학생 20명을 대상으로 TI-73 계산기를 활용하여 좌표, 백분율, 소인수분해에 대한 수업의 질적 자료를 분석하였다. 이를 통해 계산기 활용이 영재 학생들의 학습에 어떤 영향을 미치는지 살펴보고, 계산기를 활용한 수업에 대한 시사점을 얻고자 하였다. 연구를 위해 이들 각 차시의 내용에 대해 활동지를 각각 제작하였고, 3주에 걸쳐 80분씩 3차례 수업을 진행하였다. 자료 분석을 위해 동영상 촬영, 학생과의 인터뷰, 문서 자료 등을 수집하였으며, 수집된 동영상, 녹음 자료는 녹취록을 작성하여 이를 토대로 코딩 작업을 하였다. 코드의 결합과 분해를 반복함으로써 초등 수학 영재 학생들의 계산기 사용에 대한 주제를 도출하였다. 본 연구 결과에 따르면, 의사소통을 매개하는 계산기, 지필환경의 범위를 넘어선 과제 해결을 위한 계산기, 계산기 활용에 대한 남녀의 성차 존재, 학습에 영향을 주는 계산기의 제한점이라는 네 가지 주제를 도출할 수 있었다.

빅데이터 기반 추천시스템을 위한 협업필터링의 최적화 규제 (Regularized Optimization of Collaborative Filtering for Recommander System based on Big Data)

  • 박인규;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.87-92
    • /
    • 2021
  • 빅데이터 기반의 추천시스템 모델링에서 바이어스, 분산, 오류 및 학습은 성능에 중요한 요소이다. 이러한 시스템에서는 추천 모델이 설명도를 유지하면서 복잡도를 줄여야 한다. 또한 데이터의 희소성과 시스템의 예측은 서로 반비례의 속성을 가지기 마련이다. 따라서 희소성의 데이터를 인수분해 방법을 활용하여 상품간의 유사성을 학습을 통한 상품추천모델이 제안되어 왔다. 본 논문에서는 이 모델의 손실함수에 대한 최적화 방안으로 max-norm 규제를 적용하여 모델의 일반화 능력을 향상시키고자 한다. 해결방안은 기울기를 투영하는 확률적 투영 기울기 강하법을 적용하는 것이다. 많은 실험을 통하여 데이터가 희박해질수록 기존의 방법에 비해 제안된 규제 방법이 상대적으로 효과가 있다는 것을 확인하였다.