• 제목/요약/키워드: Vectorization

검색결과 58건 처리시간 0.022초

CRAY-2에서의 대형희귀행렬 연립방정식의 해법을 위한 벡터준비행렬의 재배열 방법 (A reordering scheme for the vectorizable preconditioner for the large sparse linear systems on the CRAY-2)

  • 마상백
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.960-968
    • /
    • 1995
  • 이 논문에서 우리는 CRAY-2에서 편미분방정식에서 발생하는 대형희귀 연립방정 식의 효과적인 벡터준비행렬을 만들기 위한 재배열방법을 제시한다. 이 재배열방법은 종래의 빨강/검정 배열의 선형 형태로써, ILU 준비행렬의 변형에 사용될 경우 필인 (fill-in)을 크게 하면 종래의 빨강/검정 재배열의 약점이던 수렴율의 감소를 극복할 수 있다. 우리는 CRAY-2에서 여러 가지 실험을 통해 우리의 주장을 입증한다. 또, 에러 행렬의 후로베니우스 놈을 계산한 결과도 우리의 주장과 일치한다.

  • PDF

Bag of Characters를 응용한 단어의 벡터 표현 생성 방법 (Word Vectorization Method Based on Bag of Characters)

  • 이찬희;이설화;임희석
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.47-49
    • /
    • 2017
  • 인공 신경망 기반 자연어 처리 시스템들에서 단어를 벡터로 변환할 때, 크게 색인 및 순람표를 이용하는 방법과 합성곱 신경망이나 회귀 신경망을 이용하는 방법이 있다. 이 때, 전자의 방법을 사용하려면 시스템이 수용 가능한 어휘집이 정의되어 있어야 하며 새로운 단어를 어휘집에 추가하기 어렵다. 반면 후자의 방법을 사용하면 단어를 구성하는 문자들을 바탕으로 벡터 표현을 생성하기 때문에 어휘집이 필요하지 않지만, 추가적인 인공 신경망 구조가 필요하기 때문에 모델의 복잡도와 파라미터의 수가 증가한다는 단점이 있다. 본 연구에서는 위 두 방법의 한계를 극복하고자 Bag of Characters를 응용하여 단어를 구성하는 문자들의 집합을 바탕으로 벡터 표현을 생성하는 방법을 제안한다. 제안된 방법은 문자를 기반으로 동작하기 때문에 어휘집을 정의할 필요가 없으며, 인공 신경망 구조가 사용되지 않기 때문에 시스템의 복잡도도 증가시키지 않는다. 또한, 단어의 벡터 표현에 단어를 구성하는 문자들의 정보가 반영되기 때문에 Out-Of-Vocabulary 단어에 대한 성능도 어휘집을 사용하는 방법보다 우수할 것으로 기대된다.

  • PDF

Parallel LDPC Decoding on a Heterogeneous Platform using OpenCL

  • Hong, Jung-Hyun;Park, Joo-Yul;Chung, Ki-Seok
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권6호
    • /
    • pp.2648-2668
    • /
    • 2016
  • Modern mobile devices are equipped with various accelerated processing units to handle computationally intensive applications; therefore, Open Computing Language (OpenCL) has been proposed to fully take advantage of the computational power in heterogeneous systems. This article introduces a parallel software decoder of Low Density Parity Check (LDPC) codes on an embedded heterogeneous platform using an OpenCL framework. The LDPC code is one of the most popular and strongest error correcting codes for mobile communication systems. Each step of LDPC decoding has different parallelization characteristics. In the proposed LDPC decoder, steps suitable for task-level parallelization are executed on the multi-core central processing unit (CPU), and steps suitable for data-level parallelization are processed by the graphics processing unit (GPU). To improve the performance of OpenCL kernels for LDPC decoding operations, explicit thread scheduling, vectorization, and effective data transfer techniques are applied. The proposed LDPC decoder achieves high performance and high power efficiency by using heterogeneous multi-core processors on a unified computing framework.

Multi-GPU 기반의 고속 디지털 홀로그램 생성 (Fast Generation of Digital Hologram Based on Multi-GPU)

  • 송중석;박정식;서영호;박종일
    • 방송공학회논문지
    • /
    • 제16권6호
    • /
    • pp.1009-1017
    • /
    • 2011
  • 실시간 홀로그래피 방송을 제작하기 위해서는 디지털 홀로그램을 고속으로 생성하는 것이 중요하다. 본 논문에서는 디지털 홀로그램 생성을 위한 Computer-Generated Holography(CGH) 식의 병렬 구조를 최적화하고, Compute Unified Device Architecture(CUDA)와 Open Multi-Processing (OpenMP) 를 이용한 Multi Graphic Processing Unit(Multi-GPU) 기반의 디지털 홀로그램의 고속 생성을 위한 최적화 기법을 제안한다. 디지털 홀로그램을 생성하는 과정은 독립적인 연산을 할 수 있는 다수의 개체로 병렬화 할 수 있는 구조이기 때문에 이에 특화된 CUDA와 OpenMP를 사용함으로써 CGH식을 고속으로 연산할 수 있다. 여기서 더 나아가 이를 최적화하기 위해서 상수화, 벡터화, 루프풀기 등의 방법을 제안한다. 본 논문에서 제안된 기법을 통해서 기존 CPU에서의 CGH 연산속도에 비해 약 9,700배 정도의 속도를 개선할 수 있었다.

Road Centerline Tracking From High Resolution Satellite Imagery By Least Squares Templates Matching

  • Park, Seung-Ran;Kim, Tae-Jung;Jeong, Soo;Kim, Kyung-Ok
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.34-39
    • /
    • 2002
  • Road information is very important for topographic mapping, transportation application, urban planning and other related application fields. Therefore, automatic detection of road networks from spatial imagery, such as aerial photos and satellite imagery can play a central role in road information acquisition. In this paper, we use least squares correlation matching alone for road center tracking and show that it works. We assumed that (bright) road centerlines would be visible in the image. We further assumed that within a same road segment, there would be only small differences in brightness values. This algorithm works by defining a template around a user-given input point, which shall lie on a road centerline, and then by matching the template against the image along the orientation of the road under consideration. Once matching succeeds, new match proceeds by shifting a matched target window further along road orientation at the target window. By repeating the process above, we obtain a series of points, which lie on a road centerline successively. A 1m resolution IKONOS images over Seoul and Daejeon were used for tests. The results showed that this algorithm could extract road centerlines in any orientation and help in fast and exact he ad-up digitization/vectorization of cartographic images.

  • PDF

단순한 도면으로부터 선분 확장을 이용한 아크 분할 기법 개발 (Development of an Arc Segmentation Technique Based on Line Segment Expansion from Simple Drawing)

  • 정성태
    • 한국멀티미디어학회논문지
    • /
    • 제7권4호
    • /
    • pp.579-591
    • /
    • 2004
  • 본 논문에서는 직선과 곡선으로 구성된 단순한 도면으로부터 곡선을 검출한 다음에 곡선을 원형 아크로 분할하는 방법을 제안한다. 본 논문의 방법에서는 먼저 선의 중심점을 찾은 다음에 연결된 중심점을 추적하여 선분을 검출한다. 그 다음에는 선분의 양 끝에서 선분의 방향을 이용하여 이웃한 선분을 검출하여 선분을 확장해 나간다. 선분을 확장한 다음에는 직선을 제거하고 곡선만 남긴 다음에 재귀적 분할 방법을 이용하여 곡선을 아크들의 집합으로 분할한다. 본 논문에서는 기존의 벡터화 소프트웨어와 벡터 기반 아크 분할 방법과 비교 실험을 수행하였다. 실험 결과에 의하면 본 논문에서 제안된 방법이 기존의 방법에 비하여 교차점을 가지는 곡선에 대하여 보다 정확하게 아크로 분할하였다.

  • PDF

A graph-based method for fitting planar B-spline curves with intersections

  • Bon, Pengbo;Luo, Gongning;Wang, Kuanquan
    • Journal of Computational Design and Engineering
    • /
    • 제3권1호
    • /
    • pp.14-23
    • /
    • 2016
  • The problem of fitting B-spline curves to planar point clouds is studied in this paper. A novel method is proposed to deal with the most challenging case where multiple intersecting curves or curves with self-intersection are necessary for shape representation. A method based on Delauney Triangulation of data points is developed to identify connected components which is also capable of removing outliers. A skeleton representation is utilized to represent the topological structure which is further used to create a weighted graph for deciding the merging of curve segments. Different to existing approaches which utilize local shape information near intersections, our method considers shape characteristics of curve segments in a larger scope and is thus capable of giving more satisfactory results. By fitting each group of data points with a B-spline curve, we solve the problems of curve structure reconstruction from point clouds, as well as the vectorization of simple line drawing images by drawing lines reconstruction.

객체의 영역 정보와 벡터화된 설명선으로부터 해칭 영역의 인식 (Recognition of Hatched-Area from Region Information of Object and Vectorized Interpretation Lines)

  • 정윤수;오상근;이병길;박길흠
    • 한국정보처리학회논문지
    • /
    • 제5권3호
    • /
    • pp.842-850
    • /
    • 1998
  • 본 논문에서는 기계 도면의 분할 및 벡터화에 기반하여 해칭 영역을 인식하는 방법을 제안한다. 이러한 해칭영역의 인식은 다음의 세 단계로 구성된다. 먼저, 제안된 방법은 문자가 제거된 기계 도면으로부터 객체, 화살표 및 설명선(치수선, 해칭선등)의 분할 및 분리된 선분의 벡터화가 수행된다. 이러한 도면의 분할 및 벡터화가 수행되면 벡터화된 객체로부터 폐루프를 레이블링하여 행칭 영역의 후보를 결정한다. 마지막으로, 해칭 영역의 후보넹 포함되는 해칭선들을 검출함으로써 해칭 영역의 인식을 마루리한다. 제안된 방법에 의해 해칭 영역의 추출 및 인식이 용이함이 나타난다.

  • PDF

Spectrally encapsulated OFDM: Vectorized structure with minimal complexity

  • Kim, Myungsup;Kwak, Do Young;Jung, Jiwon;Kim, Ki-Man
    • ETRI Journal
    • /
    • 제43권4호
    • /
    • pp.660-673
    • /
    • 2021
  • To efficiently use frequency resources, the next 6th generation mobile communication technology must solve the problem of out-of-band emission (OoBE) of cyclic prefix (CP) orthogonal frequency division multiplexing (OFDM), which is not solved in 5th generation technology. This study describes a new zero insertion technique to replace an existing filtering scheme to solve this internal problem in OFDM signals. In the development of the proposed scheme, a precoder with a two-dimensional structure is first designed by generating a two-dimensional mapper and using the specialty of each matrix. A spectral shaping technique based on zero insertion instead of a long filter is proposed, so it can be applied not only to long OFDM symbols, but also very short ones. The proposed method shows that the transmitted signal is completely blocked at the bandwidth boundaries of signals according to the current standards, and it is confirmed that the proposed scheme is ideal with respect to bit error rate (BER) performance because its BER is the same as that of CP-OFDM. In addition, the proposed scheme can transformed into a real time structure through vectorizing process with minimal complexity.

Research on Chinese Microblog Sentiment Classification Based on TextCNN-BiLSTM Model

  • Haiqin Tang;Ruirui Zhang
    • Journal of Information Processing Systems
    • /
    • 제19권6호
    • /
    • pp.842-857
    • /
    • 2023
  • Currently, most sentiment classification models on microblogging platforms analyze sentence parts of speech and emoticons without comprehending users' emotional inclinations and grasping moral nuances. This study proposes a hybrid sentiment analysis model. Given the distinct nature of microblog comments, the model employs a combined stop-word list and word2vec for word vectorization. To mitigate local information loss, the TextCNN model, devoid of pooling layers, is employed for local feature extraction, while BiLSTM is utilized for contextual feature extraction in deep learning. Subsequently, microblog comment sentiments are categorized using a classification layer. Given the binary classification task at the output layer and the numerous hidden layers within BiLSTM, the Tanh activation function is adopted in this model. Experimental findings demonstrate that the enhanced TextCNN-BiLSTM model attains a precision of 94.75%. This represents a 1.21%, 1.25%, and 1.25% enhancement in precision, recall, and F1 values, respectively, in comparison to the individual deep learning models TextCNN. Furthermore, it outperforms BiLSTM by 0.78%, 0.9%, and 0.9% in precision, recall, and F1 values.