• Title/Summary/Keyword: 데이터 집적 과학

Search Result 11, Processing Time 0.036 seconds

Analysis on NDN Testbeds for Large-scale Scientific Data: Status, Applications, Features, and Issues (과학 빅데이터를 위한 엔디엔 테스트베드 분석: 현황, 응용, 특징, 그리고 이슈)

  • Lim, Huhnkuk;Sin, Gwangcheon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.7
    • /
    • pp.904-913
    • /
    • 2020
  • As the data volumes and complexity rapidly increase, data-intensive science handling large-scale scientific data needs to investigate new techniques for intelligent storage and data distribution over networks. Recently, Named Data Networking (NDN) and data-intensive science communities have inspired innovative changes in distribution and management for large-scale experimental data. In this article, analysis on NDN testbeds for large-scale scientific data such as climate science data and High Energy Physics (HEP) data is presented. This article is the first attempt to analyze existing NDN testbeds for large-scale scientific data. NDN testbeds for large-scale scientific data are described and discussed in terms of status, NDN-based application, and features, which are NDN testbed instance for climate science, NDN testbed instance for both climate science and HEP, and the NDN testbed in SANDIE project. Finally various issues to prevent pitfalls in NDN testbed establishment for large-scale scientific data are analyzed and discussed, which are drawn from the descriptions of NDN testbeds and features on them.

Development of integrated data augmentation automation tools for deep learning (딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발)

  • Jang, Chan-Ho;Lee, Seo-Young;Park, Goo-Man
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

Technology and Trend of Parallel Processor (병렬 프로세서 기술 및 동향)

  • Chung, M.K.;Park, S.M.;Eum, N.W.
    • Electronics and Telecommunications Trends
    • /
    • v.24 no.6
    • /
    • pp.86-93
    • /
    • 2009
  • 프로세서는 더 이상 동작 주파수를 높이는 방법이 아닌 다수의 프로세서를 집적하는 멀티프로세서로 기술 발전이 이루어지고 있다. 최근 2, 4, 8개의 프로세서 코어를 넘어 64, 128개 이상의 프로세서를 집적한 대규모 데이터 처리 및 과학 연산용 고성능 프로세서들이 개발되고 있다. 본 문서는 이러한 병렬 프로세싱의 개념 및 병렬 프로세서의 기술을 정리하고 최근 동향과 함께 당면한 문제점들을 기술한다.

과학위성 1호 MMS(Mass Memory System) 개발

  • 서인호;이현우;임종태
    • Bulletin of the Korean Space Science Society
    • /
    • 2003.10a
    • /
    • pp.60-60
    • /
    • 2003
  • 과학위성 1호에는 원자외선 분광기를 포함한 다섯 개의 탑재체가 있다. MMS(Mass Memory System)는 이들 탑재체가 수집한 데이터를 대용량 메모리에 저장한 후 지상국으로 보내는 역할을 하며 우주방사선에 의한 메모리 데이터의 오류와 무선 채널을 통한 Downlink 상에서 발생하는 오류를 최소화하기 위해서 소프트웨어적으로 에러를 정정할 수 있는 Reed-Solomon Code를 사용 하였다. 탑재체의 데이터를 저장하기 위한 대용량 메모리는 총 2Gbits로써 8M SRAM, 64M SDRAM, 256M SDRAM의 세 가지로 구성되어 있으며 메모리 여러 개를 하나의 모듈로 만들고 이 모듈이 층으로 쌓여서 MMS에 탑재되어 있다. SRAM에 비해서 집적도가 매우 높은 SDRAM은 공간을 적게 차지하는 장점은 있지만 우주용이 아니므로 그 안정성을 보장할 수 없으므로 우리별 3호에서 성능이 입증된 SRAM과 같이 탑재되었다. 본 연구에서는 MMS의 구조, 동작모드, Spec 및 연구 개발 내용을 소개한다.

  • PDF

Linux Cluster-based Parallel File System for Parallel Volume Rendering (병렬볼륨렌더링을 위한 리눅스 클러스터 기반 병렬화일시스템)

  • 류영준;정갑주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.91-93
    • /
    • 2001
  • 볼륨 렌더링(Volume Rendering)은 과학, 의학, 공학 등의 분야에서 3차원 볼륨 데이터(Volume Date)를 효과적으로 시각화(Visualization)하는 목적으로 널리 사용되고 있으며 고화질 영상 요구로 인해 3차원 볼륨 데이터의 크기는 점차 대용량화되어 가는 추세이다. 이러한 대용량 데이터의 고성능 처리를 위해서는 병렬입출력이 필수적이다. 본 논문에서는 병렬볼륨 렌더링에 최적화된 병렬화일시스템 PBS(Parallel Block Server)을 제안한다. PBS는 고성능 입출력 제공을 위해서 데이터입출력에 대한 응용 프로그램의 집적 통제를 위한 다양한 기능을 제공하도록 설계되어 있다. 이러한 직접통제의 단점인 복잡한 인터페이스 문제를 해결하기 위해서 볼륨 렌더링에 최적화된 데이터 입출력 전략을 자동화시킨 PBS 기반 라이브러리 VRPIO(Volume Rendering Parallel Input Output)를 제공한다.

Real-time Activity and Posture Recognition with Combined Acceleration Sensor Data from Smartphone and Wearable Device (스마트폰과 웨어러블 가속도 센서를 혼합 처리한 실시간 행위 및 자세인지 기법)

  • Lee, Hosung;Lee, Sungyoung
    • Journal of KIISE:Software and Applications
    • /
    • v.41 no.8
    • /
    • pp.586-597
    • /
    • 2014
  • The next generation mobile computing technology is recently attracting attention that smartphone and wearable device imbedded with various sensors are being deployed in the world. Existing activity and posture recognition research can be divided into two different ways considering feature of one's movement. While activity recognition focuses on catching distinct pattern according to continuous movement, posture recognition focuses on sudden change of posture and body orientation. There is a lack of research constructing a system mixing two separate patterns which could be applied in real world. In this paper, we propose a method to use both smartphone and wearable device to recognize activity and posture in the same time. To use smartphone and wearable sensor data together, we designed a pre-processing method and constructed recognition model mixing signal vector magnitude and orientation pattern features of vertical and horizontal. We considered cycling, fast/slow walking and running activities, and postures such as standing, sitting, and laying down. We confirmed the performance and validity by experiment, and proved the feasibility in real world.

A Study on Characteristics of Pollutant by Automobile in Highway Road Runoff (고속도로 강우유출수 내 차량 기인 오염물질 특성 연구)

  • Yong Bin An;Eun Mi Hong;Hyuck Su Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.232-232
    • /
    • 2023
  • 고속도로 및 편의시설 건설로 불투수층의 면적이 증가하여 강우 시 고속도로 및 편의시설에서 발생하는 오염원에 의한 하천의 수질 영향도 커지고 있다. 특히 휴게소에서는 자동차의 급가속, 급감속으로 더욱 많은 분진과 오염물질이 발생할 수 있으며 타이어 마모 입자, 자동차 배기가스, 중금속 및 오일류 등이 휴게소나 도로 지표에 집적되어 있다. 이렇게 발생한 오염물질은 우기에 강우와 함께 불투수면을 침투하지 못하고 배수로를 통해 유출되어 인근 하천의 수생태 및 토양의 주요 오염원으로 작용하고 있다. 이에 따라 고속도로 및 인근 휴게소의 비점오염 저감대책이 필요하며 효율적인 비점오염원 저감을 위해 장기적인 모니터링, 지속적인 자료 수집 및 분석이 필요하다. 본 연구에서는 강원지역 고속도로 및 인근 휴게소에서 강우 시 강우유출수 모니터링을 통해 강우유출수 유량가중평균농도 (Event Mean Concentration) 산정하고 강우유출수 수문곡선 (hydrograph)을 작성하였다. 또한 강우사상에 따른 분석항목별 초기세척효과(First Flush Effects)와 오염부하량을 산정하였다. 추가적으로 차량 기인 입자를 확인하기 위해 μ-FT-IR 현미경 분석 실험을 하였다. 모니터링 장소는 휴게소 및 고속도로 일원이며, 모니터링은 선행무강우일수 2일 이상, 강우량 10mm 이상일 때 실시하였으며 2022년 6월부터 10월까지 총 4회 실시하였다. 모니터링 결과 타이어 및 브레이크 패드 마모와 관련된 중금속인 Zn, Cu, Pb 등의 중금속이 높게 분석되었으며 이러한 중금속의 오염부하량 역시 높게 산정되었다. 강우유출수 수문곡선에서 강우 초기 오염물질의 세척효과가 나타났다. MFFn 산정 결과 강우 30% 구간에서 초기세척효과를 보였다. μ-FT-IR 현미경 분석 결과 PE (Polyethylene)가 가장 많이 검출되었고 PP (Polypropylene), PS (Polystyrene) 순으로 검출되었다. 이러한 강우유출수 모니터링 데이터는 향후 고속도로 휴게소 및 고속도로 주변 오염저감 시설 설치 및 사회적 동참을 위한 타당한 근거 확보를 위한 기초자료로서 제공될 수 있을 것이다.

  • PDF

Application of Symbolic Representation Method for Fault Detection and Clustering in Semiconductor Fabrication Processes (반도체공정 이상탐지 및 클러스터링을 위한 심볼릭 표현법의 적용)

  • Loh, Woong-Kee;Hong, Sang-Jeen
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.11
    • /
    • pp.806-818
    • /
    • 2009
  • Since the invention of the integrated circuit (IC) in 1950s, semiconductor technology has undergone dramatic development up to these days. A complete semiconductor is manufactured through a diversity of processes. For better semiconductor productivity, fault detection and classification (FDC) has been rigorously studied for finding faults even before the processes are completed. For FDC, various kinds of sensors are attached in many semiconductor manufacturing devices, and sensor values are collected in a periodic manner. The collection of sensor values consists of sequences of real numbers, and hence is regarded as a kind of time-series data. In this paper, we propose an algorithm for detecting and clustering faults in semiconductor processes. The proposed algorithm is a modification of the existing anomaly detection algorithm dealing with symbolically-represented time-series. The contributions of this paper are: (1) showing that a modification of the existing anomaly detection algorithm dealing with general time-series could be used for semiconductor process data and (2) presenting experimental results for improving correctness of fault detection and clustering. As a result of our experiment, the proposed algorithm caused neither false positive nor false negative.

6G Technology Competitiveness and Network Analysis: Focusing on GaN Integrated Circuit Patent Data (6G의 기술경쟁력 및 네트워크 분석: GaN 집적회로 특허 데이터 중심)

  • Woo-Seok Choi;Jin-Yong Kim;Jung-Hwan Lee;Sang-Hyun Choi
    • Journal of Industrial Convergence
    • /
    • v.21 no.3
    • /
    • pp.1-15
    • /
    • 2023
  • Expectations for wireless communication technology are rising as a base technology that promotes innovation in various industries in line with the paradigm of digital transformation in the 21st century beyond the stage of being used only for communication service itself. In this study, in order to compare 6G technological competitiveness between Korea and leading countries, technological competitiveness was confirmed through PFS, CPP, and network analysis based on GaN Integrated Circuit patent data. Korea's 6G technological competitiveness was 0.62 in PFS and 3.93 in CPP, which were 32.8% and 19.9%, respectively, compared to leading countries. In addition, as a result of network analysis, the collaboration rate in the 6G field was 7.2%, and the collaboration ecosystem was very insufficient in most countries. In contrast, it was confirmed that Korea, unlike leading countries, has established a small-scale collaboration ecosystem linked by industry and academia. Thus, it is necessary to establish a strategy for 6G communication technology at the national level so that communication technology can be advanced based on a relatively well-established collaborative ecosystem.

High Resolution Genomic Profile of Neuro2a Murine Neuroblastoma Cell Line by Array-based Comparative Genomic Hybridization (고집적어레이 기반의 비교유전체보합법(CGH)을 통한 신경아세포종 Neuro2a 세포의 유전체이상 분석)

  • Do, Jin-Hwan;Kim, In-Su;Ko, Hyun-Myung;Choi, Dong-Kug
    • Journal of Life Science
    • /
    • v.19 no.4
    • /
    • pp.449-456
    • /
    • 2009
  • Murine Neuro-2a (N2a) cells have been widely used for the investigation of neuronal differentiation, trophic interaction and neurotoxic effects of various compounds and their associated mechanisms. N2a cells have many genomic variations such as gains or losses in DNA copy number, similar to other neuroblastoma cells, and no systematic or high-resolution studies of their genome-wide chromosomal aberrations have been reported. Presently, we conducted a systematic genome-wide determination of chromosomal aberrations in N2a cells using a high-throughput, oligonucleotide array-based comparative genomic hybridization (oaCGH) technique. A hidden Markov Model was employed to assign each genomic oligonucleotide to a DNA copy number state: double loss, single loss, normal, gain, double gain and amplification. Unlike most neuroblastoma cells, Mycn amplification was not observed in N2a cells. In addition, these cells showed gain only in the neuron-derived neurotrophic factor (NF), while other neurotrophic factors such as glial line-derived NF and brain-derived NF presented normal copy numbers. Chromosomes 4, 8, 10, 11 and 15 displayed more than 1000 aberrational oligonucleotides, while chromosomes 3, 17, 18 and 19 displayed less than 20. The largest region of gain was located on chromosome 8 and its size was no less than 26.7 Mb (Chr8:8427841-35162415), while chromosome 4 had the longest region of single deletion, with a size of 15.1 Mb (Chr4:73265785-88374165).