• 제목/요약/키워드: 데이터 집적 과학

검색결과 11건 처리시간 0.026초

과학 빅데이터를 위한 엔디엔 테스트베드 분석: 현황, 응용, 특징, 그리고 이슈 (Analysis on NDN Testbeds for Large-scale Scientific Data: Status, Applications, Features, and Issues)

  • 임헌국;신광천
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.904-913
    • /
    • 2020
  • 데이터 볼륨과 복잡도가 빠르게 증가함에 따라 과학 빅데이터를 다루는 데이터 집적 과학은 네트워크를 통해 보다 효과적인 데이터 저장 및 분배를 위한 새로운 기술을 발견하는 것을 필요로 한다. 최근 네임드 데이터 네트워킹 커뮤니티와 데이터 집적 과학 커뮤니티는 함께 과학 실험 빅데이터의 분배 및 관리에 있어서 혁신적인 변화를 꾀하였다. 본 논문 에서는 기후과학 및 고에너지물리 데이터 등과 같은 과학 빅데이터를 위한 현존하는 엔디엔 테스트베드들에 대한 분석이 처음으로 이루어진다. 과학 빅데이터를 위한 엔디엔 테스트베드들을 현황, 엔디엔 기반 응용, 특징 측면에서 묘사하고 토의한다. 마지막으로 과학 빅데이터를 위한 엔디엔 테스트베드 네트워크를 확립함에 있어서, 함정에 빠질 수 있는 다양한 이슈들을 엔디엔 테스트베드들에 대한 묘사 그리고 특징들로 부터 도출하여, 분석 제시한다.

딥러닝 학습용 집적화된 데이터 증강 자동화 도구 개발 (Development of integrated data augmentation automation tools for deep learning)

  • 장찬호;이서영;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.283-286
    • /
    • 2021
  • 4차 산업혁명을 맞이해 최근 산업 및 기술 영역에서는 인공지능을 이용한 생산력 향상, 자동화 등 딥러닝의 보편화가 빠르게 진행되고 있다. 또한, 딥러닝의 성능을 도출하기 위해서는 수많은 양의 학습용 데이터가 필요하며 그 데이터의 양은 딥러닝 모델의 성능과 정비례한다. 이에 본 작품은 최신형 영상처리 Library인 Albumentations를 이용하여 영상처리 알고리즘을 이용하여 이미지를 증강하고, 이미지 데이터 크롤링 기능을 통해 Web에서 영상 데이터를 수집을 자동화하며, Label Pix를 연동하여 수집한 데이터를 라벨링 한다. 더 나아가 라벨링 된 데이터의 증강까지 포함하여 다양한 증강 자동화를 한 인터페이스에 집적시켜 딥러닝 모델을 생성할 때 데이터 수집과 전처리를 수월하게 한다. 또한, Neural Net 기반의 AdaIN Transfer를 이용하여 이미지를 개별적으로 학습하지 않고 Real time으로 이미지의 스타일을 옮겨올 수 있도록 하여 그림 데이터의 부족 현상을 해결한다.

  • PDF

병렬 프로세서 기술 및 동향 (Technology and Trend of Parallel Processor)

  • 정무경;박성모;엄낙웅
    • 전자통신동향분석
    • /
    • 제24권6호
    • /
    • pp.86-93
    • /
    • 2009
  • 프로세서는 더 이상 동작 주파수를 높이는 방법이 아닌 다수의 프로세서를 집적하는 멀티프로세서로 기술 발전이 이루어지고 있다. 최근 2, 4, 8개의 프로세서 코어를 넘어 64, 128개 이상의 프로세서를 집적한 대규모 데이터 처리 및 과학 연산용 고성능 프로세서들이 개발되고 있다. 본 문서는 이러한 병렬 프로세싱의 개념 및 병렬 프로세서의 기술을 정리하고 최근 동향과 함께 당면한 문제점들을 기술한다.

과학위성 1호 MMS(Mass Memory System) 개발

  • 서인호;이현우;임종태
    • 한국우주과학회:학술대회논문집(한국우주과학회보)
    • /
    • 한국우주과학회 2003년도 한국우주과학회보 제12권2호
    • /
    • pp.60-60
    • /
    • 2003
  • 과학위성 1호에는 원자외선 분광기를 포함한 다섯 개의 탑재체가 있다. MMS(Mass Memory System)는 이들 탑재체가 수집한 데이터를 대용량 메모리에 저장한 후 지상국으로 보내는 역할을 하며 우주방사선에 의한 메모리 데이터의 오류와 무선 채널을 통한 Downlink 상에서 발생하는 오류를 최소화하기 위해서 소프트웨어적으로 에러를 정정할 수 있는 Reed-Solomon Code를 사용 하였다. 탑재체의 데이터를 저장하기 위한 대용량 메모리는 총 2Gbits로써 8M SRAM, 64M SDRAM, 256M SDRAM의 세 가지로 구성되어 있으며 메모리 여러 개를 하나의 모듈로 만들고 이 모듈이 층으로 쌓여서 MMS에 탑재되어 있다. SRAM에 비해서 집적도가 매우 높은 SDRAM은 공간을 적게 차지하는 장점은 있지만 우주용이 아니므로 그 안정성을 보장할 수 없으므로 우리별 3호에서 성능이 입증된 SRAM과 같이 탑재되었다. 본 연구에서는 MMS의 구조, 동작모드, Spec 및 연구 개발 내용을 소개한다.

  • PDF

병렬볼륨렌더링을 위한 리눅스 클러스터 기반 병렬화일시스템 (Linux Cluster-based Parallel File System for Parallel Volume Rendering)

  • 류영준;정갑주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.91-93
    • /
    • 2001
  • 볼륨 렌더링(Volume Rendering)은 과학, 의학, 공학 등의 분야에서 3차원 볼륨 데이터(Volume Date)를 효과적으로 시각화(Visualization)하는 목적으로 널리 사용되고 있으며 고화질 영상 요구로 인해 3차원 볼륨 데이터의 크기는 점차 대용량화되어 가는 추세이다. 이러한 대용량 데이터의 고성능 처리를 위해서는 병렬입출력이 필수적이다. 본 논문에서는 병렬볼륨 렌더링에 최적화된 병렬화일시스템 PBS(Parallel Block Server)을 제안한다. PBS는 고성능 입출력 제공을 위해서 데이터입출력에 대한 응용 프로그램의 집적 통제를 위한 다양한 기능을 제공하도록 설계되어 있다. 이러한 직접통제의 단점인 복잡한 인터페이스 문제를 해결하기 위해서 볼륨 렌더링에 최적화된 데이터 입출력 전략을 자동화시킨 PBS 기반 라이브러리 VRPIO(Volume Rendering Parallel Input Output)를 제공한다.

스마트폰과 웨어러블 가속도 센서를 혼합 처리한 실시간 행위 및 자세인지 기법 (Real-time Activity and Posture Recognition with Combined Acceleration Sensor Data from Smartphone and Wearable Device)

  • 이호성;이승룡
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권8호
    • /
    • pp.586-597
    • /
    • 2014
  • 최근 고성능 센서가 집적된 스마트폰과 웨어러블 디바이스 기술이 부각됨에 따라 이와 같은 플랫폼을 활용한 차세대 모바일 컴퓨팅 기술이 크게 주목받고 있다. 기존 행위인지는 지속적인 움직임에 따른 고유 패턴을 포착하는 반면, 자세인지는 급격한 순간 변화나 신체 방향의 변화를 포착하는 방법으로 접근되어 왔다. 그러나 이 두 가지의 패턴을 함께 고려하고 실제 활용 가능한 수준의 성능 확보와 그 시스템에 대한 연구는 다소 부족한 실정이다. 이에 본 논문에서는 최근 부각되는 스마트폰과 웨어러블 디바이스의 센서 데이터를 함께 고려하고 각각이 갖는 장점을 혼합한 사용자 행위 및 자세인지 기법과 스마트폰 플랫폼을 기반으로 실제 환경에서의 그 활용 방법을 제안한다. 스마트폰과 웨어러블 센서 데이터를 함께 운용하기 위한 전처리 방법을 설계하고 고유 진동 패턴과 수직, 수평 방향 패턴 특징을 혼합적으로 활용하여 인지 모델을 구축하였다. 이 과정에서 자전거 타기와 빠르게, 천천히 걷기, 뛰기와 같이 보다 다양한 행위와 서기, 앉기, 누워있기와 같은 자세 패턴을 고려하였다. 실험 결과 제안하는 기법의 성능과 타당성을 입증하였고 실제 환경에서의 적용을 통해 그 활용 가능성을 보였다.

고속도로 강우유출수 내 차량 기인 오염물질 특성 연구 (A Study on Characteristics of Pollutant by Automobile in Highway Road Runoff)

  • 안용빈;홍은미;김혁수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.232-232
    • /
    • 2023
  • 고속도로 및 편의시설 건설로 불투수층의 면적이 증가하여 강우 시 고속도로 및 편의시설에서 발생하는 오염원에 의한 하천의 수질 영향도 커지고 있다. 특히 휴게소에서는 자동차의 급가속, 급감속으로 더욱 많은 분진과 오염물질이 발생할 수 있으며 타이어 마모 입자, 자동차 배기가스, 중금속 및 오일류 등이 휴게소나 도로 지표에 집적되어 있다. 이렇게 발생한 오염물질은 우기에 강우와 함께 불투수면을 침투하지 못하고 배수로를 통해 유출되어 인근 하천의 수생태 및 토양의 주요 오염원으로 작용하고 있다. 이에 따라 고속도로 및 인근 휴게소의 비점오염 저감대책이 필요하며 효율적인 비점오염원 저감을 위해 장기적인 모니터링, 지속적인 자료 수집 및 분석이 필요하다. 본 연구에서는 강원지역 고속도로 및 인근 휴게소에서 강우 시 강우유출수 모니터링을 통해 강우유출수 유량가중평균농도 (Event Mean Concentration) 산정하고 강우유출수 수문곡선 (hydrograph)을 작성하였다. 또한 강우사상에 따른 분석항목별 초기세척효과(First Flush Effects)와 오염부하량을 산정하였다. 추가적으로 차량 기인 입자를 확인하기 위해 μ-FT-IR 현미경 분석 실험을 하였다. 모니터링 장소는 휴게소 및 고속도로 일원이며, 모니터링은 선행무강우일수 2일 이상, 강우량 10mm 이상일 때 실시하였으며 2022년 6월부터 10월까지 총 4회 실시하였다. 모니터링 결과 타이어 및 브레이크 패드 마모와 관련된 중금속인 Zn, Cu, Pb 등의 중금속이 높게 분석되었으며 이러한 중금속의 오염부하량 역시 높게 산정되었다. 강우유출수 수문곡선에서 강우 초기 오염물질의 세척효과가 나타났다. MFFn 산정 결과 강우 30% 구간에서 초기세척효과를 보였다. μ-FT-IR 현미경 분석 결과 PE (Polyethylene)가 가장 많이 검출되었고 PP (Polypropylene), PS (Polystyrene) 순으로 검출되었다. 이러한 강우유출수 모니터링 데이터는 향후 고속도로 휴게소 및 고속도로 주변 오염저감 시설 설치 및 사회적 동참을 위한 타당한 근거 확보를 위한 기초자료로서 제공될 수 있을 것이다.

  • PDF

반도체공정 이상탐지 및 클러스터링을 위한 심볼릭 표현법의 적용 (Application of Symbolic Representation Method for Fault Detection and Clustering in Semiconductor Fabrication Processes)

  • 노웅기;홍상진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권11호
    • /
    • pp.806-818
    • /
    • 2009
  • 반도체(semiconductor) 기술은 1950년대에 집적 회로(integrated circuit, IC)가 발명된 이후 오늘날까지 급속한 발전을 거듭하고 있다. 하나의 완전한 반도체를 제조하기 위해서는 매우 다양하고 긴 공정을 거쳐야 한다. 반도체 제조 생산성을 높이기 위하여 공정들이 종료되기 전에 미리 이상(fault)을 발견하기 위한 이상탐지 및 분류(fault detection and classification, FDC)에 대한 많은 연구가 진행되고 있다. 이를 위하여 다양한 반도체 장비에 갖가지 종류의 센서를 부착하여 일정한 시간 간격으로 원하는 값을 측정한다. 이러한 측정 값은 실수 값들의 연속이므로 시계열(time-series) 데이터의 일종이다. 본 논문에서는 반도체 공정에서의 이상탐지 및 클러스터링을 수행하는 알고리즘을 제안한다. 제안된 알고리즘은 시계열 데이터를 심볼릭 표현법(symbolic representation)으로 변환하여 이상을 탐지하는 기존의 알고리즘을 수정한 것이다. 본 논문의 공헌은 일반적인 시계열 데이터에 대한 기존의 이상탐지 알고리즘을 수정하여 반도체 공정 데이터에 대해서도 활용할 수 있음을 보일 뿐만 아니라, 이상탐지 및 클러스터링의 정확성을 높이는 실험 결과를 제시하는 것이다. 실험 결과, 본 논문에서 제안한 알고리즘은 긍정 오류(false positive) 및 부정 오류(false negative)를 모두 발생하지 않았다.

6G의 기술경쟁력 및 네트워크 분석: GaN 집적회로 특허 데이터 중심 (6G Technology Competitiveness and Network Analysis: Focusing on GaN Integrated Circuit Patent Data)

  • 최우석;김진용;이정환;최상현
    • 산업융합연구
    • /
    • 제21권3호
    • /
    • pp.1-15
    • /
    • 2023
  • 무선통신 기술은 통신서비스 자체에만 활용되는 단계를 넘어 21세기 디지털 전환이라는 패러다임과 맞물려 다양한 산업의 혁신을 촉진하는 기반 기술로써 기대가 높아지고 있다. 본 연구에서는 우리나라와 주요 선도국가의 6G 기술경쟁력을 비교하기 위해 GaN(갈륨나이트라이드) 특허 정보를 기반으로 시장확보 지수(PFS), 피인용도 지수(CPP) 그리고 네트워크 분석을 통해 6G 기술경쟁력을 분석하였다. 우리나라의 6G 기술경쟁력은 PFS가 0.62로, CPP가 3.93으로 나타났으며, 각각 선도국가 대비 32.8%, 19.9% 수준인 것으로 확인되었다. 그다음 네트워크 분석 결과, 6G 분야의 특허 협업 비율은 7.2%로 대부분 국가에서 모두 협업 생태계가 미흡한 것으로 분석되었다. 다만, 우리나라는 선도국가와 달리 산업계와 학계가 연계한 소규모 협업 관계가 구축되어 있음을 확인할 수 있었다. 따라서, 소규모 협업 생태계를 기반으로 통신 기술 고도화를 할 수 있는 국가 차원의 6G 통합 R&D 전략을 마련할 필요가 있겠다.

고집적어레이 기반의 비교유전체보합법(CGH)을 통한 신경아세포종 Neuro2a 세포의 유전체이상 분석 (High Resolution Genomic Profile of Neuro2a Murine Neuroblastoma Cell Line by Array-based Comparative Genomic Hybridization)

  • 도진환;김인수;고현명;최동국
    • 생명과학회지
    • /
    • 제19권4호
    • /
    • pp.449-456
    • /
    • 2009
  • 신경아세포종은 미분화된 신경외배엽 세포로부터 유래한 신경능세포에 의해 형성된 소아기에 보는 가장 많이 발생하는 악성 종양 중 하나이다. 신경아세포종인 Neuro-2a 세포는 신경세포의 분화, 세포사 억제 효능, 세포독성 검정 등에 활용되고 있다. Neuro-2a 역시 다른 신경아세종과 같이 염색체 변이를 가지고 있지만, 이에 대해 고밀도의 게놈수준에서 염색체 변이에 대해 보고된 바가 없다. 본 연구에서는 고집적 마이크로어레이(최소 43,000 개의 코딩, non-코딩 유전자 서열이 집적된 마이크로어레이)기반의 비교유전체보합법을 활용하여, 고해상도의 Neuro-2a 유전체 이상을 분석하였다. 마이크로 어레이 데이터는 Hidden Markov Model을 활용하여, 유전체 변이를 double loss, single loss, normal, single gain 그리고 amplification으로 나누어 분석하였다. Neuro2a는 MYCN 유전자의 증폭은 관찰되지 않았고, GDNF, BDNF, NENF등의 neurotrophic factor 가운데 NENF의 gain 현상이 관찰 되었다. 염색체의 이상은 4,8,10,11,15번에서 발견되었으며, 염색체 3,17,18,19에서는 전부 20개 미만의 염색체 이상이 발견되었다. 염색체 이상이 연속적으로 일어난 부위 중 gain으로서 가장 긴 부분은 Chr8:8,427,841-35,162,415의 약 26.7 Mb이며, single loss로서 가장 긴 곳은 Chr4:73,265,785-88,374,165의 약 15.1 Mb였다. 염색체의 위치는 UCSC 데이터베이스 (UCSC mm8, NCBI Build 36)에 근거하였다.