• 제목/요약/키워드: 바이오 데이터 분석

검색결과 706건 처리시간 0.031초

모바일 u-health 서비스 플랫폼 설계 (Design of u-Health service platform)

  • 민병원;오용선;한동수;구종영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.797-801
    • /
    • 2009
  • 제안된 u-health 서비스 플랫폼은 바이오 데이터 채집과 저장, 그리고 바이오 데이터 분석 및 결과 통보의 일련의 과정을 모바일u-health 서비스 프로세스로 해석하였다. 모바일 환경에서 건강관리 시스템 구축을 지원하는 서비스 플랫폼은 모바일 u-health 응용 서비스를 쉽게 탑재하여 운영할 수 있도록 설계 되었으며, 서비스 플랫폼의 효용성 및 유용성을 고려함으로써 u-health 사용 서비스의 기틀을 마련하였다.

  • PDF

정수형 변환을 이용한 DNA 서열 검색 알고리즘 (A DNA Sequence Search Algorithm Using Integer Type Transformation)

  • 윤경오;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.357-359
    • /
    • 2012
  • 초 고성능 바이오 서열 분석 장비 기술의 발달로 대량의 바이오 정보가 쏟아져 나오고 있으며, 바이오산업의 발달로 개인별 유전체 정보에 의한 맞춤의학의 시대가 도래되고 있다. 수많은 서열에 대한 분석에는 많은 저장장치 및 주기억장치가 필요하므로 슈퍼컴퓨터 급의 서버와 대량의 데이터를 빠르게 처리할 수 있는 프로그램이 필요하다. 이러한 분석에는 염기서열 일치 검색과 이를 기반으로 하는 Alignment와 Assembly 분석이 있으며, 이를 수행하는 기존의 알고리즘 및 대부분의 프로그램들은 염기서열을 문자열로 취급하고, 해쉬 인덱스 테이블, Brujin 그래프의 사용, 버러우즈 휠러 변환(BWT) 등의 기법을 활용하여 효율적인 분석을 도모하였다. 본 논문에서는 염기서열을 문자열이 아닌 k-mer 묶음의 정수형 하나로 변환하여 검색함으로써 저장 공간의 크기를 약 28% 이상으로 줄이고 형 변환 상태에서의 검색을 수행할 수 있는 알고리즘을 제안한다. Assembly 분석 프로그램인 CalcGen 프로그램을 개발하여 본 알고리즘의 효용성 및 효율성을 실험을 통해 검증하였다. 이 연구의 결과는 향후 대량의 유전체 염기서열의 효율적 분석과 저장 및 처리에 또 하나의 새로운 접근 방법을 제안하는데에 그 의미를 둘 수 있다.

텍스쳐 데이터를 위한 2차 캐쉬 구조를 가지는 그래픽 처리 장치의 성능 분석 (Analysis of GPGPU Performance by dedicating L2 Cache for Texture Data)

  • 김광복;김철홍
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.143-144
    • /
    • 2017
  • 최근 그래픽 처리 장치는 DRAM에 대한 접근을 줄이고자 여러 메모리 계층을 사용하고 있다. GPGPU의 L2 캐쉬는 요청 데이터의 타입에 따라 별도로 접근하는 L1 메모리와 다르게 레이턴시가 긴 DRAM에 접근하기 전에 모든 데이터 타입이 접근 가능한 캐쉬이다. 본 논문에서는 애플리케이션에서 명시하는 다양한 데이터 타입에 대하여 접근 및 적재를 허용하는 L2 캐쉬를 오직 텍스쳐 데이터만을 허용하도록 하여 변화하는 성능을 분석하고자 한다. 본 실험을 위해 텍스쳐 데이터 이외의 데이터 타입은 L2 캐쉬를 바이패스하여 바로 DRAM에 접근하도록 구조를 변경한다. 실험을 통한 분석 결과 텍스쳐 데이터만을 허용하는 경우 대부분의 벤치마크에서 성능 감소가 발생하여 기존 구조대비 평균 5.58% 감소율을 확인하였다. 반대로, 본 논문의 실험 환경에서의 L2 캐쉬의 적중률이 낮은 애플리케이션인 needle은 불필요한 L2 접근을 바이패스 함으로써 전체적인 성능 증가를 이끌어낸 것으로 분석된다.

  • PDF

단백질 구조 정보 분석을 위한 바이오 온톨로지 (Bio-ontology for Analyzing Protein Structure Information)

  • 남덕우;예형석;진훈;김인철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.799-801
    • /
    • 2003
  • 생물정보학 분야에서의 온톨로지는 다양한 생물학적 의미들을 표현하는 구조로 되어 있으며, 생물학 데이터의 의미를 효과적으로 해석할 수 있는 매우 중요한 기술로 인식되고 있다. 특히 바이오 온톨로지는 생물학 데이터베이스로부터 정보에 대한 탐색과 추론 등 의미 전달 과정에서 중심적인 역할을 수행한다. 본 논문에서는 단백질 구조 예측을 지원하는 다중 에이전트시스템인 APSS내에서 각 구성원 에이전트들간에 온톨로지에 기초한 정확한 구조 정보의 전달을 통해 효과적인 단백질 구조 예측 작업을 지원하고자 한다. 이를 위하여 먼저 단백질 구조 관련 바이오 온톨로지의 설계방법을 제시하고, 이것에 기초한 실제 바이오 온톨로지의 설계에 대해 설명한다. 그리고 이렇게 구축된 단백질 구조 온톨로지를 APSS시스템 안에서 어떻게 응용하였는가에 대해서도 설명한다.

  • PDF

디지털바이오헬스케어산업의 고용효과 추이 변화와 고용정책에 관한 연구 (A Study on the Trend of Employment Effect and Employment Policy in the Digital Bio-healthcare Industry)

  • 장필호;김용환
    • 융합정보논문지
    • /
    • 제11권1호
    • /
    • pp.175-182
    • /
    • 2021
  • 본 연구의 목적은 디지털바이오헬스케어산업의 연관산업에 대한 고용유발효과를 시기별로 비교 분석하여 효과적인 산업정책을 수립하기 위한 것이다. 연구를 위한 기본데이터는 한국은행이 실측했던 3개년의 산업연관표를 활용하였다. 연구 방법은 첫째, 산업분류 기준이 다른 시기별 통계자료들을 비교분석하기 위해 7대 산업으로 재작성하였다. 둘째, 한국은행의 산업연관분석 방법론으로 비교분석하였다. 셋째, 격차 조정을 위해 가중치를 반영하여 디지털바이오헬스케어산업의 고용, 생산, 투자 부문에서 유발 효과들을 비교분석하였다. 분석 결과는 첫째, 고용 부문에서는 전체 산업의 평균보다 높은 효과가 있고, 둘째, 생산 부문에서는 낮았고, 셋째, 투자 부문에서는 서비스 분야의 투자가 필요하였다. 분석에서 도출된 결론은, 고용 부문에서 직접투자 및 지속적인 투자가 필요하고, 전문 인력의 육성이 시급하며, 생산 부문에서는 직접투자와 장기투자가 효과적인 것으로 나타났다.

Data Analysis Methods for Quantitative Proteomics Research

  • 권경훈
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2006년도 Principles and Practice of Microarray for Biomedical Researchers
    • /
    • pp.38-44
    • /
    • 2006
  • 프로테오믹스는 생물체 안에 포함되어 있는 단백질을 통합적으로 연구하는 학문이다. 단백질을 동정(Protein identification)하고, 단백질의 상태를 분석(Protein characterization)하며, 단백질의 양적 변화를 관찰(Protein quantitation)한다. 유전자로부터 mRNA 로 복제되고 codon 의 규칙에 따라 합성되는 단백질이 세포 내에 얼만큼 존재하는가라는 단백질의 양적인 변화는 세포 내의 환경에 따라 시시각각 변화할 수 있으며, 이러한 변화의 추적은 단백질의 기능을 밝히는 기초자료로서 중요성을 가진다. 특히 질병의 조기 진단을 위한 바이오마커를 발굴하기 위한 스크리닝 역할로서, 단백질의 발현 양상을 비교하는 프로테오믹스는 기대를 모으고 있다. 단백질에 대한 분석, 특히 질량분석기에 의해 초고속으로 대량의 단백질 데이터를 생산하는 프로테오믹스의 연구는 정량적인 단백질 발현양상 분석의 정확도를 높이기 위해 다양한 실험기법과 데이터 분석기법을 동원하고 있다. 이번 발표에서는 프로테오믹스에서 단백질의 양을 측정하기 위한 실험 방법들과 그에 따른 데이터 분석 방법들을 소개하고자 한다. 프로테오믹스 연구의 초창기부터 사용되어온 2차원 전기영동법에 의해 생성되는 2D-gel image 에서의 spot 분석법으로부터, 탄뎀 질량분석기를 사용하는 ICAT, iTRAQ 등의 labeling 방법에 의한 정량분석, 그리고 질량분석기의 정확도를 최대한으로 활용하는 label-free 방법에 대한 기본 개념을 살펴보고 데이터 분석 기술의 적용 방법을 알아본다.

  • PDF

문헌정보학과의 데이터 사이언스 커리큘럼 개발 실태와 방향성 고찰 (Study on the Current Status of Data Science Curriculum in Library and Information Science and its Direction)

  • 강지혜
    • 한국도서관정보학회지
    • /
    • 제47권3호
    • /
    • pp.343-363
    • /
    • 2016
  • 본 연구는 69개의 iSchool에서 데이터 사이언스 관련 교과가 어떻게 제공되고 있는지를 파악하고, 국내 교과와 비교하여 방향성을 제시한다. iSchool은 건강, 기술, 바이오 분야를 비롯한 관련 분야로 그 교과 영역을 확장하는 현상이 두드러진다. 하지만, 국내 교과에서는 인접학문과 융합하려는 현상은 활발하게 관찰되지 않았다. 데이터를 어떻게 처리하고 관리할 것인지에 대한 영역 역시 iSchool이 집중하는 분야인데, 일반적인 데이터 사이언스, 데이터 관리, 데이터 보안 등에 중점을 둔 교과가 제공되고 있다. 데이터를 저장하는 방식에 대한 교과 분류는 '데이터베이스' 관련 교과의 비중이 높았으며, 비슷한 비중으로 통계와 분석법이 제공되고 있었다. iSchool의 교과를 분석하고 국내 사례와 비교해 본 결과 본 논문은 국내 문헌정보학이 데이터 사이언스 관련 교과를 확대하고, 병진 데이터 사이언스로의 역할을 강화하며, 수리적 분석 능력을 키우는 교과를 개발하되, 특성화된 교과를 발굴하여 실험적인 수업을 제공하고, 기술과 상호작용하는 지식을 제공해야 할 것을 제안한다.

지리정보를 갖는 통계 데이터의 Visualization

  • 이정진
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.27-29
    • /
    • 2003
  • 정보화시대의 발전과 더불어 우리 일상생활에 친숙하게 다가온 기술 중의 하나가 지리정보시스템(Geographical Information System: GIS)이다. GIS는 공간(지표, 지하, 해양 등)상에 분포하고 있는 정보에 대해 여러 종류의 세밀한 지도를 이용하여 효율적으로 사용자에게 제공하여 관리하는 종합정보기술이다. 통계 데이터 중에는 지리정보를 가지고 있는 경우가 상당히 많다. 하지만 지리정보를 갖는 통계 데이터의 탐색적 자료분석(Exploratory Data Analysis)을 위한 Visualization 기법에 대해서는 별로 연구된 바가 없다. 본 논문에서는 GIS를 위한 벡터맵(vector map)의 간단한 제작방법과 GIS의 개발방법, 그리고 탐색적 자료분석을 위한 Visualization기법을 소개한다.

  • PDF

전사체 시각화 프레임워크 개발 (Transcriptome visualization framework development)

  • 황혜련;김소라;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1340-1343
    • /
    • 2012
  • 정보의 시각화는 추상적 정보를 직관적으로 이해하기 쉽도록 시각적으로 명확하게 표현하는 방법을 말한다. 대용량의 바이오 데이터를 다루는 생물정보학(bioinformatics) 분야에서는 컴퓨터의 높은 성능을 활용하여 수많은 유전학적 데이터들을 분석하고 있다. 다양한 생물정보학 실험에서 전사체는 특정한 조건에서 발현된 RNA의 총합을 말한다. 분석된 전사체 정보는 텍스트형태로 제공이 되는데 이를 사용자가 수작업으로 비교하는 데에는 한계가 있다. 따라서 분석된 전사체 정보를 효과적으로 인지할 수 있도록 시각화하는 연구들이 진행되고 있다. 본 논문에서는 그래프 라이브러리인 yFile을 활용하여 추정된 전사체를 실시간으로 시각화하여 제공하는 방법을 제안한다. GTF파일을 입력받아서 데이터베이스에 저장하고 이 정보를 이용하여 그래프를 생성한다. 실험 결과는 전사체를 시각화 하는 방법을 통하여 다양한 전사체 정보를 알아 낼 수 있고, 최종적으로는 novel gene을 찾는 것이 가능할 것으로 기대한다.

신(新)기술(빅데이터) 등장에 따른 경제적 파급효과 및 법(규제) 연구

  • 이규철;원희선
    • 정보와 통신
    • /
    • 제29권11호
    • /
    • pp.48-54
    • /
    • 2012
  • 정보통신 기술은 아날로그 산업에서 디지털 산업을 거쳐 현재는 스마트 산업으로 이어지는 수단으로 활용되어 왔다. 특히 산업 사회생활에서 문서로 직접 주고받던 환경에서 메일, 전자문서 교환 등으로 바뀌면서 편리성과 비용절감을 통해 산업 사회생활 발전에 기여하고 있다. 최근 빅데이터 기술은 대용량 정보를 분석하여 기상예측, 신약개발, 유전자 분석 등의 다양한 분야에 활용되고 있다. 그러나 대용량 정보 안에는 개인 식별을 할 수 있는 정보가 포함되어 있어, 빅데이터 기술을 바로 적용하기에는 개인정보보호법이 정하는 개인정보보호 이용에 관한 법률에 대한 준비가 미흡한 실정이다. 예를 들어 공공기관의 데이터를 활용하여 날씨 예측, 재난 방재 서비스 등을 통해 국민의 삶을 제고함과 동시에 경제적으로 많은 이익을 가져올 수 있다. 그러나 개인정보를 타인이 악의적으로 이용할 수 있어 개인에게 경제적, 정신적 피해를 줄 수 있다. 또한 개인정보의 노출은 과거와 달리 삭제되거나 잊혀지지 않고 영구적으로 재사용이 가능하기 때문에 이를 사전에 막을 수 있는 방법이 필요하다. 이에 본고는 빅데이터 등장에 따른 시장구조 변화 및 경제적 파급효과를 분석하고, 법리적 분석을 바탕으로 빅데이터 기술이 올바르게 시장에 정착할 수 있은 법(규제)방안을 제시하고자 한다.