• 제목/요약/키워드: 바이오 데이터 분석

검색결과 702건 처리시간 0.029초

비대칭적 유사도 기반의 심볼릭 객체의 계층적 클러스터링 (Hierarchical Clustering of Symbolic Objects based on Asymmetric Proximity)

  • 오승준;박찬웅
    • 한국지능시스템학회논문지
    • /
    • 제22권6호
    • /
    • pp.729-734
    • /
    • 2012
  • 패턴 인식, 데이터 분석, 침입 탐지, 이미지 처리, 바이오 인포매틱스 등과 같은 수많은 분야에서 클러스터링 분석이 사용되고 있다. 기존의 많은 연구들은 수치 데이터에만 기반을 두고 있다. 그러나 구간 데이터, 히스토그램, 심지어는 함수들을 값으로 갖는 변수들을 다루는 심볼릭 데이터 분석이 부상하고 있다. 본 논문에서는 이런 심볼릭 데이터들을 클러스터링하기 위하여 비대칭적 유사도를 제안한다. 또한 평균 유사도 값(ASV)에 기반한 클러스터링 방법도 개발한다. 제안하는 클러스터링의 결과는 기존 방법들과 다르며, 매우 고무적인 결과를 보여준다.

데이터 그리드를 이용한 초고전압 투과전자현미경 데이터베이스 시스템 (High Voltage Electron Microscopy DataBase System Using Data Grid)

  • 안영헌;권희석;김윤중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.583-585
    • /
    • 2005
  • 바이오 및 재료 분야 등 NT(Nano Technology), BT(Bio Technology)에 관련된 연구를 보다 더 수월하게 하기 위해 본원에 설치되어 있는 초고전압 투과전자현미경(High Voltage Electron Microscopy - 이하 HVEM)을 이용한다. HVEM을 통해 획득한 이미지의 정보는 매우 방대하여 하나의 시료를 관찰하는데 있어서 수백 메가 이상의 용량을 차지하고, 연구를 수행하는데 있어서 데이터를 여러 형태로 관찰 분석하기 때문에 수월한 지원을 위해 체계적으로 관리할 수 있는 데이터베이스 시스템이 필요하다. 그러나 일반적인 범용 데이터베이스로는 이러한 대규모의 데이터를 저장할 수 없다. 따라서 본 논문에서는 이러한 용량 데이터를 체계적으로 관리할 수 있도록, 데이터 그리드와 연구 데이터의 정보를 갖는 metadata 테이블을 통해 서로 먼 거리에 있는 연구원들이 데이터를 접근하고 대규모 저장 공간을 갖는 데이터베이스 시스템을 제안한다.

  • PDF

골프 스윙 모션 추정에서 Bi-LSTM 기반의 효율적인 이상치 검출 및 보정 기법 (An efficient Bi-LSTM based method for outlier detection and correction in golf swing motion estimation)

  • 주찬양;박지성;오경수;최현준;이동호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.787-790
    • /
    • 2021
  • 본 논문에서는 최신 모션 인식 기술을 활용하여 골프 스윙 비디오에서 사람의 자세를 추정한 후 다양한 원인으로 오검출된 좌표들을 보정하여 자세 추정의 정확도를 높이는 방법을 제안한다. 기존의 사람 자세 추정 모델은 골프 스윙 데이터에서 오검출, 반전, 불안정성, 미검출의 문제를 보여 정확한 자세 추정을 어렵게 했다. 이를 해결하기 위하여 본 연구에서는 자세 추정시 발생하는 이상치 데이터들을 Bi-LSTM 으로 학습하고 골프 스윙의 특징을 고려한 간단한 규칙을 통하여 이상치 데이터를 효과적으로 검출하고 이를 보정하는 방법을 제안한다. 또한 다양한 실험과 분석을 통하여 제안하는 방법이 골프 스윙 모션에서 사람의 자세를 정확히 추정할 수 있음을 보인다.

생체신호 기반 바이오인식 시스템 기술 동향 (Biometrics System Technology Trends Based on Biosignal)

  • 최규호;문해민;반성범
    • 디지털융복합연구
    • /
    • 제15권1호
    • /
    • pp.381-391
    • /
    • 2017
  • 바이오인식 기술은 개인의 고유한 특성인 신체적 또는 행동적 특징을 이용해 사용자를 인증하는 기술이다. 현재 금융, 보안, 출입관리, 의료복지, 공공, 검역, 엔터테인먼트 등 광범위하게 그 필요성 및 효용성으로 서비스 범위가 확대되고 있는 추세이다. 지문, 얼굴과 같은 생체정보를 이용한 바이오인식은 위조, 변장 위협에 노출되어 사회적 문제가 되었다. 최근 신체 외부의 생체정보가 아닌 신체 내부의 생체신호를 이용한 연구가 진행되고 있다. 이에 따라 본 논문에서는 생체신호인 심전도, 심장음, 뇌전도, 근전도를 이용한 바이오인식 시스템의 최근 연구 및 기술들을 분석하고 발전 방향을 위해 필요한 기술들을 제시하고자 한다. 향후에는 개개인의 복합적 상태에서 생체신호 기반 빅 데이터를 관리하는 데이터베이스 구축, 빅 데이터를 분석하는 딥러닝을 이용하여 실시간 환경에 적합한 바이오인식 시스템 기술들이 연구될 것으로 예상된다.

바이오메트릭스 프라이버시 및 보안 기법에 대한 연구

  • 김혜진;이경희;양대헌
    • 정보보호학회지
    • /
    • 제27권3호
    • /
    • pp.42-47
    • /
    • 2017
  • 바이오메트릭스는 사용자가 가지는 신체적, 행동적 고유한 특성이기 때문에 유출 사고나 프라이버시 침해 사고에 매우 취약하다. 이러한 취약점을 보호하기 위하여 바이오메트릭스 시스템이 생성하는 템플릿은 반드시 원래의 데이터로 복원이 불가능하고, 취소 가능한 특성을 지녀야 한다. 본 논문에서는 바이오메트릭스 템플릿을 보호하는 특성을 부여하는 기법들을 분석하고, 특성을 제시하였다.

바이오 헬스케어 분야 국가연구개발 특허성과 네트워크 분석 (Analysis of National R&D Patent Performance Network in Bio-Healthcare Sector)

  • 권영은;김재수
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.17-24
    • /
    • 2018
  • 본 논문은 바이오 헬스 분야의 기술융합구조와 핵심기술 연구 분야를 파악하기 위해 국가R&D 수행으로 창출된 특허성과를 기반으로 네트워크 분석을 실시한 논문으로서, 이를 위한 기반 연구인 특허네트워크 분석을 실시하여 이에 대한 문제점을 도출하고 NTIS로부터 데이터를 수집하여 연구프레임 네트워크를 기반으로 바이오 헬스케어 분야 국가R&D 특허 현황 분석과 IPC 네트워크 분석을 통해 도출된 5개의 그룹을 바이오 헬스케어 분야 기술체계 기준으로 주제를 선정하였다. 분류된 것을 대상으로 기술 파급효과가 가장 높은 기술을 도출하여 다른 분야의 비교를 통해 국가R&D 분야의 연구비 투자에 대한 방향을 제시하였다. 향후 해외특허자료 분석을 추가적으로 실시하고, 기술융합과 정부투자 연구비의 상관분석을 보완하여 연구비투자 방향성 모색에 기여할 것으로 판단된다.

워드 임베딩을 이용한 COPD와 암 관련 바이오마커의 상관관계 분석 (Correlation Analysis of Cancer Biomarkers and COPD Using the Word Embedding)

  • 윤병훈;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.251-254
    • /
    • 2017
  • 본 연구에서는 COPD와 기존에 연관이 있는 것으로 알려진 바이오마커 이외의 새로운 바이오마커를 찾고자 한다. Pubmed Data에서 선정한 암 관련 바이오마커를 추출하여 COPD와 암 관련 바이오마커의 관계를 파악하는 데이터로 사용한다. 그리고 워드 임베딩 모델 중 Word2vec을 사용하여 워드 임베딩 한다. 워드 임베딩한 K차원의 COPD와 암 관련 바이오마커를 t-SNE를 사용하여 시각화한다. 또한 코사인 유사도를 이용하여 COPD와 암 관련 바이오마커의 유사도를 측정한다. 그리고 코사인 유사도와 t-SNE 결과를 이용하여 COPD와 암 관련 바이오마커와의 상관관계를 파악할 수 있으며, 암 관련 바이오마커와 COPD 관련 바이오마커를 비교 하여 기존의 COPD와 연관이 있다고 알려진 바이오마커 이외의 새로운 바이오마커를 찾을 수 있다.

  • PDF

워드 임베딩을 이용한 COPD와 암 관련 바이오마커의 상관관계 분석 (Correlation Analysis of Cancer Biomarkers and COPD Using the Word Embedding)

  • 윤병훈;김유섭
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.251-254
    • /
    • 2017
  • 본 연구에서는 COPD와 기존에 연관이 있는 것으로 알려진 바이오마커 이외의 새로운 바이오마커를 찾고자 한다. Pubmed Data에서 선정한 암 관련 바이오마커를 추출하여 COPD와 암 관련 바이오마커의 관계를 파악하는 데이터로 사용한다. 그리고 워드 임베딩 모델 중 Word2vec을 사용하여 워드 임베딩 한다. 워드 임베딩한 K차원의 COPD와 암 관련 바이오마커를 t-SNE를 사용하여 시각화한다. 또한 코사인 유사도를 이용하여 COPD와 암 관련 바이오마커의 유사도를 측정한다. 그리고 코사인 유사도와 t-SNE 결과를 이용하여 COPD와 암 관련 바이오마커와의 상관관계를 파악할 수 있으며, 암 관련 바이오마커와 COPD 관련 바이오마커를 비교 하여 기존의 COPD와 연관이 있다고 알려진 바이오마커 이외의 새로운 바이오마커를 찾을 수 있다.

  • PDF

Google Analytics API를 연동한 R 프로그래밍 데이터 시각화 (Data Visualization of R Programming using Google Analytics API)

  • 안장근;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.290-293
    • /
    • 2017
  • 최근 IoT 기술발달로 인한 스마트폰 및 대용량 미디어기기 사용증가로 인터넷 네트워크 사용량이 폭발적으로 증가되고 있고, 이러한 데이터 사용량 급증으로 대량의 데이터를 지칭하는 빅데이터 수집 및 분석에 많은 기업과 정부가 주목하고 있다. 빅데이터는 기존에 없던 새로운 데이터의 구축이 아니며, 그동안 축적된 다방면의 방대한 데이터의 집합이라 할 수 있다. 빅데이터의 이용 및 분석에 대한 기업 정부 학계의 수요는 증가하고 있지만, 고난도의 빅데이터 분석을 위한 인프라 구축이 선결과제이어서, 이러한 인프라구축 비용 때문에 빅데이터 분석이 일선 산업분야에 바로 적용하는데 많은 장애요인이 되어 데이터 분석가들의 빅데이터 분석에 애로사항으로 존재하고 있다. 이러한 어려움을 해소하기 위한 방안으로 새로운 인프라 구축 없이 Google Analytics API를 연동한 R 프로그래밍의 데이터 시각화를 활용한 데이터 분석 방안을 제시하고자 한다. 본 연구에서는 구글 애널리틱스 API를 연동하여 사용자 웹사이트의 사용자접속, 사이트운영, 이벤트 발생 등의 데이터를 R 프로그램을 활용하여 사이트 현황을 데이터 시각화로 분석하고 운영중인 웹사이트에 적용 가능한 콘텐츠 개발 방안에 대해 연구하였다.

  • PDF

바이오 정보 기술 (Bioinformatics Technology)

  • 정호열;박수준;박선희
    • 전자통신동향분석
    • /
    • 제20권5호통권95호
    • /
    • pp.93-104
    • /
    • 2005
  • 현재 우리나라에서 가장 주목받고 있는 분야가 IT와 BT일 것이다. IT는 워낙 언론매체에 많이 노출되어 어떤 것을 말하고 어떤 분야가 있다는 것을 많은 사람들이 잘 알고 있는 실정이나, BT 관련해서는 단순히 시험관을 연상하는 사람이나 줄기세포 연구 정도로 알고 있는 사람들이 많을 것이다. 현재의 BT 분야는 예전의 소규모 실험을 벗어나 대규모의 실험 수행이 가능한 시스템이 구축되었는데, 이러한 대규모 실험 결과를 분석하기 위한 정보학적인 방법의 도입이 필수적인 시대가 되었다. 그래서, 이런 접근방법을 통상 IT와 BT의 융합기술이다라고 이야기한다. 바이오 정보 기술이란 이런 대규모의 생물학적 데이터를 시스템적으로 분석하여 정보를 추출하는 제반 기술이라고 이야기 할 수 있다. 일반적으로 많이 알려진 용어로는 생물정보학(바이오인포매틱스)혹은 계산생물학이 있다. 더 넓은 의미에서 이야기 할 때는 이러한 정보 추출을 위한 분석 과정뿐만 아니라, 생물학 관련 데이터베이스 구축 및 서비스 부분도 포함해서 이야기하고 있다.