• 제목/요약/키워드: 바이오 마커

검색결과 205건 처리시간 0.027초

워드 임베딩을 이용한 COPD와 암 관련 바이오마커의 상관관계 분석 (Correlation Analysis of Cancer Biomarkers and COPD Using the Word Embedding)

  • 윤병훈;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.251-254
    • /
    • 2017
  • 본 연구에서는 COPD와 기존에 연관이 있는 것으로 알려진 바이오마커 이외의 새로운 바이오마커를 찾고자 한다. Pubmed Data에서 선정한 암 관련 바이오마커를 추출하여 COPD와 암 관련 바이오마커의 관계를 파악하는 데이터로 사용한다. 그리고 워드 임베딩 모델 중 Word2vec을 사용하여 워드 임베딩 한다. 워드 임베딩한 K차원의 COPD와 암 관련 바이오마커를 t-SNE를 사용하여 시각화한다. 또한 코사인 유사도를 이용하여 COPD와 암 관련 바이오마커의 유사도를 측정한다. 그리고 코사인 유사도와 t-SNE 결과를 이용하여 COPD와 암 관련 바이오마커와의 상관관계를 파악할 수 있으며, 암 관련 바이오마커와 COPD 관련 바이오마커를 비교 하여 기존의 COPD와 연관이 있다고 알려진 바이오마커 이외의 새로운 바이오마커를 찾을 수 있다.

  • PDF

워드 임베딩을 이용한 COPD와 암 관련 바이오마커의 상관관계 분석 (Correlation Analysis of Cancer Biomarkers and COPD Using the Word Embedding)

  • 윤병훈;김유섭
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.251-254
    • /
    • 2017
  • 본 연구에서는 COPD와 기존에 연관이 있는 것으로 알려진 바이오마커 이외의 새로운 바이오마커를 찾고자 한다. Pubmed Data에서 선정한 암 관련 바이오마커를 추출하여 COPD와 암 관련 바이오마커의 관계를 파악하는 데이터로 사용한다. 그리고 워드 임베딩 모델 중 Word2vec을 사용하여 워드 임베딩 한다. 워드 임베딩한 K차원의 COPD와 암 관련 바이오마커를 t-SNE를 사용하여 시각화한다. 또한 코사인 유사도를 이용하여 COPD와 암 관련 바이오마커의 유사도를 측정한다. 그리고 코사인 유사도와 t-SNE 결과를 이용하여 COPD와 암 관련 바이오마커와의 상관관계를 파악할 수 있으며, 암 관련 바이오마커와 COPD 관련 바이오마커를 비교 하여 기존의 COPD와 연관이 있다고 알려진 바이오마커 이외의 새로운 바이오마커를 찾을 수 있다.

  • PDF

구글 학술 검색 기반의 질병과 바이오마커 관계 분석 (Relation Analysis of Disease and Biomarker based on Google Scholar)

  • 오병두;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 하며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

구글 학술 검색 기반의 질병과 바이오마커 관계 분석 (Relation Analysis of Disease and Biomarker based on Google Scholar)

  • 오병두;김유섭
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.238-241
    • /
    • 2017
  • 본 논문에서는 구글 학술 검색 기반의 데이터를 이용하여 질병과 폐질환과 관련된 바이오마커 단어의 유사도를 계산하는 방법을 제안한다. 질병과 바이오마커의 유사도를 계산할 때, 각 단어의 구글 학술 검색의 검색 결과를 이용하였다. 이를 통해 폐질환 관련 바이오마커와 다른 질병간의 관계를 파악하고자 히며, 의료 전문가에게 폐질환 관련 바이오마커와 다른 질병간의 새로운 관계를 제시하고자 한다. 이러한 데이터를 이용하여 계산한 결과, Wor2Vec의 결과를 이용한 코사인 유사도의 결과와 상관 계수가 약 0.64로 상당히 높은 상관 관계를 확인할 수 있었다. 따라서 이 방법을 통해 질병과 바이오마커의 관계를 파악하고자 하였다. 또한 Word2Vec을 이용한 질병과 바이오마커 단어의 벡터 값과 단어 유사도 계산 방법의 결과를 이용한 Deep Neural Networks (DNNs) 모델을 구축하고자 하며, 이를 통해 자동적으로 유사도를 분석하고자 하였다.

  • PDF

텍스트 기반의 바이오마커 검출을 위한 가우시안 혼합 모델의 응용 (Application of Gaussian Mixture Model for Text-based Biomarker Detection)

  • 오병두;김기현;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.550-551
    • /
    • 2018
  • 바이오마커는 체내의 상태 및 변화를 파악할 수 있는 지표이다. 이는 암을 비롯한 다양한 질병에 대하여 진단하는데 활용도가 높은 것으로 알려져 있으나, 새로운 바이오마커를 찾아내기 위한 임상 실험은 많은 시간과 비용을 소비되며, 모든 바이오마커가 실제 질병을 진단하는데 유용하게 사용되는 것은 아니다. 따라서 본 연구에서는 자연어처리 기술을 활용해 바이오마커를 발굴할 때 요구되는 많은 시간과 비용을 줄이고자 한다. 이 때 다양한 의미를 가진 어휘들이 해당 질병과 연관성이 높은 것으로 나타나며, 이들을 분류하는 것은 매우 어렵다. 따라서 우리는 Word2Vec과 가우시안 혼합 모델을 사용하여 바이오마커를 분류하고자 한다. 실험 결과, 대다수의 바이오마커 어휘들이 하나의 군집에 나타나는 것을 확인할 수 있었다.

  • PDF

해역 건강도 평가를 위한 다매체 바이오마커 적용 (Application on Multi-biomarker Assessment in Environmental Health Status Monitoring of Coastal System)

  • 정지현;류태권;이택견
    • Ocean and Polar Research
    • /
    • 제30권1호
    • /
    • pp.109-117
    • /
    • 2008
  • 해양환경 건강성 평가에서 바이오마커의 적용은 상대적으로 새로운 분야이다. 국립학술원 및 세계보건기구에 따르면 바이오마커는 노출바이오마커, 영향바이오마커 및 민감바이오마커 등 3가지로 나누어진다. 해양생태계에 대한 환경오염물질의 노출 및 영향을 평가하기 위하여 다음과 같은 바이오마커들이 시험되고 있다: 해독, 산화스트레스, 분해산물, 스트레스 반응, 세포사멸, 물질대사, 신경반응, 생식, 스테로이드 호르몬, 항산화물질, 유전적 변형. 1990년대 초부터 여러 바이오마커 연구그룹들은 해양생물의 건강지수를 개발하여 해양환경의 상태를 평가하기 위한 수단으로 활용해 왔다. 바이오마커 지수는 생물학적 효과에 대한 모니터링활동으로부터 얻어진 자료의 해석에 사용될 수 있다. 본 총설에서는 이제까지 보고된 바이오마커 지수 관련 연구 중 대표적인 건강평가지수(Health assessment Index), 바이오마커 지수(Biomarker Index), 생물영향평가지수(Bioeffect Assessment Index) 및 일반화된 선형모델(Generalized Linear Model) 등의 연구를 요약하였다. 오염된 지역에 서식하는 해양생물의 바이오마커 반응 측정 및 바이오마커 지수 개발은 다양한 측면의 해양생태계 위해성 평가를 위해 고안된 환경모니터링 프로그램에 공헌할 수 있는 정보를 제공해 줄 수 있을 것이다.

동물 분자 진단 시장의 동향 (Investigation of the Molecular Diagnostic Market in Animals)

  • 박창은;박성하
    • 대한임상검사과학회지
    • /
    • 제51권1호
    • /
    • pp.26-33
    • /
    • 2019
  • 최근 반려동물 시장의 급격한 성장으로 인해 동물용 질병 진단키트의 개발이 이루어지고 있다. 이에 동물 분자진단 개발을 위한 바이오마커의 도입으로 효용성을 재평가하고 있다. 좋은 바이오 마커는 정확하고 신뢰할 수 있어야 하고, 정상 상태와 질병 상태를 구별하고, 다른 질병을 구별해야 한다. 최근 보고된 유전마커나 세포유리 DNA, 순환종양세포, granzyme, 피부종양에 관한 종양마커의 개발이 활발히 이루어지고 있으며, 기타로는 브루셀라증, programmed death receptor-1, symmetric dimethylarginine, periostin, cysteinyl leukotrien이 활발히 도입되고 있다. 따라서 바이오마커는 위험 예측에 사용되거나 질병 진행의 스크리닝, 진단 및 모니터링에 사용된다. 관련 바이오 마커에 대한 가장 중요한 기준은 질병 특이성이며 많은 잠재적 바이오 마커가 실험실 및 시험 연구에서 출현했지만, 독립적인 실험이나 대규모 임상 연구에서 검증이 부족하다. 후보 바이오 마커는 질병과 연관성을 평가하고, 조기 발견, 질병 진행에 대한 바이오 마커의 유효성을 검증하여서 인간 및 동물에게 접목하게 된다. 향후 잘 구조화 된 바이오마커 기반 연구의 효용성을 재평가하고 동물 질병 진단에 도입되는 추세에 맞춰 현장검사에서 활용될 수 있는 키트의 개발에 대한 연구가 요구돼야 할 것으로 사료된다.

난소암 조기진단을 위한 다중 바이오마커 선택 알고리즘 성능 비교 (Combination and evaluation to multiplex-biomarkers for check of ovarian cancer)

  • 최광원;김승일;조상연;송혜정;김종대;김유섭;박찬영;신규성;경민선;김영목;박형기;이은영;이명선;김종원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.176-179
    • /
    • 2011
  • 본 연구에서는 T-Test와 Genetic Algorithm을 사용해 Luminex 사용 환경에서 난소암을 진단할 수 있는 바이오마커의 조합을 찾고 Cancer와 Normal간의 분류 성능을 평가해 보았다. 바이오마커는 혈액, 체액 내의 특정 질환 여부나 상태를 나타내는 단백질, DNA들의 지표 물질이다. 정상인과는 다른 분포를 가진 성분이 환자의 혈액이나 체액에서 발견되면 이를 토대로 질병유무와 상태를 판단할 수 있다. 난소암을 진단할 수 있는 바이오마커 조합을 찾기 위해 T-Test와 Genetic Algorithm를 사용하여 분류성능이 좋은 바이오마커 조합을 각각 선별해 보았고, 선별된 각각의 마커조합을 선형분류기(LDA)를 사용해 평균 민감도, 특이도, 정확도를 비교해 보았다. 실험데이터는 두 곳의 병원에서 제공받은 총 58명(Cancer 27명, Normal 31명)의 혈청에서 21 종류의 바이오마커 데이터를 Luminex-PRA를 통해 얻었다. 본 연구에서는 T-Test로 만들어진 마커조합이 Genetic algorithm으로 만들어진 마커조합 보다 더 좋은 민감도, 특이도, 분류정확도를 보여주었다.

단어 표현에 기반한 연관 바이오마커 발굴 (Biomarker Detection of Specific Disease using Word Embedding)

  • 윤영신;김유섭
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.317-320
    • /
    • 2016
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다. 2차원으로 맵핑된 결과 값을 코사인 유사도를 사용하여 질병과 바이오 마커간의 유사도를 구한다. 이 유사도 결과 값 상위 20쌍의 결과를 가지고 실제 연구가 되고 있는지 구글 스콜라를 통해 관련 논문을 검색하여 확인하고, 검색 결과를 점수화 한다. 실험 결과 상위 20쌍 중에서 85%의 쌍이 실제적으로 질병과 바이오 마커 간의 관계를 파악하는 방향으로 진행 되고 있으나, 나머지 15%의 쌍에 대해서는 실질적인 연구가 잘 되고 있지 않은 것으로 파악되었다.

  • PDF

단어 표현에 기반한 연관 바이오마커 발굴 (Biomarker Detection of Specific Disease using Word Embedding)

  • 윤영신;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.317-320
    • /
    • 2016
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다. 2차원으로 맵핑된 결과 값을 코사인 유사도를 사용하여 질병과 바이오 마커간의 유사도를 구한다. 이 유사도 결과 값 상위 20쌍의 결과를 가지고 실제 연구가 되고 있는지 구글 스콜라를 통해 관련 논문을 검색하여 확인하고, 검색 결과를 점수화 한다. 실험 결과 상위 20쌍 중에서 85%의 쌍이 실제적으로 질병과 바이오 마커 간의 관계를 파악하는 방향으로 진행 되고 있으나, 나머지 15%의 쌍에 대해서는 실질적인 연구가 잘 되고 있지 않은 것으로 파악되었다.

  • PDF