• 제목/요약/키워드: Bio-Medical Corpus

검색결과 4건 처리시간 0.018초

한국어 생의학 개체명 인식 성능 비교와 오류 분석 (Performance Comparison and Error Analysis of Korean Bio-medical Named Entity Recognition)

  • 이재홍
    • 한국전자통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.701-708
    • /
    • 2024
  • 딥러닝 분야에서 트랜스포머 아키텍쳐의 출현은 자연어 처리 연구가 획기적인 발전을 가져왔다. 개체명 인식은 자연어 처리의 한 분야로 정보 검색과 같은 태스크에 중요한 연구 분야이다. 생의학 분야에서도 그 중요성이 강조되나 학습용 한국어 생의학 말뭉치의 부족으로 AI를 활용한 한국어 임상 연구 발전에 제약이 되고 있다. 본 연구에서는 한국어 생의학 개체명 인식을 위해 새로운 생의학 말뭉치를 구축하고 대용량 한국어 말뭉치로 사전 학습된 언어 모델들을 선정하여 전이 학습시켰다. F1-score로 선정된 언어 모델의 개체명 인식 성능과 태그별 인식률을 비교하고 오류 분석을 하였다. 인식 성능에서는 KlueRoBERTa가 상대적인 좋은 성능을 보였다. 태깅 과정의 오류 분석 결과 Disease의 인식 성능은 우수하나 상대적으로 Body와 Treatment는 낮았다. 이는 문맥에 기반하여 제대로 개체명을 분류하지 못하는 과분할과 미분할로 인한 것으로, 잘못된 태깅들을 보완하기 위해서는 보다 정밀한 형태소 분석기와 풍부한 어휘사전 구축이 선행되어야 할 것이다.

LitCovid-AGAC: cellular and molecular level annotation data set based on COVID-19

  • Ouyang, Sizhuo;Wang, Yuxing;Zhou, Kaiyin;Xia, Jingbo
    • Genomics & Informatics
    • /
    • 제19권3호
    • /
    • pp.23.1-23.7
    • /
    • 2021
  • Currently, coronavirus disease 2019 (COVID-19) literature has been increasing dramatically, and the increased text amount make it possible to perform large scale text mining and knowledge discovery. Therefore, curation of these texts becomes a crucial issue for Bio-medical Natural Language Processing (BioNLP) community, so as to retrieve the important information about the mechanism of COVID-19. PubAnnotation is an aligned annotation system which provides an efficient platform for biological curators to upload their annotations or merge other external annotations. Inspired by the integration among multiple useful COVID-19 annotations, we merged three annotations resources to LitCovid data set, and constructed a cross-annotated corpus, LitCovid-AGAC. This corpus consists of 12 labels including Mutation, Species, Gene, Disease from PubTator, GO, CHEBI from OGER, Var, MPA, CPA, NegReg, PosReg, Reg from AGAC, upon 50,018 COVID-19 abstracts in LitCovid. Contain sufficient abundant information being possible to unveil the hidden knowledge in the pathological mechanism of COVID-19.

Korean Red Ginseng extract ameliorates demyelination by inhibiting infiltration and activation of immune cells in cuprizone-administrated mice

  • Min Jung Lee;Jong Hee Choi;Tae Woo Kwon;Hyo-Sung Jo;Yujeong Ha;Seung-Yeol Nah;Ik-Hyun Cho
    • Journal of Ginseng Research
    • /
    • 제47권5호
    • /
    • pp.672-680
    • /
    • 2023
  • Background: Korean Red Ginseng (KRG), the steamed root of Panax ginseng, has pharmacological activities for immunological and neurodegenerative disorders. But, the role of KRGE in multiple sclerosis (MS) remains unclear. Purpose: To determine whether KRG extract (KRGE) could inhibit demyelination in corpus callosum (CC) of cuprizone (CPZ)-induced murine model of MS Methods: Male adult mice were fed with a standard chow diet or a chow diet supplemented with 0.2% (w/w) CPZ ad libitum for six weeks to induce demyelination while were simultaneously administered with distilled water (DW) alone or KRGE-DW (0.004%, 0.02 and 0.1% of KRGE) by drinking. Results: Administration with KRGE-DW alleviated demyelination and oligodendrocyte degeneration associated with inhibition of infiltration and activation of resident microglia and monocyte-derived macrophages as well as downregulation of proinflammatory mediators in the CC of CPZ-fed mice. KRGE-DW also attenuated the level of infiltration of Th1 and Th17) cells, in line with inhibited Mrna expression of IFN-γ and IL-17, respectively, in the CC. These positive effects of KRGE-DW mitigated behavioral dysfunction based on elevated plus maze and the rotarod tests. Conclusion: The results strongly suggest that KRGE-DW may inhibit CPZ-induced demyelination due to its oligodendroglial protective and anti-inflammatory activities by inhibiting infiltration/activation of immune cells. Thus, KRGE might have potential in therapeutic intervention for MS.

텍스트 마이닝을 이용한 인공지능 활용 신약 개발 연구 동향 분석 (Analysis of Research Trends in New Drug Development with Artificial Intelligence Using Text Mining)

  • 남재우;김영준
    • 생명과학회지
    • /
    • 제33권8호
    • /
    • pp.663-679
    • /
    • 2023
  • 본 리뷰 논문은 2010년부터 2022년까지의 인공지능을 활용한 신약개발 관련 연구동향을 분석하여 정리하였다. 이러한 분석을 통해 2,421개 연구의 초록을 코퍼스로 구성하고, 전처리를 거쳐 빈도가 높고 연결 중심성이 높은 단어를 추출하였다. 분석 결과 2010-201년과 2020-2022년 단어빈도 추이는 비슷한 것으로 구분되어 나타났다. 연구 방법으로는 2010년부터 2020년까지 머신 러닝을 활용한 연구가 많이 진행되었고, 2021년부터는 딥러닝을 활용한 연구가 증가하고 있다. 이러한 연구를 통해 이루어지고 있는 인공지능 활용연구 동향에 대해 분야별로 살펴보고 관련 연구의 장점, 문제점, 도전과제 등을 살펴보았다. 파악되어진 연구 동향은 2021년 이후로 약물의 재배치를 인공지능 활용 연구, 항암제 개발을 위한 컴퓨터 활용 연구, 임상시험에 인공지능 적용 연구 등과 같이 인공지능 적용 분야가 확대되고 있다는 점이다. 이러한 과정을 통해 향후 이루어질 것으로 예상되는 인공지능 활용 신약개발 연구의 전망에 대해 간략히 제시하였다. 위의 인공지능 기술 발전과 함께 바이오와 의료데이터의 신뢰성과 안전성이 확보되어진다면 인공지능 활용 신약개발의 방향이 개인 맞춤형 의료와 정밀의료 분야로 진행되어질 것으로 판단하기에 이에 대한 지속적인 노력이 필요하리라 본다.