• 제목/요약/키워드: 개체인식

검색결과 448건 처리시간 0.024초

생의학 문헌에서의 관계 정보 추출 시스템 (A Relational Information Extraction System from Biomedical Literature)

  • 임준호;임재수;장현철;박수준
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.932-937
    • /
    • 2007
  • 생의학 분야 문헌의 양이 빠르게 증가함에 따라, 생의학 연구자들이 필요로 하는 정보를 얻기가 어렵게 되었다. 이를 해결하기 위해, 인간-컴퓨터 상호작용 분야에서는 생의학 문헌 검색 시스템, 또는 생의학 문헌의 정보 추출 시스템 등에 대한 연구가 진행되고 있다. 본 논문에서는 생의학 문헌으로부터 정보를 자동으로 추출하기 위한 관계정보 추출 시스템에 대해 소개한다. 소개하는 시스템은 크게 요약 수집 모듈, 관계 추출 모듈, 관계 가시화 모듈로 구성되어 있다. 우선, 요약 수집 모듈에서는 특정 주제의 문헌들을 검색 및 수집한다. 그리고, 관계 추출 모듈에서는 수집된 문헌들에 대해서, 단백질/유전자 등의 생물학 개체를 인식하고, 구문분석을 통하여 인식된 개체들 사이의 관계를 추출한다. 마지막으로, 관계 가시화 모듈에서는 추출된 관계를 통합하여 네트워크 형태로 가시화한다. 이 시스템은 생물학 실험 이전의 문헌 기반 타당성 검사, 단백질-단백질 상호작용 또는 특정 질병과 유전자의 조절관계 분석, 또는 대용량 문헌 처리를 통한 패스웨이 데이터베이스 구축 등에 활용될 수 있다.

  • PDF

개체명 인식을 이용한 소셜 미디어에서의 약물 부작용 표현 추출 및 분류 (Detecting and classification ADRs using Named Entity Recognition on social media)

  • 정현정;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.443-446
    • /
    • 2021
  • 의약품에 대한 안전성 정보 수집과 관리는 온라인, 오프라인을 통해 약물 이상 사례를 보고받는 형태로 진행되고 있다. 하지만 소비자들의 자발적인 참여로 이루어지므로 실제 발생하는 약물 부작용보다 데이터가 현저히 적다는 단점이 존재한다. 본 논문에서는 약물 이상 데이터 희소성 문제를 해결 할 수 있도록 소셜 미디어에서 약물 부작용 표현을 찾을 수 있도록 하였다. 소셜 미디어의 경우에는 표준 약물 부작용 용어를 사용하기보다는 일반인들이 자연어로 표현한 경우가 많으므로 개체명 인식 기법을 이용해 부작용을 추출할 수 있는 모델을 개발하였다. 또한 추출된 부작용 표현을 표준용어로 분류할 수 있는 모델을 제시하였다. 실험 결과 제안한 두 가지 모델은 0.9 이상의 정확도를 얻을 수 있었으며, 일반 사용자들이 자연어로 표현한 약물 부작용 표현을 효과적으로 찾아내고 표준 부작용 용어로 매핑할 수 있음을 보여준다.

GMLP를 이용한 한국어 자연어처리 및 BERT와 정량적 비교 (GMLP for Korean natural language processing and its quantitative comparison with BERT)

  • 이성민;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.540-543
    • /
    • 2021
  • 본 논문에서는 Multi-Head Attention 대신 Spatial Gating Unit을 사용하는 GMLP[1]에 작은 Attention 신경망을 추가한 모델을 구성하여 뉴스와 위키피디아 데이터로 사전학습을 실시하고 한국어 다운스트림 테스크(감성분석, 개체명 인식)에 적용해 본다. 그 결과, 감성분석에서 Multilingual BERT보다 0.27%높은 Accuracy인 87.70%를 보였으며, 개체명 인식에서는 1.6%높은 85.82%의 F1 Score를 나타내었다. 따라서 GMLP가 기존 Transformer Encoder의 Multi-head Attention[2]없이 SGU와 작은 Attention만으로도 BERT[3]와 견줄만한 성능을 보일 수 있음을 확인할 수 있었다. 또한 BERT와 추론 속도를 비교 실험했을 때 배치사이즈가 20보다 작을 때 BERT보다 1에서 6배 정도 빠르다는 것을 확인할 수 있었다.

  • PDF

의미 정보와 BERT를 결합한 개념 언어 모델 (A Concept Language Model combining Word Sense Information and BERT)

  • 이주상;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-7
    • /
    • 2019
  • 자연어 표상은 자연어가 가진 정보를 컴퓨터에게 전달하기 위해 표현하는 방법이다. 현재 자연어 표상은 학습을 통해 고정된 벡터로 표현하는 것이 아닌 문맥적 정보에 의해 벡터가 변화한다. 그 중 BERT의 경우 Transformer 모델의 encoder를 사용하여 자연어를 표상하는 기술이다. 하지만 BERT의 경우 학습시간이 많이 걸리며, 대용량의 데이터를 필요로 한다. 본 논문에서는 빠른 자연어 표상 학습을 위해 의미 정보와 BERT를 결합한 개념 언어 모델을 제안한다. 의미 정보로 단어의 품사 정보와, 명사의 의미 계층 정보를 추상적으로 표현했다. 실험을 위해 ETRI에서 공개한 한국어 BERT 모델을 비교 대상으로 하며, 개체명 인식을 학습하여 비교했다. 두 모델의 개체명 인식 결과가 비슷하게 나타났다. 의미 정보가 자연어 표상을 하는데 중요한 정보가 될 수 있음을 확인했다.

  • PDF

개체명 인식과 이벤트 추출을 통한 판결문 범죄사실 구성요소 및 스토리라인 시각화방안 연구 (A Study on Elements of Crime Facts and Visualizing the Storyline through Named Entity Recognition and Event Extraction)

  • 이유나;박성미;박노섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.490-492
    • /
    • 2022
  • 최근 사법분야에 지능형 법률 서비스를 제공하게 되면서 학습데이터로서 판결문의 중요성이 높아지고 있다. 그중 범죄사실은 수사자료와 유사하여 범죄수사에 귀중한 자료역할을 하고 있지만, 주체가 생략되거나 긴 문장의 형태로 인해 구성요건을 추출하고 사건의 인과관계 파악이 어려울 수 있어 이를 분석하는데 적지 않은 시간과 인력이 소비될 수밖에 없다. 따라서, 본 논문에서는 사전학습모델을 활용한 개체명 인식과 형태소 분석기반 이벤트 추출기법을 범죄사건 재구성에 적용하여 핵심 사건추출을 간편화하고 시각적으로 표현해 전체적인 사건 흐름 이해도를 향상할 수 있는 방법론을 제안하고자 한다.

개체명 인식과 키워드 네트워크 분석을 활용한 약물 이상 반응 탐지 시스템 개발 (Development of Detection of Adverse Drug Reactions based on Named Entity Recognition and Keyword Network Analysis)

  • 이채연;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.670-672
    • /
    • 2023
  • 본 논문에서는 소셜 미디어 약물 리뷰 데이터로부터 약물 이상 반응을 탐지하는 모델인 FC-BERT 를 기반으로 소셜 네트워크 분석을 활용하여 웹 애플리케이션을 구현하였다. FC-BERT 모델을 거쳐 나온 개체명 인식 결과 중에 같은 의미를 가진 서로 다른 약물 이상 반응 표현들을 MedDRA 부작용 사전을 참고하여 하나의 MedDRA 용어로 표준화하여 매핑했다. 해당 결과에 소셜 네트워크 분석 기법을 적용하여 생성한 상위 15 개의 ADR 동시 출현 그래프를 상위 30 개의 워드 클라우드와 함께 시각화하여 보여주는 웹 애플리케이션을 개발했다. 동시 출현 그래프는 가장 많은 리뷰에서 동시에 나타나는 ADR 쌍을 보여준다. 본 논문에서 제안한 웹 애플리케이션은 사람마다 다르게 나타나는 다양한 약물 이상 반응을 사용자에게 좀 더 접근성이 좋게 제공할 수 있을 것으로 보인다.

Trace 변환과 펴지 기법을 이용한 곤충 발자국 인식 (Insect Footprint Recognition using Trace Transform and a Fuzzy Method)

  • 신복숙;차의영;우영운
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1615-1623
    • /
    • 2008
  • 이 논문에서는 곤충 발자국의 패턴을 찾아 개체를 인식하기 위해서, 개선된 SOM 알고리즘과 ART2 알고리즘을 사용하여 인식의 기본 영역을 추출한다. 또한 Trace 변환을 이용하여 발자국의 인식에 필요한 특징을 추출하고 개체를 판단하는 기법을 제안한다. 제안한 기법에서는 모폴로지 기법을 이용하여 region을 먼저 찾고, 개선된 SOM과 ART2 알고리즘을 이용하여 곤충의 크기와 종류에 관계없이 세그먼트를 추출한다. 그리고 곤충 발자국과 같이 다양한 변형이 존재하는 패턴에 적합한 특징값을 찾기 위해서 Trace 변환을 이용하고, 함수의 조합으로 재구성된 Triple 특징값을 이용하여 곤충별로 고유한 패턴을 찾아 인식 실험을 수행한다. 곤충 발자국에서 명확한 발자국과 그렇지 못한 발자국을 자동으로 결정하는 것이 매우 어렵다. 따라서 이와 같이 불확실한 대상을 제외시키지 않고 가능성의 대상으로 판단하고 분류하기 위해서 퍼지 가중치 평균을 이용하여 인식을 수행한다. 제안한 방법에 의한 곤충 발자국의 영역 추출과 인식 실험을 실시하고 그 결과를 제시하였다.

  • PDF

FIDO 시스템에서 EEG 신호를 이용한 사용자 인증 방법 (User Authentication Method using EEG Signal in FIDO System)

  • 김용기;채철주;조한진
    • 한국융합학회논문지
    • /
    • 제9권1호
    • /
    • pp.465-471
    • /
    • 2018
  • 최근 IT기슬과 금융 시스템의 융합으로 생체인식 기술이 사용되기 시작하였다. 이러한 생체 인식 기술인 FIDO(Fast Identity Online) 기술을 이용하여 삼성과 애플은 삼성페이와 애플페이 서비스를 시작하였다. FIDO 인증 기술은 패스워드와 같은 기존 인증 방법을 대체하고 있다. 생체 인식 기술 중 지문인식 기술은 비교적 저렴한 가격의 디바이스와 사용자 거부 반응을 최소화 할 수 있다는 점 때문에 주목받고 있다. 그러나 지문정보의 경우 사용자가 가지고 있는 수가 제한적이며, 외부 공격자에 의해 지문정보가 유출될 경우 재사용할 수 없다는 단점이 있다. 그러므로 본 논문에서는 생체인식 기술 중 하나인 EEG 신호를 이용하여 사용자를 인증할 수 있는 방법을 제안한다. 제안 논문에서는 기존의 다채널 EEG 디바이스를 사용하지 않고 단채널 EEG 디바이스를 사용하여 편리성을 높였으며, EEG 신호 측정값을 FIDO 시스템에 사용할 수 있는 방법을 제안하였다. 제안 논문에서는 특정 개체 인식 전 후의 EEG 신호를 측정하여 사용자가 특정 개체를 인식하였을 때의 EEG 신호를 사용자 인증 수단을 활용할 수 있는 방법을 제안하였다.

비문 인식, 펫 로봇 및 펫 밴드를 사용한 개체 맞춤형 반려동물 케어 및 훈련 시스템 (Customized Pet Care and Training System Using Nose-Print Recognition, Pet Robot, and Pet Band)

  • 조지연;이성수
    • 전기전자학회논문지
    • /
    • 제24권3호
    • /
    • pp.909-912
    • /
    • 2020
  • 본 논문에서는 IT 기술을 바탕으로 반려동물에게 맞춤형으로 케어와 훈련을 제공하는 시스템을 소개한다. 먼저 비문 인식을 통해 특정 반려동물 개체를 인식하고, 펫 로봇이 반려동물을 유도하여 훈련기로 이동시킨다. 훈련기는 간식, 놀이, 클리커 등을 통해 동물을 훈련시키며, 애드온 디바이스를 추가하여 특정 훈련에 적합하도록 쉽게 확장할 수 있다. 펫 밴드는 바이털 모니터링, 집밖 탈출 방지, 운동량 측정 등을 수행한다. 이 시스템은 구성을 변경하여 분리 불안 완화, 배변 장소 유도, 특정 장소 출입금지 등 다양한 훈련 프로그램이 가능하며, 반려동물 행동을 각 개체별로 분석하여 맞춤형 훈련을 제공한다. 또한 주인이 없을 때에도 반려동물을 적절히 운동시키고 같이 놀아주며, 반려동물의 건강에 이상이 있으면 즉시 주인에게 알려준다.

BERT+ 알고리즘 기반 약물 리뷰를 활용한 약물 이상 반응 탐지 (Detection of Adverse Drug Reactions Using Drug Reviews with BERT+ Algorithm)

  • 허은영;정현정;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.465-472
    • /
    • 2021
  • 본 논문에서는 약물의 시판 후 이상 반응을 모니터링하기 위해 약물 리뷰 데이터로부터 약물 이상 반응을 탐지할 수 있는 방법을 제시하였다. 부정적인 약물 리뷰는 주로 약물 이상 반응을 언급하고 있다는 점을 고려하여 약물 리뷰들을 감성 분석하여 부정 리뷰를 추출하고, 부정 리뷰에 사전 기반 추출과 개체명 인식 기법을 적용하여 약물 이상 반응을 탐지하였다. 제안하는 BERT+ 알고리즘으로 부정 리뷰를 판별한 다음, MedDRA 표준 의학 용어 사전을 활용해 이상 반응 단어를 찾고, 개체명 인식 기법을 사용하여 구로 표현된 이상 반응 표현을 탐지하였다. 실험을 위해 비스테로이드성 소염진통제 세 종류의 약물 리뷰를 약물 리뷰 사이트로부터 수집하여 테스트하였으며, 실험 결과는 약물 리뷰를 통한 약물 이상 반응 탐지가 현재의 약물 감시 체계의 한계점을 보완할 수 있음을 보여준다.