• 제목/요약/키워드: Conditional test

검색결과 192건 처리시간 0.017초

온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구 (Improving Bidirectional LSTM-CRF model Of Sequence Tagging by using Ontology knowledge based feature)

  • 진승희;장희원;김우주
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.253-266
    • /
    • 2018
  • 본 연구는 질의 응답(QA) 시스템에서 사용하는 개체명 인식(NER)의 성능을 향상시키기 위하여 시퀀스 태깅 방법론을 적용한 새로운 방법론을 제안한다. 사용자의 질의를 입력 받아 데이터베이스에 저장된 정답을 추출하기 위해서는 사람의 언어를 컴퓨터가 알아들을 수 있도록 구조화 질의어(SQL)와 같은 데이터베이스의 언어로 전환하는 과정이 필요한데, 개체명 인식은 사용자의 질의에서 데이터베이스에 포함된 클래스나 데이터 명을 식별하는 과정이다. 기존의 데이터베이스에서 질의에 포함된 단어를 검색하여 개체명을 인식하는 방식은 동음이의어와 문장성분 구를 문맥을 고려하여 식별하지 못한다. 다수의 검색 결과가 존재하면 그들 모두를 결과로 반환하기 때문에 질의에 대한 해석이 여러 가지가 나올 수 있고, 계산을 위한 시간복잡도가 커진다. 본 연구에서는 이러한 단점을 극복하기 위해 신경망 기반의 방법론을 사용하여 질의가 가지는 문맥적 의미를 반영함으로써 이러한 문제를 해결하고자 했고 신경망 기반의 방법론의 문제점인 학습되지 않은 단어에 대해서도 문맥을 통해 식별을 하고자 하였다. Sequence Tagging 분야에서 최신 기술인 Bidirectional LSTM-CRF 모델을 도입함으로써 신경망 모델이 가진 단점을 해결하였고, 학습되지 않은 단어에 대해서는 온톨로지 기반 특성치를 활용하여 문맥을 반영한 추론을 사용하였다. 음악 도메인의 온톨로지(Ontology) 지식베이스를 대상으로 실험을 진행하고 그 성능을 평가하였다. 본 연구에서 제안한 방법론인 L-Bidirectional LSTM-CRF의 성능을 정확하게 평가하기 위하여 학습에 포함된 단어들뿐만 아니라 학습에 포함되지 않은 단어들도 포함한 질의를 평가에 사용하였다. 그 결과 L-Bidirectional LSTM-CRF 모형을 재학습 시키지 않아도 학습에 포함되지 않은 단어를 포함한 질의에 대한 개체명 인식이 가능함을 확인하였고, 전체적으로 개체명 인식의 성능이 향상됨을 확인할 수 있었다.

노인 인구에서 $H_2$ Receptor Antagonist와 위암과의 관련성: 코호트 내 환자-대조군 연구 ($H_2$ Receptor Antagonists and Gastric Cancer in the Elderly: A Nested Case-Control Study)

  • 김윤이;허대석;이승미;윤경은;구혜원;배종면;박병주
    • Journal of Preventive Medicine and Public Health
    • /
    • 제35권3호
    • /
    • pp.245-254
    • /
    • 2002
  • 노인에서 $H_2$-RA의 복용과 위암간의 관련성을 밝히기 위한 코호트 내 환자-대조군 연구를 수행하였다. 연구 모집단은 공무원 및 사립학교 교직원을 대상으로 하는 의료보험 관리공단의 피보험자 및 피부양자로서 부산지역에 거주하는 65세 이상의 노인들을 대상으로 구축된 한국노인약물역학코호트의 구성원 중에서 교란변수에 대한 정보 획득을 위해 실시한 설문조사에서 응답한 사람들로 구성된 코호트이었다. $H_2$-RA폭로군은 1993년 1월 1일부터 1994년 12월 31일 사이에 코호트 대상자들이 병원에서 약물을 처방 받아 청구한 자료를 바탕으로 구축한 약물처방 데이터베이스에서 1회 이상 $H_2$-RA를 처방 받은 사람들도 정의하였다. 환자군 76명은 코호트의 위암 환자 확진을 위한 병원방문 조사 자료, 중앙 암등록 자료, 부산 지역 암등록 자료를 이용하여 확인되었다. 대조군은 환자군 확인방법과 동일한 방법을 이용하여 확인하였을 때 암으로 진단받은 병력이 없는 코호트 대상자들 중에서 환자군의 출생 년도와 성별에 따라 1:4의 비율로 개별 짝짓기를 실시하여 뽑은 304명이었다. 잠재적 인 교란변수에 대한 정보는 설문조사를 통해 수집하였다. 조건부 로지스틱 회귀모델을 이용하여 교란변수의 영향을 통제한 상태에서 구한 $H_2$-RA 복용과 위암 발생간의 관련성을 대응비와 95% 신뢰구간으로 제시하였다. 그 결과, 위궤양 증상 여부, 약물 복용력, 체질량 지수의 영향을 통제한 상태에서 $H_2$-RA의 복용은 위암 발생의 위험을 4.6배 증가시키는 것으로 관찰되었다. $H_2$-RA를 7일 이내로 사용한 군은 $H_2$-RA를 사용하지 않은 군에 비해 위암 발생의 위험이 4.6배 증가하는 것으로 관찰되었고 7일 이상 사용한 군은 2.3배 증가하는 것으로 관찰되었다. 투여 경로별로 나누어 보았을 때에는 경구로 투여한 경우에서 유의한 위험 수준의 상승을 관찰하지 못한 반면에 주사로 투여한 경우에서 위험이 4.4배 증가하는 것으로 관찰되었고, 주사와 경구의 두 가지 경로 모두로 $H_2$-RA를 투여 받은 경우 그 위험은 더욱 상승하는 것으로 관찰되었다.시메티딘, 라니티딘, 파모티딘 등의 개별 성분명 별로 위암 발생의 위험에 대한 차이는 관찰되지 않았다. 결론적으로 $H_2$-RA를 사용한 노인에서 사용하지 않은 노인에서 비해 위암 발생의 위험이 더 높아진다는 결론을 얻었으며, 이는 $H_2$-RA투여로 인해 위내에 발생한 무위산증(achlorhydria)이 위암 발생의 위험을 높일 것이라는 기존의 가설을 뒷받침하는 결론이라고 할 수 있었다.