• 제목/요약/키워드: 통계용어사전

검색결과 15건 처리시간 0.017초

텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석 (Analysis of the Yearbook from the Korea Meteorological Administration using a text-mining agorithm)

  • 선현석;임창원;이영섭
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.603-613
    • /
    • 2017
  • 최근 들어 많은 사람들이 자신의 관심사를 SNS에 게시하거나 인터넷과 컴퓨터의 기술 발달로 디지털 형태의 문서저장이 가능하게 됨으로써 생성되는 텍스트 자료의 양이 폭발적으로 증가하게 되었다. 이에 따라 수많은 문서 자료로부터 가치 있는 정보를 창출하기 위한 기술의 요구 또한 증가하고 있다. 그러나 대부분 비정형 형태로 구성되어 있는 텍스트 기반의 자료는 기존의 통계 분석이나 데이터 마이닝 기법을 적용하기에 부적합하기 때문에 텍스트 마이닝 기법이 사용되고 있다. 본 연구에서는 비정형 자료 분석 기법 중 하나인 텍스트 마이닝 기법으로 기상청 기상연감 자료를 분석하였다. 먼저 전처리 과정을 통하여 용어사전을 구축하고, 용어-문서 행렬을 생성하였다. 그리고 이것을 사용하여 연도별 용어 빈도수를 계산하고, 자주 나타나는 단어들에 대하여 상대도수의 변화를 관찰하였다. 또한 회귀 분석 기법을 사용하여 증가추세와 감소추세를 보이는 용어들을 파악하였다. 이러한 분석으로 기상청 기상연감 문서에서의 트렌드를 파악하고, 이를 통해 이슈가 되었던 기상 관련 소식과 기상현황, 그리고 기상청이 중점으로 하고 있는 업무 현황의 트렌드를 파악하였다. 본 연구를 통해 기상업무 분석 및 효율화에 도움을 주고 기상정책에 반영할 수 있는 유용한 정보를 이끌어내고자 하였다.

BERT+ 알고리즘 기반 약물 리뷰를 활용한 약물 이상 반응 탐지 (Detection of Adverse Drug Reactions Using Drug Reviews with BERT+ Algorithm)

  • 허은영;정현정;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.465-472
    • /
    • 2021
  • 본 논문에서는 약물의 시판 후 이상 반응을 모니터링하기 위해 약물 리뷰 데이터로부터 약물 이상 반응을 탐지할 수 있는 방법을 제시하였다. 부정적인 약물 리뷰는 주로 약물 이상 반응을 언급하고 있다는 점을 고려하여 약물 리뷰들을 감성 분석하여 부정 리뷰를 추출하고, 부정 리뷰에 사전 기반 추출과 개체명 인식 기법을 적용하여 약물 이상 반응을 탐지하였다. 제안하는 BERT+ 알고리즘으로 부정 리뷰를 판별한 다음, MedDRA 표준 의학 용어 사전을 활용해 이상 반응 단어를 찾고, 개체명 인식 기법을 사용하여 구로 표현된 이상 반응 표현을 탐지하였다. 실험을 위해 비스테로이드성 소염진통제 세 종류의 약물 리뷰를 약물 리뷰 사이트로부터 수집하여 테스트하였으며, 실험 결과는 약물 리뷰를 통한 약물 이상 반응 탐지가 현재의 약물 감시 체계의 한계점을 보완할 수 있음을 보여준다.

자연재해 평가를 위한 방재기상 DB 정보 (Prevention Meteorological Database Information for the Assessment of Natural Disaster)

  • 박종길;정우식;최효진
    • 한국방재학회 논문집
    • /
    • 제7권3호
    • /
    • pp.41-49
    • /
    • 2007
  • 자연재해로부터 야기되는 피해를 줄이고 자연재해저감활동을 전개하기 위해서는 기상정보와 재해자료에 근거한 정확한 예보와 방재활동이 요구된다. 또한 사전방재활동을 위해서는 방재기상정보로의 처리가 필요하다. 이를 위하여 본 연구에서는 행정자치부에서 발행하는 통계연보와 재해연보, 중앙재해대책본부에서 발행한 최근 10년간 자연재해 피해 현황, 기상청에서 발행한 기상연보를 이용하였다. 이들 4가지 자료를 이용하여 자연재해의 원인과 피해요소, 발생빈도, 취약지역 등을 분석하였는데, 이들 자료는 피해내역과 기상현상에 대한 분류 및 용어가 일치하지 않으므로, 재해의 종류와 피해액을 비교 분석한 결과, 기상재해 원인과 피해 요소, 피해액, 피해지역 등과 같은 재해 변수를 선정하고, 재해연보를 이용하여 database를 구축하였다. 이렇게 구축된 database는 앞으로 자연재해 저감계획과 risk model을 개발하고 자연재해를 평가하는데 유용하게 쓰일 수 있다.

유사도 기반 이미지 캡션을 이용한 시각질의응답 연구 (Using similarity based image caption to aid visual question answering)

  • 강준서;임창원
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.191-204
    • /
    • 2021
  • 시각질의응답과 이미지 캡셔닝은 이미지의 특징과 문장의 언어적인 특징을 이해하는 것을 요구하는 작업이다. 따라서 두 가지 작업 모두 이미지와 텍스트를 연결해 줄 수 있는 공동 어텐션이 핵심이라고 할 수 있다. 본 논문에서는 MSCOCO 데이터 셋에 대하여 사전 훈련된 transformer 모델을 이용 하여 캡션을 생성한 후 이를 활용해 시각질의응답의 성능을 높이는 모델을 제안하고자 한다. 이때 질 문과 관계없는 캡션은 오히려 시각질의응답에서 답을 맞히는데 방해가 될 수 있기 때문에 질문과의 유사도를 기반으로 질문과 유사한 일부의 캡션을 활용하도록 하였다. 또한 캡션에서 불용어는 답을 맞히는데 영향을 주지 못하거나 방해가 될 수 있기 때문에 제거한 후에 실험을 진행하였다. 기존 시 각질의응답에서 이미지와 텍스트간의 공동 어텐션을 활용하여 좋은 성능을 보였던 deep modular co-attention network (MCAN)과 유사도 기반의 선별된 캡션을 사용하여 VQA-v2 데이터에 대하여 실험을 진행하였다. 그 결과 기존의 MCAN모델과 비교하여 유사도 기반으로 선별된 캡션을 활용했을 때 성능 향상을 확인하였다.

초등학생의 시스템 사고 요인 구조 검증과 선호 과목에 따른 시스템 사고 비교 (Verification the Systems Thinking Factor Structure and Comparison of Systems Thinking Based on Preferred Subjects about Elementary School Students')

  • 이효녕;전재돈;이현동
    • 한국과학교육학회지
    • /
    • 제39권2호
    • /
    • pp.161-171
    • /
    • 2019
  • 이 연구의 주요 목적은 초등학생의 시스템 사고 요인 구조를 검증하고 초등학생의 선호 과목군에 따른 시스템 사고를 비교하여 추후 연구에 대한 시사점을 얻는 것이다. 이를 위하여 사전 검사에서는 Lee et al.(2013)이 개발한 STMI로 초등학생 732명의 데이터를 수집하였다. 그리고 탐색적 요인분석을 실시하여 초등학생이 STMI를 어떤 요인 구조로 인식하는지를 확인하였다. 그리고 사전 검사 결과를 기초로 전문가 협의회를 거쳐 초등학생들이 STMI가 의도한 5요인 구조에 응답할 수 있도록 검사지를 수정하였다. 사후 검사에서는 수정된 STMI로 초등학생 503명의 데이터를 수집하고 탐색적 요인분석을 실시하였다. 연구 결과는 다음과 같다. 첫째, 사전 검사에서 초등학생들은 STMI를 2개 요인(개인 내적 요인, 개인 외적 요인)으로 구성된 검사지로 응답하였다. 검사지에 대한 전체 신뢰도는 .932였으며 요인별 신뢰도는 .857과 .894로 나타났다. 둘째, 수정된 STMI에 대해서는 초등학생은 4개 요인으로 구성된 검사지로 응답하였다. 초등학생은 팀 학습, 공유 비전, 개인 숙련은 각각 독립된 요인으로 응답하였으며 정신 모델과 시스템 분석을 하나의 요인으로 응답하였다. 전체 검사지에 대한 신뢰도는 .886이었으며 요인별 신뢰는 .686~.864로 나타났다. 셋째, 초등학생의 선호 과목군에 따른 시스템 사고를 비교한 결과 자연과학(공학) 과목군을 선택한 학생들과 예술(예체능)을 선택한 학생들 사이에 유의미한 차이가 나타났다. 결론적으로 초등학생에게 적합한 용어와 문장 구조로 수정된 시스템 사고 검사지를 활용할 경우 시스템 사고를 비교하는 연구에서 통계적으로 유의미한 결과를 얻을 수 있음을 확인하였으며, 추후 선호하는 과목군 등 여러 학생 변인들과 시스템 사고와의 관련성 연구도 이루어질 필요성이 제기된다.