• 제목/요약/키워드: 정확도개선

검색결과 1,990건 처리시간 0.029초

하천 관리를 위한 원격탐사 자료 기반 식생 분류 기법 (Vegetation classification based on remote sensing data for river management)

  • Lee, Chanjoo;Rogers, Christine;Geerling, Gertjan;Pennin, Ellis
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.6-7
    • /
    • 2021
  • 하천에서의 식생 활착은 지형, 생태, 수리학 등의 학문 분야 뿐만 아니라 하천 관리 실무에서도 중요한 이슈 중에 하나로서 하천 식생 문제는 홍수 관리와 생태계 보전이라는 상반되는 가치의 조화에 직결된다. 국내에서는 2000년대 이후 댐 하류 조절하천, 부영화된 소규모 지류하천, 4대강 사업 대상지 고수부지 등 다양한 조건에서 하천 식생 활착과 육역화 문제가 지속적으로 제기되어 왔다. 이러한 배경에서 본 연구에서는 하천 내의 식생 분포를 원격탐사 자료를 기반으로 분류하는 기법을 제안하고 이를 내성천에 적용한 결과를 제시하였다. 내성천은 2014년부터 최근까지 지속적으로 식생 활착이 발생하여 하천 경관이 변화한 대표적인 사례 하천이다. 원격탐사 자료는 유럽항공우주국(ESA)에서 운영 중이며, Google Earth Engine에서 제공하는 Sentinel 1, 2 위성 영상을 사용하였다. 지상 참값(ground truth)으로는 수역, 사주, 초본, 목본 등을 포함한 8가지 유형으로 구분되어 있는 2016년 내성천 지표 피복 자료를 사용하였다. 분류를 위한 방법은 머신러닝 알고리듬의 하나인 랜덤 포레스트 분류 기법을 사용하였으며, 미리 선정된 10개 폴리곤 영역으로부터 1,000개의 표본을 추출하여 1/2씩 나누어 훈련 및 검증 자료로 사용하였다. 검증 자료 기반의 정확도는 82~85 %로 나타났다. 훈련을 통해 수립한 모형을 2016~2020년 자료에도 적용하여 연도에 따른 식생역의 변화 과정을 제시하였다. 본 논문의 기술적 한계와 개선 방안을 고찰하였다. 이 기법은 정량적인 식생 분포를 제공함으로써 하천에서의 홍수위 계산, 식생-수리모델링 등의 기술 분야 뿐만 아니라 간벌이나 하천 식생 회춘 유도(rejuvenation)과 같은 식생의 실무적 관리 측면에서도 활용도가 클 것으로 판단된다.

  • PDF

토지피복지도를 활용한 IUCN 생태계유형분류 국내 적용 (A Study on the Application of IUCN Global Ecosystem Typology Using Land Cover Map in Korea)

  • 손희정;원수연;전정은;박은희;김도희;한상학;송영근
    • 한국환경생태학회지
    • /
    • 제37권3호
    • /
    • pp.209-220
    • /
    • 2023
  • 인간 활동으로 광범위한 자연 생태계 변화로 지난 몇 세기 동안 전 세계적으로 생물다양성이 심각하게 위협받고 있다. 생태계의 변화 양상을 파악하는 것은 생물다양성 위협을 파악하고 관리하는 데 필수적이다. 이러한 필요성에 따라 IUCN 의회는 2019년에 생태계의 기능과 유형을 고려한 IUCN Global Ecosystem Typology(GET)를 구성했다. IUCN은 10개의 생태계 군계, 108개의 생태기능별 토지 유형(EFG; Ecological Functional Group)을 전 지구적 범위에서 지도로 제공하고 있다. IUCN GET 생태계의 유형 분류에 따르면 국내 생태계는 Realm (1수준)이 8개, Biome (2수준)이 18개, Group (3수준)은 41개 유형으로 분류된다. IUCN이 제공하는 GET의 경우 전 세계 규모로 제작되었기 때문에 해상도가 낮고 실질적인 토지 현황과 일치하지 않는 경우가 많다. 본 연구는 토지피복지도를 활용하여 국내 IUCN GET 유형 분류의 정확도를 높이고 실질적인 현황을 반영한 지도를 제작하고자 했다. 이를 위해 ① IUCN GET에서 제공하는 국내 GET 데이터 체계를 검토하고, ② 이를 국내 현황과 비교 분석하였다. 이 과정을 통해 GET의 한계와 활용 가능성을 평가하고 ③ 이후 국가자료를 최대한 활용하여 국내 현황을 반영한 국내 GET 유형 분류를 수행하였다. 본 연구는 토지피복지도와 기존 국가자료를 최대한 활용하여 국내 GET를 총 25개 유형으로 분류했다(Terrestrial Realm :9, Freshwater: 9 Marine-Terrestrial: 5, Terrestrial-Freshwater :1, Marine-Freshwater-Terrestrial:1). 기존 지도와 비교했을 때 수정된 국내 GET의 경우 'F3.2 Constructed lacustrine wetlands', 'F3.3 Rice paddies', 'F3.4 Freshwater aquafarms', 'T7.3 Plantations'가 면적이 가장 많이 축소되었다. 온대 산림(T2.2)의 면적이 가장 많이 늘어났고, 'MFT1.3 Coastal saltmarshes and reedbeds', 'F2.2 Small permanent freshwater lakes'등 3개 유형 또한 수정 후 GET 면적이 증가했다. 해당 과정을 통해 기존 GET에서 모든 EFG의 합이 국토 면적의 8.33배를 차지하던 기존의 지도를, 토지피복지도를 활용하여 총합이 국토 면적의 1.22 배가 되도록 수정하였다. 이를 통해 유형별 차이가 작고 정확성이 떨어진 기존의 EFG가 본 연구를 통해 개선 및 수정되었음을 확인하였다. 본 연구는 현장 요건을 반영한 데이터를 최대한 활용하여 GET 기준에 상응하는 한국의 GET 지도를 제작한 것에 그 의의가 있다.

Google Earth Engine 기반 Sentinel-1 SAR 위성영상을 이용한 지표 토양수분량 산정 가능성에 관한 연구 (Study on the Possibility of Estimating Surface Soil Moisture Using Sentinel-1 SAR Satellite Imagery Based on Google Earth Engine)

  • 조영현
    • 대한원격탐사학회지
    • /
    • 제40권2호
    • /
    • pp.229-241
    • /
    • 2024
  • 클라우드 플랫폼을 이용한 빅데이터 처리기술의 발달로 위성영상과 같이 용량이 큰 자료에 대한 접근 및 처리와 분석이 최근 획기적으로 개선되고 있다. 본 연구에서는 그 플랫폼 중 하나인 Google Earth Engine (GEE) 기반의 전처리 완료된 Sentinel-1 합성개구레이더(synthetic aperture radar, SAR) 위성영상 자료의 후방산란계수 값에 비교적 간단한 토양수분량 추출 방법인 Change Detection Method를 적용하여, 2015~2023년의 국내 용담댐 유역 내 6개 관측소 지점 및 유역 평균에 대한 지표 토양수분량을 산정 후 실측과의 상관성 분석 및 GEE의 활용성을 검토하였다. 그 결과 SAR 위성영상 자체의 지표 측정 정확도와 자료간 특성 변동 등으로 인해 유역 내 관측소별 일부구역에 대해 산정한 지점 지표 토양수분량은 VH와 VV 편파에서 모두 0.1~0.3 수준의 낮은 상관성이 확인된 반면, 유역 전체 면적에 대한 평균 SAR 후방산란계수 값 추출 및 이동평균으로 자료의 불확실성 및 변동성을 완화시킨 유역 평균 지표 토양수분량은 0.5 수준의 향상된 결과를 보였다. 이렇게 GEE를 활용하여 산정된 토양수분량의 결과는 SAR 자료의 전처리에 있어 직접적으로 원하는 분석을 수행하지 못하는 제한점은 있지만, 방대한 위성영상 자료를 효율적으로 처리하여 장기간의 유역 평균과 같은 넓은 범위의 토양수분량을 산정, 평가해 볼 수 있다는 점에서 그 활용성을 확인할 수 있었다. 이를 바탕으로 향후 국내 여러 지점의 지표 토양수분량 관측자료와 연계해 주요 댐 유역의 평균지표 토양수분량 장기 변화 파악 등에 유용하게 활용될 수 있을 것으로 기대된다.

딥러닝 기반 윤곽정보 추출자를 활용한 RPC 보정 기술 적용성 분석 (Analysis of Applicability of RPC Correction Using Deep Learning-Based Edge Information Algorithm)

  • 허재원;이창희;서두천;오재홍;이창노;한유경
    • 대한원격탐사학회지
    • /
    • 제40권4호
    • /
    • pp.387-396
    • /
    • 2024
  • 대부분의 고해상도 위성영상은 rational polynomial coefficients (RPC) 정보를 제공하여 지상좌표와 영상좌표 간 변환을 수행한다. 그러나 초기 RPC에는 기하학적 오차가 존재하여 ground control points (GCPs)와의 정합을 통해 보정을 수행하여야 한다. GCP chip은 항공정사영상에서 추출한 높이 정보가 포함된 작은 영상 패치(patch)이다. 많은 선행연구에서는 영역 기반 정합 기법을 사용하여 고해상도 위성영상과 GCP chip 간 정합을 수행하였다. 계절적 차이나 변화된 지역이 존재하는 영상에서는 화소값에 의존하는 정합이 어렵기 때문에 윤곽 정보를 추출하여 정합을 수행하기도 한다. 그러나 일반적으로 사용하는 canny 기법으로 정합에 용이한 윤곽을 추출하기 위해서는 위성영상의 분광 특성에 적절한 임계치를 설정해주어야 하는 문제가 존재한다. 따라서 본 연구에서는 위성영상의 지역별 특성에 둔감한 윤곽 정보를 활용하여 RPC 보정을 위한 정합을 수행하고자 한다. 이를 위해 딥러닝 기반 윤곽 정보 추출 네트워크인 pixel difference network (PiDiNet)를 활용하여 위성영상과 GCP chip의 윤곽맵(edge map)을 각각 생성하였다. 그 후 생성된 윤곽맵을 normalized cross-correlation과 relative edge cross-correlation의 입력데이터로 대체하여 영역 기반의 정합을 수행하였다. 마지막으로 RPC 보정에 필요한 변환모델 계수를 도출하기 위하여 data snooping 기법을 반복적으로 적용하여 참정합쌍을 추출하였다. 오정합쌍을 제거한 참정합쌍에 대해 root mean square error (RMSE)를 도출하고 기존에 사용하던 상관관계 기법과 결과를 정성적으로 비교하였다. 실험 결과, PiDiNet은 약 0.3~0.9 화소의 RMSE 값 분포를 보였으나 canny 기법에 비해 두꺼운 윤곽을 나타내어 일부 영상에서 미세하게 정확도가 저하되는 것을 확인하였다. 그러나 위성영상 내 특징적인 윤곽을 일관적으로 나타냄으로써 정합이 어려운 지역에서도 정합이 잘 수행되는 것을 확인하였다. 본 연구를 통해 윤곽 기반 정합 기법의 강인성을 개선하여 다양한 지역에서의 정합을 수행할 수 있을 것으로 예상된다.

Emoticon by Emotions: 소비자 감성 기반 이모티콘 추천 시스템 개발 (Emoticon by Emotions: The Development of an Emoticon Recommendation System Based on Consumer Emotions)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.227-252
    • /
    • 2018
  • 인터넷의 발달을 통해 지속적으로 인스턴트 커뮤니케이션이 발달해왔다. 인스턴트 커뮤니케이션에서 가장 대표적인 것이 메신저 애플리케이션이다. 메신저 애플리케이션에서 이모티콘은 송신자의 감정 전달을 보완하기 위해 활용됐다. 메신저 애플리케이션 송신자의 감정 전달에 약한 모습을 보이는데 그 이유는 면대면 커뮤니케이션이 아니기 때문이다. 이모티콘은 과거 화자의 기분 상태를 나타내는 기호로만 사용됐다. 그러나 현재는 이모티콘은 감정 전달 뿐만 아니라 개인의 특성과 개성을 나타내고 싶어 하는 소비자의 심리를 반영하는 형태로 발전해가고 있다. 이모티콘의 사용 환경이 개선되었고, 이모티콘 자체가 발전함으로써 이모티콘 자체에 대한 관심도는 증가하였다. 대표적인 예로 카카오톡, 라인, 애플 등에서 서비스를 진행하고 있으며, 관련 컨텐츠 상품의 매출도 지속적으로 증가할 것으로 전망하고 있다. 이모티콘 자체의 관심도 증가와 관련 사업의 성장세에도 불구하고 현재 적절한 이모티콘 추천 시스템이 부재하다. 국내 점유율 90% 이상의 메신저 애플리케이션인 카카오톡조차 단순히 인기 순이나 최근 순, 혹은 간략한 카테고리 별로 분류한 정도이다. 소비자들은 원하는 이모티콘을 찾기 위해서 스크롤을 계속해서 내려야 하는 불편함이 있으며, 본인이 원하는 감성의 이모티콘을 찾기 어렵다. 소비자들이 편의성 향상과 기업의 이모티콘 관련 사업의 판매 매출 증가를 위해 소비자가 원하는 이모티콘을 추천해줄 수 있는 이모티콘 추천 시스템이 필요하다. 적절한 이모티콘을 추천하기 위해서 소비자가 이모티콘을 보고 느낀 감성에 대해 정량화할 필요성이 있다. 정량화를 통해 소비자가 원하는 이모티콘 셋이 가진 특징과 감성에 대해 분석할 수 있으며, 분석 결과를 토대로 소비자에게 이모티콘을 추천할 수 있다. 이모티콘은 메타데이터화의 방법으로 정량화가 가능하다. 메타데이터화 방법은 빅데이터 시대에 비정형, 반정형 데이터에 대해서 의미를 추출하기 위해 데이터를 구조화 혹은 조직화하는 작업이다. 비정형 데이터인 이모티콘을 메타데이터화를 통해 구조화한다면, 쉽게 소비자가 원하는 감성 형태로 분류할 수 있을 것으로 생각한다. 정확한 감성을 추출하기 위해 감정과 관련된 선행 연구를 통해 7개의 공통 감성 형용사와 한국어에서만 나타나는 은유 혹은 표현적 특징들을 반영하기 위해 하위 세부 표현들까지 고려했다. 이모티콘의 가장 큰 특징인 캐릭터를 기반으로 "표상", "형상", "색상"의 범주에서 세부 하위 감성들을 수집했다. 정확도 높은 추천 시스템을 설계하기 위해 감성 지표만이 아니라 객관적 지표도 고려하였다. 메타데이터화 방법을 통해 이모티콘이 갖고 있는 캐릭터의 특징을 객관적 지표로 14개, 감성 지표로 활용하기 위해 감성 형용사를 36개를 추출하였다. 추출된 감성 형용사는 대비되는 형용사로 구성하여 총 18개로 줄였으며, 18개의 감성 형용사는 카카오톡의 이모티콘을 인기 순으로 임의의 40개 셋을 대상으로 측정하였다. 측정을 위해 이모티콘을 평가할 조사 대상자 온라인으로 모집하였고, 277명의 20~30대의 이모티콘을 구매한 경험이 있는 소비자를 대상으로 설문을 진행하였다. 설문응답자에게 서로 다른 5개의 이모티콘 셋을 평가하도록 하였다. 평가 결과 수집된 18개의 감정 형용사는 요인분석을 통해 감성 지표 요인으로 추출하였다. 추출된 소비자 감성 지표의 요인은 "코믹", "부드러움", "모던함", "투명함"이었다. 이모티콘의 객관적 지표와 감성 지표 요인을 활용하여 소비자 만족과의 관계를 분석하였고, 객관적 지표와 감성 지표 간의 관계도 분석하였다. 이 과정에서 객관적 지표가 소비자 태도에 바로 영향을 주는 것이 아니라 감성 지표 요인을 통해 소비자 태도에 영향을 주는 매개 효과가 있음을 확인하였다. 분석 결과는 소비자의 감성 평가 메커니즘을 밝혀냈고, 소비자의 이모티콘 감성 평가 메커니즘은 객관적 지표가 감성 지표 요인에 영향을 미치며, 감성 지표 요인은 소비자 만족에 영향을 미치는 관계였다. 따라서 감성 지표 요인의 네 가지만으로 이모티콘 추천 시스템을 설계하였고, 추천 방법은 각 감성과의 거리를 유클리디안 거리로 측정하여 거리의 차가 0에 가까울수록 비슷한 감성으로 정의하였다. 본 연구에서 제안한 이모티콘 시스템의 검증을 위해 각 감성 지표 요인과 소비자 만족의 평균을 지표 값으로 활용하여 각 이모티콘 셋의 감성 패턴을 그래프로 비교하였고, 추천된 이모티콘들과 선택된 이모티콘이 대체로 비슷한 패턴을 그리는 것을 확인하였다. 정확한 검증을 위해 사전 조사하였던 소비자를 대상으로 이모티콘 추천 시스템이 제시한 결과와 유사하게 평가하였는지 유사 순위를 세 구간으로 나누어 비교하였고, 순위별 예측 정확도는 결과 1순위 81.02%, 2순위 76.64%, 3순위 81.63%였다. 본 연구의 결과는 학문적, 실무적으로 다양한 분야에서 활용 가능한 방법론을 제시하였으며, 기존에 없던 이모티콘 추천 시스템의 설계를 통해 소비자에게는 편의와 이모티콘을 서비스하는 기업에는 매출증대의 효과를 가져올 것으로 예상한다. 그리고 본 연구를 통해 지능형 이모티콘 시스템으로 발전할 수 있는 단초를 제공했다는 점에서 의미가 있다. 본 연구에서 제안한 감성 요인들을 활용하여 감성 라이브러리로 사용함으로써, 새로운 이모티콘 출시 시 감성 평가의 지표로 활용할 수 있다. 축적된 감성 라이브러리와 기업의 판매 데이터, 매출 정보, 소비자 데이터를 결합하여 본 연구에서 제안한 추천 시스템을 복합형 추천 시스템으로 발전시켜 단순 소비자의 편의성이나 매출 증가뿐만 아니라 기업에서 전략적으로 활용 가능한 지적 자산으로 활용할 수 있을 것으로 판단한다.

새로운 국가결핵감시체계 시행 후 한 민간종합병원에서 작성된 결핵정보관리보고서의 정확도 조사 (The Accuracy of Tuberculosis Notification Reports at a Private General Hospital after Enforcement of New Korean Tuberculosis Surveillance System)

  • 김철홍;고원중;권오정;안영미;임성용;안창혁;윤종욱;황정혜;서지영;정만표;김호중
    • Tuberculosis and Respiratory Diseases
    • /
    • 제54권2호
    • /
    • pp.178-190
    • /
    • 2003
  • 연구배경 : 효율적인 결핵관리체계를 위해, 보건복지부는 2000년 6월 1일부터 결핵정보관리보고서에 의한 새로운 국가결핵감시체계를 출범시키게 되었다. 보건소의 결핵환자에 대한 결핵감시체계는 이미 1962년부터 운영 중에 있었으므로 이번의 감시체계는 민간의료부문의 결핵 환자들을 비로소 국가결핵감시체계에 포함시켰다는데 의미가 있다. 의사들의 일상적인 신고에 의한 결핵규모의 정확한 파악을 위해서는, 결핵정보관리보고서의 정확한 작성과 성실한 신고가 필수조건이다. 본 연구는 서울소재 한 민간종합병원에서 관할보건소로 신고된 결핵정보관리보고서가 얼마나 정확하게 기재되어 있으며 향후 개선할 점이 없는지를 알아보고자 하였다. 방 법 : 2000년 8월 1일부터 2001년 1월 31일까지 6개월간 삼성서울병원에서 관할보건소로 신고된 291명의 성인 폐결핵 환자들을 대상으로 하였다. 결핵정보관리보고서 항목인 인적사항, 과거 치료력, 검사결과, 질병코드 및 환자치료 사항을, 의무기록 및 병원 전산화 시스템의 컴퓨터에 저장되어 있는 검사 기록들과 비교하여 얼마나 정확한가를 알아보았다. 결 과 : 291명의 성인 결핵 환자는 폐결핵 222명, 폐외 결핵이 69명이었다. 성별은 남자 164명(56%), 여자가 127명(44%)였으며, 평균연령은 46세였다. 직업이 미기재된 경우가 132명(45%)이었다. 결핵과거 치료력은 83%, 치료기간은 93%, 과거 결핵치료 받은 횟수는 83%에서 보고서와 의무기록간에 일치하였다. 폐결핵 환자 222명 중 객담도말검사는 보고서의 76%가 의무기록과 일치하였으나 배양검사는 23%만이 실제 검사기록과 일치하였다. 객담배양 미검 표기 198명 중, 실제 객담 배양 미검은 43명(21.7%)이었다. 폐외 결핵환자 진단에 이용되었던 객담이외의 검체 도말검사는 54%, 배양 검사48%, 조직검사는 68%, 그리고, PCR 등의 기타검사는 67%에서 실제 검사결과와 일치하였다. 질병코드는 A15에서 A19의 3단계 분류를 적용했을 때는 85%, A15.0에서 A19.9의 4단계 분류에서는 66%가 의무기록과 일치하였다. 환자구분에서 신환으로 보고된 246명 중 실제 신환이었던 경우는 217명(88%)였으며, 나머지는 재발 13명, 치료실패자 2명, 중단 후 재등록 1명, 전입 12명 및 기타 1명으로 판명되었다. 재발로 신고된 23명 중 실제 재발은 18명(78%)으로 보고서 내용과 실제 의무기록 간에 조금씩 차이가 있었다. 치료시작 또는 진단일자는 264명(91%)이 일치하였으며, 보고서에는 HREZ 처방이 204명이었지만, 의무기록에는 HREZ 처방이 172명(84.3%)이었으며, 나머지는 HRE 9명(4.4%), 기타 처방 21명(10.3%)이었으며, HRE 처방으로 보고된 34명 중 실제 HRE 처방은 19명(55.9%)이었다. 결 론 : 우리나라의 효율적인 결핵관리를 위해서는 민간의료기관에서 작성되는 결핵정보관리보고서의 정확한 기재와 성실한 작성이 중요하며, 결핵과거치료력, 객담 배양 검사 항목 등의 보완과 민간부문 결핵환자들에 추후 관리하는 제도마련도 고안되어야 할 것으로 사료된다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

핵의학 검체검사 내부정도관리 허용범위 설정에 관한 고찰 (A Study on the Establishment of Acceptable Range for Internal Quality Control of Radioimmunoassay)

  • 이영지;이소영;이선호
    • 핵의학기술
    • /
    • 제26권2호
    • /
    • pp.43-47
    • /
    • 2022
  • 핵의학 검체검사는 검사 결과의 품질 보증을 위해 내부정도관리 시스템을 체계화하여 질 관리를 시행하고 있다. 본 연구는 검사실 자체적인 허용 범위의 설정 시 참고가 될 수 있도록 여러 기관의 종목별 내부정도관리 및 외부정도관리의 변동계수 평균을 산출하여 종목별 질 관리 현황을 제공함으로써 핵의학 검체검사 결과의 품질 보증에 기여하고 체계적인 질 관리를 수행하고자 한다. 2020년 10월에서 2021년 12월까지 각 기관에서 시행한 42종목에 대한 내부정도관리 변동계수의 평균 및 10.0% 이상 이탈률을 구하였다. CV% 성적에 따라 상위 그룹(5.0% 이하), 중위 그룹(5.0~10.0%), 하위 그룹(10.0% 이상)으로 구분하여 비교하였고, 10.0% 이상 이탈률은 5개 이상 기관의 종목에 대해서 종양 표지자, 갑상선 호르몬, 기타 호르몬으로 분류하여 비교하였다. 2021년 1분기에서 4분기까지 28종목에 대해 외부정도관리 결과의 전체 평균 및 표준편차로 변동계수의 평균을 구하였다. 또한 2021년 상반기, 하반기 13종목에 대해 기관 간 숙련도 결과의 전체 평균 및 표준편차로 변동계수의 평균을 구하였다. 종목별로 내부정도관리 및 외부정도관리의 변동계수 평균을 비교하여 질 관리가 잘 이루어지는 종목과 관리에 주의가 필요한 종목을 비교 분석하였다. 6개 기관의 42종목에 대해 내부정도관리 변동계수의 평균을 산출한 결과 상위 그룹에 속하는 종목(5.0% 이하)은 ferritin, HGH, SHBG, 25-OH-VitD이며, 하위 그룹(10.0% 이상)은 cortisol, ATA, AMA, renin, estradiol이었다. 5개 이상 기관의 종양 표지자 8종목에 대해 변동계수의 10.0% 이상 이탈률은 CA-125와 CA-19-9가 우수한 성적을 나타내었으나, SCC-Ag와 CA-15-3 검사는 관리에 주의가 필요한 종목에 속했다. 갑상선 호르몬 7종목에 대해 변동계수의 10.0% 이상 이탈률을 비교한 결과 free T4와 T3 검사는 우수하였지만 AMA와 ATA는 관리에 주의가 필요해 보였다. 기타 호르몬 11종목에 대해 변동계수의 10.0% 이상 이탈률을 비교하였을 때 IGF-1, FSH, prolactin은 우수한 성적을 나타내었지만, estradiol, testosterone, cortisol은 관리에 주의가 필요한 종목에 속했다. 28종목에 대해 외부정도관리를 참여하는 전체 기관에 대한 변동계수 평균을 산출한 결과 상위 그룹에 속하는 종목(10.0% 이하)은 HGH, SCC-Ag이었으며, 하위 그룹(30.0% 이상)은 ATA, estradiol, TSI, thyroglobulin이었다. 6개 기관의 42종목에 대해 평가한 결과 변동계수가 3.7~12.2%로 하위 그룹과 상위 그룹이 3.3배의 차이를 보였다. 변동계수의 값이 높은 cortisol, ATA, AMA, renin, estradiol 검사들은 정밀도를 향상시키기 위한 개선 활동들이 지속적으로 이루어져야 할 것이다. 또한 HBs-Ab를 제외한 41종목에 대해 내부정도관리 및 외부정도관리, 기관 간 숙련도 참여기관의 전체 CV% 평균을 산출하여 비교한 결과 ATA, AMA, renin, estradiol 검사는 높은 허용범위 설정을 권장한다. 설정된 허용범위를 기준으로 체계적인 질 관리를 수행한다면 핵의학 검체검사 결과의 정확도 및 신뢰도를 향상시킬 수 있을 것으로 사료된다.

천리안해양위성 2호(GOCI-II) 원격반사도 품질 검증 시스템 적용 및 결과 (Application and Analysis of Ocean Remote-Sensing Reflectance Quality Assurance Algorithm for GOCI-II)

  • 배수정;이은경;;이경상;김민상;최종국;안재현
    • 대한원격탐사학회지
    • /
    • 제39권6_2호
    • /
    • pp.1565-1576
    • /
    • 2023
  • 천리안 해양위성 2호(Geostationary Ocean Color Imager-II, GOCI-II)에서 관측된 대기상층 복사휘도에서 해양환경 분석이 가한 원격반사도(remote-sensing reflectance, Rrs) 자료를 얻기 위해서 복사 전달 모델 기반의 대기 보정을 수행한다. 이 Rrs는 다시 엽록소, 총부유사, 용존유기물 농도 등의 다양한 해양환경변수 산출에 이용되고 있기 때문에 대기보정은 모든 해색 산출물의 정확도에 영향을 주는 중요한 알고리즘이다. 맑은 해역에서는 대기의 복사휘도가 청색 파장대의 해수 복사휘도보다 10배 이상 높다. 따라서 대기보정 과정에서 1%의 대기 복사휘도 추정 오차가 10% 이상의 Rrs 오차를 유발할 수 있으며, 이처럼 대기보정은 매우 높은 오차 민감도를 가진 알고리즘이다. 그 결과 대기보정 산출물인 Rrs의 품질 평가는 신뢰성 있는 해양 위성 기반 자료 분석을 위해 반드시 선행되어야 한다. 본 연구에서는 Sea-viewing Wide Field-of-view Sensor (SeaWiFS) Bio-optical Archive and Storage System (SeaBASS)을 통해 데이터베이스화 된 현장 측정 Rrs 기반 통계적 신뢰성을 평가하는 Quality Assurance (QA) 알고리즘을 GOCI-II의 분광 특성에 맞게 수정 및 적용하였다. 이 방법은 National Oceanic and Atmospheric Administration (NOAA)의 해색위성 자료처리 시스템에 공식적으로 적용되어 서비스 중이며, Rrs의 품질 분석 점수(0~1점)를 제공할 뿐 아니라 해수의 유형(23 유형)도 구분해 준다. 실제로 검보정 초기 단계의 GOCI-II 자료에 QA를 적용한 결과, Rrs는 비교적 낮은 값인 0.625에서 가장 높은 빈도를 보여주었지만 추가적인 검보정을 통해 개선된 GOCI-II 대기보정 결과에 QA 알고리즘을 적용했을 시 기존보다 높은 0.875에서 가장 높은 빈도를 보여주었다. QA 알고리즘을 통한 해수 유형 분석 결과, 동해 및 남해 일부 그리고 북서태평양 해역은 주로 탁도가 낮은 case-I 해역이었으며 서해 연안 및 동중국해는 주로 탁도가 높은 case-II 해역으로 구분되었다. 이처럼 QA 알고리즘의 적용을 통해 대기보정 과정에서 오차가 크게 발생한 Rrs 자료를 객관적으로 판별하여 배제할 수 있으며 이는 배포자료 및 검보정의 신뢰도 향상으로 이어질 수 있다. 본 방법은 추후 GOCI-II의 대기보정 flag에 적용되어 사용자들이 양질의 Rrs 자료만을 적용할 수 있도록 도움을 줄 것이다.