• 제목/요약/키워드: Benchmark Data

검색결과 695건 처리시간 0.023초

지구온난화에 따른 벼 생육 및 생산성 변화 예측 (Assessing Impacts of Global Warming on Rice Growth and Production in Korea)

  • 심교문;노기안;소규호;김건엽;정현철;이덕배
    • 한국기후변화학회지
    • /
    • 제1권2호
    • /
    • pp.121-131
    • /
    • 2010
  • 본 연구에서는 미국에서 개발되어 IBSNAT(International Benchmark Site Network for Agrotechnology Transfer) 사업에 의해 국제적으로 널리 보급된 DSSAT 패키지(CERES-Rice 모형)의 최근 윈도우 버전(DSSAT v4)을 국내에 도입하여, 우리나라 벼 품종과 기상요소, 그리고 국립농업과학원의 정밀농업토양자료 등을 적용하여, 출수생태형별 품종유전모수를 추정한 후, GCM 기후시나리오에 따른 벼 생육 및 생산량의 변동을 시뮬레이션 방법으로 평가하였다. 온도가 상승함에 따라 출수 기간은 단축하는 것으로 조사되었다. 온도가 $2^{\circ}C$ 상승하였을 때는 7~8일 단축되는 것으로 모의되었고, $5.2^{\circ}C$ 상승하는 UKMO 기후시나리오를 적용하면 최대 16~18일 단축되는 것으로 추정되었다. 출수 기간은 출수생태형의 구분 없이 온도 상승에 따라 비슷하게 단축되는 것으로 분석되었지만, 벼 등숙 기간의 변화는 출수생태형에 따라 다른 경향을 나타내었다. 즉, 생육 기간이 길은 중만생종의 출수 기간은 온도 상승 정도에 따라 14~18일 짧아졌는데 반하여, 생육 기간이 짧은 조생종의 경우에는 1~3일 짧아져, 단축 정도가 상대적으로 적은 것으로 조사되었다. 온도가 30년 평년 기후(1971~2000년)보다 $2^{\circ}C$$3^{\circ}C$ 상승하는 조건에서, 전국적인 평균 벼 수량은 평년 기후에 의해 추정된 것보다 각각 4.5%와 8.2% 감소하는 것으로 전망되었고, $CO_2$ 배증에 따라 온도 상승을 가장 높게 예측하는 UKMO 전지구 기후변화모델을 적용하여, 전국적으로 벼 수량을 모의하였을 때는 평년기후에 적용하여 추정한 수량보다 전국 평균 14.9% 감소하는 것으로 분석되었다. 이는 온난화로 인한 등숙 기간의 단축뿐 아니라 고온에서의 임실율 저하, 그리고 야간고온에 의한 호흡손실 때문인 것으로 판단된다. 따라서 지역별 정밀농업기후 추정과 이에 근거한 최적 품종의 선택, 이앙기 및 수확기 등 생육 기간의 조절 등 온난화 대응기술의 개발이 필요하다.

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.

식도암 방사선 치료에 대한 Patterns of Care Study ($1998{\sim}1999$)의 예비적 결과 분석 (Preliminary Report of the $1998{\sim}1999$ Patterns of Care Study of Radiation Therapy for Esophageal Cancer in Korea)

  • 허원주;최영민;이형식;김정기;김일한;이호준;이규찬;김정수;전미선;김진희;안용찬;김상기;김보경
    • Radiation Oncology Journal
    • /
    • 제25권2호
    • /
    • pp.79-92
    • /
    • 2007
  • 목 적: 전국 병원의 방사선종양학과에서 식도암으로 방사선 치료를 받은 환자들을 각 병원으로부터 입력 받아 세부 항목별로 분석하여 식도암 환자들의 구성과 특징을 파악하여 범국가적인 자료로 활용하는 한편 치료방침을 분석하여 향후 적절한 치료를 위한 가이드라인으로 삼고자 하였다. 대상 및 방법: 전국 병원의 방사선종양학과에서 1998년과 1999년의 2년간에 걸쳐 식도암으로 확진된 246명을 대상으로 하였다. 연간 400명 미만의 방사선치료 신환자 발생병원들을 A군, 400명 이상 900명 미만의 병원들을 B군, 그리고 900명 이상 신환자가 발생하는 병원을 C군으로 분류하여 최종적으로 A군에서 12병원, B군에서 8개 병원, 그리고 C군에서 3개의 병원이 연구에 참여하였다. 이미 개발된 Web-based Korean PCS system을 통해 각 병원으로부터 직접 자료를 입력 받아 이를 세부 항목별로 분석하였고 통계적 처리는 SPSS version 12.0.1을 사용하고 범주형 자료는 Chi-squared test를 사용하였고 연속변수는 ANOVA, Kruskal-Wallis test를 적용하였다. 결 과: 입력된 환자들의 성별 분포는 남자 224명(91.1%), 여자 22명(8.9%)이었고 연령별 중앙값은 62세 전후였다. 진단 및 병기결정을 위한 검사로는 식도 촬영술(228명, 92.7%), 식도내시경(226명, 91.9%) 및 흉부 식도 CT 스캔(238명, 96.7%)을 주로 시행하였다. 편평상피암이 대종을 이루어 237명(96.3%)의 환자에서 관찰되었고 중흉부식도(mid-thoracic esophagus)에서 발생한 식도암이 가장 많았다(110명, 44.7%). 임상 병기는 III기가 과반수 이상을 차지하였다(135명, 54.9%). 방사선 치료만 받은 경우는 57명(23.2%), 방사선 치료와 수술을 병용한 경우는 전체의 15%인 37명, 항암약물 치료와 방사선 치료를 병용한 경우는 123명(50%)이었다. 수술과 방사선 치료를 병행한 경우 전례에서 수술을 먼저 시행한 후 방사선 치료를 하였다. 항암치료를 방사선치료와 병행한 경우 반수 이상에서(70명, 56.9%) 동시항암방사선 치료를 시행하였고 31명(25.2%)에서 항암치료 후 방사선치료를 또는 항암요법 단독치료 후 동시항암방사선치료를(13명, 10.6%) 시행하였다. 방사선 치료는 6 MV (116명, 47.2%)와 10 MV (87명, 35.4%)의 X-ray가 대종을 이루었다. 방사선 치료 시 조사야는 longitudinal margin의 경우 중앙값은 7.0 cm이었지만 각 군별로 현저한 차이가 있었다(A군; 5.5 cm, B군; 8.0 cm, C군; 14.0 cm). 계획용 CT를 사용하지 않고 고식적인 AP/PA 조사야를 사용하여 치료한 경우가 대부분이었는데(206명, 83.7%) 이 때 방사선 조사량의 중앙값은 3,600 cGy이었다. 이후 추가 방사선 치료 시 계획용 CT를 사용하지 않고 2-oblique fields 사용하여 치료한 경우가 87명(35.4%)이었는데 방사선 조사량의 중앙값은 1,800 cGy이었다. 전 환자에서 1일 1회 180 cGy로 치료하였다. 전 환자에서 조사된 총 방사선량의 중앙값은 5,580 cGy이었다. 수술 후 방사선 치료를 시행한 경우 중앙값은 5,040 cGy이었고 수술을 받지 않은 환자 중앙값은 5,940 cGy이었다. 근접조사 방사선 치료는 총 34명(13.8%)에서 시행되었고, 전 환자에서 high dose rate Iridium-192를 사용하였다. 조사범위는 종양에서 longitudinal margin의 중앙값은 1 cm, prescribed isodose curve에서 axial length의 평균값은 8.25 cm, 폭은 2 cm, 그리고 전후 폭의 중앙값도 2 cm이었다. Fraction size의 중앙값은 300 cGy이었는데 B군의 경우는 500 cGy이었다. 총 분할 횟수는 $3{\sim}4$회가 대부분이었다. 한편, 방사선 치료 중 발생한 급성 부작용은 식도염이 가장 많았는데 전체 246명 환자 중 155명(63.0%)에서 발생하였다. 결 론: 전국 23개 병원의 식도암 환자 치료 Data를 분석해 본 결과 대부분의 병원에서 환자의 특징과 진단 및 병기 결정 방법, 치료의 유형 등에서 유사한 결과를 보였으며 신환 발생 수에 따른 병원 규모의 차이는 조사 결과에 큰 영향을 미치지 못하였다. 하지만 병원 규모가 클수록 10 MV 이상의 고에너지로 치료하는 경향이 많았으며 3D CT Plan도 병원 규모가 클수록 활용도가 높았다. 조사 야의 면적도 병원 군별로 차이를 보였다. 향후 더 많은 환자를 입력하여 생존율 분석까지 이루어지면 이 연구는 식도암 치료방침의 결정에 중요한 guideline을 제시해 줄 것으로 사료된다.

지능형 전망모형을 결합한 로보어드바이저 알고리즘 (Robo-Advisor Algorithm with Intelligent View Model)

  • 김선웅
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.39-55
    • /
    • 2019
  • 최근 은행과 증권회사를 중심으로 다양한 로보어드바이저 금융상품들이 출시되고 있다. 로보어드바이저는 사람 대신 컴퓨터가 포트폴리오 자산배분에 대한 투자 결정을 실행하기 때문에 다양한 자산배분 알고리즘이 활용되고 있다. 본 연구에서는 대표적 로보어드바이저 알고리즘인 블랙리터만모형의 강점을 살리면서 객관적 투자자 전망을 도출할 수 있는 지능형 전망모형을 제안하고 이를 내재균형수익률과 결합하여 최종 포트폴리오를 도출하는 로보어드바이저 자산배분 알고리즘을 새로이 제안하며, 실제 주가자료를 이용한 실증분석 결과를 통해 전문가의 주관적 전망을 대신할 수 있는 지능형 전망모형의 실무적 적용 가능성을 보여주고자 한다. 그동안 주가 예측에서 우수한 성과를 보여주었던 기계학습 방법 중 SVM 모형을 이용하여 각 자산별 기대수익률에 대한 예측과 예측 확률을 도출하고 이를 각각 기대수익률에 대한 투자자 전망과 전망에 대한 신뢰도 수준의 입력변수로 활용하는 지능형 전망모형을 제안하였다. 시장포트폴리오로부터 도출된 내재균형수익률과 지능형 전망모형의 기대수익률, 확률을 결합하여 최종적인 블랙리터만모형의 최적포트폴리오를 도출하였다. 주가자료는 2008년부터 2018년까지의 132개월 동안의 8개의 KOSPI 200 섹터지수 월별 자료를 분석하였다. 블랙리터만모형으로 도출된 최적포트폴리오의 결과가 기존의 평균분산모형이나 리스크패리티모형 등과 비교하여 우수한 성과를 보여주었다. 구체적으로 2008년부터 2015년까지의 In-Sample 자료에서 최적화된 블랙리터만모형을 2016년부터 2018년까지의 Out-Of-Sample 기간에 적용한 실증분석 결과에서 다른 알고리즘보다 수익과 위험 모두에서 좋은 성과를 기록하였다. 총수익률은 6.4%로 최고 수준이며, 위험지표인 MDD는 20.8%로 최저수준을 기록하였다. 수익과 위험을 동시에 고려하여 투자 성과를 측정하는 샤프비율 역시 0.17로 가장 좋은 결과를 보여주었다. 증권계의 애널리스트 전문가들이 발표하는 투자자 전망자료의 신뢰성이 낮은 상태에서, 본 연구에서 제안된 지능형 전망모형은 현재 빠른 속도로 확장되고 있는 로보어드바이저 관련 금융상품을 개발하고 운용하는 실무적 관점에서 본 연구는 의의가 있다고 판단된다.