• 제목/요약/키워드: Output indicator

검색결과 113건 처리시간 0.018초

Structural SVM을 이용한 백과사전 문서 내 생략 문장성분 복원 (Restoring Omitted Sentence Constituents in Encyclopedia Documents Using Structural SVM)

  • 황민국;김영태;나동열;임수종;김현기
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.131-150
    • /
    • 2015
  • 영어와 달리 한국어나 일본어 문장의 경우 용언의 필수격을 채우는 명사구가 생략되는 무형대용어 현상이 빈번하다. 특히 백과사전이나 위키피디아의 문서에서 표제어로 채울 수 있는 격의 경우 그 격이 문장에서 더 쉽게 생략된다. 정보검색, 질의응답 시스템 등 주요 지능형 응용시스템들은 백과사전류의 문서에서 주요한 정보를 추출하여 수집하여야 한다. 그러나 이러한 명사구 생략 현상으로 인해 양질의 정보추출이 어렵다. 본 논문에서는 백과사전 종류 문서에서 생략된 명사구 즉 무형대용어를 복원하는 시스템의 개발을 다루었다. 우리 시스템이 다루는 문제는 자연어처리의 무형대용어 해결 문제와 거의 유사하나, 우리 문제의 경우 문서의 일부가 아닌 표제어도 복원에 이용할 수 있다는 점이 다르다. 무형대용어 복원을 위해서는 먼저 무형대용어의 탐지 즉 문서 내에서 명사구 생략이 일어난 곳을 찾는 작업을 수행한다. 그 다음 무형대용어의 선행어 탐색 즉 무형대용어의 복원에 사용될 명사구를 문서 내에서 찾는 작업을 수행한다. 문서 내에서 선행어를 발견하지 못하면 표제어를 이용한 복원을 시도해 본다. 우리 방법의 특징은 복원에 사용된 문장성분을 찾기 위해 Structural SVM을 사용하는 것이다. 문서 내에서 생략이 일어난 위치보다 앞에 나온 명사구들에 대해 Structural SVM에 의한 시퀀스 레이블링(sequence labeling) 작업을 시행하여 복원에 이용 가능한 명사구인 선행어를 찾아내어 이를 이용하여 복원 작업을 수행한다. 우리 시스템의 성능은 F1 = 68.58로 측정되었으며 이는 의미정보의 이용 없이 달성한 점을 감안하면 높은 수준으로 평가된다.

상세화된 CMIP5 기후변화전망의 다중모델앙상블 접근에 의한 농업기후지수 평가 (Evaluation of Agro-Climatic Index Using Multi-Model Ensemble Downscaled Climate Prediction of CMIP5)

  • 정유란;조재필;이은정
    • 한국농림기상학회지
    • /
    • 제17권2호
    • /
    • pp.108-125
    • /
    • 2015
  • 다수의 기후요소를 지수화하고 특정지역의 기후 자원량을 분석하여, 종합 및 판단하는 과정은 특정지역의 농업기후자원의 특성을 한 눈에 알 수 있게 한다. 농업기후자원의 특징을 단순 명료하게 표현한 것을 농업기후지수라고 하는데, 이 지수는 기후자원(예, 기온, 일사, 강수)으로부터 작물의 생육과 수량 추측을 위한 가능성과 여러 가지 영농기술을 실시하는데 필요한 기초자료를 제공함으로써 농업생산성의 주요 지표가 될 수 있다. 그러나 농업기후지수는 절대적인 것이 아니기 때문에 기후변화에 따라 항상 변화할 수 있다. 최근 IPCC 제5차 평가보고서에서 온실가스 대표경로(RCP)에 따른 시나리오가 많은 연구에 이용됨에 따라서 기후정보의 역학 및 통계적 규모축소를 통한 미래기후변화전망정보의 불확실성을 고려한 연구들이 활발히 진행되고 있다. 본 연구에서는 IPCC 제5차 평가 보고서에 사용된 RCP 시나리오를 기반으로 비모수적 분위사상법을 이용한 상세화된 기후변화 전망정보를 바탕으로 한반도의 농업기후지수(예, 식물기간 및 작물기간, 생장도일, 무상기간)의 시공간적인 변화와 불확실성을 평가하였다. 동일한 과거 기간에 대하여 기후모델(GCM)으로부터 계산된 농업기후지수와 관측자료에 의해 계산된 농업기후지수를 비교한 결과, KMA-12.5km를 제외하고 사용된 8개 개별 GCM의 농업기후지수의 각각의 평균은 4대강 유역 모두에서 관측자료에 의해 계산된 값의 평균과 비교적 잘 일치하여 개별 GCM 뿐만 아니라 다중모델앙상블(MME)의 과거기후 재현성에는 문제가 없는 것으로 확인하였다. 또한 불확실성을 고려하기 위한 MME 계산에서 사용되는 GCM의 개수가 무한적으로 증가한다고 해서 오차가 줄어들지 않았다. 추가 연구가 계속 필요하지만, 본 연구에서 3-4개의 GCM을 사용하는 경우 확실하게 오차가 개선되기 시작하였으며, 대체로 7-8개 이후부터는 더 이상 오차가 개선되지 않았다. 미래전망 결과에서, 4대강 유역 전체에 대하여 inmcm4가 과거 기간의 MME에 대한 RCP 4.5에서 1% 증가, RCP 8.5에서 2% 증가로 9개 개별 GCM 중에서 가장 낮았고, CanESM이 과거 기간의 MME에 대하여 RCP 4.5에서 10%, RCP 8.5에서 15% 증가로 가장 높은 증가를 보였다. 4대강 유역의 시공간분포의 변화에서 관측자료와 다른 경향을 보이는 개별 GCM이 있어서 지형 특성과 개별 GCM의 일변동 특성을 반영할 수 있는 상세화 방법의 개선 및 개발이 필요하다. 도출 및 평가된 본 연구의 농업기후지수는 농업용 상세 전자기후도와의 활용뿐만 아니라, 후속 연구를 위한 농업이상기후지수 및 생산성지수의 평가에 활용될 수 있을 것이다. 예를 들면, 낙동강 유역과 영산-섬진강 유역의 무상기간 증가로부터 '겨울기간이 짧아질 수 있다'라고 가정할 경우, 농업이상 기후지수(예, 저온발생빈도) 분석을 통해 겨울작물의 생산성지수의 불확실성 증감 혹은 재배시스템(예, 이모작 혹은 이기작 등)의 변화에 대한 불확실성 증감 등에 대한 평가에 활용될 수 있을 것이다.

Hourglass 기반 공공도입연계형 국가연구개발사업 성과평가 프레임워크 제안: 빅데이터 기반 인공지능 도시계획 기술개발 사업 사례를 바탕으로 (Proposal for the Hourglass-based Public Adoption-Linked National R&D Project Performance Evaluation Framework)

  • 이승하;김대환;정광식;박건철
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.31-39
    • /
    • 2023
  • 본 연구의 목표는 통합형 국가연구개발 사업에서 정보화사업, 공공조달 등 공공수요 기반의 상용화로 연계되는 복잡한 형태의 사업성과를 측정하고 관리하기 위한 과학적이고 효율적인 성과평가 프레임워크를 제안하는데 있다. 다수의 연구기관이 참여하여 하나의 최종성과물을 이루는 통합형 국가연구개발사업과 사업의 결과물이 수요기반의 실증 및 상용화까지 이루어지는 사업의 경우, 연구개발사업을 구성하는 세부과제의 단기적 산출물을 바탕으로 성과를 평가하는 기존의 평가체계로는 통합적 연구성과물에 대한 중장기적 효과와 실용성을 평가하기에는 한계가 있다. 더욱이 국가연구개발사업의 패러다임이 효율성을 중시하는 임무중심으로 변화함에 따라, 국가연구개발과제의 성과평가도 결과의 효과와 실용성을 중심으로 변화해야 할 필요성이 제기되고 있다. 본 연구에서는 Hourglass 모델을 활용하여 각 국가연구개발과제의 성과가 단순한 단기적 산출을 넘어, 실제 그 효과성 등 실용적 관점에서 완성도를 평가하기 위한 구조적 관점의 성과평가 프레임을 제시한다. 이는 연구개발과제의 구조에 따라 Tool-System-Service-Effect로 이어지는 하향식(Top-down) 및 상향식(Bottom-up) 접근을 연계한 통합적 프레임이라 할 수 있다. 제시된 세부 평가지표와 성과평가 프레임을 실제 국가연구개발사업에 적용함으로써 지표의 타당성과 제안된 성과평가 프레임의 효용성을 검증하였으며, 이러한 결과는 향후 효율성을 강조하는 국가연구개발사업의 성과평가 체계에 대한 학술적, 정책적, 산업적 시사점을 제시할 것으로 기대된다.