• 제목/요약/키워드: 측정-보정-예측

검색결과 266건 처리시간 0.033초

사전 학습된 한국어 언어 모델의 보정 (Calibration of Pre-trained Language Model for Korean)

  • 정소영;양원석;박채훈;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.243-248
    • /
    • 2020
  • 인공 신경망을 통한 심층 학습 모델의 발전은 컴퓨터 비전, 자연언어 이해 문제들에서 인간을 뛰어넘는 성능을 보이고 있다. 특히 트랜스포머[1] 기반의 사전 학습 모델은 질의응답, 대화문과 같은 자연언어 이해 문제에서 최근 높은 성능을 보이고 있다. 하지만 트랜스포머 기반의 모델과 같은 심층 학습 모델의 급격한 발전 양상에 비해, 이의 동작 방식은 상대적으로 잘 알려져 있지 않다. 인공 신경망을 통한 심층 학습 모델을 해석하는 방법으로 모델의 예측 값과 실제 값이 얼마나 일치하는지를 측정하는 모델의 보정(Calibration)이 있다. 본 연구는 한국어 기반의 심층학습 모델의 해석을 위해 모델의 보정을 수행하였다. 그리고 사전 학습된 한국어 언어 모델이 문장이 내포하는 애매성을 잘 파악하는지의 여부를 확인하고, 완화 기법들을 적용하여 문장의 애매성을 확신 수준을 통해 정량적으로 출력할 수 있도록 하였다. 또한 한국어의 문법적 특징으로 인한 문장의 의미 변화를 모델 보정 관점에서 평가하여 한국어의 문법적 특징을 심층학습 언어 모델이 잘 이해하고 있는지를 정량적으로 확인하였다.

  • PDF

토지이용변화모형을 이용한 용담댐 소유역의 지표유출량 분석 (Analysis of Surface Runoff in Yongdam Dam Small Basin by Using CLUE Model)

  • 천범석;이태화;김상우;정영훈;신용철
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.170-170
    • /
    • 2021
  • 본 연구에서는 토지이용변화 예측 모형으로 산출된 토지이용도를 사용하여 용담댐 소유역의 지표유출량을 비교 및 분석하였다. 토지이용예측모형은 DynaCLUE 모형을 사용하였으며, 토지이용 면적 시나리오는 2000년, 2007년 및 2013년 실제 중분류 토지이용도를 기반으로 회귀식을 산정하였다. 모의된 토지이용도는 실제 토지이용도와 공간적인 분포 및 면적 비교를 통해 변환 탄성계수와 변환 행렬을 수정하여 검·보정하였다. DynaCLUE 모형으로 모의된 토지이용도는 공간적인 분포에서 초지가 실제 토지이용도와 차이가 발생하였으나, 각 토지이용별 면적을 비교한 경우 모의 토지이용도와 실제 토지이용도가 매우 유사하게 나타났다. CLUE 모형으로 모의된 토지이용도에서 발생하는 공간적인 불확실성은 복잡한 용담댐 소유역의 토지이용을 반영할 Driving factor가 부족하여 발생하는 것으로 판단된다. 산출된 모의 토지이용도를 SWAT 모형의 입력 자료로 사용하여 2013년 용담댐의 소유역 지표유출량을 모의하였다. SWAT으로 산정된 유출량의 보정은 SWAT-CUP의 SUFI-2 알고리즘을 이용했으며, 보정된 모의 지표유출량과 실제 유량 측정값을 비교한 결과 유의미한 비교 결과가 나타났다. 향후 토지이용예측모형을 이용하여 토지이용 변화를 수문 분석에 반영하는 추가 연구가 필요할 것으로 판단된다.

  • PDF

데이터 저장소를 이용한 이상치 및 결측치 보정 시스템 (Adjustment System for Outlier and Missing Value using Data Storage)

  • 김광호;김능회
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.47-53
    • /
    • 2023
  • 현재 4차 산업혁명 시대에 오면서 다양하고 많은 데이터가 쌓여왔다. 농업사회도 스마트팜이나 노지에서 작물의 성장에 영향을 주는 환경 데이터를 센서로 수집해왔다. 환경 데이터는 측정하는 지역에 따라 특징을 가지고, 측정하는 시기에 따라서도 특징을 보이는 데이터이다. 수집된 농업 데이터를 활용해 통계, 인공지능을 사용하여 성장을 예측하거나 수확량을 예측하는 연구가 진행되어왔다. 이러한 연구는 기반이 되는 데이터에 따라 결과가 크게 차이난다. 이에 성능 향상을 위해서 데이터의 품질을 개선하기 위한 연구 또한 지속해서 진행되어왔다. 높은 성능을 위하여 많은 양의 데이터가 필요하고, 양이 충분하여도 데이터의 이상치나 결측치가 있을 경우 결과에 큰 영향을 미친다. 따라서 이상치와 결측치 값의 보정은 데이터 전처리 과정에서 필수이다. 이에 본 논문에서는 실제 농가에서 수집된 데이터를 통합하고 이를 기반으로 이상치와 결측치 보정 시스템을 제안한다.

L1/L2 측정치 조합을 이용한 GPS 기준국간 반송파 미지정수 결정 기법 (Ambiguity Determination Technique for Multiple GPS Reference Stations using the Combination of L1/L2 Carrier Phase)

  • 박병운;송준솔;기창돈
    • 한국항행학회논문지
    • /
    • 제15권5호
    • /
    • pp.705-713
    • /
    • 2011
  • 본 논문에서는 Network RTK 보정정보 생성 프로세스에서 핵심 process인 기준국간 미지정수 결정을 위해 Hatch filter를 이용한 방법과 L1/L2 측정치 조합을 활용하는 방법에 대해 소개하고 시뮬레이션 데이터 및 실측 데이터를 활용하여 그 성능을 비교 및 검증하였다. 각각의 방법에 대해 수식 전개를 수행하였으며, 사용자 성능 검증을 위해서 다중 기준국 네트워크에 대해 생성한 보정정보와 사용자 위치에서 생성한 보정정보의 차이값을 비교하였다. 각각의 기준국간 미지정수 결정 방법을 실측 데이터에 적용하여 사용자 성능을 예측한 결과, Hatch filter를 사용한 경우에는 단일 기준국 RTK 기반의 방법에 비해 다중 기준국 네트워크에서 생성된 보정정보를 사용하는 것이 사용자 성능을 크게 향상시키는 결과를 확인하였다. 그러나 사용자의 미지정수에 영향은 없으나, 상당한 크기의 바이어스 오차가 포함되는 것을 확인하였고 그 원인에 대해 분석하였다. L1/L2 측정치 조합을 이용한 경우, Hatch filter를 사용한 방법에 비해 사용자에 발생하는 오차의 크기가 훨씬 감소하였으며 잔차의 경향성도 훨씬 감소한 것을 확인하였다.

다중 기준국 보정정보 모델링 방식에 따른 Compact Network RTK 사용자 성능 비교 (Performances Comparison of Compact Network RTK User Based on Modelling of Multiple Reference Station Corrections)

  • 송준솔;박병운;기창돈
    • 한국항행학회논문지
    • /
    • 제17권5호
    • /
    • pp.475-483
    • /
    • 2013
  • 본 논문에서는 Network RTK 보정정보를 사용자에 적용 시, 다중 기준국 보정정보 모델링 방식에 따른 사용자 성능 비교를 수행하였다. 기준국과 사용자 거리가 멀어질수록 사용자와 기준국의 GPS 오차요소 상관성이 감소하므로, 이와 같은 GPS 오차요소의 공간적 특성에 입각하여 다수의 네트워크 보정정보를 적절히 조합하여 사용자에 적용해주어야 한다. 기존에 기준국간 수평 거리 및 고도를 활용한 다양한 보정정보 모델링 방식을 활용하여, MAC 방식의 Compact Network RTK에 적용 가능한지 이론적으로 분석하였다. 한국 내 설치된 상시 기준국에서 습득한 실측 GPS 데이터를 활용하여, 서울대학교에서 제안한 Compact RTK와 기존의 Network RTK가 결합된 방식인 Compact Network RTK 사용자에 대해 각 모델링 방식 별 사용자 성능을 측정치 잔여오차 및 위치 정확도 예측치 관점에서 비교 및 분석을 수행하였다. 그 결과, 각 보정정보 모델링 방식에 대해 사용자 수평 위치 정확도 예측치의 경우 모두 2DRMS 5 cm 이내의 정확도를 보였고, 수직 위치 정확도 예측치의 경우 모두 95 % 신뢰도로 7 cm 이내의 정확도를 나타내었다. 또한, 기존 보정정보 모델 방식 중, 기준국간 고도 차이를 사용한 모델링 방법의 적용 가능 기준국 배치 조건에 대해 분석하였다.

서해안의 해저표면형상 예측 경험식 제안 (Proposal of Empirical Formula for Bedform Size on West Coast of Korea)

  • 김효섭;유호준;장창환
    • 한국습지학회지
    • /
    • 제14권4호
    • /
    • pp.457-469
    • /
    • 2012
  • 우리나라 서해 근해역 4개지역의 해저표면형상 자료를 분석하였다. 우리나라 서해안은 조차가 클 뿐 아니라 파랑 또한 상당히 크며, 해저질의 입도가 약 1.2 ~ 1.6 ${\varnothing}$의 분포로 상대적으로 입경이 큰 사질의 형태이다. 자료를 취한 해역에서의 수심은 10 ~ 65 meters로서 해저면의 표면형상이 잘 발달해 있는 편이며, 해저표면형상에서 모래결 길이(ripple length)는 약 6 ~ 13 meters 범위이다. 기존의 모래결 길이를 예측할 수 있는 예측식 중 파랑과 흐름이 공존할 때에 적용할 수 있는 예측식으로는 Khelifa and Ouellet 과 Soulsby 가 있다. 조사한 모래결 길이를 이 두 식으로 예측한 결과 두 식 모두 실제 측정값보다 작은 값을 나타내었다. 이는 기존의 두 예측식이 우리나라 서해안과는 다른 해역에서 구한 자료로부터 얻은 식이거나 실험실에서 얻어졌기 때문으로 판단된다. 기존의 예측식에 일정한 보정계수를 곱하여 수정한 결과 우리나라 서해안에서 관측한 모래결 길이를 잘 표현할 수 있게 되었다.

변형률을 이용한 복합재 평판 후퇴익 구조물의 변위 예측 (Displacement Prediction of Swept Composite Cantilevered Panel Wings Using Strains)

  • 김문국;유제균;김소영;김인걸;김근상;전민혁
    • Composites Research
    • /
    • 제30권5호
    • /
    • pp.280-287
    • /
    • 2017
  • 복합재 후퇴익은 비행 중 굽힘 하중 외에도 비틀림 하중을 받아 복잡한 변형이 발생할 수 있다. 따라서 복잡한 변형이 나타나는 복합재 후퇴익의 구조 건전성 평가를 위해 복합재 후퇴익 구조물의 변위 예측이 요구된다. 날개의 변위 예측은 변위와 변형률 관계를 통해 예측할 수 있지만 후퇴익의 복잡한 변형으로 고정단 부근의 변형률 분포는 복잡하게 나타나기 때문에 일부 위치의 변형률 센서만으로 변형률을 측정하면 변위 예측의 오차가 발생할 수 있다. 본 논문에서는 복잡한 변형률 분포를 고려한 평판 형태의 복합재 후퇴익의 변위를 예측하는 연구를 수행하였다. 유한요소 해석을 통해 변형률 측정 지점을 선정하였다. 측정 지점의 변형률을 이용하여 예측한 변위는 해석에서 계산된 변위와 잘 일치하였으며, 실험을 통하여 검증하였다.

음운환경을 고려한 피치 기반 세기 제어 모델 (Pitch-based Intensity Control Models Considering Phonetic Environments)

  • 김기중;김진영;진달복
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.80-85
    • /
    • 1998
  • 본 논문에서는 음성합성기에서 합성음의 자연성을 향상시키기 위한 한 방법으로 운 율 제어요소중 세기 제어 모델을 통계적인 방법을 이용하여 제안하였다. 세기 제어 모델을 구성하기 위하여, 음성의 세기는 피치에 비례한다는 사실에 기반하여, 녹음된 음성 데이터에 서 음절의 각 모음에 대한 평균파워와 평균피치를 구하고, 피치를 종속변수로 하는 모음의 세기 예측식을 만들었다. 예측식에 의하여 얻어진 세기값과 실제 측정된 세기값과의 상관도 는 전체모음에 대하여 약 0.63으로 나타났다. 본 논문에서는 예측 세기와 실제 세기와의 상 관도를 향상시키기 위하여 피치만을 고려하여 예측된 세기값을 음운환경을 고려하여 선형 오차를 보정하는 방법을 제안하였고, 이 방법을 이용하여 얻어진 세기값은 전체모음에 대하 여 실제 세기값과 0.71의 상관도로 향상시킬 수 있었다.

  • PDF

화면 간 차이신호의 화소영역 위너-지브 비디오 부호화 기법에서 왜곡 예측방법 (A Method of Estimating Distortion in Pixel-Domain Wyner-Ziv Residual Video Coding)

  • 김진수
    • 한국정보통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.891-898
    • /
    • 2014
  • 분산 비디오 부호화기법은 초경량의 비디오 부호화기법에 대한 이론적인 근거를 제공하고 있다. 기존에 많이 연구되어온 분산 비디오 부호화기법은 주로 스탠포드 대학교의 연구에 기초하고 있으며, 피드백 채널을 통하여 비트율을 정교하게 제어하는 방법을 사용하고 있다. 그러나 이 방법은 복호화기에서 수신된 패리티 비트에 의해 복원된 각 프레임의 품질에 대한 평가하는 방법은 제시되지 않고 있다. 본 논문에서는 보조정보에 있는 가상채널잡음을 보정함으로써 왜곡크기를 예측하고 또한 복원된 영상의 화질측정을 손쉽게 측정할 수 있는 방법을 제안한다. 다수의 실험을 통하여 제안한 방법은 복원된 프레임의 왜곡을 효과적으로 예측할 수 있음을 보인다.

근적외선 반사스펙트럼을 이용한 분말식품의 저함수율 측정 기술 (Moisture Content Measurement Technique for Powdered Food using NIR Reflectance Spectroscopy)

  • 모창연;노상하
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2002년도 동계 학술대회 논문집
    • /
    • pp.444-449
    • /
    • 2002
  • 1. 시료의 흡광도는 입도가 커짐에 따라 전체 파장 영역에 걸쳐 증가하는 경향을 보였다. 가시광 영역에서는 입도 보다도 색상의 영향이 큰 것으로 나타났다. 2. 시료의 함수율과 각 파장에서의 흡광도 사이의 상관관계는 550~950nm 영역에서는 상관계수가 0.53이하로 작았으며, 물의 흡수파장대역인 1430 nm 부근에서는 0.85~0.87로 높게 나타났다. 3. 각 시료들의 반사 스펙트럼을 이용하여 세 가지 파장 영역에 대해 PLS회귀모델과 MLR 모델에 의한 함수율 예측 모델을 개발하였다. 모든 시료에서 PLS회귀모델이 MLR 회귀 모델보다 예측성능이 우수하였다. 4. PLS회귀 모델에서 전처리 효과를 분석한 결과, 시료의 입도에 따른 흡광도의 차이를 보정하기 위해 평활화, 미분, MSC, SNV 등의 전처리가 필요한 것으로 판단되었다. 5. 전체시료에 대해 함수율 예측을 위한 PLS회귀모델을 개발한 결과 400~2500nm영역에서의 개발된 모델의 예측성능은 $R^2$=0.9986, SEP=0.2166, 900~1700nm영역에서의 모델은 $R^2$=0.9985, SEP=0.2233이었으며 550~950nm 영역에서의 모델은 $R^2$=0.9838, SEP=0.7405로 나타났다. 각 시료의 종류별로 회귀모델을 개발할 경우 상기 결과보다 SEP가 더욱 작게 나타났다. 6. 이 연구 결과에 의하면 현재 시판되고 있는 실시간 분광기를 이용할 경우 시료의 입도에 무관한 온라인 함수율 측정장치의 개발이 가능할 것으로 판단된다.

  • PDF