• Title/Summary/Keyword: 일반화 모델

Search Result 614, Processing Time 0.032 seconds

Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment (기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가)

  • Lim, Joon-Ho;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

Rules to control propagations in deriving spatial data models (공간데이터모델 유도에 따른 파급 처리 규칙)

  • 도순희;강혜경;이기준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.94-96
    • /
    • 2001
  • 기존의 대축척 지리정보 데이터베이스로 부터 새로운 소축적 지리정보 데이터베이스를 유도하는 방법 중의 하나는 일반화이다. 이는 대축적 공간데이터를 소축척에 적합하도록 변형시킨다. 즉, 일반화를 통해서 지리정보 데이터의 공간 및 비공간적 특성이 변형되고 그 결과 데이터 모델로 변하게 된다. 본 연구는 이러한 변형에 따른 파급효과를 제어할 수 있는 규칙들을 제시한다. 특히 여섯 가지 일반화 연산자들이 모델에 미치는 영향을 조사하여, 이를 바탕으로 모델 변형을 제어할 수 있는 규칙을 제시하였다.

  • PDF

A Study of Solving the Generalized Vehicle Routing Problem Using Reinforcement Learning (강화학습 기반의 차량 경로 문제 일반화 방안 연구)

  • Jung, Chul-Hwan;Kim, Kwang-Su;Kim, Han-Sol
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.705-707
    • /
    • 2022
  • 본 연구에서는 기존 차량 경로 문제(Vehicle Routing Problem)의 범위를 확장시켜 일반화된 차량 경로문제(Generalized Vehicle Routing Problem)를 제시하고, 이 문제를 해결하기 위한 강화학습 모델을 제안한다. 기존의 차량 경로 문제는 depot에서 각 node(또는 각 node에서 depot)의 단방향만 존재해 제한된 문제만을 해결할 수 있었다. 이 한계점을 극복하기 위해 depot을 제외한 모든 node가 서로 연결된 형태의 일반화된 차량 경로 문제를 정의하고 이를 해결하고자 한다. 차량 경로 문제는 NP-hard 문제로 최근에는 강화학습을 이용해 이를 해결하고자 하는 모델이 연구되고 있다. 본 연구에서는 새로 정의한 일반화된 차량 경로 문제를 해결하기 위한 강화학습 모델을 제안한다.

  • PDF

Sum-of-Basis-Functions Model As a Generalized Voice Source Model (일반화된 음원 모델로서 기저함수합계 모델)

  • 홍준모
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.55-60
    • /
    • 1994
  • 본 논문에서는 음원을 모델링하기 위한 새로운 음원 모델로서 기저함수합계 모델을 제안하고 그 모델의 변수를 추정하는 방법에 관하여 설명한다. 기존 모델들이 다양한 음원신호를 표현하는데 부족함이 많았던데 비해 기저함수합계 모델은 다양한 음원신호를 표현하기에 적합하며 ML 이라는 통일된 추정 방법을 통해 모델의 변수들을 구할 수 있다. 또한 기저함수합계 모델은 기존의 모델들을 포함하는 일반화된 음원 모델이 됨을 보인다.

  • PDF

Hyper-Geometric Distribution Software Reliability Growth Model : Generalizatio, Estimation and Prediction (초기하분포 소프트웨어 신뢰성 성장 모델 : 일반화, 추정과 예측)

  • Park, Jung-Yang;Yu, Chang-Yeol;Park, Jae-Hong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.9
    • /
    • pp.2343-2349
    • /
    • 1999
  • The hyper-geometric distribution software reliability growth model (HGDM) was recently developed and successfully applied to real data sets. The HGDM considers the sensitivity factor as a parameter to be estimated. In order to reflect the random behavior of the test-and-debug process, this paper generalizes the HGDM by assuming that the sensitivity factor is a binomial random variable. Such a generalization enables us to easily understand the statistical characteristics of the HGDM. It is shown that the least squares method produces the identical results for both the HGDM and the generalized HGDM. Methods for computing the maximum likelihood estimates and predicting the future outcomes are also presented.

  • PDF

Rules for Control Propagation of Geospatial Data Generalization (공간데이터 일반화의 파급을 처리하기 위한 규칙)

  • Kang, He-Gyoung;Li, Ki-Joune
    • Journal of Korea Spatial Information System Society
    • /
    • v.4 no.1 s.7
    • /
    • pp.5-14
    • /
    • 2002
  • The generalization of geospatial data is an important way in deriving a new database from an original one. The generalization of a geospatial object changes not only its geometric and aspatial attributes but also results in propagation to other objects along their relationship. We call it generalization propagation of geospatial databases. Without proper handling of the propagation, it brings about an inconsistent database or loss of semantics. Nevertheless, previous studies in the generalization have focused on the derivation of an object by isolating it from others. And they have proposed a set of generalization operators, which were intended to change the geometric and aspatial attributes of an object. In this paper we extend the definition of generalization operators to cover the propagation from an object to others. In order to capture the propagation, we discover a set of rules or constraints that must be taken into account during generalization procedure. Each generalization operator with constraints is expressed in relational algebra and it can be converted to SQL statements with ease. A prototype system was developed to verify the correctness of extended operators.

  • PDF

A Generalized Regression Neural Network Plasma Model for Semiconductor Process Optimization (반도체 공정 최적화를 위한 일반화된 회귀 신경망 플라즈마 모델)

  • Park, Sung-Jin;Kim, Byung-Whan
    • Proceedings of the KIEE Conference
    • /
    • 2000.07d
    • /
    • pp.2744-2746
    • /
    • 2000
  • 일반화된 회귀 신경망을 이용하여 반도체 공정 최적화를 위한 플라즈마를 모델링한다. 플라즈마는 Box-W린son 실험계획표에 의해 특성화되었으며, 여기에서 변화시킨 인자로는 소스전력, 압력, 척지지대의 위치, 그리고 염소의 유량이다. 총 24회의 실험이 수행이 되었으며, 플라즈마 변수는 Langmuir Probe를 이용하여 측정하였다. 측정된 주요 플라즈마 변수로는 전자밀도, 전자온도, 그리고 플라즈마 전위이다. 폭변수를 점진적으로 증가시켜 회귀신경망을 최적화하였으며. 최적화된 모델은 통계적인 반응표면모델과 비교하였다. 비교 결과, 회귀신경망은 반응표면모델에 상응하는 예측능력을 보이고 있음을 알 수 있었다.

  • PDF

Improvement of generalization of linear model through data augmentation based on Central Limit Theorem (데이터 증가를 통한 선형 모델의 일반화 성능 개량 (중심극한정리를 기반으로))

  • Hwang, Doohwan
    • Journal of Intelligence and Information Systems
    • /
    • v.28 no.2
    • /
    • pp.19-31
    • /
    • 2022
  • In Machine learning, we usually divide the entire data into training data and test data, train the model using training data, and use test data to determine the accuracy and generalization performance of the model. In the case of models with low generalization performance, the prediction accuracy of newly data is significantly reduced, and the model is said to be overfit. This study is about a method of generating training data based on central limit theorem and combining it with existed training data to increase normality and using this data to train models and increase generalization performance. To this, data were generated using sample mean and standard deviation for each feature of the data by utilizing the characteristic of central limit theorem, and new training data was constructed by combining them with existed training data. To determine the degree of increase in normality, the Kolmogorov-Smirnov normality test was conducted, and it was confirmed that the new training data showed increased normality compared to the existed data. Generalization performance was measured through differences in prediction accuracy for training data and test data. As a result of measuring the degree of increase in generalization performance by applying this to K-Nearest Neighbors (KNN), Logistic Regression, and Linear Discriminant Analysis (LDA), it was confirmed that generalization performance was improved for KNN, a non-parametric technique, and LDA, which assumes normality between model building.

Performance of KRM Dispersion Modelling System (KRM 대기확산모델의 수행능력)

  • 김용준
    • Proceedings of the Korea Air Pollution Research Association Conference
    • /
    • 1999.10a
    • /
    • pp.163-167
    • /
    • 1999
  • 컴퓨터가 일반화됨에 따라 대기질 관리 및 연구 분야에서 수치모델 이용이 보편화되고 있다. 현재 사용되는 대기오염 수치모델의 종류는 매우 다양하며, 구동에 필요한 전산시스템의 규모도 다양하다. 연구용 및 대형 모델들은 활용 분야가 넓고 신뢰도가 높은 반면 대형 전산시스템과 고도의 전문 인력을 요구한다. 그러나, 국내 대부분의 대기질 관련 기관의 사용 가능한 전산시스템과 담당 인력을 고려할 때 대형 모델의 사용이 일반화되기에는 한계가 있다.(중략)

  • PDF

균열암반에서의 양수시험자료 해석과 일반화 방사상 유동모델의 적용성 연구

  • 성현정;김용제;우남칠;이철우;김구영
    • Proceedings of the Korean Society of Soil and Groundwater Environment Conference
    • /
    • 2003.09a
    • /
    • pp.493-496
    • /
    • 2003
  • 이 연구는 우리나라 균열암반 대수층의 수리적 특성을 해석ㆍ평가하기 위하여 양수시험 해석해(Theis, 1935; Cooper-Jacob, 1946; Papadopulos-Cooper, 1967; Hantush, 1962a,b; Moench, 1985; Hantush-Jacob, 1955) 및 일반화 방사상 유동 모델을 이용하여 균열암반 대수층(화강암, 화산암, 변성암, 백악기퇴적암, 제3기 퇴적암에 굴착된 100개 조사공)에서 수행되어진 양수시험으로부터 얻은 122개의 양수시험자료(수위강하 자료)를 분석하였다. AQTESOLV 전산프로그램을 이용한 양수시험자료 분석에 의하면, 122개 자료중 86개(71%)의 자료들이 이 연구에 사용된 해석해와 일치하며, 양수시험자료 해석해 중에 누수(leaky) 및 경계조건(boundary condition)을 고려한 해석해들이 53개(43%)로 가장 많이 나타났다. 그러므로, 양수시험자료의 해석은 균열암반 대수층의 수리지질학적 특성에 적합한 개념모델의 설정이 중요하다. 일반화 방사상 유동(GRF)모델을 적용해보면, 122개의 자료중 77개(63%)의 자료들이 Barker(1988)의 표준곡선에 의한 차원(1.1차원-2.9차원)을 보여준다. 이중 44.2%에 해당하는 39개 자료가 1.1차원과 1.9차원 사이의 분할 유동차원을 보여주는 반면에 26개(6.5%)만이 Theis 이론에 맞는 2차원의 방사상 흐름을 보여주며, 38개(49.3%)는 2.1차원에서 2.9차원에 속한다. 따라서 우리나라 균열암반 대수층에서 지하수 유동은 대부분 분할차원의 유동을 보여주는 것으로 평가된다.

  • PDF