Search | Korea Science

Iterative learning system design for relation extraction and knowledge base population (관계 추출 및 지식베이스 확장을 위한 반복 학습 시스템 설계)

Jeong, Yong-Bin;Nam, Sang-Ha;Kim, Ji-Seong;Lee, Min-Ho;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.185-189
- /
- 2019
관계추출기의 학습을 위해서는 많은 학습 데이터가 필요한데, 사람이 모으게 되면 많은 비용이 필요하여 원격 지도 학습을 이용한 데이터 수집이 많은 연구에서 사용되고 있다. 원격 지도 학습은 지식베이스를 기반으로 학습 데이터를 자동으로 만들어 내는 방식이기에 비용이 거의 들지 않지만, 지식베이스의 질과 양에 영향을 받는다. 본 연구는 원격 지도 학습을 기본으로 관계추출기의 성능을 향상 시키고, 지식베이스를 확장하는 방안으로 반복학습을 제안한다. 실험을 적은 비용으로 빠르게 진행하기 위해 반복학습을 자동화 하는 시스템을 설계하여 실험을 하였고, 이 시스템으로 관계추출기의 성능이 향상 될 수 있는 가능성을 보였으며, 반복학습을 통한 지식베이스의 확장 방안을 제시한다.
PDF

Improving a Korean Spell/Grammar Checker for the Web-Based Language Learning System (웹기반 언어 학습시스템을 위한 한국어 철자/문법 검사기의 성능 향상)

남현숙;김광영;권혁철
- Korean Journal of Cognitive Science
- /
- v.12 no.3
- /
- pp.1-18
- /
- 2001
The goal of this paper is the pedagogical application of a Korean Spell/Grammar Checker to the web-based language learning system for Korean writing. To maximize the efficient instruction of our learning system \\`Urimal Baeumteo\\` we have to improve our Korean Spell/Grammar Checker. Today the NLP system\\`s performance defends on its semantic processing capability. In our Korean Spell/Grammar Checker. the tasks accomplished in the semantic level are: the detection and correction of misused derived and compound nouns in a Korean spell-checking device and the detection and correction of syntactic and semantic errors in a Korean grammars-checking device. We describe a common approach to the partial parsing using collocation rules based on the dependency grammar. To provide more detailed semantic rules. we classified nouns according to their concepts. and subcategorized verbs referring to their syntactic and semantic features. Improving a Korean Spell/Gl-Grammar Checker makes our learning system active and intelligent in a web-based environment. We acknowledge the flaws in our system: the classification of nouns based on their meanings and concepts is a time consuming task. the analytic unit of this study is principally limited to the phrases in a sentence therefore the accurate parsing of embedded sentences remains a difficult problem to solve. Concerning the web-based language learning system. it is critically important to consider its interface design and structure of its contents.
PDF

Estimation of the streamflow during dry season using artificial neural network (인공신경망을 이용한 갈수기 수문량 산정)

Jung, Sung Ho;Cho, Hyo Seob;Kim, Jeong Yup;Lee, Gi Ha
- Proceedings of the Korea Water Resources Association Conference
- /
- 2019.05a
- /
- pp.377-377
- /
- 2019
본 연구에서는 LSTM 모형을 이용하여 갈수예보를 위한 월 단위 전망모형개발의 대상지점으로 이수 및 치수의 측면에서 아주 중요한 한강대교 지점을 선정하였으며 유량예보를 위하여 한강수계 19개 기상관측소의 월평균강수량, 월평균기온 및 3개 댐(소양,횡성,충주)의 월방류량을 사용하여 한강대교의 월 유량을 예측하였다. 1996년부터 2016년까지의 자료는 모형의 학습, 2017년 자료는 모형의 검증에 활용하였으며 가장 최근 건설된 횡성댐 방류량의 경우 1996년~2000년의 자료가 없으므로 2001년~2005년의 자료를 반복하여 학습에 활용하였다. 모형의 예측결과는 신경망 학습 시 한강대교 월유량자료를 포함한 결과와 미포함 결과를 도출하였으며, 모의결과의 재현성 분석을 위하여 월별 예측값과 실측값의 비율을 산정하였으며 1월부터 12월까지 12개 값을 평균하여 평균예측률을 산정하고 이를 홍수기(6월~10월) 및 비홍수기(1월~5월, 11월~12월)를 구분하였다. 딥러닝 학습 시 월유량을 포함한 경우의 예측결과가 학습 시 월유량을 포함하지 않았을 경우보다 상대적으로 좋은 정확도를 보이는 것으로 분석되었다. 다만, 신경망을 실제 갈수예보에 활용하기 위해서는 예측 기상정보인 월강우량, 월평균기온, 댐방류량만을 활용하여야 하는데 학습 시월유량 미포함 결과는 예측률이 매우 낮았으며, 신경망의 학습횟수가 늘어날 경우 학습자료 과적합(over-fitting)되어 정확도가 보다 저하되는 것으로 나타났다. 그래서 기존의 현재시간 t까지의 입력자료로 학습 후 익월(t+1)의 월유량을 예측하는 (t $\rightarrow$ t+1) 방법에서 현재시점 (t-n ~ t)까지의 입력자료를 이용하여 당월(t)의 월유량을 산정하는 (t$\rightarrow$t) 방법으로 재학습 후 모형검증을 수행한 결과 전술한 익월(t+1) 유량을 예측한 결과보다 재현성이 훨씬 향상된 것으로 분석되며평균예측률이 0.99로 홍수기 및 비홍수기에서도 뛰어난 정확성을 보이고 있다.
PDF

A Representation Model of Human-Computer Interactions in Storuboard (스토리보드에서의 학습자와 컴퓨터간의 상호작용 표현기법)

이근백;예홍진
- Proceedings of the Korean Information Science Society Conference
- /
- 1998.10c
- /
- pp.697-699
- /
- 1998
멀티미디어 교수/학습 자료들을 제작함에 있어서 학습자가 컴퓨터와의 상호작용을 통해 직접 학습과정에 참여할 수 있도록 하기 위하여 시나리오의 내용에 따라 각각의 멀티미디어 요소를 정의하고 화면에 배치하는 것은 물론 시간흐름에 따라 화면상에서 이루어지는 사용자와의 상호작용을 스토리보드에 손쉽게 표현할 수 있어야 한다. 이를 위하여 본 논문에서는 스토리보드 작성기를 개발함에 있어서, 화면상에서 이루어지는 학습자와 컴퓨터간의 상호작용을 스토리보드에 표현하기 위한 모델을 제안하고, 그에 따른 스토리보드 작성기의 주요 기능과 작업 화면들을 설명하고 있다.
PDF

Performance Comparison of Crawling Robots Trained by Reinforcement Learning Methods (강화학습에 의해 학습된 기는 로봇의 성능 비교)

Park, Ju-Yeong;Jeong, Gyu-Baek;Mun, Yeong-Jun
- Proceedings of the Korean Institute of Intelligent Systems Conference
- /
- 2007.04a
- /
- pp.33-36
- /
- 2007
최근에 인공지능 분야에서는, 국내외적으로 강화학습(reinforcement learning)에 관한 관심이 크게 증폭되고 있다. 강화학습의 최근 경향을 살펴보면, 크게 가치함수를 직접 활용하는 방법(value function-based methods), 제어 전략에 대한 탐색을 활용하는 방법(policy search methods), 그리고 액터-크리틱 방법(actor-critic methods)의 세가지 방향으로 발전하고 있음을 알 수 있다. 본 논문에서는 이중 세 번째 부류인 액터-크리틱 방법 중 NAC(natural actor-critic) 기법의 한 종류인 RLS-NAC(recursive least-squares based natural actor-critic) 알고리즘을 다양한 트레이스 감쇠계수를 사용하여 연속제어입력(real-valued control inputs)으로 제어되는 Kimura의 기는 로봇에 대해 적용해보고, 그 성능을 기존의 SGA(stochastic gradient ascent) 알고리즘을 이용하여 학습한 경우와 비교해보도록 한다.
PDF

A Study on the Storage Requirement and Incremental Learning of the k-NN Classifier (K_NN 분류기의 메모리 사용과 점진적 학습에 대한 연구)

이형일;윤충화
- The Journal of Information Technology
- /
- v.1 no.1
- /
- pp.65-84
- /
- 1998
The MBR (Memory Based Reasoning) is a supervised learning method that utilizes the distances among the input and trained patterns in its classification, and is also called a distance based learning algorithm. The MBR is based on the k-NN classifier, in which teaming is performed by simply storing training patterns in the memory without any further processing. This paper proposes a new learning algorithm which is more efficient than the traditional k-NN classifier and has incremental learning capability, Furthermore, our proposed algorithm is insensitive to noisy patterns, and guarantees more efficient memory usage.
PDF

Constructing Korean Named Recognition Dataset for Financial Domain Using Active Learning (능동 학습 기법을 활용한 한국어 금융 도메인 개체명 인식 데이터 구축)

Jeong, Dong-Ho;Heo, Min-Kang;Kim, Hyung-Chul;Park, Sang-Won
- Annual Conference on Human and Language Technology
- /
- 2020.10a
- /
- pp.82-86
- /
- 2020
딥러닝 모델의 성능은 데이터의 품질과 양에 의해 향상된다. 그러나 데이터 구축은 많은 비용과 시간을 요구한다. 특히 전문 도메인의 데이터를 구축할 경우 도메인 지식을 갖춘 작업자를 활용할 비용과 시간이 더욱 제약적이다. 능동 학습 기법은 최소한의 데이터 구축으로 모델의 성능을 효율적으로 상승시키기 위한 방법이다. 다양한 데이터셋이 능동 학습 기법으로 구축된 바 있으나, 아직 전문 도메인의 한국어 데이터를 구축하는 연구는 활발히 수행되지 못한 것이 현실이다. 본 논문에서는 능동학습기법을 통해 금융 도메인의 개체명 인식 코퍼스를 구축하였고, 이를 통해 다음의 기여가 있다: (1) 금융 도메인 개체명 인식 코퍼스 구축에 능동 학습 기법이 효과적임을 확인하였고, (2) 이를 통해 금융 도메인 개체명 인식기를 개발하였다. 본 논문이 제안하는 방법을 통해 8,043문장 데이터를 구축하였고, 개체명 인식기의 성능은 80.84%로 달성되었다. 또한 본 논문이 제안하는 방법을 통해 약 12~25%의 예산 절감 효과가 있음을 실험으로 보였다.
PDF

Object Detection Method Using Adversarial Learning on Domain Discriminator (도메인 판별기의 적대적 학습을 이용한 객체 검출 방법)

Hyeonseok Kim;Yeejin Lee
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2022.11a
- /
- pp.91-94
- /
- 2022
자율주행 자동차 개발 연구가 활발히 진행됨에 따라 객체 검출기의 성능이 중요하게 되었다. 딥러닝 기술의 발전하면서 객체 검출기의 성능도 큰 발전을 이루었다. 그에 따라 도로 위 차량 검출기의 성능도 발전하고 있으나 평상시 낮 도로상황에서 잘 동작하던 모델은 안개가 끼거나 밤 상황이 되면 제대로 동작하지 못하는 문제를 가지고 있다. 이유는 딥러닝 모델이 학습할 때 사용한 데이터셋의 정보에 따라 특정 도메인에 편향된 특성을 학습하기 때문이다. 따라서, 본 논문에서는 객체 검출 신경망에 도메인 판별기를 적용하여 이와 같은 도메인 이동 문제를 극복하는 모델을 제안한다. 모델의 성능을 Cityscapes 데이터셋과 Foggy Cityscapes 데이터셋을 사용하여 평가한 결과, 기존의 특정 도메인에서 학습한 모델보다 제안하는 모델의 검출 성능이 개선된다는 것을 확인하였다.
PDF

Novel Intent Category Discovery using Contrastive Learning (대조학습을 활용한 새로운 의도 카테고리 발견)

Seungyeon Seo;Gary Geunbae Lee
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.107-112
- /
- 2023
라벨 데이터 수집의 어려움에 따라 라벨이 없는 데이터로 학습하는 준지도학습, 비지도학습에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 그의 일환으로 Novel Intent Category Discovery(NICD) 문제를 제안하고 NICD 연구의 베이스라인이 될 모델을 소개한다. NICD 문제는 라벨이 있는 데이터와 라벨이 없는 데이터의 클래스 셋이 겹치지 않는다는 점에서 기존 준지도학습의 문제들과 차이가 있다. 제안 모델은 RoBERTa를 기반으로 두 개의 분류기를 추가하여 구성되며 라벨이 있는 데이터셋과 라벨이 없는 데이터셋에서 각각 다른 분류기를 사용하여 라벨을 예측한다. 학습방법은 2단계로 먼저 라벨이 있는 데이터셋으로 요인표현을 학습한다. 두 번째 단계에서는 교차 엔트로피, 이항교차 엔트로피, 평균제곱오차, 지도 대조 손실함수를 NICD 문제에 맞게 변형하여 학습에 사용한다. 논문에서 제안된 모델은 라벨이 없는 데이터셋에 대해 이미지 최고성능 모델보다 24.74 더 높은 정확도를 기록했다.
PDF

Classification Performance Comparison of Inductive Learning Methods : The Case of Corporate Credit Rating (귀납적 학습방법들의 분류성능 비교 : 기업신용평가의 경우)

이상호;지원철
- Journal of Intelligence and Information Systems
- /
- v.4 no.2
- /
- pp.1-21
- /
- 1998
귀납적 학습방법들의 분류성능을 비교 평가하기 위하여 대표적 분류문제의 하나인 신용평가 문제를 사용하였다. 분류기로서 사용된 귀납적 학습방법론들은 통계학의 다변량 판별분석(MDA), 기계학습 분야의 C4.5, 신경망의 다계층 퍼셉트론(MLP) 및 Cascade Correlation Network(CCN)의 4 가지이며, 학습자료로는 국내 3개 신용평가기관이 발표한 신용등급 및 공포된 재무제표를 사용하였다. 신용등급 예측의 정확도에 의한 분류성능을 평가하였는데 연도별 평가와 시계열 평가의 두 가지를 실시하였다. Cascade Correlation Network이 가장 좋은 분류성능을 보였지만 4가지 분류기들 사이에 통계적으로 유의한 차이는 발견되지 않았다. 이는 사용된 학습자료가 갖는 한계로 인한 것으로 추정되지만, 성능평가 과정에 있어 학습자료의 전처리 과정이 분류성과의 제고에 매우 유효함이 입증되었다.
PDF

Search Result 2,709, Processing Time 0.034 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)