• Title/Summary/Keyword: 언어모형

Search Result 391, Processing Time 0.026 seconds

Bayesian Model based Korean Semantic Role Induction (베이지안 모형 기반 한국어 의미역 유도)

  • Won, Yousung;Lee, Woochul;Kim, Hyungjun;Lee, Yeonsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.111-116
    • /
    • 2016
  • 의미역은 자연어 문장의 서술어와 관련된 논항의 역할을 설명하는 것으로, 주어진 서술어에 대한 논항 인식(Argument Identification) 및 분류(Argument Labeling)의 과정을 거쳐 의미역 결정(Semantic Role Labeling)이 이루어진다. 이를 위해서는 격틀 사전을 이용한 방법이나 말뭉치를 이용한 지도 학습(Supervised Learning) 방법이 주를 이루고 있다. 이때, 격틀 사전 또는 의미역 주석 정보가 부착된 말뭉치를 구축하는 것은 필수적이지만, 이러한 노력을 최소화하기 위해 본 논문에서는 비모수적 베이지안 모델(Nonparametric Bayesian Model)을 기반으로 서술어에 가능한 의미역을 추론하는 비지도 학습(Unsupervised Learning)을 수행한다.

  • PDF

The type of associative relationships of Thesaurus described in literature of science and technology (과학기술 문헌에 나타난 시소러스의 연관관계 유형에 관한 연구)

  • Song, Yoo-Hwa;Choe, Ho-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.117-122
    • /
    • 2011
  • 시소러스의 연관관계는 유형의 세분화에 관한 원칙과 방법론의 부재로 시소러스를 구축하는 기관에서 개별적인 분류를 사용하고 있다. 분류에 적용되는 패싯지시어 모형에 관한 연구는 계속 되고 있지만 그 타당성을 뒷받침 할 실증적 사례연구는 찾아볼 수 없다. 본 연구에서는 Inspec에서 구축한 시소러스 중에 일정 기준으로 선정한 우선어와 관련어를 대상으로 IEL에서 제공하는 문헌에서 두 용어가 동시에 출현하는 문장을 찾아 그 연관관계 모형을 제안한다.

  • PDF

Development of Diffusive Wave Rainfall-Runoff Model Based on CUDA FORTRAN (CUDA FORTEAN기반 확산파 강우유출모형 개발)

  • Kim, Boram;Kim, Hyeong-Jun;Yoon, Kwang Seok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.287-287
    • /
    • 2021
  • 본 연구에서는 CUDA(Compute Unified Device Architecture) 포트란을 이용하여 확산파 강우 유출모형을 개발하였다. CUDA 포트란은 그래픽 처리 장치(Graphic Processing Unit: GPU)에서 수행하는 병렬 연산 알고리즘을 포트란 언어를 사용하여 작성할 수 있도록 하는 GPU상의 범용계산(General-Purpose Computing on Graphics Processing Units: GPGPU) 기술이다. GPU는 그래픽 처리 작업에 특화된 다수의 산술 논리 장치(Arithmetic Logic Unit: ALU)로 구성되어 있어서 중앙 처리 장치(Central Processing Unit: CPU)보다 한 번에 더 많은 연산 수행이 가능하다. 이에 따라, CUDA 포트란기반 확산파모형은 분포형 강우유출모형의 수치모의 연산시간을 단축시킬 수 있다. 분포형모형의 지배방정식은 확산파모형과 Green-Ampt모형으로 구성되었고, 확산파모형은 유한체적법을 이용하여 이산화 하였다. CUDA 포트란기반 확산파모형의 정확성은 기존 연구된 수리실험 결과 및 CPU기반 강우유출모형과 비교하였으며, 연산소요시간에 대한 효율성은 CPU기반 확산파모형과 비교하였다. 그 결과 CUDA 포트란기반 확산파모형의 결과는 수리실험 결과 및 CPU기반 강우유출모형의 결과와 유사한 결과를 나타냈다. 또한, 연산소요시간은 CPU 기반 확산파모형의 연산소요시간보다 단축되었으며, 본 연구에 사용된 장비를 기준으로 최대 100배 정도 단축되었다.

  • PDF

A statistical journey to DNN, the second trip: Architecture of RNN and image classification (심층신경망으로 가는 통계 여행, 두 번째 여행: RNN의 구조와 이미지 분류)

  • Hee Ju Kim;Yu Jin Kim;Kisuk Jang;Yoon Dong Lee
    • The Korean Journal of Applied Statistics
    • /
    • v.37 no.5
    • /
    • pp.553-565
    • /
    • 2024
  • RNNs are models that play a pivotal role in understanding various forms of DNNs. They have evolved into Seq2Seq models and subsequently into Transformers, leading to the development of large language models (LLMs) that are currently the focus of significant interest. Nonetheless, understanding the operation of RNNs is not an easy task. In particular, the core models of RNNs, LSTM and GRU, are challenging to comprehend due to their structural complexity. This paper explores ways to understand the operation of LSTM and GRU. Additionally, to demonstrate specific use cases of LSTM and GRU, we applied them to the problem of handwritten digit classification using the MNIST dataset. We utilized a method of segmenting each image into multiple patches and applied bidirectional LSTM and bidirectional GRU. The results were then compared with those of CNN.

한중일영 다국어 어휘 데이터베이스의 모형

  • 차재은;강범모
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2002.06a
    • /
    • pp.48-67
    • /
    • 2002
  • This paper is a report on part of the results of a research project entitled "Research and Model Development for a Multi-Lingual Lexical Database". It Is a six-year project in which we aim to construct a model of a multilingual lexical database of Korean, Chinese, Japanese, and English. Now we have finished the first two-year stage of the project In this paper, we present the goal of the project, the construction model of items in the lexical database, and the possible (semi-)automatic methods of acquisition of lexical information. As an appendix, we present some sample items of the database as an i1lustration.

  • PDF

규칙기반과 신경망 모델을 결합한 한국어 글자-음소 변환 시스팀 개발에 관한 연구

  • Kim, Se-Hun;Lee, Ju-Heon
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.307-320
    • /
    • 1991
  • 본 연구는 한국어 음성합성 시스팀에서 한글 텍스트를 음소로 변환 시키는 규칙기반과 신경망을 결합한 한글-음소 변환 시스팀을 제안하고 이를 위해 시스팀 모델을 설계하고 시스팀의 각 구성요소들을 설명하며 한국어 음운 변동 규칙중 설측음화 데이타와 설측음화에 상충되는 데이타를 사용하여 시스팀을 실험하고 제안된 모형의 타당성을 분석한다.

  • PDF

Proposal for a New Korean Keyboard Layout (Q2. 5벌식 한글자만 배열 제안)

  • Lee, Yill-Byung
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.133-138
    • /
    • 1991
  • 새로운 한글 자판 배열이 제안되었다. 자판에서 키 선택을 위한 기본적인 원칙들과 유추되는 제안들이 간략하게 설명되었으며, 나아가 이들에 토대한 키 배열이 선택되었다. 가장 중요한 원칙은 한글에 대한 인지모형을 따라서 자음중에서 초성자와 종성자의 구분이 같은 키에서 Shift의 동작의 유무로 이루어지는 점이며, 따라서 2벌식과 3벌식의 중간 형태로 생각될 수 있으므로, 본 자판 배열은 2.5벌식으로 명명하였다. 구체적인 키들의 배열은 최근에 조사된 신빙성있는 현대 한글에 대한 자소 빈도수와 손가락에 대한 부하를 고려해서 결정되었다.

  • PDF

A study on Hangul writing behavior(II): an information processing approach (한글 필기 행동의 연구(II): 정보처리적 접근)

  • Yi, Kwang-Oh
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.461-468
    • /
    • 1993
  • 이광오[1]의 연구를 바탕으로 한글 필기 행동의 설명을 시도하였다. 한글 필기에 나타나는 실수에는 예기, 지속, 부가, 생략 등의 유형이 있었으며, 실수에 개입되는 단위로는 단어, 글자, 자모가 인정되었다. 필기에 필요한 기본단위로 글자표상을 가정하고, 심성어휘집에서의 부분적 표기정보 인출과 음소-자모 변환에 의해 글자표상이 생성되는 필기행동 모형에 대해 고찰하였다.

  • PDF

The Multi Objective Strategy Test Model for Electric Power Supply planing under Uncertainties - MOST Model (불확실성 하에서의 전력수급계획을 위한 다목적 전략평가모형 - MOST 모형)

  • 권영한;김재균
    • Proceedings of the Korea Society for Energy Engineering kosee Conference
    • /
    • 1993.05a
    • /
    • pp.106-111
    • /
    • 1993
  • 오늘날의 전력수급계획은 불확실성하에서의 다목적 의사결정과정으로 볼 수 있으며, 이러한 계획환경하에서는 하나의 최적해는 존재하지 않는다. 본 논문은 의사결정자가 여러 상충하는 목적들 사이의 최상의 계획안 또는 전략을 도출하기 위하여, 전략계획의 개념을 응용한 표준적인 전력수급계획체계를 제시하였으며, 분석모형으로서 다목적 전략평가모형 (MOST)을 개발하였다. 개발된 다목적 전략평가모형은 Trade-off 분석기법을 기초로 하고 있으며, 특히 C 언어로 프로그래밍 되어 있어서 Menu 방식에 의한 분석이 용이하다. 이 모형은 화면상에서의 속성간 Graphic 분석기능, Robust 계획안 및 옵션 도출기능, 위험도 및 계획안간 비교분석기능을 포함하고 있다.

  • PDF

Application of GIS Engine for Runoff Parameter Analysis (유출 매개변수 분석을 위한 GIS 엔진의 적용)

  • Kim, Sang-Ho;Choi, Keun-Ho;Kim, Seong-Joon
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2008.06a
    • /
    • pp.101-108
    • /
    • 2008
  • 본 연구의 목적은 분포형 추문모형에 있어 공간변수의 디테일함을 고려하기 위해 GIS와 결합된 SCS-CN 값 산정 모형을 개하는데 있다. 모형은 (주)한국공간정보통신의 GIS 소프트웨어 개발도구인 IntraMap/Objects를 사용하였고 마이크로소프트사의 닷넷 플랫폼 개발 언어인 C#으로 개발하였다. 모형의 입력자료인 토지이용도와 토양도의 지형학적 가공을 위해 클립(Clip), 디졸브(Dissolve), 인터섹션(Intersection)과 같은 지형전처리 모듈(GeoPreprocessing Module)을 개발하였다. 또한 전처리된 토지이용도(토지이용항목필드)와 토양도(추문학적 토양그룹필드)를 CN 값 기준도표에 매치시킴으로서 유역의 선행토양함수조건에 따른 분포형 CN 값 및 개략적인 유출량을 산정하는 모형을 개발하였다. 본 연구의 모형은 지형, 토양도 토지이용도, 토지피복도 변화에 따른 미래 유출량을 예측하는데 사용될 수 있을 것이다.

  • PDF