• 제목/요약/키워드: 언어 종류

검색결과 367건 처리시간 0.028초

KoBERT와 KR-BERT의 은닉층별 통사 및 의미 처리 성능 평가 (How are they layerwisely 'surprised', KoBERT and KR-BERT?)

  • 최선주;박명관;김유희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.340-345
    • /
    • 2021
  • 최근 많은 연구들이 BERT를 활용하여, 주어진 문맥에서 언어학/문법적으로 적절하지 않은 단어를 인지하고 찾아내는 성과를 보고하였다. 하지만 일반적으로 딥러닝 관점에서 NLL기법(Negative log-likelihood)은 주어진 문맥에서 언어 변칙에 대한 정확한 성격을 규명하기에는 어려움이 있다고 지적되고 있다. 이러한 한계를 해결하기 위하여, Li et al.(2021)은 트랜스포머 언어모델의 은닉층별 밀도 추정(density estimation)을 통한 가우시안 확률 분포를 활용하는 가우시안 혼합 모델(Gaussian Mixture Model)을 적용하였다. 그들은 트랜스포머 언어모델이 언어 변칙 예문들의 종류에 따라 상이한 메커니즘을 사용하여 처리한다는 점을 보고하였다. 이 선행 연구를 받아들여 본 연구에서는 한국어 기반 언어모델인 KoBERT나 KR-BERT도 과연 한국어의 상이한 유형의 언어 변칙 예문들을 다른 방식으로 처리할 수 있는지를 규명하고자 한다. 이를 위해, 본 연구에서는 한국어 형태통사적 그리고 의미적 변칙 예문들을 구성하였고, 이 예문들을 바탕으로 한국어 기반 모델들의 성능을 놀라움-갭(surprisal gap) 점수를 계산하여 평가하였다. 본 논문에서는 한국어 기반 모델들도 의미적 변칙 예문을 처리할 때보다 형태통사적 변칙 예문을 처리할 때 상대적으로 보다 더 높은 놀라움-갭 점수를 보여주고 있음을 발견하였다. 즉, 상이한 종류의 언어 변칙 예문들을 처리하기 위하여 다른 메커니즘을 활용하고 있음을 보였다.

  • PDF

영어 말하기, 쓰기 학습자를 위한 문법 오류 검출 시스템 (Grammar Error Detection System for Learners of Spoken and Written English)

  • 서홍석;이성진;이진식;이종훈;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.136-139
    • /
    • 2011
  • 외국어 교육의 필요성이 강조되고 그에 대한 요구가 늘어남에 따라 언어 교육의 기회를 늘리고 비용을 줄이기 위해 컴퓨터 기반의 다양한 기술들의 요구 역시 증가하고 개발되고 있다. 언어 능력 개발의 중요한 요소로서 문법 교육에 대한 컴퓨터 지원 기술 연구가 활발히 진행되고 있다. 본 연구에서는 문법 오류 시뮬레이션을 통해 문법 오류 패턴 데이터베이스를 구축하고 이들 패턴과 사용자 입력의 패턴 매칭으로 생성된 자질 벡터로 기계 학습을 하여 문법성 확인을 했다. 문법성 확인 결과에 따라 오류 종류에 따른 상대 빈도를 고려하여 오류 종류를 분류했다. 또 말하기와 쓰기 작업의 서로 다른 특성을 반영하기 위해 말하기 작업과 쓰기 작업에 대한 두 개의 다른 말뭉치가 학습에 이용 되었다.

  • PDF

.NET 언어를 위한 중간 언어 번역기 (An Intermediate Language Translator for .NET Languages)

  • 최성규;박진기;이양선
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.533-536
    • /
    • 2003
  • 자바는 썬 마이크로시스템즈사가 개발한 언어로서 현재 가장 널리 사용되는 프로그래밍 언어 중 하나이며, 컴파일러에 의해 플랫폼에 독립적인 바이트코드를 바이너리 형태로 가지고 있는 클래스 파일을 생성하면 JVM에 의해 어떠한 하드웨어나 운영체제에 상관없이 수행이 가능한 플랫폼 독립적인 언어이다. 마이크로소프트사는 .NET 플랫폼을 개발하면서 자바 언어에 대응하기 위해 C# 프로그래밍 언어를 만들었다. C#은 C/C+.의 강력함과 자바나 비주얼 베이직의 높은 생산성을 매우 효과적으로 결합한 프로그래밍 언어이다. C#은 컴파일 과정을 거치면 자바의 바이트코드와 같은 중간 언어인 MSIL코드를 갖는 파일을 출력하게 되는데, C# 이외에도 모든 .NET 언어들은 컴파일과정을 거치면서 MSIL 코드를 얻기 때문에 여러 .NET 언어들을 이용해서 하나의 응용 프로그램을 만들 수 있다. 본 논문에서는 임베디드 시스템에서의 적용을 위해 C#을 컴파일 하여 나오는 중간 언어 형태인 MSIL 코드를 자바의 중간 언어의 한 종류인 Oolong 코드로 변환해 줌으로서 C#으로 구현된 프로그램이 자바 플렛폼에서 JVM에 의해 실행되도록 하는 중간 언어 번역기를 구현하였다.

  • PDF

2-level grammar를 이용한 교육용 프로그래밍 언어 (The educational programming language based on 2-level grammar)

  • 오솔길;박성빈
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.29-30
    • /
    • 2017
  • W-grammar(Van Wijngaarden grammar)[1].란 형식 문법의 한 종류인 문맥 자유 문법(Context-free grammar, CFG)의 대안으로, 두 개의 CFG가 서로 상호작용하면서 언어를 정의하도록 구성된 문법을 말하며 그 구성상의 특징을 감안하여 2-level grammar라고도 부른다. 현재 많은 프로그래밍 언어는 CFG를 기반으로 구성되어 있는데, 본 연구에서는 W-grammar로 교육용 프로그래밍 언어를 정의하여 CFG 기반이 아닌 W-grammar 프로그래밍 언어의 진입점을 제공함과 동시에 기저의 문법에 따른 계산가능성에 대해서 연구하는 토대를 쌓는 것을 목표로 한다.

  • PDF

통합 에이전트 구축 언어를 지원하는 지능형 에이전트 쉘의 개발 (Development of An Intelligent Agent Shell Supporting An Integrated Agent Building Language)

  • 장혜진
    • 한국정보처리학회논문지
    • /
    • 제6권12호
    • /
    • pp.3548-3558
    • /
    • 1999
  • 여러 종류의 기존의 다중 에이전트 프레임웍들(multi-agent frameworks)이 에이전트의 지적인 능력의 표현을 위하여 고수준의 지식 표현 언어를 지원한다. 하지만 그들의 에이전트 프로그래밍 인터페이스는 지식 표현 언어 뿐 아니라 어떤 다른 범용의 프로그래밍 언어들의 사용을 요구한다. 일반적으로 고수준 지식 표현 언어와 범용의 프로그래밍 언어간에는 언어의 수준 및 자료 표현 모델에 있어서 상당한 차이가 있으며, 그런 차이는 지능형 에이전트의 개발에 필요한 요소들의 결합에 관련된 문제점들을 발생시킨다. 본 논문은 그런 문제점들의 극복을 위해 개발한 새로운 유형의 지능형 에이전트 쉘 INAS(INtelligent Agent Shell) 버전 2에 대한 것이다. 지능형 에이전트의 개발을 위하여 고수준의 지식 표현 언어와 범용 프로그래밍 언어를 결합하여 사용해야 하는 기존의 에이전트 프레임웍들과 달리 INAS 버전 2는 그 자체만으로 에이전트들을 구축할 수 있는 고수준의 통합 에이전트 구축 언어를 지원한다. 따라서 INAS 버전 2를 사용한 지능형 에이전트의 개발은 지능형 에이전트의 개발에 필요한 요소들의 결합에 관련된 기존의 에이전트 프레임웍들의 문제점들을 겪지 않는다. 몇 종류의 지능형 에이전트들의 개발을 통하여 INAS 버전 2의 통합 에이전트 구축 언어가 지능형 에이전트들의 개발에 효과적 임을 경험할 수 있었다.

  • PDF

상표지로서의 부사 '거의' (Adverbs as Aspectual Markers)

  • 송현석;이정민
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.150-154
    • /
    • 2000
  • 동사의 종류와 곡용, 논항의 종류와 격 등 문장의 상을 결정하는 요인들은 여러 가지이다(Tenny 1994). 그러나 실제 자연언어처리에서 상 결정 요소들의 복잡한 조합은 기계가 문장의 상을 파악하는 작업을 더욱 어렵게 만들뿐이다. 본 논문에서는 다양한 상 결정 요인을 참조하지 않고 특정 부류의 부사에 의존하여 문장의 상을 결정하는 방법을 제안하고자 한다. 부사는 이른바 불변화사로 분류하는 품사 중의 하나로 통사적 혹은 형태소적 규칙의 적용을 받아 변형하지 않는다. 따라서 기계는 복잡한 형태소 분석을 통하지 않는 부사를 포착하기가 쉽다. 이와 같은 이점을 지닌 부사가 통사적 분석을 토대로 파악할 수 있는 문장의 의미인 상에 대한 표지임을 증명하여 자연언어처리의 간결함을 확보하고자 하는 것이 본 논문의 목적이다.

  • PDF

흐름 제어 언어 분석 도구 설계 및 구현 (Design and Implementation of Analysis Tool for Flow Control Language)

  • 김선주;김태완;장천현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.634-636
    • /
    • 2002
  • 산업분야에서 자동화 시스템은 자동설계, 생산설비의 관리, 품질검사 등 각종 생산과 관련되어 모든 일을 자동으로 처리 할 수 있도록 하여 생산성을 향상시킨다. 일반적으로 자동화 시스템에서 사용되는 소프트웨어는 사용할 수 있는 흐름 제어 언어가 2종류 이하로 제한이 되어 있고, 동일한 시스템에서 언어의 혼용을 통한 시뮬레이션이 불가능하다. 이에 본 논문에서 혼용 사용이 가능한 흐름 제어 언어 통합 분석기를 제시한다. 고급언어 형태의 ST를 기초로 확장한 언어인 EST를 제시하고 통합 분석기를 위하여 그래픽언어를 EST로 변환하고 흐름제어 규칙 작성이 가능한 FBD 편집기, FBD 편집기에서 출력한 EST를 다시 변환하는 EST-IL 변환기를 설계 및 구현한다. EST를 기준으로 그래픽 언어를 통합하는 통합 분석기는 흐름 제어 언어의 통합 시뮬레이션이 가능하다.

  • PDF