• Title/Summary/Keyword: 기술적 언어

Search Result 1,981, Processing Time 0.028 seconds

Construction of bilingually pre-trained language model from large-scaled Korean and English corpus (KE-T5: 한국어-영어 대용량 텍스트를 활용한 이중언어 사전학습기반 대형 언어모델 구축)

  • Shin, Saim;Kim, San;Seo, Hyeon-Tae
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.419-422
    • /
    • 2021
  • 본 논문은 한국어와 영어 코퍼스 93GB를 활용하여 구축한 대형 사전학습기반 언어모델인 KE-T5를 소개한다. KE-T5는 한국어와 영어 어휘 64,000개를 포함하는 대규모의 언어모델로 다양한 한국어처리와 한국어와 영어를 모두 포함하는 번역 등의 복합언어 태스크에서도 높은 성능을 기대할 수 있다. KE-T5의 활용은 대규모의 언어모델을 기반으로 영어 수준의 복잡한 언어처리 태스크에 대한 연구들을 본격적으로 시작할 수 있는 기반을 마련하였다.

  • PDF

Grammaire du nom $pr{\acute{e}}dicatif$ : $\underline{yaksok}$ et dictionnaire (약속의 문법 : 서술명사의 통사.어휘적 기술과 사전)

  • Hong, Chai-Song
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.361-366
    • /
    • 1992
  • 이 발표에서는 공시적 기술 위주의 대규모 언어사전으로서의 현대한국어 사전을 구상할 때 성찰이 요구되는 서술명사의 처리방안을 생각해 보고자 한다. 보통명사의 한 하류부류인 서술명사로 특징지어지는 명사 약속을 실례로, 그 통사 어휘적 기술을 시도하고, 그 결과를 활용하는, 언어학적으로 근거있는 명사의 사전항목 구성을 검토해 보는 것이다. 약속의 항목에 명시적으로 표시되어야 할 주요 어휘 통사적 속성을 제시하고 또 이들의 사전적 표상을 위한 몇 가지 실제적 제안을 소개하려고 한다.

  • PDF

Language Model Evaluation Based on Korean-English Empathetic Dialogue Datasets and Personality (한국어-영어 공감대화 데이터셋과 성격을 기반으로 한 언어모델 평가)

  • Young-Jun Lee;JongHwan Hyeon;DoKyong Lee;Joo-Won Sung;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.312-318
    • /
    • 2023
  • 본 연구는 다양한 대규모 언어 모델들의 한국어/영어 공감 대화 생성에서 성능을 실험적으로 비교 분석하는 것과 개인의 성향과 공감 사이에서의 상관 관계를 실험적으로 분석하는 것을 목표로 한다. 이를 위해, 한국어 공감 대화 데이터셋인 KorEmpatheticDialogues 를 구축하였고, personality-aware prompting 방법을 제안한다. 실험을 통해, 총 18개의 언어 모델들 간의 공감 대화 생성 성능을 비교 분석하였고, 개인의 성향에 맞춤형 제공하는 공감이 더 상호작용을 이끌어낼 수 있다는 점을 보여준다. 코드와 데이터셋은 게재가 허용되면 공개할 예정이다.

  • PDF

Developing Knowledge-Based Korean Syntactic Parser In terms of Mobile Configuration and Marker Theory (모빌구조와 표지 개념에 의한 지식기반적 한국어 구문분석기 개발)

  • Woo, Soon-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.184-190
    • /
    • 2003
  • 이 글은 활용 개념과 수형도를 근간으로 기술되어 온 한국어 문법 모델에 대한 대안으로 표지 개념과 모빌 구조를 제시하고 이를 바탕으로 개발된 한국어 구문분석기의 특성을 소개하고자 한다. 먼저, 조사와 어미를 독자적인 토사 단위인 표지로 처리함으로써 국부 구조의 통사 범주와 문법적 기능을 명확하고 일관되게 구분할 수 있으며, 모빌 구조는 한국어의(상대적) 자유 어순 현상을 효과적으로 기술할 수 있다. 이에 의거한 문법 모형은 언어학적 지식과 구문분석 엔진 사이의 독립성을 향상시킴으로써 향후 구문분석기의 성능 개선을 보다 용이하게 한다. 이 글에서 소개하는 구문분석기는 언어학자에 의해 구축된 지식을 이용한다는 점에서 지식기반적이라고 할 수 있는데 여기에는 동사의 하위범주화 정보, 첨어 유형정보, 의미정보가 핵심적인 언어 지식으로 이용된다. 모빌 구조에 의한 구문분석은 국부 구조를 단순화함으로써 구문적 중의성을 최소화하며, 의미정보는 주어진 술어의 논항적 자격을 검증하는 기준으로 작용하여 구문적 중의성을 감소시키고 정확한 분석을 가능하게 한다.

  • PDF

Design andf Implementation of the JavaScript Interpreter to Use Java Objects (자바객체를 사용할 수 있는 자바스크립트 해석기의 설계 및 구현)

  • 이창환;오세만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.394-396
    • /
    • 1999
  • 사용자와 개발자의 컴퓨터 환경은 시간이 지날수록 객체지향 환경으로 변화하고 있다. 초기에는 소프트웨어 개발단계에 객체지향 기술이 적용이 되었으나, 최근에는 운영체제와 같은 사용환경에도 기술이 적용되고 있다. 또한 과거 운영체제에서는 순차적이고 반복적인 작업을 쉽게 하기 위해 스크립트 언어를 많이 사용하였으나 이와 같은 스크립트 언어는 객체지향 방법이 적용된 사용환경에서는 적합하지 않은 무제점이 있다. 따라서 객체지향 기술을 사용할 수 있는 스크립트 언어에 대한 요구가 증가하였고, 자바스크립트도 그런 요구의 일부를 만족시키는 언어이다. 그러나 현재까지 사용되는 자바스크립트 해석기는 시스템에서 제공되는 객체만이 사용가능했으며 언어명세에도 기능확장을 위한 방법이 정의되어 있지 않다. 따라서 추가적인 기능확장을 위한 방법이 제공되지 않는 단점이 있다.

  • PDF

Pour un traitement lexicographique des proprietes syntaxiques et lexicales des noms coreens (언어사전의 명사항목 구성을 위한 통사 어휘 정보)

  • Hong, Chai-Song
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.96-98
    • /
    • 1989
  • 본 발표는 현대 한국어 어휘에 대한 공시적 시각 우위의 총체적 기술을 지향하는 대규모 언어사전의 명사 항목 내에 표시 되어야할 주요 통사 어휘 정보가 어떠한 것인가 하는 문제를 다룬다. 특히 기간 한국어 사전에서 소홀히 취급되었거나 무시되었으나, 언어학적으로는 중요하고, 따라서 언어 사전에 기록되는 것이 바람직한 한국어 명사의 통사 어휘적 속성의 일부를 소개해 보기로 한다.

  • PDF

음성언어연구와 음성 데이터베이스

  • Lee, Yong-Ju;Jeong, Yu-Hyeon;Han, Nam-Yong;Choe, Jun-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.211-221
    • /
    • 1992
  • 한국어 음성 및 언어정보처리를 위해 필수적인 우리말 음성 데이타베이스의 구축을 위하여 먼저 각국의 동향을 살펴보고, 용도, 필요성, 기술적 고려사항에 관하여 검토한후 현재 전자통신연구소에서 수행하고있는 관련연구활동및 계획을 소개한다.

  • PDF

XML 변환 및 포맷팅 기술

  • Jeong, Hoe-Gyeong
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.6
    • /
    • pp.18-27
    • /
    • 2001
  • XML은 임의 형태 문서, 임의 응용에 대해 일반화 마크업(Markup)을 정의하기 위한 방법을 표준화하는 메타 언어(Meta Language)로서 기술적 문서 마크업을 생성하는 기법과 문서의 지능적 내용이나 체계를 정의하기 위한 언어를 제공하며, 다양한 응용들 사이에 구조화된 데이터를 상호 교환하기 위한 도구와 다양한 입력으로부터 출력의 내용, 구조, 조직을 표준화하기 위한 방법을 제공한다.

  • PDF

Preliminary Analysis of Language Styles between South and North Korean Broadcastings (남북한 방송언어의 차이에 대한 기초 분석)

  • Lee, Chang-H.;Kim, Kyung-Il;Park, Jong-Min
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.9
    • /
    • pp.3311-3317
    • /
    • 2010
  • This study compared South and North Korean broadcasting languages to measure the language differences due to the long segregation. This study would provide fundamental database on the language uses between South and North Korea. The KLIWC analyzed the text that was selected from news clips of South and North Korean broadcasting agencies. The results showed that North Korean languages were significantly different from South in terms of affective, cognitive, and social words. In addition, North Korean broadcasting used more person pronoun and a part of speech than South Korean broadcasting. Psychological interpretations were provided based on the language differences.

음성정보처리 기술 개발 현황 및 전방

  • 김회린
    • Korea Information Processing Society Review
    • /
    • v.11 no.2
    • /
    • pp.25-32
    • /
    • 2004
  • 미국 MIT의 기술혁신 잡지인 테크놀로지 리뷰(Technology Review)는 2004년 2월호에서 미래를 변화시킬 10대 기술(10 emerging technologies that will change your world) 중 그 첫 번째로 만국어 번역 (Universal Translation)을 선정하였다. 만국어 번역은 통역자가 중간에서 어떤 음성언어를 상대방 언어로 즉시 통역해 주는 일을 컴퓨터가 자동으로 처리해 주는 것이다. 이 기술이 상용화되면 그 사회적 파급효과가 실로 지대한 꿈같은 기술로서이 기술의 핵심에는 음성정보처리 기술 및 언어정보처리 기술이 자리 잡고 있다.(중략)

  • PDF