• Title/Summary/Keyword: 과학언어

Search Result 1,524, Processing Time 0.028 seconds

Probing Semantic Relations between Words in Pre-trained Language Model (사전학습 언어모델의 단어간 의미관계 이해도 평가)

  • Oh, Dongsuk;Kwon, Sunjae;Lee, Chanhee;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.237-240
    • /
    • 2020
  • 사전학습 언어모델은 다양한 자연어처리 작업에서 높은 성능을 보였다. 하지만, 사전학습 언어모델은 문장 내 문맥 정보만을 학습하기 때문에 단어간 의미관계 정보를 추론하는데는 한계가 있다. 최근에는, 사전학습 언어모델이 어느수준으로 단어간 의미관계를 이해하고 있는지 다양한 Probing Test를 진행하고 있다. 이러한 Test는 언어모델의 강점과 약점을 분석하는데 효율적이며, 한층 더 인간의 언어를 정확하게 이해하기 위한 모델을 구축하는데 새로운 방향을 제시한다. 본 논문에서는 대표적인 사전 학습기반 언어모델인 BERT(Bidirectional Encoder Representations from Transformers)의 단어간 의미관계 이해도를 평가하는 3가지 작업을 진행한다. 첫 번째로 단어 간의 상위어, 하위어 관계를 나타내는 IsA 관계를 분석한다. 두번째는 '자동차'와 '변속'과 같은 관계를 나타내는 PartOf 관계를 분석한다. 마지막으로 '새'와 '날개'와 같은 관계를 나타내는 HasA 관계를 분석한다. 결과적으로, BERTbase 모델에 대해서는 추론 결과 대부분에서 낮은 성능을 보이지만, BERTlarge 모델에서는 BERTbase보다 높은 성능을 보였다.

  • PDF

Unpaired Korean Text Style Transfer with Masked Language Model (마스크 언어 모델 기반 비병렬 한국어 텍스트 스타일 변환)

  • Bae, Jangseong;Lee, Changki;Noh, Hyungjong;Hwang, Jeongin
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.391-395
    • /
    • 2021
  • 텍스트 스타일 변환은 입력 스타일(source style)로 쓰여진 텍스트의 내용(content)을 유지하며 목적 스타일(target style)의 텍스트로 변환하는 문제이다. 텍스트 스타일 변환을 시퀀스 간 변환 문제(sequence-to-sequence)로 보고 기존 기계학습 모델을 이용해 해결할 수 있지만, 모델 학습에 필요한 각 스타일에 대응되는 병렬 말뭉치를 구하기 어려운 문제점이 있다. 따라서 최근에는 비병렬 말뭉치를 이용해 텍스트 스타일 변환을 수행하는 방법들이 연구되고 있다. 이 연구들은 주로 인코더-디코더 구조의 생성 모델을 사용하기 때문에 입력 문장이 가지고 있는 내용이 누락되거나 다른 내용의 문장이 생성될 수 있는 문제점이 있다. 본 논문에서는 마스크 언어 모델(masked language model)을 이용해 입력 텍스트의 내용을 유지하면서 원하는 스타일로 변경할 수 있는 텍스트 스타일 변환 방법을 제안하고 한국어 긍정-부정, 채팅체-문어체 변환에 적용한다.

  • PDF

The Analysis of The Science Gifted's Characteristics Present in Linguistic Interactions in The Animal Development Inquiry Activity Program Based on Creative Problem Solving(CPS) Model (CPS 모형으로 개발된 동물 발생 실험수업에서 나타난 과학영재의 특성에 따른 언어적 상호작용 분석)

  • Ahn, Ju-Hyun;Chun, Mi-Ran;Park, Ki-Seok;Jeon, Sang-Hak
    • Journal of Gifted/Talented Education
    • /
    • v.20 no.1
    • /
    • pp.107-130
    • /
    • 2010
  • The purpose of this study is to investigate the characteristics that indicate scientifically gifted students by analyzing the verbal interactions in developmental biology inquiry-experimental classes. The subjects were 20 first-grade middle school students who were participating in SNU Science Gifted Education Center. In these experimental classes which were developed based on the CPS Model, we conducted a total of four experimental sessions of small group discussions, and the students' verbal interactions were both taped and video recorded, and observed. From the transcriptions, the patterns of question-answer and the characteristics of scientifically gifted students were analyzed. In the case of question-answer patterns, thinking questions appeared 3~6 times more frequently than the standard information questions. Especially, the case of experimental class I showed 40% more thinking questions as well as standard information questions that the other 3 classes. Through the results of analysing verbal interactions, we were able to find more detailed aspects to creativity that were not identifiable in paper-pencil examinations, as well as affective characteristics such as task commitment and leadership. We believe our findings upon inquiry will be of substantial significance in substituting for the paper-pencil examination in distinguishing and selecting scientifically gifted students.

A Review and Synthesis of Research in Educational Programming Language (교육용 프로그래밍 언어 연구 동향)

  • An, Sang-Jin;Seo, Young-Min;Lee, Young-Jun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.01a
    • /
    • pp.139-142
    • /
    • 2012
  • 최근 정보교육과정의 개정은 컴퓨터 과학의 기본 내용들을 정보 교과에 포함하였고, 그 컴퓨터 과학적인 사고를 실세계에 구현하는 것을 교육 목표로 하여 학생들에게 프로그래밍 교육을 실시하고 있다. 하지만 기존의 범용 프로그래밍 언어는 학습자가 습득하고 활용하는 데 많은 시간이 걸리고 인지적 부담이 큰 단점이 있었다. 이러한 단점을 보완하고자 교육용 프로그래밍 언어가 등장하였고, 교육용 프로그래밍 언어를 활용하여 교육적인 효과를 얻기 위한 다양한 연구가 진행되고 있다. 본 연구는 한국에서 진행된 교육용 프로그래밍 언어 관련 연구를 분석하여 연구의 의미를 발견하고 추후의 연구 방향을 제시하고자 한다.

  • PDF

Hypernetwork Memory-Based Model for Infant's Language Learning (유아 언어학습에 대한 하이퍼망 메모리 기반 모델)

  • Lee, Ji-Hoon;Lee, Eun-Seok;Zhang, Byoung-Tak
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.12
    • /
    • pp.983-987
    • /
    • 2009
  • One of the critical themes in the language acquisition is its exposure to linguistic environments. Linguistic environments, which interact with infants, include not only human beings such as its parents but also artificially crafted linguistic media as their functioning elements. An infant learns a language by exploring these extensive language environments around it. Based on such large linguistic data exposure, we propose a machine learning based method on the cognitive mechanism that simulate flexibly and appropriately infant's language learning. The infant's initial stage of language learning comes with sentence learning and creation, which can be simulated by exposing it to a language corpus. The core of the simulation is a memory-based learning model which has language hypernetwork structure. The language hypernetwork simulates developmental and progressive language learning using the structure of new data stream through making it representing of high level connection between language components possible. In this paper, we simulates an infant's gradual and developmental learning progress by training language hypernetwork gradually using 32,744 sentences extracted from video scripts of commercial animation movies for children.

C2JNI: An Embedded C to JNI Translator (C2JNI: 내장 C 언어에서 JNI 코드를 생성하는 변환기)

  • 유재우;최종명;김영철
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.11
    • /
    • pp.1551-1559
    • /
    • 2004
  • Java, a platform independent object-oriented programming language, is widely used, however it should be integrated with JNI to use system services or to reuse legacy systems. Though JNI provides the standard APIs which allow Java to be combined with C/$C^{++}$, it is very hard and cumbersome for developers to use JNI APIs. In order to address this problem, we introduce a translator named C2JNI, which converts the embedded C program into a JNI compatible C program. With C2JNI, developers can Integrate Java and C programs without JNI APIs, and it will reduce the complexity caused by JNI APIs.

Korean language model construction and comparative analysis with Cross-lingual Post-Training (XPT) (Cross-lingual Post-Training (XPT)을 통한 한국어 언어모델 구축 및 비교 실험)

  • Suhyune Son;Chanjun Park ;Jungseob Lee;Midan Shim;Sunghyun Lee;JinWoo Lee ;Aram So;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.295-299
    • /
    • 2022
  • 자원이 부족한 언어 환경에서 사전학습 언어모델 학습을 위한 대용량의 코퍼스를 구축하는데는 한계가 존재한다. 본 논문은 이러한 한계를 극복할 수 있는 Cross-lingual Post-Training (XPT) 방법론을 적용하여 비교적 자원이 부족한 한국어에서 해당 방법론의 효율성을 분석한다. 적은 양의 한국어 코퍼스인 400K와 4M만을 사용하여 다양한 한국어 사전학습 모델 (KLUE-BERT, KLUE-RoBERTa, Albert-kor)과 mBERT와 전반적인 성능 비교 및 분석 연구를 진행한다. 한국어의 대표적인 벤치마크 데이터셋인 KLUE 벤치마크를 사용하여 한국어 하위태스크에 대한 성능평가를 진행하며, 총 7가지의 태스크 중에서 5가지의 태스크에서 XPT-4M 모델이 기존 한국어 언어모델과의 비교에서 가장 우수한 혹은 두번째로 우수한 성능을 보인다. 이를 통해 XPT가 훨씬 더 많은 데이터로 훈련된 한국어 언어모델과 유사한 성능을 보일 뿐 아니라 학습과정이 매우 효율적임을 보인다.

  • PDF

A Comparative Analysis of the Linguistic Features of Texts used in the unit of Volcano and Earthquake in Korean Elementary and Secondary School Science Textbooks (초.중등 과학 교과서 화산과 지진 관련 단원 글의 언어 구조 비교 분석)

  • Shin, Myung-Hwan;Maeng, Seung-Ho;Kim, Chan-Jong
    • Journal of the Korean earth science society
    • /
    • v.31 no.1
    • /
    • pp.36-50
    • /
    • 2010
  • The purpose of this study is to investigate the aspect of variation of the texts in elementary and secondary school science textbooks at each grade level in terms of linguistic features. Data included some of the written texts related to 'Volcano and Earthquake' in Korean elementary and secondary school science textbooks in the seventh National Curriculum. The written texts were comparatively analyzed in terms of textual meaning, interpersonal meaning, and ideational meaning. Results revealed that there were different structures and linguistic features of the texts in school science textbooks depending on the grade level. Therefore, we argue that the differences in this study may make students feel difficult and strange when they read and understand science textbooks. We suggest that science teachers need to play the role of a mediator between students' understanding and the structural features of the scientific language in science learning.

Understanding of the Linguistic Features of Earth Science Treatises: Register Analysis Approach (지구과학 논문의 언어 특성 이해: 레지스터 분석)

  • Maeng, Seung-Ho;Shin, Myung-Hwan;Cha, Hyun-Jung;Ham, Seok-Jin;Shin, Hyeon-Jeong;Kim, Chan-Jong
    • Journal of the Korean earth science society
    • /
    • v.31 no.7
    • /
    • pp.785-797
    • /
    • 2010
  • This study identified the linguistic features of Earth science treatises through the analysis of the register. Data included three Korean treatises that were in geology, atmospheric science, and oceanography. The register of Earth science treatise was as follows: First, there were semantic, referential connections between Themes and Rhemes, that the messages and main points of the texts were expressed coherently and cohesively. Second, some predicates were used which were related to deductive inference, abductive inferences, or causal relation according to the genre elements of each text. The logical relations were not represented by the conjunctions but by the types of predicates. Third, most texts in the treatises showed interpersonally weak relationship using mental predicates related to possibilities, which meant scientists expressed indirectly their interpretation, explanation, or arguments. From these results, we argued that some activities of unpacking the language of science be included in science curriculum in order to improve students' literacy of science texts and understanding scientists' knowledge construction.