• 제목/요약/키워드: sentence representation

검색결과 58건 처리시간 0.022초

Visual Sentences for Educational Math Games

  • Chang, Hee-Dong
    • 한국게임학회지
    • /
    • 제8권1호
    • /
    • pp.32-38
    • /
    • 2011
  • 수학적 명제들을 사용하는 수학교육용 게임의 학습 도움말이나 안내말은 그래픽 우선 인지스타일을 가진 게임세대의 학습자를 위해 그래픽적인 형태로 표현하는 것이 필요하다. 본 논문에서는 수학 명제들에 대한 객체 기반 비주얼적 표현방법을 제안하였다. 이 표현방법은 단어들과 함께 그래픽적 기호들과 수학적 기호들 사용하여 객체 기반적인 표현방법의 규칙을 갖고 있다. 그래서 수학적 의미를 정확하게 표현하거나 이해하기가 쉽다. 그리고 학습자가 내용을 빠르게 읽을 수 있다. 제안된 방법은 게임 세대 학습자들에게 교육용 게임을 통해 수학 학습의 스캐폴딩으로써 도움을 받기가 좋다.

  • PDF

람다 계산과 통합문법에 의거한 ′시간명사구+에′의 의미 기술

  • 손현정
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 학술대회 발표논문집
    • /
    • pp.77-86
    • /
    • 2002
  • The aim of this study is to construct a formal semantic representation of the korean adverbial phrase(AdvP) composed of NP of t imp and of the adverbial particle OE. This AdvP establishes various relations between the time indicated by NP and the time of the event described by the sentence, depending on the type of th first and the aspectual property of the second. To represent formally the semantic functions of this AdvP, we used lambda-calculus and unification grammar in the way proposed by Renaud(1996).

  • PDF

Automatic Categorization of Islamic Jurisprudential Legal Questions using Hierarchical Deep Learning Text Classifier

  • AlSabban, Wesam H.;Alotaibi, Saud S.;Farag, Abdullah Tarek;Rakha, Omar Essam;Al Sallab, Ahmad A.;Alotaibi, Majid
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.281-291
    • /
    • 2021
  • The Islamic jurisprudential legal system represents an essential component of the Islamic religion, that governs many aspects of Muslims' daily lives. This creates many questions that require interpretations by qualified specialists, or Muftis according to the main sources of legislation in Islam. The Islamic jurisprudence is usually classified into branches, according to which the questions can be categorized and classified. Such categorization has many applications in automated question-answering systems, and in manual systems in routing the questions to a specialized Mufti to answer specific topics. In this work we tackle the problem of automatic categorisation of Islamic jurisprudential legal questions using deep learning techniques. In this paper, we build a hierarchical deep learning model that first extracts the question text features at two levels: word and sentence representation, followed by a text classifier that acts upon the question representation. To evaluate our model, we build and release the largest publicly available dataset of Islamic questions and answers, along with their topics, for 52 topic categories. We evaluate different state-of-the art deep learning models, both for word and sentence embeddings, comparing recurrent and transformer-based techniques, and performing extensive ablation studies to show the effect of each model choice. Our hierarchical model is based on pre-trained models, taking advantage of the recent advancement of transfer learning techniques, focused on Arabic language.

의료용 전문가 시스템에서 추론에 관한 연구 (A Study on Reasoning for Medical Expert Systems)

  • 김진상;신양규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권2호
    • /
    • pp.359-367
    • /
    • 1999
  • 본 논문에서는 의료용 전문가 시스템에 사용 가능한 의료지식을 수리논리적으로 표현하고 이에 대한 연역 및 진단추론을 행하는 방법을 제시하였다. 문제해결을 위해서는 연역추론을 행하며 원인의 규명을 위해서는 진단추론을 행하지만 일차논리 언어로 표현된 의료지식에서 두 종류의 추론을 병행할 수 있다. 그리고 의료지식에 자주 발생하는 시간에 따라 가변적인 결과의 추론방법도 함께 고찰하였다.

  • PDF

확률 발음사전을 이용한 대어휘 연속음성인식 (Stochastic Pronunciation Lexicon Modeling for Large Vocabulary Continous Speech Recognition)

  • 윤성진;최환진;오영환
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.49-57
    • /
    • 1997
  • 본 논문에서는 대어휘 연속음성인식을 위한 확률 발음사전 모델에 대해서 제안하였다. 확률 발음 사전은 HMM과 같이 단위음소 상태의 Markov chain으로 이루어져 있으며, 각 음소 상태들은 음소들에 대한 확률 분포 함수로 표현된다. 확률 발음 사전의 생성은 음성자료와 음소 모델을 이용하여 음소 단위의 분할과 인식을 통해서 자동으로 생성되게 된다. 제안된 확률 발음 사전은 단어내 변이와 단어간 변이를 모두 효과적으로 표현할 수 있었으며, 인식 모델과 인식기의 특성을 반영함으로써 전체 인식 시스템의 성능을 보다 높일 수 있었다. 3000 단어 연속음성인식 실험 결과 확률 발음 사전을 사용함으로써 표준 발음 표기를 사용하는 인식 시스템에 비해 단어 오류율은 23.6%, 문장 오류율은 10% 정도를 감소시킬 수 있었다.

  • PDF

한국어 서사 텍스트 처리의 다중 표상과 구성 통합 이론: 주제어 연속성에 대한 양태 어미의 형태 통사적, 담화 화용적 기능 (A Multi-level Representation of the Korean Narrative Text Processing and Construction-Integration Theory: Morpho- syntactic and Discourse-Pragmatic Effects of Verb Modality on Topic Continuity)

  • 조숙환;김세영
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.103-118
    • /
    • 2006
  • 본 논문은 구성 통합 이론(Kintsch, 1988, Singer & Kintsch 2001, Graesser, Gernsbacher, & Goldman, 2003)을 토대로 주제어 연속성의 강도와 양태 어미 단서가 이야기 서사 텍스트에 쓰인 공주어 해석에 어떻게 이용되는지 검토했다. 실험 연구에는 명시적 조건과 중립적 조건 등 두 조건이 생성되었는데, 명시적 조건에는, 중립적 조건과는 달리, 주제어가 일관성 있게 유지되었고 또한 동사 어미의 형태 통사적 특징이 인칭과 일치되었다. 이 실험에는 59명의 대학생들이 다음 세 가지 과제에 참여했다. 실험은 첫째, 주어가 생략된 경우 피험자가 시험 문장(target sentence)을 읽는데 소요되는 시간을 측정했고, 둘째, 공주어의 해석, 즉, 선행사 (참조대상) 선택에 소요되는 반응 시간을 측정했으며, 셋째, 선행사 선정의 정답율을 분석했다. 실험 결과, 텍스트 처리과정에서 인칭과 같은 형태 통사적 조건이 유의미한 결과를 낳았으며, 또한, 주제어 연속성 조건의 효과가 형태 통사 조건에 따라 선택적인 양상을 보였다. 즉, 주제어가 지속적으로 연결되는 동안 화용적 맥락, 담화자의 사전 정보, 추론 등과 같은 총체적 정보와 주어, 동사 어미의 인칭과 같은 어휘적, 지엽적인 형태 통사적인 정보가 선행사 해석에 핵심적인 역할을 했다. 따라서, 이 실험 결과는 최소주의 가설 보다 공명 기반 모델을 지지한다.

  • PDF

구어체 말뭉치의 어휘 사용 특징 분석 및 감정 어휘 사전의 자동 구축 (Analyzing Vocabulary Characteristics of Colloquial Style Corpus and Automatic Construction of Sentiment Lexicon)

  • 강승식;원혜진;이민행
    • 스마트미디어저널
    • /
    • 제9권4호
    • /
    • pp.144-151
    • /
    • 2020
  • 모바일 환경에서 의사소통은 SMS 문자로 이루어진다. SMS 문자에서 사용되는 어휘들은 일반적인 한국어 문어체 문장에서 사용되는 어휘들과 다른 부류의 어휘들이 사용될 것으로 예상할 수 있다. 예를 들어, 일반적인 문어체의 경우 문장의 시작이나 끝맺음이 올바르고 문장의 구성요소가 잘 갖추어졌지만, SMS 문자 말뭉치의 경우 구성요소를 생략 및 간략한 표현으로 대체하는 경우가 많다. 이러한 어휘 사용 특성을 분석하기 위하여, 기존에 구축된 구어체 말뭉치와 문어체 말뭉치를 사용한다. 실험에서는 구어체 말뭉치인 SMS 문자 말뭉치와 네이버 영화평 말뭉치, 그리고 문어체 말뭉치인 한국어 문어체 원시 말뭉치의 어휘사용 특성을 비교-분석한다. 말뭉치별 어휘 비교 및 분석을 위하여 품사 태그 형용사(VA)를 기준으로 하였고, 공연강도를 측정하기 위해 변별적 공연어휘소 분석 방법론을 사용하였다. 그 결과 '좋-', '죄송하-', '즐겁-' 등 감정표현 형용사들이 SMS 문자 말뭉치에서 선호되는 반면, 네이버 영화평 말뭉치에서는 평가 표현과 관련된 형용사들이 선호되는 것을 확인할 수 있었다. 이러한 과정에서 추출된 공연강도가 높은 형용사를 기준으로 감정어휘 사전을 자동 구축하기 위하여 단어 임베딩 기법을 사용하였으며, 총 343,603개의 감성어휘를 자동 구축하였다.

양화사와 초점의 영향권 관계 (Scope Relations Between Quantifier and Focus)

  • 조유미
    • 인지과학
    • /
    • 제19권2호
    • /
    • pp.205-222
    • /
    • 2008
  • 양화문 안의 강 양화사와 약 양화사가 전제적/비전제적 해석과 관련된 영향권 다툼의 과정에서도 약 양화사가 주어이든 목적어이든지 표면 형태에서 VP로부터 멀리 떨어져 있는 경우에는 전제적 해석만을 받게 되어 양화문에 중의성이 발생하지 않는다. 그런데 타동사의 목적어나 비대격 주어 등의 약 양화사가 초점에 민감한 경우에 비전제적 해석이 가능하게 되어 중의적인 문장이 될 수 있다고 본다. 표면구조상 VP 밖에 위치한 약 양화사라도 초점화되면, 초점투사를 통하여 논리 형태에서 형성된 초점의 영향권(초점 구문) 안에 들어있게 되며, 이때의 초점이 가지는 영향권은 핵 영향권과 일치한다. 즉, 초점은 안에 있는 약 양화사가 핵 영향권 안에서 비전제적으로 해석되도록 하는 동력으로 작용한다고 볼 수 있다.

  • PDF

BERT-Fused Transformer 모델에 기반한 한국어 형태소 분석 기법 (Korean Morphological Analysis Method Based on BERT-Fused Transformer Model)

  • 이창재;나동열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권4호
    • /
    • pp.169-178
    • /
    • 2022
  • 형태소는 더 이상 분리하면 본래의 의미를 잃어버리는 말의 최소 단위이다. 한국어에서 문장은 공백으로 구분되는 어절(단어)의 조합이다. 형태소 분석은 어절 단위의 문장을 입력 받아서 문맥 정보를 활용하여 형태소 단위로 나누고 각 형태소에 적절한 품사 기호를 부착한 결과를 생성하는 것이다. 한국어 자연어 처리에서 형태소 분석은 가장 핵심적인 태스크다. 형태소 분석의 성능 향상은 한국어 자연어 처리 태스크의 성능 향상에 직결된다. 최근 형태소 분석은 주로 기계 번역 관점에서 연구가 진행되고 있다. 기계 번역은 신경망 모델 등으로 어느 한 도메인의 시퀀스(문장)를 다른 도메인의 시퀀스(문장)로 바꾸는 것이다. 형태소 분석을 기계 번역 관점에서 보면 어절 도메인에 속하는 입력 시퀀스를 형태소 도메인 시퀀스로 변환하는 것이다. 본 논문은 한국어 형태소 분석을 위한 딥러닝 모델을 제안한다. 본 연구에서 사용하는 모델은 기계 번역에서 높은 성능을 기록한 BERT-fused 모델을 기반으로 한다. BERT-fused 모델은 기계 번역에서 대표적인 Transformer 모델과 자연어 처리 분야에 획기적인 성능 향상을 이룬 언어모델인 BERT를 활용한다. 실험 결과 형태소 단위 F1-Score 98.24의 성능을 얻을 수 있었다.

피봇 기계번역시스템에서의 한국어생성을 위한 문제선정 (Style Selection for Korean Generation under the Pivot MT System)

  • 이종혁
    • 인지과학
    • /
    • 제1권2호
    • /
    • pp.279-291
    • /
    • 1989
  • 피봇 기계번역 시스템하에서 자연스런 출력문 생성을 위한 문체선정 문제는 표층 구문정보를 배제한 언어에 의존하지 않는 중간표현의 특성과 언어마다 문화적 차이에서 기인한 사고.발상의 차이로 인해 큰 어려움을 갖는다.본논문은 이들 문제점들을 해결하기 위한 시도로 첫째,출력문의 자연스런 문장구조를 크게 좌우하는 태의 화용적.문체적 결정과 한국어의 심한 피동 제약 가운데서의 태의 생성,둘째,한국어 특유의 표현양식을 위한 문장구조 변경,마지막으로 출력문에서 기능어의 의미 애매성을 제거하기 위한 실질어를 이용한 의미보완 등을 논한다.