• Title/Summary/Keyword: 언어모형

Search Result 391, Processing Time 0.03 seconds

Semantic Parsing of Questions based on the Frame Semantics for Korean Question Answering System (한국어 질의응답 시스템을 위한 프레임 시멘틱스 기반 질의 의미 분석)

  • Hahm, Younggyun;Nam, Sangha;Choi, Key-Sun
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.122-127
    • /
    • 2016
  • 본 논문에서서는 질의응답 시스템을 위한 자연언어 질의 이해를 위하여 프레임 시멘틱스 기반 의미 분석방식을 제안한다. 지식베이스에 의존적인 질의 이해는 지식베이스의 불완전성에 의해 충분한 정보를 분석하지 못한다는 점에 착안하여, 질의의 술부-논항구조 및 그 의미에 대한 분석을 수행하여 자연언어 질의에서 나타난 정보들을 충분히 파악하고자 하였다. 본 시스템은 자연언어 질의를 입력으로 받아 이를 프레임 시멘틱스의 구조에 기반하여 기계가 읽을 수 있는 임의의 RDF 표현방식의 모형 쿼리를 생성한다.

  • PDF

Subdialogue Cues, Speaker Intention, and the Deletion of Hearer Arguments in Spoken Korean (대화체에서 부대화의 개시/종료 및 화자의 의도, 그리고 청자 논항의 생략)

  • Hong, Min-Pyo;Lee, Hyon-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.358-364
    • /
    • 1998
  • 본 연구는 한국어 대화인지모형을 구축하는 데 필요한 화용론적 지식에 관한 연구의 일환으로, 부대화의 개시 및 종료 시점에서 나타나는 담화 참여자의 의도 및 그 의도와 관련된 표층표지를 분석하고, 나아가 필수 논항 성분의 하나로서 대화체에서는 자주 생략되어 나타나는 청화자 논항의 의미복원을 위한 예비적 단계로서 술어의 어미 특성 및 화자의 언어행위 혹은 화행과 관련하여 청자 논항의 생략 유형을 분류하고 분석했다. 이러한 연구는 한국어 대화 에이전트를 개발하는데 있어 필수적인 단계로서 향후 대화체 이해시스템 연구에 기초적인 틀을 제공해 줄 수 있다.

  • PDF

Estimating the Number of Korean Words Based on Corpus (말뭉치를 이용한 한국어 단어 개수 추정)

  • Kim, Seong-Gi;Han, Geun-Sik
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.7
    • /
    • pp.1774-1782
    • /
    • 1998
  • 한 언어에서 사용된느 단어의 총 개수를 추정하는 것은 매우 어려운 작업이다. 최근 한 언어를 대표하는 것으로 생각되는 원문, 발화, 또는 기타 표본들의 뭉치인 말뭉치가 대규모로 구축됨으로 말뭉치를 기반으로 하여 한 언어의 총 단어 개수를 추정할 수 있게 되었다. 본 논문에서는 한국어 말뭉치에 나타난 단얼르 기반으로한국어 단어의 총 개수를 추정하는 방법을 제시하고 한국어 단어의 총 개수를 추정한다. 이와 더불어 한국어에서 가장 많은 수의 고유명사를 차지하는 한국사람 이름의 총 개수도 함께 추정한다. 단어 개수와 이름 개수의 추정방법은 빈도를 이용한 일반화된 선형모형을 적용하였다. 1000만 어절의 말뭉치를 이용하여 한국어의 총 단어를 추정한 결과 1,062,392개로 추정되었으며 한국사람 이름의 개수는 1,493,003개로 추정되었다.

  • PDF

한국어 피동형의 전산적 구현

  • 홍정하
    • Language and Information
    • /
    • v.4 no.1
    • /
    • pp.130-140
    • /
    • 2000
  • 이 논문에서는 피동접사 '이, 히, 리, 기'와 결합하는 피동형과 관련된 형태·통사적 문제를 전산적 관점에서 다룬다. 전산처리에서 이러한 피동형의 형태적 문제는 다음과 같다. 첫째, 피동접사 '이, 히, 리, 기'와 결합할 수 있는 타동사 어간의 분포가 제한되어 있다. 둘째, 타동사 어간이 결합할 수 있는 피동접사는 고정접사는 고정되어 있다. 셋째, 피동형 중에 타동사 어간과 피동접사가 결합할 대 형태적으로 변화하는 것들이 있다. '나누다/나뉘다, 모으다/모이다, 잠그다/잠기다, 자르다/잘리다'등이 여기에 해당된다. 이러한 형태적 문제 외에도 전산처리에서 피동형과 관련된 통사적 문제는 다음과 같다. 첫째, 능동형의 타동사가 피동형이 되면서 논항구조도 함께 변화한다. 둘째, 피동문의 행동주가 문장에서 생략되는 경우가 종종 있다. '문제가 쉽게 풀리었다','소리가 잘 들린다'등이 이에 해당된다. 이 논문은 한국어 피동접사 '이, 히, 라, 기'와 결합하는 피동형의 형태·통사적 특징을 전산적으로 처리하는 것이 목적이다. 이를 위해 표상모형으로는 자질구조를, 구현도구로는 Malage를 사용한다.

  • PDF

Improving the Performance of Statistical Context-Sensitive Spelling Error Correction Techniques Using Default Operation Algorithm (Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상)

  • Lee, Jung-Hun;Kim, Minho;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.165-170
    • /
    • 2016
  • 본 논문에서 제안하는 문맥의존 철자오류 교정은 통계 정보를 이용한 방법으로 통계적 언어처리에서 가장 널리 쓰이는 샤논(Shannon)이 발표한 노이지 채널 모형(noisy channel model)을 기반으로 한다. 선행연구에서 부족하였던 부분의 성능 향상을 위해 교정대상단어의 오류생성 및 통계 데이터의 저장 방식을 개선하여 Default 연산을 적용한 모델을 제안한다. 선행 연구의 모델은 교정대상단어의 오류생성 시 편집거리의 제약을 1로 하여 교정 실험을 하지만 제안한 모델은 같은 환경에서 더욱 높은 검출과 정확도를 보였으며, 오류단어의 편집거리(edit distance) 제약을 넓게 적용하더라도 신뢰도가 있는 검출과 교정을 보였다.

  • PDF

Korean Q&A Chatbot for COVID-19 News Domains Using Machine Reading Comprehension (기계 독해를 이용한 COVID-19 뉴스 도메인의 한국어 질의응답 챗봇)

  • Lee, Taemin;Park, Kinam;Park, Jeongbae;Jeong, Younghee;Chae, Jeongmin;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.540-542
    • /
    • 2020
  • 코로나 19와 관련한 다양한 정보 확인 욕구를 충족하기 위해 한국어 뉴스 데이터 기반의 질의응답 챗봇을 설계하고 구현하였다. BM25 기반의 문서 검색기, 사전 언어 모형인 KoBERT 기반의 문서 독해기, 정답 생성기의 세 가지 모듈을 중심으로 시스템을 설계하였다. 뉴스, 위키, 통계 정보를 수집하여 웹 기반의 챗봇 인터페이스로 질의응답이 가능하도록 구현하였다. 구현 결과는 http://demo.tmkor.com:36200/mrcv2 페이지에서 접근 및 사용을 할 수 있다.

  • PDF

Modified grid-based KIneMatic wave STOrm Runoff Model (ModKIMSTORM) (격자기반의 운동파 강우유출모형 KIMSTORM의 개선)

  • Jung, In-Kyun;Shin, Hyung-Jin;Park, Jin-Hyeog;Kim, Seong-Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.254-258
    • /
    • 2008
  • 본 연구는 격자기반 운동파 강우유출모형 KIMSTORM(grid-based KIneMatic wave STOrm Runoff Model)의 기능을 개선하고 적용성을 평가하는 것이다. KIMSTORM은 김성준(1998)이 개발한 분포형 강우유출모형으로 포화상태의 지표흐름 및 토양수분상태의 시공간적인 분포를 파악할 수 있다. UNIX C++ 언어로 개발되었으며, GRASS 형태의 ASCII Grid를 입출력하도록 구성되어 있는 모형으로 UNIX 운영체제에서 구동이 가능하다. 그러나 UNIX와 GRASS는 최근에 많이 이용되지 않는 추세로 KIMSTORM 모형을 이용한 홍수유출해석이 적극적으로 활용되는데 주요 제약사항이 되어 왔다. 본 연구에서는 KIMSTORM을 윈도우즈 환경에서 운영될 수 있도록 FORTRAN 90을 이용하여 재개발하였으며 주요개선 사항으로, ESRI ASCII Grid 형태의 GIS(geographic information system) 자료 입력, 물리적 침투모의 방법인 GAML (Green-Ampt and Mein- Larson) 적용, 공간강우 입력가능, 정렬 알고리즘을 이용한 계산속도의 개선, 모형 자료입력 등 전처리 기능개선, 계산결과의 자동평가 및 분포도출력 등 후처리 방식개선으로 요약할 수 있다. 개선된 모형 GAML에 의한 침투방법을 적용하여, 남강댐유역($2,293\;km^2$)의 6개 강우사상을 대상으로 결정계수, Nash & Sutcliffe 모형효율계수, 용적편차, 첨두유량의 상대오차, 첨두시간의 절대오차를 이용하여 적용성을 평가하였으며, 민감도분석결과 초기토양수분조건과 하천조도계수가 가장 큰 민감도를 나타내었다.

  • PDF

영재교육을 위한 물리과 수업 및 평가의 실제

  • 최정곤;박수경;이병세
    • Proceedings of the Korean Society for the Gifted Conference
    • /
    • 2003.11a
    • /
    • pp.185-186
    • /
    • 2003
  • 영재교육 프로그램 개발의 핵심적인 부분은 영재들에게 적절한 교육과정이며, 대표적인 영재교육과정모형으로 삼부심화학습모형(Enrichment Triad Model: ETM), 학교단위 심화학습모형(Schoolwide Enrichment Model: SEM), 자기주도적 학습모형 (Self-Directed Learning Model), 퍼듀 3단계 심화학습 모형(Purdue Three-Stage Enrichment Model) 등이 있다. 이들 모형에 대한 적용 연구가 일부 초등학교냐 중학교의 시범적인 속진 및 심화 프로그램 실시로 적용된 바는 있으나 정규 교육과정에서는 실시될 기회가 없었다. 국내에서도 2002년 영재교육법 시행령 적용 이후 과학영재학교가 지정되어 운영되고 있기에, 영재교육을 위한 모형을 정규 교육과정 및 교수-학습 과정에 적용하고 그 효과를 밝히는 연구가 필요하다. 이에 본 연구에서는 삼부심화학습모형을 적용하기 위한 구체적인 교수·학습 과정안을 개발하고, 이를 과학영재학교 물리수업에 적용하여 그 과정과 학생들의 인식을 분석하고자 한다. 본 연구의 대상은 과학영재고등학교 1학년 72명이며 검사결과 지능지수, 추리력, 수리력, 지각력 면에서 매우 우수한 집단으로 나타났다. 삼부심화학습모형을 실시한 기간은, 1단계 활동을 2주간 실시하였고, 2단계 활동은 4개월간 진행하고 있으며, 3단계 활동은 겨울방학을 이용하여 실시할 계획이다. 삼부심화학습모형에 의하면 1단계는‘일반 탐색 활동을 통한 심화 학습’단계로 정규 교육과정 속에 포함되어 있지 않은 새롭고, 흥미로운 주제나 지식 영역들에 학생들이 접할 수 있도록 설계된 일반적 탐구 혹은 탐색 경험들을 제공하는 것으로 구성된다. 점수를 종속변인으로 하여 회귀분석을 한 결과 TTCT 도형과 언어 검사 모두 WAIS 소검사중의 기본지식문제가 TTCT 전체점수에 가장 높은 영향력을 미쳤다. 지능이 높은 그룹과 낮은 그룹에 대해 WAIS 11개 소검사와 TTCT 전체점수와의 상관을 구한 결과, 지능이 높은 그룹에서는 유의미한 상관을 의미는 소검사가 거의 없었던 것과는 달리, 지능이 낮은 그룹에서는 결정성지능을 대표하는 소 검사와 TTCT 도형검사 점수간의 상관이 유의미하게 나타났다. 이상의 결과를 통해 TTCT는 도형과 언어 검사 모두 유동성지능 보다는 결정성지능과 상관이 있음을 알 수 있는데, 이는 창의력 검사가 문제 해결 상황에 기존의 지식을 이용하는 능력을 측정하고 있기 때문으로 추정된다. 또한 지능이 낮은 그룹에서 높은 그룹에 비해 창의력 검사와 지능 검사 사이의 상관의 정도가 높았는데, 이는 일정 수준까지는 창의적 능력이 결정성 지능에 의해 제한을 받으나 일정 수준 이상의 결정성 지능을 갖게 되면 더 이상 결정성 지능이 창의적 능력을 제한하지 않기 때문인 것으로 해석된다.circ}C$에서 2.5~8.2mg$CO_2$/kg.hr로 일반적으로 보고되고 있는 토마토 호흡속도와 일치하는 결과를 나타내었다.다.환원당인 sucrose 함량은 계속 증가하였고 fructose, glucose, sorbitol의 함량(추황의 sorbitol을 제외)은 생장이 촉진됨에 따라 증가하다가 다시 점차적으로 감소하였다. 이러한 결과는 총당과 환원당의 측정결과와 일치한 것으로 나타났다. 결론적으로 배의 성장에 따라 산 함량은 감소하였고 당 함량은 증가하였다.luco-pyranoside, quercetin 7-O

  • PDF

Enhancing Empathic Reasoning of Large Language Models Based on Psychotherapy Models for AI-assisted Social Support (인공지능 기반 사회적 지지를 위한 대형언어모형의 공감적 추론 향상: 심리치료 모형을 중심으로)

  • Yoon Kyung Lee;Inju Lee;Minjung Shin;Seoyeon Bae;Sowon Hahn
    • Korean Journal of Cognitive Science
    • /
    • v.35 no.1
    • /
    • pp.23-48
    • /
    • 2024
  • Building human-aligned artificial intelligence (AI) for social support remains challenging despite the advancement of Large Language Models. We present a novel method, the Chain of Empathy (CoE) prompting, that utilizes insights from psychotherapy to induce LLMs to reason about human emotional states. This method is inspired by various psychotherapy approaches-Cognitive-Behavioral Therapy (CBT), Dialectical Behavior Therapy (DBT), Person-Centered Therapy (PCT), and Reality Therapy (RT)-each leading to different patterns of interpreting clients' mental states. LLMs without CoE reasoning generated predominantly exploratory responses. However, when LLMs used CoE reasoning, we found a more comprehensive range of empathic responses aligned with each psychotherapy model's different reasoning patterns. For empathic expression classification, the CBT-based CoE resulted in the most balanced classification of empathic expression labels and the text generation of empathic responses. However, regarding emotion reasoning, other approaches like DBT and PCT showed higher performance in emotion reaction classification. We further conducted qualitative analysis and alignment scoring of each prompt-generated output. The findings underscore the importance of understanding the emotional context and how it affects human-AI communication. Our research contributes to understanding how psychotherapy models can be incorporated into LLMs, facilitating the development of context-aware, safe, and empathically responsive AI.

A Beta-distributed Timed Petri Net Model for Specification, Analysis and Playout Control of Multimedia Titles (멀티미디어 응용의 명세, 분석 및 재생제어를 위한 베타분포형 시간 패트리넷 모형)

  • 이진석;이강수
    • Journal of Korea Multimedia Society
    • /
    • v.2 no.2
    • /
    • pp.200-216
    • /
    • 1999
  • In this paper, we propose a BTPN (Beta-distributed Timed Petri Net) model which is not only an effective multimedia synchronization and authoring specification model, but also a direct control model for playout of a title. Methods of specification of relationships among all media objects in a title by using the BTPN structure and language, as well as methods of analysis of the BTPN by means of a Remaining Timed Reachability Graph and Timing diagram, are proposed. A concept of critical object path, coming from PERT/CPM, is useful for modeling the uncertainty of playout of a multimedia title and editing of title.

  • PDF