• 제목/요약/키워드: 담화단위

검색결과 16건 처리시간 0.02초

담화 내 계층 구조의 개념 구조적 기술 (Conceptual Description of Hierarchical Structure in Discourse)

  • 구유선
    • 인지과학
    • /
    • 제11권3_4호
    • /
    • pp.23-32
    • /
    • 2000
  • 과거 서술 연구 중심의 주구조와 부구조의 차이는 적절하고 형식적인 정의가 부족하다. 본 연구는 주구조, 하위 구조, 부구조를 구성하는 담화 단위사이에 계층구조가 존재함을 주장한다. 본 연구의 목적은 두 가지로 요약된다. 첫째, Kuppevelt가 제안한 주구조를 하위구조나 부구조와 구별하는 식별기준을 나타내는 형식적 정의를 제시한다. 둘째, 지식 표현 언어인 Sowa의 개념구조론의 체계 내에서 담화의 계층구조와 그 구조를 나타내는 언어적 표시인 담화표시의 예를 기술하는 방법을 제시한다. 개념관계로 일탈, 화제 전환, 틀의 관계를 설정하여 담화 내 계층구조와 담화부분과의 화용적인 관계를 규명하였다. 기존의 개념구조론은 선택적 제약, 조응 등의 의미론적인 개념들을 간결하고 정확하게 기술할 수 있었는데 화용론적인 측면의 기술도 가능함을 보여준다.

  • PDF

한국어 텍스트의 논증 구조 내 담화 관계의 자동 분류 연구 (An Automatic Classification of Discourse Relations in the Arguing Structure of Korean Texts)

  • 이상아;신효필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.59-64
    • /
    • 2015
  • 최근 온라인 텍스트 자료를 이용하여 대중의 의견을 분석하는 작업이 활발히 이루어지고 있다. 이러한 작업에는 주관적 방향성을 갖는 텍스트의 논증 구조와 중요 내용을 파악하는 과정이 필요하며, 자료의 양과 다양성이 급격히 증가하면서 그 과정의 자동화가 불가피해지고 있다. 본 연구에서는 정책에 대한 찬반 의견으로 구성된 한국어 텍스트 자료를 직접 구축하고, 글을 구성하는 기본 단위들 사이의 담화 관계를 정의하였다. 각 단위들 사이의 관계는 기계학습과 규칙 기반 방식을 이용하여 예측되고, 그 결과는 합성되어 하나의 글에 대응되는 트리 구조를 이룬다. 또한 텍스트의 구조상에서 주제문을 직접적으로 뒷받침하는 문장 혹은 절을 추출하여 글의 중요 내용을 얻고자 하였다.

  • PDF

한국어 수사구조 분류체계 수립 및 주석 코퍼스 구축 (Building an RST-tagged Corpus and its Classification Scheme for Korean News Texts)

  • 노은정;이연수;김연우;이도길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.33-38
    • /
    • 2016
  • 수사구조는 텍스트의 각 구성 성분이 맺고 있는 관계를 의미하며, 필자의 의도는 논리적인 구조를 통해서 독자에게 더 잘 전달될 수 있다. 따라서 독자의 인지적 효과를 극대화할 수 있도록 수사구조를 고려하여 단락과 문장 구조를 구성하는 것이 필요하다. 그럼에도 불구하고 지금까지 수사구조에 기초한 한국어 분류체계를 만들거나 주석 코퍼스를 설계하려는 시도가 없었다. 본 연구에서는 기존 수사구조 이론을 기반으로, 한국어 보도문 형식에 적합한 30개 유형의 분류체계를 정제하고 최소 담화 단위별로 태깅한 코퍼스를 구축하였다. 또한 구축한 코퍼스를 토대로 중심문장을 비롯한 문장 구조의 특징과 분포 비율, 신문기사의 장르적 특성 등을 살펴봄으로써 텍스트에서 응집성의 실현 양상과 구문상의 특징을 확인하였다. 본 연구는 한국어 담화 구문에 적합한 수사구조 분류체계를 설계하고 이를 이용한 주석 코퍼스를 최초로 구축하였다는 점에서 의의를 갖는다.

  • PDF

GIS를 활용한 수업이 공간적 사고능력과 지리적 기능에 미치는 영향 (Effect of GIS-integrated Lessons on Spatial Thinking Abilities and Geographical Skills)

  • 전보애
    • 대한지리학회지
    • /
    • 제45권6호
    • /
    • pp.820-844
    • /
    • 2010
  • 본 연구는 GIS를 활용한 수업이 공간적 사고능력에 미치는 영향을 담화분석방법과 사례연구를 통해서 살펴보고자 한다. 분석에 사용된 자료는 6회에 걸친 GIS활용 수업에서 학생들이 주고 받는 대화를 녹취하여 수집하였다. 개별 학생들의 '발화가 수행하는 행위' (언어학의 화행론상의 행위, 담화분석의 최소단위)를 확인하고, 이를 다시 담화의 내용을 기준으로 공간적 사고 및 지리적 기능으로 분류하였다. 담화분석을 통한 실증적 연구 결과, 학생들은 주로 저차 공간적 사고능력을 지니고 있는 것으로 나타났고, 그 다음으로 중간 정도의 공간적 사고능력을 보였으며, GIS를 활용한 수업에 참여히는 동안 공간적 사고를 나타내는 적절한 용어를 생성하였다. 본 연구가 진행된 것이 지리수업이 아니라 환경과 관련한 생물 수업이었음을 감안한다면, 학생틀의 공간적 사고가 GIS를 활용한 수업의 결과임을 반영한다고 볼 수 있다. 이는 앞으로 학생들의 공간적 사고를 향상시키는 새로운 도구로서 GIS를 활용한 수업과 함의하는 바가 크다.

신경망 기반 텍스트 모델링에 있어 순차적 결합 방법의 한계점과 이를 극복하기 위한 담화 기반의 결합 방법 (A Discourse-based Compositional Approach to Overcome Drawbacks of Sequence-based Composition in Text Modeling via Neural Networks)

  • 이강욱;한상규;맹성현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권12호
    • /
    • pp.698-702
    • /
    • 2017
  • 자연 언어 처리(Natural Language Processing) 분야에 심층 신경망(Deep Neural Network)이 소개된 이후, 단어, 문장 등의 의미를 나타내기 위한 분산 표상인 임베딩(Embedding)을 학습하기 위한 연구가 활발히 진행되고 있다. 임베딩 학습을 위한 방법으로는 크게 문맥 기반의 텍스트 모델링 방법과, 기학습된 임베딩을 결합하여 더 긴 텍스트의 분산 표상을 계산하고자 하는 결합 기반의 텍스트 모델링 방법이 있다. 하지만, 기존 결합 기반의 텍스트 모델링 방법은 최적 결합 단위에 대한 고찰 없이 단어를 이용하여 연구되어 왔다. 본 연구에서는 비교 실험을 통해 문서 임베딩 생성에 적합한 결합 기법과 최적 결합 단위에 대해 알아본다. 또한, 새로운 결합 방법인 담화 분석 기반의 결합 방식을 제안하고 실험을 통해 기존의 순차적 결합 기반 신경망 모델 대비 우수성을 보인다.

한국어 수사구조 분류체계 수립 및 주석 코퍼스 구축 (Building an RST-tagged Corpus and its Classification Scheme for Korean News Texts)

  • 노은정;이연수;김연우;이도길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.33-38
    • /
    • 2016
  • 수사구조는 텍스트의 각 구성 성분이 맺고 있는 관계를 의미하며, 필자의 의도는 논리적인 구조를 통해서 독자에게 더 잘 전달될 수 있다. 따라서 독자의 인지적 효과를 극대화할 수 있도록 수사구조를 고려하여 단락과 문장 구조를 구성하는 것이 필요하다. 그럼에도 불구하고 지금까지 수사구조에 기초한 한국어 분류체계를 만들거나 주석 코퍼스를 설계하려는 시도가 없었다. 본 연구에서는 기존 수사구조 이론을 기반으로, 한국어 보도문 형식에 적합한 30개 유형의 분류체계를 정제하고 최소 담화 단위별로 태깅한 코퍼스를 구축하였다. 또한 구축한 코퍼스를 토대로 중심문장을 비롯한 문장 구조의 특징과 분포 비율, 신문기사의 장르적 특성 등을 살펴봄으로써 텍스트에서 응집성의 실현 양상과 구문상의 특징을 확인하였다. 본 연구는 한국어 담화 구문에 적합한 수사구조 분류체계를 설계하고 이를 이용한 주석 코퍼스를 최초로 구축하였다는 점에서 의의를 갖는다.

  • PDF

실시간 동시통역 시스템 개발을 위한 통역 분절단위 연구 (A Study on Segmentation Unit for the Real-time Simultaneous Interpretation System)

  • 구영은;김지연;홍정표;홍문표;최승권
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.229-235
    • /
    • 2019
  • 동시통역에서는 번역이 즉각적으로 빠르게 이루어지면서 원천텍스트의 의미가 정확히 전달되는 것이 핵심이다. 따라서 실시간 동시통역 시스템의 개발을 위해서는 번역정확도와 번역속도가 균형적으로 최적을 이루는 지점에서 분절하는 방법론이 필요하다. 이를 위해 본 연구에서는 운율 정보, 문법·통사 규칙, 의미 단위, 담화구조 표지, 분절단위의 길이 등 다양한 언어학적 자질을 제시하였다. 또한 본 논문에서 제안한 방법론을 검증하는 실험을 진행하였으며 그 결과 영한 데이터는 82%, 한영 데이터는 90%의 정확도를 보였다.

  • PDF

고등학교 공통 과학 강의에서 교사에 따른 역동적 구조의 정량적 비교 분석 (A Comparative Analysis of the Kinetic Structure in Lectures on a High School Science)

  • 유승근;이준상
    • 한국과학교육학회지
    • /
    • 제20권4호
    • /
    • pp.505-509
    • /
    • 2000
  • 담화단위의 연관도를 측정하는 평균기본계수 $(\bar{B}_1)$, 평균가중계수 $(\bar{B}_2)$ 그리고 진행도 (P)는 다음과 같다. T1($\bar{B}_1$, 0.21: $\bar{B}_2$, 0.86: P. 0.79), T2($\bar{B}_1$, 0.02:$\bar{B}_2$, 0.85: P. 0.80), T3($\bar{B}_1$, 0.22: $\bar{B}_2$, 0.83: P.0.78) and T4($\bar{B}_1$, 0.14: $\bar{B}_2$, 0.82: P. 0.86), T4 교사는 다른 교사들에 비해 낮은 역동적 구조를 나타냈으나 수업은 빠른 진행도를 보였다. 총 담화단위 수, 어소의 총 빈도 수, 어소의 종류 수는 T1, T2, T3,T4 교사의 순으로 나타났다. 결과적으로 T4 교사는 다른 교사에 비해 수업 내용의 역동적 구조가 전체적으로 볼 때 낮은 수준을 보였는데, 그 주된 이유는 T4 교사는 수업 준비를 체계적으로 하지 않아, 수업내용이 상대적으로 적었기 때문으로 추측된다. 게다가 T4 교사가 담당하고 있는 학급이 1개 학급이기에 반복적인 수업이 이루어지지 않아 자기 분석의 기회가 없었고, 수업의 내용이 전공 영역과의 관련성이 적었으며 교직 경력 또한 다른 교사보다 낮았기 때문으로 사료된다.

  • PDF

기계 학습을 활용한 논증 수준 자동 채점 및 논증 패턴 분석 (Automated Scoring of Argumentation Levels and Analysis of Argumentation Patterns Using Machine Learning)

  • 이만형;유선아
    • 한국과학교육학회지
    • /
    • 제41권3호
    • /
    • pp.203-220
    • /
    • 2021
  • 이 연구는 과학적 논증 담화에 대한 자동 채점의 성능 개선 방향을 탐색하였으며, 자동 채점 모델을 활용하여 논증 담화의 양상과 패턴을 분석하였다. 이를 위해 과학적 논증 수업에서 발생한 학생 발화를 대상으로 논증 수준을 평가하는 자동 채점을 수행하였다. 이 자동 채점의 데이터셋은 4가지 단위의 논증 피처와 논증 수준 평가틀로 구성되었다. 특히, 자동 채점에 논증 패턴을 반영하기 위하여 논증 클러스터와 n-gram을 활용하였다. 자동 채점 모델은 3가지의 지도 학습 기법으로 구성되었으며, 그 결과 총 33개의 자동 채점 모델이 구성되었다. 자동 채점의 결과, 최대 85.37%, 평균 77.59%의 채점 정확도를 얻었다. 이 과정에서 논증 담화의 패턴이 자동 채점의 성능을 개선하는 주요한 피처임을 확인하였다. 또한, 의사결정 나무와 랜덤 포레스트의 모델을 통하여 과학적 논증 수준에 따른 논증의 양상과 패턴을 분석하였다. 이를 통하여 주장, 자료와 함께 정당화가 체계적으로 구성된 과학적 논증과 자료에 대한 활발한 상호작용이 이루어진 과학적 논증이 논증 수준의 발달을 이끈다는 점 등을 확인하였다. 이와 같은 자동 채점 모델의 해석은 논증 패턴을 분석하는 새로운 연구 방법을 제언하는 것이다.

고등학교 생물 강의에서의 역동적 구조의 정량적 분석 (Quantitative Analysis of Kinetic Structure in a High School Biology Lecture)

  • 김영수
    • 한국과학교육학회지
    • /
    • 제7권1호
    • /
    • pp.69-79
    • /
    • 1987
  • 학교 교실에서의 수업 활동 중 가장 주된 활동은 언어적 의사소통이며 대부분의 지식 전달이 교사의 언어 활동을 통해 이루어 지고 있다. 그리고 교사의 언어적 의사소통의 순서와 구조는 효과적이고 효율적인 학습에 중요한 의미를 가지므로 이를 조직적으로 분석 평가할 필요가 있다. 따라서, 이 연구는 교실에서의 교사 언어 행동의 구조를 분석 연구할 수 있는 방법론적 기초를 마련하고자 Anderson 의 역동적 구조 이론 (Theory of Kinetic Structure) 을 소개하고, 그의 정량적 분석 방법을 한국어에 적용 할 수 있도록 수정하였으며, 교사의 실제 강의 내용을 분석하였다. 분석에 사용한 자료는 50분 동안 진행된 고등학교 1학년 생물 강의를 녹음한 것으로 소화에 관한 내용이었다. 강의 내용에서 역동적 구조의 정량적 분석 결과는 다음과 같다. 강의는 316개의 담화단위 (discourse units) 로 구성되었으며. 261개의 어소 (verbal elements)가 동정되었다. 전체 강의에서 37개의 secondary span 이 동정되었고 이는 6개의 primary span으로 구분되었다. 전체 강의에 대한 평균 기본계수(mean fundamental coefficient, $\bar{B}_1$)는 0.26으로 낮은 수준의 연관도 (commonality )를 보였으며, 평균 가중 기본계수(mean weighted coefficient, $\bar{B}_2$)의 값은 0.88이었다. 전체적으로 이 강의는 중 내지 하 구조 (moderate to low structure)를 갖고 있으며, 높은 진행도 (high progression, $\bar{D}_s$=1.07)를 보였다.

  • PDF