• 제목/요약/키워드: Syntactic Analysis

검색결과 263건 처리시간 0.024초

Topic Classification for Suicidology

  • Read, Jonathon;Velldal, Erik;Ovrelid, Lilja
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.143-150
    • /
    • 2012
  • Computational techniques for topic classification can support qualitative research by automatically applying labels in preparation for qualitative analyses. This paper presents an evaluation of supervised learning techniques applied to one such use case, namely, that of labeling emotions, instructions and information in suicide notes. We train a collection of one-versus-all binary support vector machine classifiers, using cost-sensitive learning to deal with class imbalance. The features investigated range from a simple bag-of-words and n-grams over stems, to information drawn from syntactic dependency analysis and WordNet synonym sets. The experimental results are complemented by an analysis of systematic errors in both the output of our system and the gold-standard annotations.

복식의 도해적 분석 -언어학 이론을 적용하여- (A Diagrammatic Analysis of Dress)

  • 한명숙
    • 복식문화연구
    • /
    • 제2권2호
    • /
    • pp.317-335
    • /
    • 1994
  • The purpose of this thesis is to analyze the relation of the mentalistics linguistics and costume, and to clarify the relationship between language as psychological expressions and costume to understand the phenomena of human costume behavior more deeply and comprehensively. As for the analysis of he costume phenomena, Noam Chomsky's psychological linguistic theory were applied to costume system. In this respect, particularly, by means of Chomsky's later theory(1965), the costume behavior were analyzed. The followings are the findings of the analysis : 1. The Syntactic Component: (※ See Full-Text) 2. The Semantic Component. The costme behavior is similar to a language system. Just as one morpheme or a phrase and phrases make different sentences, so various methods wearing costume make different sentences, so various methods wearing costume make different forms is costume. Language and costume have dictionary entry showing the meaning of vocabulary, and rules combining the individual meaning of the dictionary entry to complete the sentence.

  • PDF

한국어 서사 텍스트 처리의 다중 표상과 구성 통합 이론: 주제어 연속성에 대한 양태 어미의 형태 통사적, 담화 화용적 기능 (A Multi-level Representation of the Korean Narrative Text Processing and Construction-Integration Theory: Morpho- syntactic and Discourse-Pragmatic Effects of Verb Modality on Topic Continuity)

  • 조숙환;김세영
    • 인지과학
    • /
    • 제17권2호
    • /
    • pp.103-118
    • /
    • 2006
  • 본 논문은 구성 통합 이론(Kintsch, 1988, Singer & Kintsch 2001, Graesser, Gernsbacher, & Goldman, 2003)을 토대로 주제어 연속성의 강도와 양태 어미 단서가 이야기 서사 텍스트에 쓰인 공주어 해석에 어떻게 이용되는지 검토했다. 실험 연구에는 명시적 조건과 중립적 조건 등 두 조건이 생성되었는데, 명시적 조건에는, 중립적 조건과는 달리, 주제어가 일관성 있게 유지되었고 또한 동사 어미의 형태 통사적 특징이 인칭과 일치되었다. 이 실험에는 59명의 대학생들이 다음 세 가지 과제에 참여했다. 실험은 첫째, 주어가 생략된 경우 피험자가 시험 문장(target sentence)을 읽는데 소요되는 시간을 측정했고, 둘째, 공주어의 해석, 즉, 선행사 (참조대상) 선택에 소요되는 반응 시간을 측정했으며, 셋째, 선행사 선정의 정답율을 분석했다. 실험 결과, 텍스트 처리과정에서 인칭과 같은 형태 통사적 조건이 유의미한 결과를 낳았으며, 또한, 주제어 연속성 조건의 효과가 형태 통사 조건에 따라 선택적인 양상을 보였다. 즉, 주제어가 지속적으로 연결되는 동안 화용적 맥락, 담화자의 사전 정보, 추론 등과 같은 총체적 정보와 주어, 동사 어미의 인칭과 같은 어휘적, 지엽적인 형태 통사적인 정보가 선행사 해석에 핵심적인 역할을 했다. 따라서, 이 실험 결과는 최소주의 가설 보다 공명 기반 모델을 지지한다.

  • PDF

부정문 처리와 문장 진리치 판단의 인지신경기제: 한국어 통사적 부정문과 어휘적 부정문에 대한 ERP 연구 (An ERP study on the processing of Syntactic and lexical negation in Korean)

  • 남윤주
    • 인지과학
    • /
    • 제27권3호
    • /
    • pp.469-499
    • /
    • 2016
  • 본 논문에서는 한국어의 통사적 부정문(예를 들면, 침대는/시계는 가구에 속한다/속하지 않는다)과 어휘적 부정문(예를 들면, 호랑이는/나비는 꼬리가 있다/없다)을 이용하여 부정어 처리의 인지신경기제를 확인하고 부정문 처리의 언어 보편적/특수적 기제를 밝히기 위한 진리치 판단과제 및 ERP(Event-related potentials) 실험연구를 진행하였다. 총 23명의 피험자가 전체 실험에 참여하였고 이들 중 15명의 뇌파 반응 데이터를 ERP 분석을 위하여 사용하였다. 실험 결과, 진리치 판단과제에 있어서는 영어를 이용한 선행연구들과 동일하게 긍정-참 >긍정-거짓>부정-거짓>부정-참의 순서를 확인할 수 있었다(높은 정확도, 짧은 반응 시간 순서). 그러나 ERP 결과에서는 선행 연구와는 다른 몇 가지 점을 발견하였다. 우선 어휘적 부정문의 경우 이른 시간 구간(250-350ms)에서의 N400효과를 확인할 수 있었지만 긍정문과 부정문을 아우르는 진리치 요인의 주 효과는 나타나지 않았다. 그러나 통사적 부정문의 경우 부정-참에 비하여 부정 거짓문장에서 P600 효과를 발견하였다. 이러한 결과는 표층적으로 나타나는 부정의 형태 및 위치와 같은 언어 특수적 요인에 대한 처리 전략은 각 언어별, 부정 종류별로 달라질 수 있지만 부정 처리의 결과로 얻어지는 문장의 최종 표상 및 이에 대한 진리치 판단의 기제는 언어 및 부정어 종류의 영향을 받지 않는 보편적인 특성을 지닌다는 것을 보여준다.

정상성인 여성 화자와 음성장애 성인 여성 화자의 문단 낭독 시 휴지 및 호흡단락 특성의 비교 (A comparison study of the characteristics of pauses and breath groups during paragraph reading for normal female adults with and without voice disorders)

  • 표화영
    • 말소리와 음성과학
    • /
    • 제11권4호
    • /
    • pp.109-116
    • /
    • 2019
  • 본 연구는 정상군과 음성장애 환자군의 문단낭독 시 휴지 및 호흡단락 특성을 파악해보고자 시행되었다. 정상군 40명과 기능적 음성장애 환자군 40명을 대상으로 PAS(Phonatory Aerodynamic System) 중 Running Speech를 이용하여 '가을' 문단을 낭독하게 하였다. 이를 통해 흡기 동반 및 미동반, 어절간 및 어절내 휴지와 호흡단락을 구분하고 이에 대한 기술통계 및 집단간 통계적 유의성을 검증하였다. 그 결과 흡기를 동반한 휴지횟수는 환자군이 더 높았으나 흡기를 동반하지 않은 휴지횟수는 정상군이 더 높은 수치를 보였다. 어절경계 중 휴지가 동반된 비율은 환자군이 더 높았고 호흡단락당 음절수는 정상군이 유의하게 더 높았다. 음성장애 화자군은 성대폐쇄부전으로 인한 호흡지지가 정상군보다 부족하므로 휴지 시 흡기를 동반하는 경우나 호흡단락의 수가 더 많은 것으로 사료된다. 이는 일상대화의 자연스러움을 저해할 수 있으므로 음성장애 화자의 중재 시 휴지와 호흡단락의 빈도를 적절히 조절하는 것도 평가 및 중재에 포함해야 할 것이다.

명사 의미 부류를 이용한 연속된 명사열의 구묶음 (Chunking of Contiguous Nouns using Noun Semantic Classes)

  • 안광모;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제10권3호
    • /
    • pp.10-20
    • /
    • 2010
  • 본 논문에서는 조사가 없는 연속된 명사열 중 하나의 명사처럼 쓰일 수 있는 명사열을 복합명사구라 정의하고, 의미 정보를 이용한 복합명사구의 구묶음 방법을 제시한다. 복합명사구의 구묶음에는 구문분석 말뭉치에서 추출한 명사쌍과 이들의 의미부류정보를 이용한다. 이러한 명사쌍과 의미부류정보는 신뢰도를 위해 세종말뭉치의 구문분석 말뭉치와 상세사전을 기반으로 구축하였다. 이들 정보를 이용한 복합명사구 구묶음 모듈은 길이(명사의 수)가 2 이상인 복합명사구에 대해서도 구묶음을 수행할 수 있다. 복합명사구 구묶음을 위해 '왼쪽명사-오른쪽명사' 쌍 38,940개, '왼쪽명사-오른쪽명사의미부류' 쌍 65,629개, '왼쪽명사의미부류-오른쪽명사' 쌍 46,094개, '왼쪽명사의미부류-오른쪽명사의미부류' 쌍 45,243개의 정보를 구축하여 이용하였다. 실험을 위하여 신문기사의 내용으로 이루어진 세종형태소분석 말뭉치로부터 길이가 3 이상인 조사와 결합하지 않은 연속된 명사열을 포함하는 1,000 문장을 임의로 선별하였으며, 실험결과는 86.89%의 정밀도와 80.48%의 재현율, 그리고 83.56%의 f-measure를 보였다.

운율구 경계현상 분석 및 텍스트에서의 운율구 추출 (Analysis and Prediction of Prosodic Phrage Boundary)

  • 김상훈;성철재;이정철
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.24-32
    • /
    • 1997
  • 이 논문에서는 첫 번째로 운율구 경계를 자동으로 추출하고자 할 때 인간의 지각과 관련하여 어떠한 자질을 이용하는 것이 좋은가 하는 점을 밝혀 보았다. 운율구 경계의 유형은 크게 경계가 없는 강도(zero), 약한 경계 강도(minor break strength), 강한 경계 강도(major break strength) 3 단계로 정하는 것이 통계적으로 의의가 있으며 지속시간의 정보가 강한 경계 유형의 결정에 중요하게 작용하는 자질이었음을 알 수 있었다. 두 번째로는 운율구 경계현상 분석결과를 바탕으로 운율구 경계의 경계 강도를 약한 경계 강도(zero를 포함)와 강한 경계 강도로 나누고, 2단계의 경계 강도를 텍스트상에서 문장성분의 bigram, trigram을 정보를 이용하여 자동으로 할당하였다. Bigram의 경우 Test-I, Test-II 텍스트 DB에 대해 각각 46.0%, 38.2%의 강한 경계 강도 예측정확률과 22.8%, 8.4%의 삽입오류율의 성능을 내었으며, Trigram인 경우 Test-I, Test-II 텍스트 DB 각각에 대해 58.3%, 42.8%의 강한 경계 강도 예측정확률과 30.0%, 11.8%의 삽입오류율를 나타냈다.

  • PDF

복합 레이블을 적용한 한국어 구문 규칙 (Korean Syntactic Rules using Composite Labels)

  • 김성용;이공주;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.235-244
    • /
    • 2004
  • 본 논문에서는 한국어 구문 분석 및 구문 트리 표현을 위한 복합 레이블 생성 방법을 제안한다. 기존의 구문 트리 표현에서는 미리 정의된 구문 트리 레이블을 사용하여 구문 정보를 표현하였다. 본 논문에서는 이진 규칙하에서 품사태그 정보만을 이용하여 구문 레이블을 자동으로 생성하는 방법을 제시한다. 제안된 구문 레이블은 두 개의 하위 구성체의 품사정보를 적절히 구성하여 형성되며, 동시에 현 구성체의 상태 및 역할 정보를 표현할 수 있도록 고안되었다. 이와 같이 함으로써 품사태그 정보가 가지고 있는 정보를 그대로 구문 트리에 반영시킬 수 있었다. 또한, 품사 정보와 이진규칙만을 이용하여 구문 트리를 표현하기 때문에, 다양한 구문 규칙을 채택하고 있는 서로 다른 구문 분석기의 결과를 정규화 하는 데 적용할 수 있을 것이며, 일본어와 같은 다른 언어에도 쉽게 적용 가능하다. 약 31,080 문장에 대한 구문 분석의 결과, 79.30%의 정확도를 얻을 수 있었으며, 이는 제안된 구문 트리 표현 방법이 구문 분석기의 효율에도 좋은 영향을 미침을 보이는 것이다.

행위공동체 내의 언어·사회·문화: 국내외 사례를 통한 영어간판의 오류분석과 사회·문화적 양상 (The Language·Society·Culture in a Community of Practice: Error Analysis and Socio-cultural Aspects on English Signboards of the Domestic and a Foreign Country)

  • 이영화
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.504-512
    • /
    • 2019
  • 본 연구는 국내외 도시 지역 영어간판의 언어적 오류를 살펴보고, 이를 비교해 봄으로써 공동체의 언어 사회 문화적 양상을 고찰해 보는 것을 목적으로 한다. 자료 수집으로 국내 5개 도시와 프랑스 파리 지역의 영어 간판을 촬영하였다. 분석 결과, 국내 영어간판의 39.2%가 오류를 포함한 반면 파리 시내 영어간판의 오류 비율은 24.7%였다. 국내에서는 명동 지역이 영어간판은 물론 오류도 가장 많은 반면, 파리에서는 에펠탑을 중심으로 한 7구역에서 영어간판이 가장 많았고, 오류는 마레지역 3, 4구역이 가장 높았다. 업종과 관련, 국내에서는 주류, 음식, 의류 순으로 간판 오류가 많은 반면, 프랑스에서는 의류, 음식, 문화 순으로 오류 비율이 높아 두 나라간 차이를 보였다. 국내와 프랑스 공히 의미, 형태, 통사 요소의 순으로 오류를 보였다. 국내나 프랑스 모두 옥외광고물 언어에 관한 규정이 존재하고 있으나 제대로 지켜지고 않고 있었다. 따라서 영어간판 사용이 필요 불가결한 글로벌 시대에서 조화로운 영어간판 문화의 정착을 위해선 보다 실제적이고 합리적인 정책 수립이 필요하다.

A Corpus-Based Study on Korean EFL Learners' Use of English Logical Connectors

  • Ha, Myung-Jeong
    • International Journal of Contents
    • /
    • 제10권4호
    • /
    • pp.48-52
    • /
    • 2014
  • The purpose of this study was to examine 30 logical connectors in the essay writing of Korean university students for comparison with the use in similar types of native English writing. The main questions addressed were as follows: Do Korean EFL students tend to over- or underuse logical connectors? What types of connectors differentiate Korean learners from native use? To answer these questions, EFL learner data were compared with data from native speakers using computerized corpora and linguistic software tools to speed up the initial stage of the linguistic analysis. The analysis revealed that Korean EFL learners tend to overuse logical connectors in the initial position of the sentence, and that they tend to overuse additive connectors such as 'moreover', 'besides', and 'furthermore', whereas they underuse contrastive connectors such as 'yet' and 'instead'. On the basis of the results of this study, some pedagogical implications are made concerning the need for teaching of the semantic, stylistic, and syntactic behavior of logical connectors.