• Title/Summary/Keyword: text linguistics

Search Result 69, Processing Time 0.021 seconds

A comparative study of Entity-Grid and LSA models on Korean sentence ordering (한국어 텍스트 문장정렬을 위한 개체격자 접근법과 LSA 기반 접근법의 활용연구)

  • Kim, Youngsam;Kim, Hong-Gee;Shin, Hyopil
    • Korean Journal of Cognitive Science
    • /
    • v.24 no.4
    • /
    • pp.301-321
    • /
    • 2013
  • For the task of sentence ordering, this paper attempts to utilize the Entity-Grid model, a type of entity-based modeling approach, as well as Latent Semantic analysis, which is based on vector space modeling, The task is well known as one of the fundamental tools used to measure text coherence and to enhance text generation processes. For the implementation of the Entity-Grid model, we attempt to use the syntactic roles of the nouns in the Korean text for the ordering task, and measure its impact on the result, since its contribution has been discussed in previous research. Contrary to the case of German, it shows a positive result. In order to obtain the information on the syntactic roles, we use a strategy of using Korean case-markers for the nouns. As a result, it is revealed that the cues can be helpful to measure text coherence. In addition, we compare the results with the ones of the LSA-based model, discussing the advantages and disadvantages of the models, and options for future studies.

  • PDF

Ist Text ein Prototyp? - Versuch einer Begriffsbestimmung aus prototypentheoretischer Sicht - (텍스트는 원형인가? - 개념 정립을 위한 원형 이론적 토대를 찾아서 -)

  • Lee Seong-Man
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.5
    • /
    • pp.289-310
    • /
    • 2002
  • Die Arbeit versucht, den Textbegriff aus prototypentheoretischer Sicht neu zu orientieren. Damit wird unter Text immer eine monologisch geschriebene sprachliche $\"{A}u{\ss}erung$ aus mehreren $S\"{a}tzen$ verstanden. Die in de Beaugrande/Dressler(l98l) als wichtig bezeichnete Textmerkmale wird dann in Bezug auf Vater(1992), $L\"{o}tscher(1987)$ und Klein/von Stutterheim (1991) kritisch $gekl\"{a}rt$. Daraus ergibt sich eine merkmalsorientierte Textbestimmung: Ein Text ist eine abgeschlossene themenorientierte kommunikative Einheit in einem konkreten Kontext; er hat eine bestimmte kommunikative Funktion und $erf\"{u}llt\;koh\"{a}rente$ Bedingungen. Meine These ist: Typische Texte sind auf Mustern, $n\"{a}mlich$ auf Prototypen bezogen. Textmuster sind als Prototypen bezeichnet, die in unterschiedlichem $Ma\ss\;Spielraum\;f\"{u}r\;Variationen\;und\;Kreativit\"{a}t$ lassen. Textmuster sind zu beschreiben $\"{u}ber$ das Zusammenspiel von nichtsprachlichem Handlungstyp und sprachlicher Textsorte. Dieses Zusammenspiel yon Handlungsaspekten wird in prototypischer Weise mit bestimmten Textmerkmalen verbalisiert. Mit Textmusterbeschreibungen werden jeweils prototypische Exemplare beschrieben: die beste Exemplare, die klar als solehe erkennbar sind. Die Formulierung 'Es war einmal....'. ist $f\"{u}r\M\"{a}rchen$ zwar prototypische Anfangsform, aber sie wird nur in etwa einem drittel der $F\"{a}lle$ verwendet. Prototypische Textmustermerkmale sind also nicht obligatorisch. Das $hei{\ss}t$, dass die Realiseirungen je nach individueller bzw. kultureller Situation und damit verfolgtem Zweck variabel sind Damit habe ich mich am Beispiel der Textsorte $besch\"{a}ftigt$.

  • PDF

Vorbereitende Bemerkungen zur kulturvergleichenden Untersuchung der Textsorte 'Todesanzeige' (텍스트종류 '부음'의 한$\cdot$독 비교 연구 시론 - 텍스트의 통보적 기능과 거시구조의 텍스트유형학적 차이를 중심으로 -)

  • Lee Seong-Man
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.2
    • /
    • pp.307-342
    • /
    • 2000
  • Die Arbeit zeigt an, dass die kulturspezifische Textsortenkonvention der Gebrauchstextsorte 'Todesanzeige' im Mittelpunkt steht, wobei anhand von Sprachgemeinschaften vorgegangen wird. Das setzt bestimmte $Verst\"{a}ndnisse$ von Text und Textlinguistik einerseits und von Textsorte und Textsortenlinguistik andererseits voraus. Zuerst versuche ich einen Standort der Todesanzeige im Rahmen der Gebrauchstextsorte zu bestimmen. Danach erstelle ich eine Typologie der Todesanzeige. Die Wahl der klassischen Todesanzeige erlaubt die Kon-stituierung eines zweisprachigen Korpus, das als Grundlage $f\"{u}r$ die in Kapiteln $4\~6$ angestellte Paralleltextanalyse dient. Im Mittelpunkt steht dabei die Makrostruktur und die Textfunktion, also die kommunikative Funktion im Text der $ausgew\"{a}hlten$ Anzeigen, deren Einzelteile auf Struktur und Funktion untersucht werden. Die Gesamtstruktur der Todesanzeigen ist von der Zeitung und dem damit zusammenhangenden Kulturraum $abh\"{a}ngig.\;Au{\ss}er$ dem obligato-rischen Mitteilungs- und Abschlussteil finden sich in beiden $Kulturra\"{u}men$ nicht alle makrostrukturellen Elemente. Kulturbedingte Unterschiede zwischen den koreanischen und deutschen Anzeigen gibt es auch in der $Vorkommensh\"{a}ufigkeit$ einzelner Elemente und in ihren inhaltlichen und syntaktischen Merkmalen sowie in der Handlungsstruktur des Textes. Unterschiede gibt es auch in der H\"{a}ufigkeit$, im Umfang und lnhalt der verschiedenen Elemente sowie in ihrer sprachlichen Formulierung.

  • PDF

Corpus-Based Literary Analysis (코퍼스에 기반한 문학텍스트 분석)

  • Ha, Myung-Jeong
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.9
    • /
    • pp.440-447
    • /
    • 2013
  • Recently corpus linguistic analyses enable researchers to examine meanings and structural features of data, that is not detected intuitively. While the potential of corpus linguistic techniques has been established and demonstrated for non-literary data, corpus stylistic analyses have been rarely performed in terms of the analysis of literature. Specifically this paper explores keywords and their role in text analysis, which is primary part of corpus linguistic analyses. This paper focuses on the application of techniques from corpus linguistics and the interpretation of results. This paper addresses the question of what is to be gained from keyword analysis by scrutinizing keywords in Shakespeare's Romeo and Juliet.

SILLA THE FOUNDER OR SILLA THE KINGDOM: ACCORDING TO KUŠ-NĀMEHAND SELECTED ARABO-PERSIAN TEXTS

  • AKBARZADEH, DARYOOSH
    • Acta Via Serica
    • /
    • v.1 no.1
    • /
    • pp.25-32
    • /
    • 2016
  • Iran's relations with the Far East date back to the Parthian Period. Despite this, the collapse of the Sasanian Empire and the escape of Yazdgird's survivors is currently being re-evaluated as the beginning of a new chapter in bilateral ties, especially between Iran and China and Iran and Silla. In a chapter of $Ku{\check{s}}-n{\bar{a}}meh$ (KN), the text describes Silla (an individual's name) as the father of the people of Silla (toponym). In this paper, I have tried to give a reasonable interpretation for this narration by KN. Also I have frequently referred to other texts to present a comparative study that supports my claim.

Textwissenschaft im Zeitalter der Mediapolis (미디어폴리스 시대의 텍스트과학 - 미디어와 하이퍼텍스트에 대한 고찰)

  • Park Yo-song
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.4
    • /
    • pp.241-266
    • /
    • 2001
  • Die Erscheinung van den elektrischen Schriften und Hypertexte, die $\"{u}ber$ raum-zeitlichen Dimensionen und linearen Charakter der traditionellen Texte $\"{u}berschreiten,\;pr\"{a}gt$ gerade unsere postmoderne bzw. nomadische Gesellschaft. Also der Zeitalter der Mediapolis ist schon da. In diesem Zusammenhang sollte die Textwissenschaft nicht nur auf die traditionelle Analyse der Sprachsystemen, sondern eher auf die semiotische Ambiente und ihre erkenntnistheoretische Folgen Aufmerksamkeit lenken. Daher mochte ich hier bisherige Begriffskategorien der traditionellen Textlinguistik wie Zentrum vs. Paripherie, hierarchische Struktur, $Linearit\"{a}t\;\"{u}berwinden:$ Stattdessen $l\"{a}{\ss}t$ sich die Eigenschaft der Hypertexte wie Schreiben und Plagiate, Link und Knote usw. als eine holistische $Verarbeitungs­modalit\"{a}t$ betonen. In diesem $Proze\ss$ spielen nun die medientechnischen Evolutionen $f\"{u}r$ Entwicklung der Medienhandlungs-schernata zwischen den Kommunikationspartner eine entscheidende Rolle. Bei unserer aktuellen Ph\"{a}nomenologie$ geht es nicht um reine Sprache, sondern eher um synkretisches Zeichen: nicht Text, sondern Hypertext steht im Mittelpunkt der Interesse. Allerdings, Hypertext bleibt auch als eine mogliche Alternative, bis eine andere Alternative in Erscheinung tritt.

  • PDF

A Diagrammatic Analysis of Dress (복식의 도해적 분석 -언어학 이론을 적용하여-)

  • 한명숙
    • The Research Journal of the Costume Culture
    • /
    • v.2 no.2
    • /
    • pp.317-335
    • /
    • 1994
  • The purpose of this thesis is to analyze the relation of the mentalistics linguistics and costume, and to clarify the relationship between language as psychological expressions and costume to understand the phenomena of human costume behavior more deeply and comprehensively. As for the analysis of he costume phenomena, Noam Chomsky's psychological linguistic theory were applied to costume system. In this respect, particularly, by means of Chomsky's later theory(1965), the costume behavior were analyzed. The followings are the findings of the analysis : 1. The Syntactic Component: (※ See Full-Text) 2. The Semantic Component. The costme behavior is similar to a language system. Just as one morpheme or a phrase and phrases make different sentences, so various methods wearing costume make different sentences, so various methods wearing costume make different forms is costume. Language and costume have dictionary entry showing the meaning of vocabulary, and rules combining the individual meaning of the dictionary entry to complete the sentence.

  • PDF

Rhetorische Analyse des literarischen Textes - unter besonderer $Ber\"{u}cksichtigung$ der Inventio - (문학 텍스트의 수사적 분석 - 착상을 중심으로 -)

  • Yang Taezong
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.5
    • /
    • pp.311-333
    • /
    • 2002
  • Im Gegensatz zur $gegenw\"{a}rtig\;\"{u}blichen$ rhetorischen Analyse des literarischen Textes, die $haupts\"{a}chlich$ elokutionell ist, wird hier versucht, anhand des Prozesses um des Esels Schatten von Ch. M. Wieland einen Analyseansatz aus den 4 anderen Teilgebieten der Rhetorik zu suchen. Dieser inventionelle Versuch, ist eine $Teilaktivit\"{a}t$ im Rahmen der rhetorischen Analyse und damit selbst ein Desiderat der Forschung. Als Gegenstand der Analyse ist derjenige Text am passendesten, der eine rhetorische Situation darstellt, in der Situations-Interessierte durch parteiliche Rede an den Situationsmachtigen die $\"{A}nderung$ der Situation versuchen. Dabei wird die Rede den kanonischen Regeln der Inventio unterworfen und ihre rhetorische Strategie zur Persuasion wird $folgenderma{\ss}en$ entwickelt:

  • PDF

Comparative Study of Various Persian Stemmers in the Field of Information Retrieval

  • Moghadam, Fatemeh Momenipour;Keyvanpour, MohammadReza
    • Journal of Information Processing Systems
    • /
    • v.11 no.3
    • /
    • pp.450-464
    • /
    • 2015
  • In linguistics, stemming is the operation of reducing words to their more general form, which is called the 'stem'. Stemming is an important step in information retrieval systems, natural language processing, and text mining. Information retrieval systems are evaluated by metrics like precision and recall and the fundamental superiority of an information retrieval system over another one is measured by them. Stemmers decrease the indexed file, increase the speed of information retrieval systems, and improve the performance of these systems by boosting precision and recall. There are few Persian stemmers and most of them work based on morphological rules. In this paper we carefully study Persian stemmers, which are classified into three main classes: structural stemmers, lookup table stemmers, and statistical stemmers. We describe the algorithms of each class carefully and present the weaknesses and strengths of each Persian stemmer. We also propose some metrics to compare and evaluate each stemmer by them.

An English Essay Scoring System Based on Grammaticality and Lexical Cohesion (문법성과 어휘 응집성 기반의 영어 작문 평가 시스템)

  • Kim, Dong-Sung;Kim, Sang-Chul;Chae, Hee-Rahk
    • Korean Journal of Cognitive Science
    • /
    • v.19 no.3
    • /
    • pp.223-255
    • /
    • 2008
  • In this paper, we introduce an automatic system of scoring English essays. The system is comprised of three main components: a spelling checker, a grammar checker and a lexical cohesion checker. We have used such resources as WordNet, Link Grammar/parser and Roget's thesaurus for these components. The usefulness of an automatic scoring system depends on its reliability. To measure reliability, we compared the results of automatic scoring with those of manual scoring, on the basis of the Kappa statistics and the Multi-facet Rasch Model. The statistical data obtained from the comparison showed that the scoring system is as reliable as professional human graders. This system deals with textual units rather than sentential units and checks not only formal properties of a text but also its contents.

  • PDF