• Title/Summary/Keyword: 문장

Search Result 3,058, Processing Time 0.021 seconds

Sentence Type Identification in Korean Applications to Korean-Sign Language Translation and Korean Speech Synthesis (한국어 문장 유형의 자동 분류 한국어-수화 변환 및 한국어 음성 합성에의 응용)

  • Chung, Jin-Woo;Lee, Ho-Joon;Park, Jong-C.
    • Journal of the HCI Society of Korea
    • /
    • v.5 no.1
    • /
    • pp.25-35
    • /
    • 2010
  • This paper proposes a method of automatically identifying sentence types in Korean and improving naturalness in sign language generation and speech synthesis using the identified sentence type information. In Korean, sentences are usually categorized into five types: declarative, imperative, propositive, interrogative, and exclamatory. However, it is also known that these types are quite ambiguous to identify in dialogues. In this paper, we present additional morphological and syntactic clues for the sentence type and propose a rule-based procedure for identifying the sentence type using these clues. The experimental results show that our method gives a reasonable performance. We also describe how the sentence type is used to generate non-manual signals in Korean-Korean sign language translation and appropriate intonation in Korean speech synthesis. Since the method of using sentence type information in speech synthesis and sign language generation is not much studied previously, it is anticipated that our method will contribute to research on generating more natural speech and sign language expressions.

  • PDF

A Study on Automatically Constructing a Critical Abstracts of the Articles in Scholar Journals (학술잡지기사 초록의 비평문장 자동작성에 대한 연구)

  • Lee, Tae-Young
    • Journal of the Korean Society for information Management
    • /
    • v.25 no.1
    • /
    • pp.19-41
    • /
    • 2008
  • Cue words and phrases of critical sentences, Paradigms knowing the critical information between sentences, Rules extracting the sentences contained critical information and producing the critical sentences were made to construct the critical abstract of scholar journals in the web environment. The ontology aided to accomplish above works were designed, to manage and operate the cue words and phrases in documents and the symptoms related to Purpose, Method, Result, and Conclusion sentences. The results of performance test remarked to improve the advancement of extraction and production rules and the reinforcement of ontology's relationship.

A Neurolinguistic Study of Korean Scrambling: An Event-related Potentials(EPR) based Study (한국어 어순재배치(scrambling) 문장의 신경언어학적 연구)

  • Hwang, Yu Mi;Lee, Kap-Hee;Yun, Yungdo
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.29-34
    • /
    • 2012
  • 본 연구는 한국어 어순재배치(scrambling) 문장의 이해 과정에서 발생되는 대뇌 활동을 사건관련전위(event-related Potentials; ERPs) 이용하여 살펴보기 위하여 실시되었다. 네 개의 어절로 구성된 표준 어순 문장(일년만에 마님이 영감을 만났어요.)과 어순재배치 문장(일년만에 영감을 마님이 만났어요.)을 어절별로 제시하고 첫 번째 명사구(NP1), 두 번째 명사구(NP2), 동사(Verb)의 시작점(onset)에서 측정한 뇌파를 비교하였다. 뇌파의 분석은 대뇌 영역을 중심선(midline), 중앙(medial), 편측(lateral)로 나누어 전후 분포(anterior-posterior distribution)와 정중선(midline)의 열에 의해 좌우 반구(hemisphere)로 분리하여 분석하였다. 분석 결과 중심선 영역에서 표준 어순에 비해 뒤섞기 어순에서 300-500ms 시간 창(time window)에서 큰 부적 전위(negative potential)가 관찰되었으며 이는 어순재배치로 인한 N400효과로 해석되며 P600효과는 관찰되지 않았다. 특히 첫 번째 명사구에서 문장유형(표준 어순 vs. 어순재배치)의 차이가 가장 크게 관찰되었으며 두 번째 명사구에서는 중앙에서 문장유형과 반구(좌우반구)의 상호작용이 관찰되었고, 동사에서는 문장유형과 반구, 문장유형과 전극 위치의 전후 분포와의 상호작용이 관찰되었다. 본 연구 결과에서 관찰된 N400효과는 독일어와 일본어를 대상으로 한 어순재배치 연구 결과와 유사하며 한국어 어순재배치 문장에 관한 사건관련 전위를 고찰하였다는 점에서 의의가 있다.

  • PDF

Characteristics of Resolving Syntatic Ambiguity in Normals and Aphasic (한국어 구문 중의성 해결과정 : 정상인과 명칭성 실어증 환자의 구문정보처리 특성)

  • Kim, Yoon-Jung;Kim, Su-Jung;Jung, Jae-Bum;Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.470-475
    • /
    • 1999
  • 문장을 이해하기 위해서는 각 단어를 이해한 후에 이 단어들이 문장 내에서 어떠한 기능을 담당하고 있는지 그 구조를 파악해야 한다. 한국어 정보 처리에 있어서 명칭성 실어증 환자는 어떠한 방식으로 이러한 문장 구조를 파악하는지 정상인과의 비교를 통해 그 특성을 살펴보고자 하는 데 본 연구의 목적이 있다. 실험 재료로는 구문 중의성 문장을 사용하였는데, 구문 중의성이란 가령 '정치가'와 같은 어절이 '정치+가(주격조사)'나, '정치+가(접미사)' 모두를 뜻할 수 있음을 말한다. 본 연구에서는 이러한 중의성을 이해하는 과정을 알아보기 위해 중의성 해결 지역에서의 읽기 시간(reading time)을 측정하였으며, 실험 과제는 자기 조절 읽기 과제(self-paced reading task)를 사용하였다. 그 결과 정상인 피험자와 마찬가지로 '정치가'와 같은 중의적 어절이 주어로 쓰였을 때에는 중의적 문장 / 비중의적 문장간의 차이가 없었으나 '명사+접사'로 해석해야 할 경우에는 둘 간의 차이가 크게 나타나 피험자였던 명칭성 실어증 환자의 경우 이러한 중의성을 해결하면서 읽는 데에는 손상이 없는 것으로 보였다. 단 전체적인 문장을 읽는데에는 시간이 오래 걸려 역시 문장을 읽고 이해하는 데에는 어려움을 겪는 것으로 나타났다. 따라서, 명칭성 실어증 환자는 문장 산출의 어려움이 구문적 정보처리에서의 문제라기보다는 어휘 정보를 적절하게 인출하지 못하기 때문에 나타나는 것으로 추론된다.

  • PDF

Two-Level Clausal Segmentation Algorithm using Sense Information (의미 정보를 이용한 이단계 단문 분할 알고리즘)

  • Park, Hyun-Jae;Lee, Su-Seon;Woo, Yo-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.237-241
    • /
    • 1999
  • 단문 분할은 한 문장에 중심어인 용언이 복수개인 경우 용언을 중심으로 문장을 나누는 방법이다. 기존의 방법은 정형화된 문장의 경우 효율적인 결과를 얻을 수 있으나 구문적으로 복잡한 문장인 경우는 한계를 보였다. 본 논문에서는 이러한 한계를 극복하기 위해 구문 정보의 단문 분할이 아닌 의미 정보를 활용하여 복잡한 문장을 효율적으로 단문으로 분할하는 방법을 제안한다. 정형화된 문장의 경우와 달리 일상적인 문장은 문장의 구조적 애매성이나 조사의 생략 등이 빈번하므로 의미 수준에서의 단문 분할이 필요하다. 본 논문에서는 의미 영역에서 단문 분할의 할 경우 기존의 방법들의 애매성을 해소할 수 있다는 점을 보인다. 이를 위해, 먼저 하위범주화 사전과 시소러스의 의미 정보를 이용하여 용언과 보어 성분간의 의존구조를 1차적으로 작성하고 이후 구문적인 정보와 기타 문법적인 지식을 사용하여 기타 성분을 의존구조에 점진적으로 포함시켜가는 이단계 단문 분할 알고리즘을 제안한다. 제안된 이단계 단문 분할 방법의 유용성을 보이기 위해 ETRI-KONAN의 말뭉치 중 20,000문장을 반 자동적인 방법으로 술어와 보어 성분간의 의존구조를 태깅한 후 본 논문에서 제안한 방법과 비교하는 실험을 수행한다.

  • PDF

A Simultaneous Recognition Technology of Named Entities and Objects for a Dialogue Based Private Secretary Software (대화형 개인 비서 시스템을 위한 하이브리드 방식의 개체명 및 문장목적 동시 인식기술)

  • Lee, ChangSu;Ko, YoungJoong
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.18-23
    • /
    • 2013
  • 기존 대화시스템과 달리 대화형 개인 비서 시스템은 사용자에게 정보를 제공하기 위해 앱(APP)을 구동하는 방법을 사용한다. 사용자가 앱을 통해 정보를 얻고자 할 때, 사용자가 필요로 하는 정보를 제공해주기 위해서는 사용자의 목적을 정확하게 인식하는 작업이 필요하다. 그 작업 중 중요한 두 요소는 개체명 인식과 문장목적 인식이다. 문장목적 인식이란, 사용자의 문장을 분석해 하나의 앱에 존재하는 여러 정보 중 사용자가 원하는 정보(문장의 목적)가 무엇인지 찾아주는 인식작업이다. 이러한 인식시스템을 구축하는 방법 중 대표적인 방법은 사전규칙방법과 기계학습방법이다. 사전규칙은 사전정보와 규칙을 적용하는 방법으로, 시간이 지남에 따라 새로운 규칙을 추가해야하는 문제가 있으며, 규칙이 일반화되지 않을 경우 오류가 증가하는 문제가 있다. 또 두 인식작업을 파이프라인 방식으로 적용 할 경우, 개체명 인식단계에서의 오류를 가지고 문장목적 인식단계로 넘어가기 때문에 두 단계에 걸친 성능저하와 속도저하를 초래할 수 있다. 이러한 문제점을 해결하기 위해 우리는 통계기반의 기계학습방법인 Conditional Random Fields(CRF)를 사용한다. 또한 사전정보를 CRF와 결합함으로써, 단독으로 수행하는 CRF방식의 성능을 개선시킨다. 개체명과 문장목적인식의 구조를 분석한 결과, 비슷한 자질을 사용할 수 있다고 판단하여, 두 작업을 동시에 수행하는 방법을 제안한다. 실험결과, 사전규칙방법보다 제안한 방법이 문장단위 2.67% 성능개선을 보였다.

  • PDF

Analysis of Processes in Students' Scientific Understanding Through Reading Scientific Texts -Focused on Literature Review- (과학문장 읽기를 통한 학생들의 과학적 이해 과정 분석 - 문헌 연구를 중심으로 -)

  • Park, Jong-Won
    • Journal of The Korean Association For Science Education
    • /
    • v.30 no.1
    • /
    • pp.27-41
    • /
    • 2010
  • Scientific texts are some of major sources for scientific understanding. Therefore, reading scientific texts should be considered as an important learning activity. However, there is little research about reading scientific text in Korea. In this study, as a starting point for research about reading scientific text, lists of scientific text constituents and scientific text functions are suggested based on a comprehensive literature review. The study also reviewed how scientific text structure, familarity of scientific text and analogy involved in scientific text can affect students' scientific understanding through reading scientific text. Finally, further study plans, such as analysis of actual science textbooks using the lists suggested in this study as well as the investigation of actual students' thinking processes when reading scientific text, were described.

Event Sentence Extraction for Information Extraction (정보 추출을 위한 이벤트 문장 추출)

  • Kim, Tae-Hyun;Lim, Soo-Jong;Yun, Bo-Hyun;Park, Sang-Gyu
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.325-331
    • /
    • 2002
  • 정보추출 시스템의 목적은 관심의 대상이 되는 특정 정보를 선택적으로 찾아내 제시하는데 있다. 따라서 도메인 정보에 의존적인 방법으로 정보추출이 이루어질 수밖에 없고, 이에 따른 도메인 정보 구축의 부담이 컸다. 이러한 부담을 줄이기 위해 본 연구에서는 특정 주제영역과 관련한 문서로부터 자동으로 이벤트 문장을 추출하는 시스템을 제안한다. 이벤트 문장이란, 특정도메인에서 다루어지는 이벤트의 구체적인 내용을 포함하고 있는 문장이다. 이러한 문장을 추출함으로써 기본적인 수준의 정보추출 요구를 만족시킬 수 있을 뿐만 아니라, 주출된 이벤트 문장을 도메인 정보 구축에 활용할 수 있을 것이다. 본 연구에서는 동사, 명사, 명사구, 및 3W 자질을 이용하여 문장추출의 성능을 최대화하기 위한 방안을 제안하고, 세 개의 평가 도메인을 대상으로 실험을 수행하였다. 실험 결과, when 및 where 자질과 동사, 명사. 명사구의 가중치를 이용하여 문장 가중치를 계산함으로써 최적의 이벤트 문장추출 성능을 얻을 수 있음을 알 수 있었다.

  • PDF

Building an Automated Scoring System for a Single English Sentences (단문형의 영작문 자동 채점 시스템 구축)

  • Kim, Jee-Eun;Lee, Kong-Joo;Jin, Kyung-Ae
    • The KIPS Transactions:PartB
    • /
    • v.14B no.3 s.113
    • /
    • pp.223-230
    • /
    • 2007
  • The purpose of developing an automated scoring system for English composition is to score the tests for writing English sentences and to give feedback on them without human's efforts. This paper presents an automated system to score English composition, whose input is a single sentence, not an essay. Dealing with a single sentence as an input has some advantages on comparing the input with the given answers by human teachers and giving detailed feedback to the test takers. The system has been developed and tested with the real test data collected through English tests given to the third grade students in junior high school. Two steps of the process are required to score a single sentence. The first process is analyzing the input sentence in order to detect possible errors, such as spelling errors, syntactic errors and so on. The second process is comparing the input sentence with the given answer to identify the differences as errors. The results produced by the system were then compared with those provided by human raters.

A Study on the Sentence Generation using Lexical Information (어휘정보를 이용한 문장작성에 관한 연구)

  • 황인정;민홍기
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.5 no.3
    • /
    • pp.198-204
    • /
    • 2004
  • This study suggests a sentence generating method to help those who have language impediment with their communication. The method suggested in this study was constructed into a system in order to be applied to AAC system. AAC system is a personal portable device that generates sentences. Those who have language impediment need another communication method, causes inconvenience when used in a conversation with those who don't have the same trouble. The method of inputting both consonants and vowels can be inconvenient and time consuming for a conversational communication because of the number of the key strokes. The lexical information for the sentence generating of this study defines the user's domain, collects the adequate words and sentences, and extracts and classifies the characteristics of the collected words. The comparison between the number of key strokes for sentence generating using the system and that of inputting consonants and vowels using a keyboard was made in order to evaluate the usefulness the sentence generating method.

  • PDF