• 제목/요약/키워드: sentence translation

검색결과 106건 처리시간 0.024초

현풍(玄風) 곽씨(郭氏) 언간(諺簡)의 격조사(格助詞) 생략(省略)에 대한 고찰(考察) (A Study on the Ellipsis of Case markers through the Hangul letters of Hyun-Poong Kwak's family)

  • 전병용
    • 동양고전연구
    • /
    • 제33호
    • /
    • pp.413-435
    • /
    • 2008
  • 본고의 목적은 17세기 전반기(前半期)에 쓰인 '현풍(玄風) 곽씨(郭氏) 언간(諺簡)'을 대상으로 격조사(格助詞)의 생략 양상과 기능을 분석하는 데 있다. 판본 자료가 주로 불특정한 다수에게 메시지를 전달하는 데 반해 언간 자료는 특정한 개인에게 메시지를 전달한다는 점에서 판본 자료보다 '생략'이 더 자주 나타난다. 그 가운데에서 '격조사'의 생략이 두드러진다. 이러한 생략에는 '간결성', '비격식성', '신속성', '문체적 효과' 따위의 기능이 있다. 위에 제시한 생략의 네 가지 기능을 중심으로 격조사 생략의 양상을 분석하였다. 분석 결과는 다음과 같다. 격조사 가운데 주격조사와 대격조사의 생략이 가장 자주 일어난다. 문장의 운율효과를 높일 때나 연어와 관용어 표현에서 이러한 생략이 일어났다. 또한 한문을 직역한 번역체에서도 생략이 나타났다. 처격조사는 주격조사와 대격조사에 비해 상대적으로 생략이 덜 일어나는 편이다. 처격조사 가운데에서도 '-에/-의'가 '-에셔/-의셔/-셔'보다 생략이 더 잘 되었다. '-에/-의' 다음에 동작성이 약하거나 동작성이 없는 동사가 오고, '-에셔/-의셔/-셔' 다음에 동작성이 강한 동사가 오는 것과 관련이 있는 듯하나 단정할 수 없다. 여격조사는 주격, 대격, 처격에 비해 실현이 잘 되었다. 다만 존칭 체언이 '아바님'이나 '어마님'일 경우 존칭의 여격조사('-')가 결합되지 않고 평칭의 여격조사('-의게/-게')가 결합된다는 점이 특기(特記)할 만하다. 속격조사는 현대국어에서와 마찬가지로 생략이 잘 되었으며 중세국어 언해문에서 보았던 주격적 속격이 꽤 남아 있었다. 구격조사 '-로'는 시간관련 어휘와 결합에서 [과거]의 '어제'에는 붙지 않고, [현재]의 ''과 [미래]의 ''에는 결합하는 경우가 많았고 간혹 생략되는 경우도 있었다.

오류분석을 통한 효율적인 영작문 지도법 (An effective teaching method of English composition through error analysis)

  • 박병제
    • 영어어문교육
    • /
    • 제1호
    • /
    • pp.159-187
    • /
    • 1995
  • The purpose of this study is to investigate common errors made by Korean learners in English composition and to find out what is an effective and appropriate teaching method of English composition in Korea. For these purposes, 197 students on the third grade in high school were selected as the subjects of this research. The students were tested by way of the immediate translation of 31 simple Korean sentences into English which are supposed to be easy for those students to write without any difficulty. About 2 minutes were given for testing each sentence. The results are as follows : First. the whole sum of errors made by 197 students was 2,972 and these types of errors were classified into 13 categories by Duskova's grammatical method and James'. The errors with comparatively high frequency were prepositional errors(17.2%), verbal errors(15.4%), and the errors with low frequency were article errors(1.9%), to-infinitive errors. Second, when Korean students learn English as a target language, overgeneralization(33.6%) and reduction(17.5) influenced the learners much more greatly than language transfer(22.2) did. But the influence of language transfer including interference & overgeneralization(l5.2%) and interference & reduction(10.7%) was no less than 48.1%. The statistics shows that the learners have a tendency to analyze, systematize and regularize the target language when they start to learn a new language.

  • PDF

영어 청해력 향상을 위한 효율적인 학습 지도 방안 (A study of an effective teaching of listening comprehension)

  • 박찬식
    • 영어어문교육
    • /
    • 제1호
    • /
    • pp.69-108
    • /
    • 1995
  • Listening comprehension can be defined as a process of an integrative, positive and creative activity through which listeners get the message of speakers' production using linguistic or non-linguistic redundancy as well as linguistic or non-linguistic knowledge. Compared with reading comprehension, it has many difficulties especially for foreigners. while it can be transferred to the other skills: speaking, reading, writing. With this said, listening comprehension can be taught effectively using the following teaching strategies. First. systematic and intensive instruction of segmental phonemes, suprasegmental phonemes and sound changes must be given to remove the difficulties of listening comprehension concerned with the identification of sounds. Second, vocabulary drill through various games and other activities is absolutely needed until words can be unconsciously recognized. Without this, comprehension is almost impossible. Third, instruction of sentence structures is thought to be essential considering grammar is supplementary to listening comprehension and reading comprehension for academic purpose. So grammar translation drills, mechanical drills, meaningful drills and communicative drills should be performed in succession with common or frequently used structures. Fourth, listening activities for overall comprehension should teach how to receive overall meaning of intended messages intact. Linguists and literatures have listed some specific activities as follows: Total Physical Response, dictation, role playing, singing songs, selective listening, picture recognition, list activities, completion, prediction, true or false choice, multiple choice, seeking of specific information, summarizing, problem-solving and decision-making, recognization of relationships between speakers, recognition of mood, attitude and behavior of speakers.

  • PDF

정렬된 성경 코퍼스로부터 바꿔쓰기표현(paraphrase)의 자동 추출 (Automatic Extraction of Paraphrases from a Parallel Bible Corpus)

  • 이공주;윤보현
    • 인지과학
    • /
    • 제17권4호
    • /
    • pp.323-336
    • /
    • 2006
  • 바꿔쓰기(paraphrasing)는 동일한 내용을 다르게 표현하는 방식을 의미한다. 이러한 바꿔쓰기표현들(paraphrues)은 기계번역, 질의 응답 시스템, 문서 요약과 같은 다양한 분야에 매우 유용하게 사용될 수 있다. 그러나 이와 같은 바꿔쓰기표현의 유용성에도 불구하고 바꿔쓰기표현을 자동으로 추출할 수 있는 방법이 매우 어렵다. 우선 바꿔쓰기표현을 자동으로 추출할 수 있는 데이터를 구하는 것부터가 어려운 문제이다. 본 연구에서는 여러 버전의 한글 성경 코퍼스로부터 바꿔쓰기표현을 자동으로 추출해 보고자 한다. 성경은 각 문장이 절과 구로 나누어져 있어 문장과 문장을 정렬시키는 것이 매우 용이하다. 정렬된 여러 버전의 성경 코퍼스로부터 자율학습(unsupervised learning)을 통해서 자동으로 바꿔쓰기표현을 추출한다. 이와 같은 방법은 어휘수준의 바꿔쓰기표현 뿐만 아니라 구문수준의 바꿔쓰기표현도 추출할 수 있음을 보여준다.

  • PDF

문장 길이가 한영 통계기반 기계번역에 미치는 영향 분석 (Empirical Impact Analysis of Sentence Length on Statistical Machine Translation)

  • 조희영;서형원;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.199-203
    • /
    • 2007
  • 본 논문에서는 한영 통계기반 기계번역에서 한국어 문장 길이의 변화에 따른 번역 성능의 변화를 분석하고자 한다. 일반적으로 통계기반 기계번역은 정렬기법을 이용하는데 문장의 길이가 길수록 많은 변형(distortion)이 이루어진다. 특히 한국어와 영어처럼 어순이 매우 다를 경우, 문장 길이의 변화에 따라 그 변형이 더욱 심할 수 있다. 본 논문에서는 이러한 성질이 통계기반 기계번역에 어떠한 영향을 주는지를 실험적으로 살펴보고자 한다. 본 논문에서 비교적 잘 정렬된 203,310개의 문장을 학습데이터로 사용하였고, 세종 병렬 말뭉치로부터 89,309개의 문장을 추출하여 실험데이터로 사용하였다. 실험데이터는 한국어 문장의 길이에 따라 5구간($1{\sim}4,\;5{\sim}8,\;9{\sim}13,\;14{\sim}19,\;20{\sim}n$ 개)로 나뉘었다. 각 구간은 가능한 문장의 수가 비슷하도록 하였으며, 17,126, 18,507, 20,336, 17,884, 15,456개의 문장이 포함되었다. 데이터들은 모두 어절단위로 토큰을 나누었다. 본 논문에서는 한영 번역을 중심으로 평가되었다. 첫 번째 구간에서 가장 좋은 성능인 0.0621 BLEU를 보였으며, 마지막 구간에서 가장 좋지 않은 0.0251 BLEU를 보였다. 이는 문장의 길이가 길수록 변역 성능이 좋지 않음을 알 수 있었다. 문장이 길수록 구가 길어지고 구간의 수식이 복잡해지므로 번역의 성능은 점차 떨어진다. 이것을 볼 때, 구번역을 먼저 한 후, 다시 문장 번역을 한다면 좀 더 높은 기계번역의 성능을 기대할 수 있을 것이다.

  • PDF

고려말에서 조선중기까지의 구결자료에 관한 서지학적 연구 (A bibliographical study of the 'kukyeul system' in Korean language from Koryo to Chosun dynasty)

  • 남권희
    • 한국도서관정보학회지
    • /
    • 제27권
    • /
    • pp.485-572
    • /
    • 1997
  • The purpose of this study is to investigate the textual and physical bibliography of these books that were printed from Koryo to Chosun Dynasty and written by the Kukyul system. This study is concerned with the Kukyul written in the transformed Chinese characters which representing their sino-Korean sound values only. The Kukyul is the Korean function word inserted to a written Chinese sentence for an easier understanding of the meaning by the Koreans. Until the present, most of these studies on the Kukyul are mainly concerned with the Korean linguistic characters. But this mentions to present the basic bibliographical information in order to presume the written period of the Kukyul system. 2The analysis of each book is made in the respect of: 1) historical aspect of the book 2) physical form and publishing date 3) transcription period of the Kukyul 4) the category of presenting Kukyul 5) historical change of transcribing Kukyul system The results of the study are as follows : First, the Kukyul system was divided into Sokdok and Sundok Kukyul according to the translation and recording format. Second, the Sokdok Kukyul is a kind of writing system for translated Chinese into Korean. Third, the Sundok Kukyul was frequently used Buddhist publications from later Koryo Dynasty to Middle Chosun period. Fourth, through the analysis of physical bibliography for that books, we rearrange the chronological oder of Sokdok Kukyul system as Hwaum-kyung, Hwaum-kyungSo, Kumkwngmyu ngkyung, Kuyeukinwang-kyung, Yukasajiron. Fifth, the characters of Sundok Kukyul systems were gradually decreased from eighty numbers to fifty numbers. This change is caused by the unification trends of sound value in morphological aspect.

  • PDF

문틀기반 영한 자동번역 시스템 (Sentence-Frame based English-to-Korean Machine Translation)

  • 최승권;서광준;김영길;서영애;노윤형;이현근
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.323-328
    • /
    • 2000
  • 국내에서 영한 자동번역 시스템을 1985 년부터 개발한 지 벌써 15년이 흐르고 있다. 15년의 영한 자동번역 기술개발에도 불구하고 아직도 영한 자동번역 시스템의 번역품질은 40%를 넘지 못하고 있다. 이렇게 번역품질이 낮은 이유는 다음과 같이 요약할 수 있을 것이다. $\textbullet$ 입력문에 대해 파싱할 때 오른쪽 경계를 잘못 인식함으로써 구조적 모호성의 발생문제: 예를 들어 등위 접속절에서 오른쪽 등위절이 등위 접속절에 포함되는 지의 모호성. $\textbullet$ 번역 단위로써 전체 문장을 대상으로 한 번역패턴이 아닌 구나 절과 같은 부분적인 번역패턴으로 인한 문장 전체의 번역 결과 발생. $\textbullet$ 점차 증가하는 대용량 번역지식의 구축과 관련해 새로 구축되는 번역 지식과 기구축된 대용량 번역지식들 간의 상호 충돌로 인한 번역 품질의 저하. 이러한 심각한 원인들을 극복하기 위해 본 논문에서는 문틀에 기반한 새로운 영한 자동번역 방법론을 소개하고자 한다. 이 문틀에 기반한 영한 자동번역 방법론은 현재 CNN 뉴스 방송 자막을 대상으로 한 영한 자동번역 시스템에서 실제 활용되고 있다. 이 방법론은 기본적으로 data-driven 방법론에 속한다. 문틀기반 자동번역 방법론은 규칙기반 자동번역 방법론보다는 낮은 단계에서 예제 기반 자동번역 방법론 보다는 높은 단계에서 번역을 하는 번역방법론이다. 이 방법론은 영한 자동번역에 뿐만 아니라 다른 언어쌍의 번역에서도 적용할 수 있을 것이다.

  • PDF

한국어-수화 번역시스템을 위한 형태소 변환 (Morpheme Conversion for korean Text-to-Sign Language Translation System)

  • 박수현;강석훈;권혁철
    • 한국정보처리학회논문지
    • /
    • 제5권3호
    • /
    • pp.688-702
    • /
    • 1998
  • 본 논문에서는 한국어 각 품사별로 형태소 해석 규칙에 대응하는 수화 형태소 생성규칙을 제안한다. 한국어 자연수화는 한국어 자연언어에 비하여 극히 한정된 어휘를 가지며, 문법 요소의 수도 매우 한정적으로 사용되고 있다. 따라서 본 논문에서는 자연스러운 한국어 문장을 대응하는 수화로 변환시키기 위해서 한국어 문법에 대응하는 자연수화 문법을 정의한다. 각 phrase는 한국어 해석 문법과는 별도의 수화 형태소 생성문법을 정의 해야 하며, 이 문법은 형태소 해석/결합 규칙 및 구구조 해석규칙에 적용되고, 이 규칙의 정의로 가장 자연스러운 자연수화를 생성할 수 있게 된다.

  • PDF

국어 로마자 표기 자동 변환 시스템 설계 및 구현 (The design and implementation of automatic translation system for hangul's romanization)

  • 김홍섭
    • 한국컴퓨터정보학회지
    • /
    • 제2권1호
    • /
    • pp.45-54
    • /
    • 1995
  • 본 연구는 ASCII 코드중에서 잘 쓰이지 않는 코드를 반달점(ˇ)으로 할당, 글꼴을 제작하여, 사용자가 국어 로마자 표기법 기본원칙을 모르더라도 한글단어, 문장, 문서를 문자열(string)로 입력받아 알고리즘화된 음운법칙을 적용하여 소리글자로 자동 변환 후 현행 정부 표준안인 국어 로마자 표기법 테이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 설계하였으며, 예외어 처리, 화면색상 및 풀다운 팝업 메뉴 방식을 지원, 마우스 활용 방식을 채택, 사용자 편리성을 제공하였으며, 다양한 서체, 글꼴 확대 및 축소, 이단ㆍ혼합 인쇄기능 등을 고려 C언어를 이용하여 구현하였다.

  • PDF

이중 언어 기반 패러프레이즈 추출을 위한 피봇 차별화 방법 (Pivot Discrimination Approach for Paraphrase Extraction from Bilingual Corpus)

  • 박에스더;이형규;김민정;임해창
    • 인지과학
    • /
    • 제22권1호
    • /
    • pp.57-78
    • /
    • 2011
  • 패러프레이즈는 같은 의미를 다른 단어를 사용하여 표현한 것을 말한다. 패러프레이즈는 일상적인 언어생활에서도 흔히 관측되며 자연어처리 분야에서 다양하게 활용할 수 있다. 특히 최근에는 통계적 기계 번역 분야에서 데이터 부족 문제를 보완하여 번역 성능을 향상시키기 위해 패러프레이즈를 활용한 연구가 많다. 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇으로 사용하기 때문에 단어 정렬 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류가 패러프레이즈로 전파될 수 있다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우에는 단어 정렬 오류가 더 심각하기 때문에 피봇 프레이즈부터 잘못 추출되는 경우가 많아진다. 이러한 문제를 보완하기 위해 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서 어휘, 품사 정보를 이용해 올바른 피봇 프레이즈에 더 높은 가중치를 부여하는 방법을 제안한다. 실험 결과, 제안하는 피봇 가중치 부여 방법을 기존의 패러프레이즈 추출 방법에 추가했을 때 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다. 또한, 제안하는 방법을 통해 추출한 패러프레이즈를 한영 기계 번역 시스템에서 활용하였을 때 번역률이 향상됨을 확인할 수 있었다.

  • PDF