• 제목/요약/키워드: Sentence Length

검색결과 88건 처리시간 0.025초

문장 길이 축소를 이용한 구 번역 테이블에서의 병렬어휘 추출 성능 향상 (Performance Improvement of Extracting Bilingual Term from Phrase Table using Sentence Length Reduction)

  • 정선이;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.120-125
    • /
    • 2013
  • 본 연구는 대량의 특정 도메인 한영 병렬 말뭉치에서 통계 기반 기계 번역 시스템을 이용하여 병렬어휘를 효과적으로 추출해 낼 수 있는 방법에 관한 것이다. 통계 번역 시스템에서 어족이 다른 한국어와 영어간의 문장은 길이 및 어순의 차이로 인해 용어 번역 시 구절 번역 정확도가 떨어지는 문제점이 발생할 수 있다. 또한 문장 길이가 길어짐에 따라 이러한 문제는 더욱 커질 수 있다. 본 연구는 이러한 조건에서 문장의 길이가 축소된 코퍼스를 통해 한정된 코퍼스 자원 내 구 번역 테이블의 병렬어휘 추출 성능이 향상될 수 있도록 하였다.

  • PDF

말소리장애 아동과 일반 아동의 발화 속도와 쉼 비교 (Comparison of overall speaking rate and pause between children with speech sound disorders and typically developing children)

  • 이흥임;김수진
    • 말소리와 음성과학
    • /
    • 제9권2호
    • /
    • pp.111-118
    • /
    • 2017
  • This study compares speech rate, articulatory rate, and pause between the children with mild and moderate Speech Sound Disorder (SSD) who performed Sentence Repetition Tasks and the Typically Developing children (TD) of the same chronological age. The results showed that three groups are categorized in terms of speaking rate and articulatory rate. There is no difference between the two groups with SSD children, namely between the mild and moderate groups. However, there is a significant difference in their rate of speech and the articulatory rate between the two groups, such that the two groups with SSD are significantly slower than the TD group. The results also showed that there are no significant difference in the length and frequency of pause between the moderate group and the mild group. However, there is a substantial difference between them and the TD group. This study, provided the basic data for evaluating the speech rate of the children and implies that there are limitations in speech rate among the children with SSD.

환자/보호자 교육 및 건강정보제공용 인쇄매체의 읽기쉬움 평가 연구 (Readability of Printed Educational Materials Used to Inform Computer Tomography)

  • 유혜라
    • 지역사회간호학회지
    • /
    • 제12권3호
    • /
    • pp.670-679
    • /
    • 2001
  • This study examined the readability of 4 different kinds of patient education handouts about computer tomography tests from 5 different university-affiliated hospitals in Korea. Readability was evaluated in terms of syntax. length of sentence, usage of unfamiliar words. foreign words. Chinese words, abbreviation, and technical jargon. This study found that all of the handouts were very difficult to read. An excessive use of complex and long sentences was found. Unfamiliar words, rarely used in everyday life, were recklessly used. Most of the unfamiliar words were Chinese words and can be exchanged with Korean language. Excessive medical terminologies were used without any explanations. Based on the study results, guidelines to make the handouts easier and more accessible to patients and their family were recommended.

  • PDF

길이 정보와 유사도 정보를 이용한 한영 문장 정렬 (Korean-English Sentence Alignment using Length and Similarity Information)

  • 홍진표;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.130-135
    • /
    • 2010
  • 문장 정렬은 두 개의 문서 간의 대응이 되는 문장을 찾는 작업이다. 이 방법은 통계적 기계 번역의 학습 문서인 병렬 말뭉치를 자동으로 구축하는데 필수적인 방법이다. 본 연구에서는 길이 정보에 추가적으로 유사도 정보를 반영하는 한영 문장 정렬 방법을 제안한다. 먼저 한국어로 된 문서를 기계번역 시스템에 적용하여 영어 문서로 변환한다. 그리고 번역된 영어로 된 문서 결과와 영어로 된 대상 문서 간의 정렬 작업을 수행한다. 정렬 완료된 결과와 원시 문서, 대상 문서로부터 최종적인 결과를 생성해낸다. 본 논문에서는 기계 번역을 이용하는 방법과 더불어 기존의 길이 기반 문장 정렬 프로그램에 문장 유사도 정보를 추가하여 단어 정렬의 성능 향상을 꾀하였다. 그 결과 "21세기 세종기획"의 최종 배포본 내에 포함된 한영 병렬 말뭉치에 대해 한영 문장 정렬 F-1 자질의 결과가 89.39%를 보였다. 이 수치는 기존의 길이 기반의 단어 정렬의 성능 평가 결과와 비교했을 때 약 8.5% 가량 성능이 향상되었다.

  • PDF

The Effectiveness of Language Learning Through Native English Teachers' Online Synchronous Class

  • Tan, Jialu;Tan, Shengyuan;Bae, Ki-Hyung
    • International Journal of Contents
    • /
    • 제18권3호
    • /
    • pp.1-10
    • /
    • 2022
  • The advancement of Internet technologies has provided a new and effective way to cultivate international talents. To investigate the effect of native English teachers' online synchronous classes on Chinese primary school students' oral English improvement, an 18-month quasi-experimental study was conducted on 300 primary school students in China. The experiment and control groups were provided biweekly synchronous online classes with native and non-native English teachers. SPSS was used to conduct Paired Sample T-Tests and analyze performance differentials. The results showed that online classes taught by native English teachers perform better than non-native English teachers in three areas: vocabulary accuracy, average sentence length, and phonological intonation.

InferSent를 활용한 오픈 도메인 기계독해 (Open Domain Machine Reading Comprehension using InferSent)

  • 김정훈;김준영;박준;박성욱;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.89-96
    • /
    • 2022
  • 오픈 도메인 기계독해는 질문과 연관된 단락이 존재하지 않아 단락을 검색하는 검색 기능을 추가한 모델이다. 문서 검색은 단어 빈도 기반인 TF-IDF로 많은 연구가 진행됐으나 문서의 양이 많아지면 낮은 성능을 보이는 문제가 있다. 아울러 단락 선별은 단어 기반 임베딩으로 많은 연구가 진행됐으나 문장의 특징을 가지는 단락의 문맥을 정확히 추출하지 못하는 문제가 있다. 그리고 문서 독해는 BERT로 많은 연구가 진행됐으나 방대한 파라미터로 느린 학습 문제를 보였다. 본 논문에서는 언급한 3가지 문제를 해결하기 위해 문서의 길이까지 고려한 BM25를 이용하며 문장 문맥을 얻기 위해 InferSent를 사용하고, 파라미터 수를 줄이기 위해 ALBERT를 이용한 오픈 도메인 기계독해를 제안한다. SQuAD1.1 데이터셋으로 실험을 진행했다. 문서 검색은 BM25의 성능이 TF-IDF보다 3.2% 높았다. 단락 선별은 InferSent가 Transformer보다 0.9% 높았다. 마지막으로 문서 독해에서 단락의 수가 증가하면 ALBERT가 EM에서 0.4%, F1에서 0.2% 더 높았다.

우리 문장 읽기에서 안구 운동의 특성: 어절 길이, 단어 빈도 및 착지점 관련 효과 (The characteristics of eye-movement in Korean sentence reading: cluster length, word frequency, and landing position effects)

  • 고성룡;윤낙영
    • 인지과학
    • /
    • 제18권4호
    • /
    • pp.325-350
    • /
    • 2007
  • 본 연구에서는 대학생 독자들이 48개의 평이한 문장을 읽을 때, 전반적인 안구 운동의 특성과 어절/단어 수준에서의 특성을 알아보았다 대학생 독자들은 어절을 대략 225ms 보다가 3.6자 정도 뛰어 다음 어절로 눈을 움직였다. 어절이 짧고 단어가 고빈도일 때는 어절을 건너뛰기도 하고, 앞으로만 읽어가는 것이 아니라 19% 정도 다시 되돌아가서 읽기도 했다. 물론 고정과 도약의 양상은 독자에 따라 개인차가 있었다. 이런 전반적인 양상과 더불어, 어절 수준에서 어절 길이, 단어 빈도 및 착지점 관련 효과를 살펴보았는데, 눈은 대체로 어절의 중앙에 자주 착지했으며, 가장자리에 착지했을 때가 중앙에 착지할 때보다 그 어절을 다시 더 고정했다. 또한 독자들은 단어가 고빈도인 어절을 저빈도인 어절보다 훨씬 빨리 읽었다.

  • PDF

SOME PROSODIC FEATURES OBSERVED IN THE PASSAGE READING BY JAPANESE LEARNERS OF ENGLISH

  • Kanzaki, Kazuo
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.37-42
    • /
    • 1996
  • This study aims to see some prosodic features of English spoken by Japanese learners of English. It focuses on speech rates, pauses, and intonation when the learners read an English passage. Three Japanese learners of English, who are all male university students, were asked to read the speech material, an English passage of 110 word length, at their normal reading speed. Then a native speaker of English, a male American English teacher. was asked to read the same passage. The Japanese speakers were also asked to read a Japanese passage of 286 letters (Japanese Kana) to compare the reading of English with that of japanese. Their speech was analyzed on a computerized system (KAY Computerized Speech Lab). Wave forms, spectrograms, and F0 contours were shown on the screen to measure the duration of pauses, phrases and sentences and to observe intonation contours. One finding of the experiment was that the movement of the low speakers' speech rates showed a similar tendency in their reading of the English passage. Reading of the Japanese passage by the three learners also had a similar tendency in the movement of speech rates. Another finding was that the frequency of pauses in the learners speech was greater than that in the speech of the native speaker, but that the ration of the total pause length to the whole utterance length was about tile same in both the learners' and the native speaker's speech. A similar tendency was observed about the learners' reading of the Japanese passage except that they used shorter pauses in the mid-sentence position. As to intonation contours, we found that the learners used a narrower pitch range than the native speaker in their reading of the English passage while they used a wider pitch range as they read the Japanese passage. It was found that the learners tended to use falling intonation before pauses whereas the native speaker used different intonation patterns. These findings are applicable to the teaching of English pronunciation at the passage level in the sense that they can show the learners. Japanese here, what their problems are and how they could be solved.

  • PDF

Praat을 활용한 영어발음특성의 시각적 연구 (A Visual Study of the Quality of English Pronunciation Using the Praat Program)

  • 박희석
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권3호
    • /
    • pp.323-331
    • /
    • 2013
  • Praat프로그램을 활용하면 시각적인 영어교육효과를 얻을 수 있다. 시청각교육이 중시되는 영어교육의 방법론에 비추어볼 때 시각적인 연구의 활용은 교육의 효율성 측면에서 기대되는바가 크다고 할 수 있다. 이러한 점에 착안하여 본 연구에서는 현재 고등학교에 재학 중인 학생들 중 영어성적이 1,2등급에 해당되는 학생과 5,6등급에 해당되는 학생들을 두 그룹으로 나누어 각각의 그룹이 원어민의 발음과 어떤 차이를 보이는지를 알아보고, 그 차이가 어떻게 다른지를 시각적인 면으로 규명해보고자 시도하였다. 이를 위해 원어민이 녹음한 CD가 내장되어있는 영어발음교재를 실험자료로 활용하였다. 구체적으로 영어발음에서 외국인어투를 보일 가능성이 있는 영어저모음과 이중모음이 들어있는 단어와 문장을 대상으로 하였으며, 단어와 문장들은 캠브리지대학교 출판국에서 출간된 English Pronunciation in Use의 교재내용 중의 일부를 활용하였다. 실험을 통해 나타난 결과를 보면 한국인 피 실험자의 두 집단 간에 공히 모음이나 단어단위에선 집단 간, 그리고 원어민의 녹음자료와의 사이에서도 유의미한 차이가 나타나지 않았다. 그러나 다섯 단어 이상으로 구성된 상대적으로 긴 문장단위의 실험에서는 5,6등급 집단의 발음이 유의미하게 크게 나타났다. 이러한 결과는 한국인 피 실험자들의 억양구현실패에서 기인한 것으로 보여지며, 이러한 분석은 Praat프로그램에서 제공한 시각적인 자료에 의해 뒷받침되고 있다.

휴지 단위와 호흡 단위의 실현 양상 연구 (Study on the realization of pause groups and breath groups)

  • 유도영;신지영
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.19-31
    • /
    • 2020
  • 이 연구의 목적은 성인 화자의 휴지 단위와 호흡 단위의 실현 양상을 관찰하여, 이것이 인지적 차이나 사회 언어적 변수 간 차이를 어떻게 반영하고 있는지 고찰하는 것이다. 이러한 차이를 고찰하기 위해 과제, 세대, 성별에 따른 발화 길이와 호흡 단위의 실현을 살펴보았다. 이를 위해 청·장년층 남녀 화자 48명의 문단 낭독 발화와 자유 발화를 분석하였다. 과제와 성별 변수는 휴지 단위와 호흡 단위 실현에 모두 영향을 주었다. 발화 길이는 낭독 발화에서, 여성의 발화에서 더 길었고, 호흡 단위의 길이는 자유 발화와 남성의 발화에서 더 길게 나타났다. 한편 세대 변수는 발화 길이 실현에는 영향을 주지 못했지만, 음절 수와 어절 수 실현에는 영향을 주었다. 발화 과제에 따른 차이는 인지적 부담량을 반영한다. 발화 계획이 빈번하게 이뤄져야 하는 자유 발화는 상대적으로 더 짧은 발화 길이를 보인다. 호흡 단위의 길이가 낭독 발화에서 더 짧았던 이유는 낭독 발화의 문장 길이에 영향을 받은 것이다. 성별에 따른 차이는 남성과 여성의 발화 내 휴지 패턴 차이에서 기인하였다. 호흡 단위의 경우 남성이 여성보다 더 긴 길이를 보였는데, 이는 남성과 여성의 폐활량 차이에서 비롯한 것으로 보인다. 세대는 음절 수와 어절 수 실현에만 영향을 주었는데, 이는 세대 간 발화속도 차이에서 기인한 결과로 해석할 수 있다.