• 제목/요약/키워드: words frequency

검색결과 876건 처리시간 0.026초

한국어 단어재인에 있어서 빈도와 길이 효과 탐색 (The exploration of the effects of word frequency and word length on Korean word recognition)

  • 이창환;이윤형;김태훈
    • 한국산학기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.54-61
    • /
    • 2016
  • 단어는 언어의 기초적인 의미 단위이기 때문에 단어재인에 대한 연구는 언어 연구에서 중요하며 단어처리에 기여하는 변인이 무엇인지에 관한 연구가 이루어져 왔다. 본 연구에서는 한국어 단어재인 과정의 주요 변인 중 단어 빈도와 단어길이의 영향을 탐색하였다. 먼저 단어 빈도와 관련하여, 한국어의 특징 중 하나인 한자어로 이루어진 단어에서도 기존의 연구와 동일한 양상의 빈도 효과가 나타나는지를 탐색하였다. 이를 위해 순 한글 단어와 한자어로 이루어진 단어를 비교하였으며, 그 결과 한자어로 이루어진 단어에서는 빈도 효과가 나타나지 않았다. 한편 단어 길이 효과의 경우, 단음절로 구성된 단어의 양상을 확인해 보고자, 음절의 개수를 변화시켜 단어 길이 효과를 측정하였다. 그 결과 단음절 단어는 이음절 단어에 비해 느리게 처리되었다. 특정 유형의 단어에 대한 빈도 효과의 부재 및 단음절 단어의 느린 처리는 한국어의 특징을 반영한 결과라 할 수 있으며 추후 연구를 통해 이에 대한 좀더 자세한 탐색이 필요할 것이다.

비유창성 실어증 환자의 단어빈도 및 길이, 생물성에 따른 이름대기 수행의 차이 (The Differences of Naming by Word Frequency, Length, and Animacy in Nonfluent Aphasic Patients)

  • 권정희;최현주
    • 재활복지
    • /
    • 제20권1호
    • /
    • pp.171-188
    • /
    • 2016
  • 이 연구는 비유창성 실어증 환자 집단과 정상 성인 집단을 대상으로 단어빈도, 단어길이, 생물성의 세 가지 어휘조건에 따른 이름대기 수행에 차이가 있는지 알아보는 것을 목적으로 하였다. 연구 대상은 비유창성 실어증 환자 15명과 정상 성인 15명이었다. 이름대기 과제의 목표 단어는 그림으로 표현 가능한 구체명사만 사용하였으며, 이름대기 평가는 그림을 이용한 대면이름대기방법을 사용하였다. 목표 단어는 단어빈도(저빈도어/고빈도어), 단어길이(1음절/3음절), 생물성(생물/무생물)의 어휘조건을 적용하여 총 40개의 문항으로 구성하였다. 연구 결과를 살펴보면 다음과 같다. 첫째, 두 집단 모두 고빈도 단어의 이름대기 수행이 저빈도 단어보다 높게 나타났다. 둘째, 두 집단 모두 1음절 단어의 이름대기 수행이 3음절 단어보다 높게 나타났다. 셋째, 두 집단 모두 생물성에 따른 이름대기 수행에는 유의한 차이가 없었다. 넷째, 집단과 어휘조건의 상호작용 효과는 단어빈도에서만 나타났다. 이러한 결과는 비유창성 실어증 환자들의 어휘조건에 따른 이름대기 능력의 저하는 단어길이나 생물성에 비해 단어빈도의 효과가 크다는 것을 시사한다. 이러한 연구결과는 비유창성 실어증 환자의 이름대기 평가와 중재의 기초 자료로 활용될 수 있다.

의미 네트워크 분석법을 활용한 초등 예비교사들이 생각하는 과학에 대한 의미 분석 (An Analysis of Scientific Concepts Pre-service Elementary School Teachers Have through Semantic Network Analysis)

  • 김동렬
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제32권3호
    • /
    • pp.327-345
    • /
    • 2013
  • This study aims to investigate how pre-service elementary school teachers understand 'something scientific', 'being scientific', 'scientific events' and 'scientific questions' through semantic network analysis. To achieve this purpose, this study carried out a central analysis of the frequency and density of words and the degree of connection between key words, a concentric analysis, a click analysis and a common network analysis through text semantic network analysis by using NetMiner 4.0 Program. Based on the results of these analyses, this study came to the following conclusions. Firstly, in perceiving 'something scientific', pre-service elementary school teachers recognized 'verification', 'objective' and 'experiment' as most important words. In other words, they perceived that main grounds for something scientific should be provided through clear facts, possible to be verified and accompanied by an exact and logical theoretical system. In regard to 'being scientific', they perceived 'explanation', 'objective' and 'verification' as most important words, while having a traditional point of view that science is a set that can be explained objectively. Secondly, in regard that the term, 'observation', is contained in 'scientific events', they showed a high rate of understanding it as a scientific event. In regard to scientifical reasons, they showed the highest frequency of 'observation', and for unscientific reasons, they showed the highest frequency of 'behavior'. In perceiving 'scientific questions', they showed the highest frequency of determining bacteria-related questions as scientific. As a reason why they thought as scientific, they mentioned 'observation' most frequently like 'scientific events', while mentioning 'value judgement' as a reason why they thought as unscientific most frequently. From the results of integrated network analysis, this study found out that words pre-service teachers commonly used in stating scientific events or scientific questions were overlapped with words they mentioned for scientific events or scientific questions. As a result, it was found there were many pre-service teachers having interpreted scientific words without clearly distinguishing scientific events or scientific questions.

조선왕조실록 분석을 위한 단어 빈도수 기반 빅 데이터 분석 (Word Frequency-Based Big Data Analysis for the Annals of the Joseon Dynasty)

  • 변영일;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.707-709
    • /
    • 2022
  • 조선왕조실록은 조선왕조가 태조부터 철종까지 이르기까지 472년간의 역사를 편찬한 사서이다. 조선왕조실록은 국보 제 151호로 중요한 기록유산이지만 내용이 방대하여 분석함에 있어 어려움이 따른다. 따라서 조선왕조실록의 모든 내용을 분석하기 보다는 중요한 단어들을 추출하여 분석해야 할 필요가 있다. 본 논문에서는 웹 크롤링을 통하여 조선왕조실록 웹페이지의 본문에서 단어를 추출하고 단어의 빈도수에 따라 정렬한 데이터를 기반으로 번역된 조선왕조실록의 본문을 분석하는 방법을 제안한다. 본 연구는 조선왕조실록의 세종 부분만을 추출하여 단어의 빈도수에 따라 중요도를 분석하였다.

  • PDF

English vowel production conditioned by probabilistic accessibility of words: A comparison between L1 and L2 speakers

  • Jonny Jungyun Kim;Mijung Lee
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.1-7
    • /
    • 2023
  • This study investigated the influences of probabilistic accessibility of the word being produced - as determined by its usage frequency and neighborhood density - on native and high-proficiency L2 speakers' realization of six English monophthong vowels. The native group hyperarticulated the vowels over an expanded acoustic space when the vowel occurred in words with low frequency and high density, supporting the claim that vowel forms are modified in accordance with the probabilistic accessibility of words. However, temporal expansion occurred in words with greater accessibility (i.e., with high frequency and low density) as an effect of low phonotactic probability in low-density words, particularly in attended speech. This suggests that temporal modification in the opposite direction may be part of the phonetic characteristics that are enhanced in communicatively driven focus realization. Conversely, none of these spectral and temporal patterns were found in the L2 group, thereby indicating that even the high-proficiency L2 speakers may not have developed experience-based sensitivity to the modulation of sub-categorical phonetic details indexed with word-level probabilistic information. The results are discussed with respect to how phonological representations are shaped in a word-specific manner for the sake of communicatively driven lexical intelligibility, and what factors may contribute to the lack of native-like sensitivity in L2 speech.

4세 유아의 수세기 기술과 어머니의 수 단어 사용: 유아 수 단어 사용의 매개효과 (Four-Year-Old Children's Counting Skills and Their Mothers' Use of Number Words: The Mediating Role of Children's Number Word Use)

  • 박지현;박유정;이유진;백선정;최수경
    • 한국보육지원학회지
    • /
    • 제19권6호
    • /
    • pp.79-95
    • /
    • 2023
  • Objective: This study examines the relationships among four-year-olds' counting skills, their use of number words, and their mothers' use of number words during mother-child free play. Specifically, we assess whether children's use of number words mediates the relationship between their counting skills and their mothers' use of number words during play. Methods: Forty-two 4-year-old children and their mothers were asked to play freely with a given set of toys at their home for 10 minutes. Children also completed a counting skill test. Frequencies of number word use were calculated for mothers and children from transcriptions of the free play. Results: Children's counting skills, the frequency of their number word use, and their mothers' frequency of number word use were positively correlated with each other. Additionally, the frequency of children's number-word use completely mediated the relationship between their counting skills and their mothers' frequency of number-word use. Conclusion/Implications: The results suggest that children's use of number language may play a crucial role in the provision of number-related language input by parents, based on their children's math skills. Practical implications of the findings are discussed.

명명 과제에서 음절 토큰 및 타입 빈도 효과 (The Syllable Type and Token Frequency Effect in Naming Task)

  • 권유안
    • 인지과학
    • /
    • 제25권2호
    • /
    • pp.91-107
    • /
    • 2014
  • 음절 빈도 효과란 고빈도 음절로 시작되는 단어가 저빈도 음절로 시작되는 단어에 비해 어휘 판단 속도가 느리며 어휘 판단 오류율도 증가하는 효과를 의미한다. 이 효과를 유발하는 원인은 전체 단어 수준에서 활성화된 음절 이웃 단어의 방해로 알려져 있으며 이 방해의 크기는 표적 단어가 얼마나 많은 음절 이웃 단어를 또는 얼마나 강력한 음절 이웃 단어를 가지고 있는지에 의해 결정된다. 그러나 음절 빈도의 정의가 음절 타입 빈도와 토큰 빈도로 구분됨에도 불구하고 이를 구분하지 않고 많은 연구들이 수행되어 왔다. 최근 Conrad, Carreiras, & Jacobs(2008)에 따르면 음절 토큰 빈도는 전체 단어 처리 수준을 반영하는 변인이며 음절 타입 빈도는 하위 어휘 처리 수준의 음절 처리 수준을 반영하는 변인일 수 있다고 주장하였다. 이에 본 연구는 이들의 주장이 맞다면 음절 타입 빈도는 단어 명명 속도를 촉진 시킬 것이며 반대로 음절 토큰 빈도는 명명 시간과 관련 없을 것이라고 예측하였다. 왜냐하면 표기 심도가 얕고 음절의 경계가 명확한 언어에서 명명 과제는 전체 단어수준을 덜 참고하기 때문이었다. 실험 1결과에서 음절 토큰 빈도를 통제한 상태에서 고빈도 타입음절의 단어 명명 시간은 유의미하게 짧았다. 실험 2에서 음절 타입 빈도를 통제한 상태에서 음절토큰 빈도의 증가는 명명 시간을 역시 단축시켰다. 이에 본 연구는 음절 토큰 빈도가 하위 어휘 처리와 무관하다는 Conrad, Carreiras, & Jacobs(2008)의 주장을 반박하였다.

세 가지 자극 양식이 실어증자의 언어이해력과 언어표현력에 미치는 영향 (The Effects of Three Stimulus Modes on receptive Language Performance and expressive Language Performance in Aphasics.)

  • 이무경;유재연;이옥분;정옥란
    • 음성과학
    • /
    • 제7권3호
    • /
    • pp.263-272
    • /
    • 2000
  • The purpose of this study was to compare receptive language performance and expressive language performance in 13 patients with aphasia by using three stimulus presentation modes: Stimulus mode I (picture), Stimulus mode II (written word), Stimulus m (question using verbal explanation). The stimulus consisted of 10 words. They included 5 functional words and 5 non-functional words. The 13 subjects with aphasia were divided into 2 aphasic types: 5 Broca's aphasics and 8 anomie aphasics. The results were as follows: Firstly, the three stimulus modes didn't affect receptive language performance of aphasia subjects. Secondly; the three stimulus modes were effective on expressive language performance of aphasia subjects. Particularly, stimulus mode II (written words) was effective in naming the aphasia subjects. Thirdly, the functional words with high frequency were better than non-functional words with low frequency on expressive language performance, but not on receptive language performance of aphasia subjects. Finally, the interaction between three stimulus modes and the functional (nonfunctional) words affected expressive language performance only, but not receptive language performance. Particularly, presenting stimulus in written words which are functional words produced the best expressive language performance.

  • PDF

Word Frequency Effects on Duration and F0 in English Homophone Utterances

  • Kwon, Soon-Kyo;Jang, Tae-Yeoub
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.227-229
    • /
    • 2007
  • We investigate whether the word frequency effects occur in native speakers' homophone speech in such a way that less frequent words are produced with greater magnitudes in duration and F0 than more frequent words. Acoustic analyses of homophone data produced by four speakers reveal that there is a tendency that vowels in less frequent words get longer than those in more frequent words, and statistical tests verify the significance of their differences. On the other hand, no considerable correlation has been discovered between F0 and word frequency.

  • PDF

A Study on the Diachronic Evolution of Ancient Chinese Vocabulary Based on a Large-Scale Rough Annotated Corpus

  • Yuan, Yiguo;Li, Bin
    • 아시아태평양코퍼스연구
    • /
    • 제2권2호
    • /
    • pp.31-41
    • /
    • 2021
  • This paper makes a quantitative analysis of the diachronic evolution of ancient Chinese vocabulary by constructing and counting a large-scale rough annotated corpus. The texts from Si Ku Quan Shu (a collection of Chinese ancient books) are automatically segmented to obtain ancient Chinese vocabulary with time information, which is used to the statistics on word frequency, standardized type/token ratio and proportion of monosyllabic words and dissyllabic words. Through data analysis, this study has the following four findings. Firstly, the high-frequency words in ancient Chinese are stable to a certain extent. Secondly, there is no obvious dissyllabic trend in ancient Chinese vocabulary. Moreover, the Northern and Southern Dynasties (420-589 AD) and Yuan Dynasty (1271-1368 AD) are probably the two periods with the most abundant vocabulary in ancient Chinese. Finally, the unique words with high frequency in each dynasty are mainly official titles with real power. These findings break away from qualitative methods used in traditional researches on Chinese language history and instead uses quantitative methods to draw macroscopic conclusions from large-scale corpus.