• 제목/요약/키워드: Reading Speech

검색결과 203건 처리시간 0.027초

말하기 숙달도에 따른 대학생 집단별 억양곡선 고찰 (A Study on the Intonation Contours of Students' Groups by Oral Proficiency Level)

  • 양병곤;서준영
    • 음성과학
    • /
    • 제14권3호
    • /
    • pp.77-89
    • /
    • 2007
  • This paper examined the intonation contours of English sentences produced by the Korean students. Thirty students participated in the speaking tasks made up of three parts: an oral interview, picture description and a conversational text reading. Their pronunciations in the parts were recorded on a minidisk. Then, two native instructors evaluated their proficiency level focusing on general intelligibility and suprasegmental aspects of the speech. Based on the results of evaluation they were divided into two groups: high and low proficiency groups. The pitch contours of three sentences produced by both the Korean students and a native speaker were compared to find any similarities and differences in the students' intonation patterns using Praat. Results showed that there was a moderate correlation in the proficiency scores of the students by the two native speakers. Secondly, students who earned high scores in the proficiency level matched better the native model. Thirdly, the high group students knew more on the pitch contour and tried to carefully realize them while fewer students in the low group answered positively on the questionnaire. In conclusion, English learners need to know the proper intonation patterns and to practice them consciously and sufficiently to realize correct intonation contours. Further studies would be desirable on the students' pronunciation focused on discourse structure.

  • PDF

바이모달 음성인식기의 시각 특징 추출을 위한 색상 분석자 SVM을 이용한 입술 위치 검출 (Lip Detection using Color Distribution and Support Vector Machine for Visual Feature Extraction of Bimodal Speech Recognition System)

  • 정지년;양현승
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.403-410
    • /
    • 2004
  • 바이모달 음성인식기는 잡음 환경하 음성인식 성능을 향상하기 위해 고안되었다. 바이모달 음 성인식기에 있어 영상을 통한 시각 특징 추출은 매우 중요한 역할을 하며 이를 위한 입술 위치 검출은 시각 특징 추출을 위한 중요한 선결 과제이다 본 논문은 색상분포와 SVM을 이용하여 시각 특징 추출을 위한 입술 위치 검출 방법을 제안하였다. 제안된 방법은 얼굴색/입술 색상 분포를 학습하여 이로부터 입술의 초기 위치를 빠르게 찾아내고 SVM을 이용하여 입술의 정확한 위치를 찾음으로써 정확하고 빠르게 입술의 위치를 찾도록 하였으며 실험을 통해 바이모달 인식기에 적용하기에 적합함을 알 수 있었다.

음성과 인상의 관계규명을 위한 실험적 연구 (Voice and Image: A Pilot Study)

  • 문승재
    • 대한음성학회지:말소리
    • /
    • 제35_36호
    • /
    • pp.37-48
    • /
    • 1998
  • When we hear someone's voice, even without having met the person before, we usually make up a certain mental image of the person. This study aims at investigating the relationship between the voice and the image information carried within the voice. Does the mental picture created by the voice closely reflect the real image and if not, is it related with the real image at all\ulcorner To answer the first question, a perception experiment was carried out. Speech samples reading a short sentence from 8 males and 8 females were recorded and pictures of subjects were also taken. Ajou University students were asked to participate in the experiment to match the voice with the corresponding picture. Participants in the experiment correctly match 1 female voice and 4 male voices with their corresponding pictures. However, it is interesting to note that even in cases of mismatch, the results show that there is a very strong tendency. In other words, even though participants falsely match a certain voice with a certain picture, majority of them chose the same picture for the voice. It is the case for all mismatches. It seems that voice does give the listener a certain impression about physical characteristics even if it might not be always correct. By showing that there is a clear relationship between voice and image, this study provides a starting point for further research on voice characteristics: what characteristics of the voice carry the relevant information\ulcorner This kind of study will contribute toward the understanding of the affective domain of human voice and toward the speech technology.

  • PDF

모바일 환경에서의 시각 음성인식을 위한 눈 정위 기반 입술 탐지에 대한 연구 (A Study on Lip Detection based on Eye Localization for Visual Speech Recognition in Mobile Environment)

  • 송민규;;김진영;황성택
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.478-484
    • /
    • 2009
  • 음성 인식 기술은 편리한 삶을 추구하는 요즘 추세에 HMI를 위해 매력적인 기술이다. 음성 인식기술에 대한 많은 연구가 진행되고 있으나 여전히 잡음 환경에서의 성능은 취약하다. 이를 해결하기 위해 요즘은 청각 정보 뿐 아니라 시각 정보를 이용하는 시각 음성인식에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 모바일 환경에서의 시각 음성인식을 위한 입술의 탐지 방법을 제안한다. 시각 음성인식을 위해서는 정확한 입술의 탐지가 필요하다. 우리는 입력 영상에서 입술에 비해 보다 찾기 쉬운 눈을 이용하여 눈의 위치를 먼저 탐지한 후 이 정보를 이용하여 대략적인 입술 영상을 구한다. 구해진 입술 영상에 K-means 집단화 알고리듬을 이용하여 영역을 분할하고 분할된 영역들 중 가장 큰 영역을 선택하여 입술의 양 끝점과 중심을 얻는다. 마지막으로, 실험을 통하여 제안된 기법의 성능을 확인하였다.

A Study of Apology Strategies between Genders in EFL College Students

  • Shim, Jae-Hwang
    • 영어어문교육
    • /
    • 제15권2호
    • /
    • pp.225-243
    • /
    • 2009
  • This study investigates the use of different speech act of apology strategies between male and female EFL college students by comparing the components of intensity, stylistic competence, and semantic formulas. The data was collected from 37 participants who were studying freshmen English reading course at the Department of English Education of C University in Seoul. Most students were English majors taking pre-teacher course of teaching English for secondary school students. The participants were divided into two gender groups of male and female. The discourse completion test (DCT) which was revised from the speech act of apology by Olshtain and Cohen (1990) was provided with the participants after the researcher explained the speech act of apology in ten situations. The speech act of apology depends on situation variables: social solidarity, severity of offense, and social status. The results show that in the preference of intensity, male and female have almost the similar ratio in high (female: 24.7%, male 24%) and low intensity (female: 75.3%, male: 76%). In the use of stylistic competence, male group (21%) expresses more diversely formal features than female group (12%), while female (87%) use more informal features than male (66%). Most of participants show a limitation in the use of speaking four types of semantic formulas: expression of apology (APOL), acknowledgment of responsibility (RESP), offer of repair (REPR), and promise of forbearance (FORB). As nonnative speakers, the participants cannot conduct the semantic formula in some situations regardless of the tasks provided. The results suggest that English teachers should recognize pragmatic variations in which students feel difficulty in appropriate speaking strategies on apology. This study also contributes to teaching learners the strategies and speaking patterns in the course of various apology situations.

  • PDF

과제, 성별, 세대에 따른 휴지의 실현 양상 연구 (A realization of pauses in utterance across speech style, gender, and generation)

  • 유도영;신지영
    • 말소리와 음성과학
    • /
    • 제11권2호
    • /
    • pp.33-44
    • /
    • 2019
  • 이 연구의 목적은 한국어의 휴지 실현에 과제, 세대, 성별이라는 변수가 어떠한 영향을 미치는지 살펴보는 것이다. 이를 위해 구어 코퍼스에서 세대, 성별에 따른 총 48명을 선정하여 두 가지 발화 과제 데이터를 분석하였다. 휴지는 발화에서 출현하는 위치와 들숨 동반 여부에 따라 들숨 동반 발화 말 휴지, 들숨 동반 발화 내 휴지, 들숨 비동반 발화 말 휴지, 들숨 비동반 발화 말 휴지로 구분하여 살펴보았고 각각의 빈도와 길이, 그리고 휴지에 영향을 줄 수 있는 다양한 요소들을 함께 살펴보았다. 그 결과 발화 말 휴지 길이가 발화 내 휴지 길이보다 약 160 ms 이상 더 긴 것을 확인하였다. 이는 휴지가 운율적 정규성을 가지며, 발화 말 휴지는 발화의 종결을 신호하는 역할을 체계적으로 수행한다는 것을 의미한다. 자유 발화는 낭독 발화보다 더 긴 휴지가 더 자주 나타나는 것을 확인하였다. 낭독 발화에서는 화자의 즉각적이고 적극적인 발화 계획이 요구되기 때문이다. 성별의 경우 전반적으로 남성은 여성보다 길고 빈번한 휴지를 보였다. 특히 들숨 동반 휴지는 남성이 여성보다 길었다. 세대의 경우 장년층이 청년층보다 더 자주 휴지를 산출했다. 이 밖에도 변수 간 상호 작용 효과가 관찰되었다. 휴지 길이의 성별 차이에 따르면 남성이 여성보다 휴지 길이가 긴데, 이는 특히 발화 말 휴지에서 두드러졌다.

노화에 따른 음질과 구어 유창성의 음향학적 특성 변화 (Change in acoustic characteristics of voice quality and speech fluency with aging)

  • 박희준;박진
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.45-51
    • /
    • 2023
  • 나이가 들면서 발생하는 음성 문제는 사회적, 정서적으로 영향을 미칠 수 있으며, 나아가 고립감과 우울증으로 이어질 수 있다. 이에 본 연구에서는 노화로 인한 음향학적 특성 변화를 음질과 구어 유창성의 변화를 알아보고자 한다. 이를 위해 노년층 남성 20명과 청년층 남성 20명이 산출한 연장발성과 구절 읽기 과제를 녹음하여 분석하였다. 음질 분석 변수로 기본주파수(F0), 주기 변동률(jitter), 진폭 변동률(shimmer), 켑스트럼 정점(cepstral peak prominence, CPP) 값을 분석하였으며 구어 유창성 분석 변수로는 평균 음절 길이(average syllable duration, ASD), 조음 속도(articulation rate, AR), 구어 속도(SR)를 분석하였다. 연구결과, 음질 측정에서 노년층의 경우 F0가 높게 나타났으며 jitter, shimmer, CPP의 결과값을 통해 음질이 저하된 것으로 나타났다. 구어 유창성 분석 결과, 노년층은 ASD, AR, SR의 결과값을 통해 느리게 발화하는 것으로 나타났다. 음질과 구어유창성 간 상관관계 분석 결과, shimmer와 CPP 값과 각각 ASD와 SR에서 높은 상관관계가 나타났다. 본 연구결과를 통해 노화에 따른 음성과 구어 유창성 변화를 조기에 발견하고 이에 대한 적절한 훈련법을 제공할 수 있을 것으로 기대된다.

AN ALGORITHM FOR CLASSIFYING EMOTION OF SENTENCES AND A METHOD TO DIVIDE A TEXT INTO SOME SCENES BASED ON THE EMOTION OF SENTENCES

  • Fukoshi, Hirotaka;Sugimoto, Futoshi;Yoneyama, Masahide
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.773-777
    • /
    • 2009
  • In recent years, the field of synthesizing voice has been developed rapidly, and the technologies such as reading aloud an email or sound guidance of a car navigation system are used in various scenes of our life. The sound quality is monotonous like reading news. It is preferable for a text such as a novel to be read by the voice that expresses emotions wealthily. Therefore, we have been trying to develop a system reading aloud novels automatically that are expressed clear emotions comparatively such as juvenile literature. At first it is necessary to identify emotions expressed in a sentence in texts in order to make a computer read texts with an emotionally expressive voice. A method on the basis of the meaning interpretation that utilized artificial intelligence technology for a method to specify emotions of texts is thought, but it is very difficult with the current technology. Therefore, we propose a method to determine only emotion every sentence in a novel by a simpler way. This method determines the emotion of a sentence according to an emotion that words such as a verb in a Japanese verb sentence, and an adjective and an adverb in a adjective sentence, have. The emotional characteristics that these words have are prepared beforehand as a emotional words dictionary by us. The emotions used here are seven types: "joy," "sorrow," "anger," "surprise," "terror," "aversion" or "neutral."

  • PDF

성악과 실용음악 보컬 전공 대학생들의 주관적 음성평가 비교 예비연구 (Preliminary Study for Comparison of Subjective Voice Evaluations among Vocal and Applied Music Major Students)

  • 이다혜;황영진;김재옥
    • 말소리와 음성과학
    • /
    • 제6권2호
    • /
    • pp.37-45
    • /
    • 2014
  • The purpose of this study was to determine whether the Korean Singing Voice Handicap Index (K-SVHI) was suitable for singers in other genres than vocal music to assess their vocal problems subjectively. Twenty six college students majoring in vocal music and twenty six students majoring in applied music were included in the study. They were divided into G0 and G1 in voice quality using the GRBAS scale during the tasks of singing. K-SVHI was divided into three sub-areas (Physical, Functional, and Emotional). In the singing task, both groups showed no significant difference between K-SVHI scores by G scale. In the reading task, the vocal music group had significantly higher K-SVHI in G0 than in G1 in K-SVHIs by G scale, while the applied vocal music group had significantly higher K-SVHI in G1 than in G0. Also, the two groups were not significantly different in G0, G1 in the singing task while the vocal music group showed higher K-SVHI than the applied vocal music group in G0 in the reading task. In addition, the vocal music group had higher K-SVHI than the applied vocal music group in G1 in both tasks. As comparing by groups in three sub-areas of K-SVHI, significant differences were found in the Emotional and Functional area. Those results showed that singers felt their voice problems differently by musical genres, which means that K-SVHI may not be a proper tool for evaluating voice handicap of singers in diverse voice music genres.

젊은 성인 및 노인 음성장애 환자의 연속발화시 공기역학적 특성 비교 (Aerodynamic Characteristics of Young and Elderly Adult Patients with Voice Disorders during Continuous Speech)

  • 표화영
    • 한국콘텐츠학회논문지
    • /
    • 제19권12호
    • /
    • pp.270-278
    • /
    • 2019
  • 본 연구는 젊은 성인 음성장애 환자 집단과 노인 음성장애 환자 집단을 대상으로 문단낭독시 공기역학적 특성을 비교해보고자 시행되었다. 20-45세의 남성 음성장애 환자 12명과 60세 이상의 남성 음성장애 환자 9명이 연구에 참여하였다. PAS(Phonatory Aerodynamic System)의 Running Speech를 이용하여 문단을 낭독하게 하고 공기역학 측정치를 구하였다. 그 결과 노인집단은 젊은 성인집단보다 더 긴 지속시간과 더 적은 기류량 및 기류체적을 보였다. 그러나 그 차이는 발성지속시간에서만 유의하게 나타났다. 공기역학 측정치는 일반적으로 노인보다 젊은 성인이 모든 측면에서 비정상 소견을 보일 것이라고 예상하지만 본 연구결과 노인집단이 보인 측정치는 발성지속시간을 제외하고 기류량과 기류체적은 젊은 성인집단과 비슷한 수치를 보인것으로 나타났다. 그러므로 노인 음성장애 환자의 연속발화시 공기역학 측정치가 갖는 의미를 해석할 때 기류와 기류체적은 연령뿐 아니라 발화자료, 폐 기능 등 다양한 요건을 함께 고려해야 한다.