• 제목/요약/키워드: 발화 스타일

검색결과 7건 처리시간 0.019초

한국어 낭독체 담화문의 운율적 특징 (A PZrosodic Characteristics of Korean Read Sentences in Discourse Context)

  • 성철재
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.209-213
    • /
    • 1998
  • 50개의 담화단독 문장과 연속발성 문장을 대상으로 무장의 첫 어절과 마지막 어절에서의 첫 음절과 마지막 음절의 운율특징을 조사하였다. 이를 체계적으로 살펴 보기 위하여 각 어절에서의 마지막 음절의 음향변수에 대한 첫 음절의 음향변수의 비율을 얻은 뒤 이를 대상으로 하여 평균값과 분포를 구하였다. 지속시간의 경우 두 스타일 간에 주목할 만한 큰 차이점은 없었으나 담화 연속 문장의 문두에서 화자의 조음시간 프로그래밍이 약간 조화롭지 못함을 알 수 있었다. Fo는 마지막 어절 부분의 비율값이 두 스타일간 통계적으로 유의한 차이를 보였으며 운율자질로 기능할 수 있는 가능성을 보였다. 에너지는 Fo와 유사한 분포경향을 보인다. 문미 어절의 마지막 음절이 첫 음절의 약 85% 정도의 힘으로 발성됨을 알 수 있고, 담화 연속 발화의 마지막 어절에서 단독 발화문보다 상대적으로 강하게 조음되었음을 알 수 있었다.

  • PDF

과제, 성별, 세대에 따른 휴지의 실현 양상 연구 (A realization of pauses in utterance across speech style, gender, and generation)

  • 유도영;신지영
    • 말소리와 음성과학
    • /
    • 제11권2호
    • /
    • pp.33-44
    • /
    • 2019
  • 이 연구의 목적은 한국어의 휴지 실현에 과제, 세대, 성별이라는 변수가 어떠한 영향을 미치는지 살펴보는 것이다. 이를 위해 구어 코퍼스에서 세대, 성별에 따른 총 48명을 선정하여 두 가지 발화 과제 데이터를 분석하였다. 휴지는 발화에서 출현하는 위치와 들숨 동반 여부에 따라 들숨 동반 발화 말 휴지, 들숨 동반 발화 내 휴지, 들숨 비동반 발화 말 휴지, 들숨 비동반 발화 말 휴지로 구분하여 살펴보았고 각각의 빈도와 길이, 그리고 휴지에 영향을 줄 수 있는 다양한 요소들을 함께 살펴보았다. 그 결과 발화 말 휴지 길이가 발화 내 휴지 길이보다 약 160 ms 이상 더 긴 것을 확인하였다. 이는 휴지가 운율적 정규성을 가지며, 발화 말 휴지는 발화의 종결을 신호하는 역할을 체계적으로 수행한다는 것을 의미한다. 자유 발화는 낭독 발화보다 더 긴 휴지가 더 자주 나타나는 것을 확인하였다. 낭독 발화에서는 화자의 즉각적이고 적극적인 발화 계획이 요구되기 때문이다. 성별의 경우 전반적으로 남성은 여성보다 길고 빈번한 휴지를 보였다. 특히 들숨 동반 휴지는 남성이 여성보다 길었다. 세대의 경우 장년층이 청년층보다 더 자주 휴지를 산출했다. 이 밖에도 변수 간 상호 작용 효과가 관찰되었다. 휴지 길이의 성별 차이에 따르면 남성이 여성보다 휴지 길이가 긴데, 이는 특히 발화 말 휴지에서 두드러졌다.

요약문 기반 문학 스타일 문장 생성 (Generating Literature-Style Sentences based on Summarized Text )

  • 최부광;이은찬;안상태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.67-70
    • /
    • 2022
  • 최근 자연어 생성 연구는 딥러닝 기반의 사전 학습 모델을 중심으로 활발하게 연구되고 있다. 하위 분야 중 하나인 텍스트 확장은 입력 텍스트를 출력에 잘 반영하는 것이 무엇보다도 중요하다. 기존 한국어 기반 텍스트 확장 연구의 경우 몇 개의 개념 집합에 기반해 문장을 생성하도록 한다. 그러나 이는 사람의 실제 발화 길이에 비해 짧고 단순한 문장만을 생성한다는 문제점이 존재한다. 본 논문은 이러한 문제점을 개선하면서 문학 스타일의 문장들을 생성하는 모델을 제안하였다. 또한 동일 모델에 대해 학습 데이터의 양에 따른 성능도 비교하였다. 그 결과, 짧은 요약문을 통해 문학 스타일의 여러 문장들을 생성하는 것을 확인하였고, 학습 데이터를 추가한 모델이 성능이 더 높게 나타나는 것을 확인하였다.

  • PDF

음절 별 발화속도 조절을 통한 노인 음석인식 개선 (Syllabic Speech Rate Control for Improving Elderly Speech Recognition of Smart Devices)

  • 경주원;손귀영;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1711-1714
    • /
    • 2015
  • 스마트 디바이스가 사회와 소통할 수 있는 도구가 되었음에도 불구하고 아직까지 노인들이 사용하기에는 어려움이 있다. 여기에 음성인식 기술을 이용한 음성인터페이스를 활용함으로써 노인들의 스마트 디바이스에 대한 사용성을 높일 수 있다. 하지만 일반적인 음성인식 시스템은 청장년의 발성 스타일에 맞춰져 있기 때문에, 노화된 노인의 발성이 그대로 입력될 경우 음성인식률이 하락한다. 본 연구에서는 노인의 음절 별 발화속도가 일반적인 음성인식 시스템의 성능을 보증할 수 있는 범위를 벗어나는 경우가 많다는 분석 결과를 토대로 노인의 음절 별 발화속도를 조정한 결과 노인남녀 평균 음성인식률이 15.3% 상승하였다. 이처럼 노인의 음성인식 오류 원인들 중 하나인 발화속도의 재조정으로 음성 인식률을 높일 수 있는 토대를 마련하였다. 이는 노인들이 스마트 디바이스를 이용하여 쉽고 정확한 작업을 수행할 수 있게 됨으로써, 노인들의 사회 참여와 정보 획득이 용이해 지고 더 나아가 세대 간의 소통에도 이바지할 것으로 기대한다.

공통음성 DB 구축 (Common Speech Database Collection)

  • 김상훈;오승신;정호영;전형배;김정세
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.21-24
    • /
    • 2002
  • 본 논문은 ETRI 음성정보연구센터에서 추진하고 있는 공통음성 DB 구축에 관하여 기술한다. 총 3 년(2001 11-2004. 10) 동안 음성인식, 음성합성, 화자인식 등 다양한 용도의 음성 DB 를 수집할 예정이며, 1년차인 2002 년에는 총 14 종의 음성 DB 를 수집할 계획이다. 공통 음성 DB 는 다양한 통신망(마이크, 헤드셋, VoIP, 유무선 전화망), 지역, 성별, 발성환경(사무실, 지하철, 도로 등)을 고려하여 설계하였으며, 발성대상은 숫자, 단어, 문장이고, 발성방법은 자유발화, 대화체, 낭독체 등 다양한 스타일의 음성 DB 로 구성되어 있다. 이에 본 논문에서는 총 14 종에 해당하는 공통음성 DB 의 구축내역과 구축방안 및 DB 구축 일정에 관해 기술하고자 한다.

  • PDF

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

종합편성채널 저널리즘의 비판적 재조명 시사토크쇼 정치 매개 엘리트들의 텔레비전 정치 (A Critical Review on the Comprehensive Cable TV Channels' Journalism Focused on the TV Politics of Political Mediating Elites in Current Affairs Talk Show)

  • 이영주
    • 한국언론정보학보
    • /
    • 제77권
    • /
    • pp.36-72
    • /
    • 2016
  • 정치적 산물로서 출범한 지 5년을 넘어선 종합편성채널의 영향력과 방송 영역에서의 지위가 상승하고 있다. 종편의 안정화는 저널리즘의 물량 공세에 기초한다. 끊임없이 반복적으로 쏟아 내는 뉴스와 시사토론 프로그램들이 '종편 타임대'라 불리는 오후 시간대를 점유한다. 시사토크쇼는 종편이 만들어 낸 대표적인 프로그램 형식이자 상품으로 독특한 종편 스타일 저널리즘을 이끌고 있다. 시사토크쇼의 주인공은 평론과 토론을 위해 모인 출연자들이다. 이 연구는 이들을 정치 매개 엘리트라는 개념적 위치화와 함께 TV조선, 채널A, MBN, JTBC의 대표적인 시사토크쇼에서 이들이 벌이는 텔레비전 정치의 풍경들을 살펴본다. 이 연구는 종편의 시청률을 상승시키고 시청자들의 이목을 집중시키는 시사토크쇼에서 정치 매개 엘리트들이 자신들의 정치적 편향성과 감정을 과감하게 드러내고 독특한 규정과 서술적 발화들을 통해 특정 대상들을 형상화하는 텔레비전 정치의 효과들을 읽어 내고자 한다. 이 연구에서 출연자로 불리는 정치 매개 엘리트들은 주로 극우, 보수, 중도보수적 정치 성향들을 가지며, 특정한 정당이나 정치 집단과 밀착된 관계를 형성한다. 정치 매개 엘리트들은 종편 시사토크쇼에서 수행하는 텔레비전 정치를 통해 대중들에게 영향을 미치는 자산을 확보하면서 정치 집단과 정치적 교환 혹은 거래 관계를 형성한다. 이 같은 정치적 동원, 교환, 거래의 관계 속에 종편의 시사토크쇼가 위치하며, 시사토크쇼는 정치적 전장으로 존재할 수밖에 없다는 점을 이 연구는 강조한다.

  • PDF