• 제목/요약/키워드: Broadcast news

검색결과 97건 처리시간 0.026초

형태소 기반의 한국어 방송뉴스 인식 (Morpheme-based Korean broadcast news transcription)

  • 박영희;안동훈;정민화
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.123-126
    • /
    • 2002
  • In this paper, we describe our LVCSR system for Korean broadcast news transcription. The main focus is to find the most proper morpheme-based lexical model for Korean broadcast news recognition to deal with the inflectional flexibilities in Korean. There are trade-offs between lexicon size and lexical coverage, and between the length of lexical unit and WER. In our system, we analyzed the training corpus to obtain a small 24k-morpheme-based lexicon with 98.8% coverage. Then, the lexicon is optimized by combining morphemes using statistics of training corpus under monosyllable constraint or maximum length constraint. In experiments, our system reduced the number of monosyllable morphemes from 52% to 29% of the lexicon and obtained 13.24% WER for anchor and 24.97% for reporter.

  • PDF

한국어 방송 뉴스 인식 시스템을 위한 OOV update module (Korean broadcast news transcription system with out-of-vocabulary(OOV) update module)

  • 정의정;윤승
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.33-36
    • /
    • 2002
  • We implemented a robust Korean broadcast news transcription system for out-of-vocabulary (OOV), tested its performance. The occurrence of OOV words in the input speech is inevitable in large vocabulary continuous speech recognition (LVCSR). The known vocabulary will never be complete due to the existence of for instance neologisms, proper names, and compounds in some languages. The fixed vocabulary and language model of LVCSR system directly face with these OOV words. Therefore our Broadcast news recognition system has an offline OOV update module of language model and vocabulary to solve OOV problem and selects morpheme-based recognition unit (so called, pseudo-morpheme) for OOV robustness.

  • PDF

방송 저널리즘의 UGC 이용에 관한 연구: 방글라데시의 사례를 중심으로 (A Study on the integration of UGC in broadcast journalism: An evidence from Bangladesh)

  • 사이풀 혹큐;박재영
    • 디지털융복합연구
    • /
    • 제17권1호
    • /
    • pp.301-311
    • /
    • 2019
  • 인터넷 기술 덕분에 미디어 수용자들이 미디어 콘텐츠를 생산하고 유통하는 역량은 전통 미디어 조직에 큰 도전이 될 정도로 커졌다. 이러한 도전은 인터넷이 이제 걸음마 단계인 방글라데시와 같은 국가에서 훨씬 더 긴요하다. 이 연구는 사용자 생성 콘텐츠(UGC)가 어떻게 그리고 왜 방글라데시의 텔레비전 방송에 나타나고 있는지를 알아보았다. 방글라데시 주요 방송사 보도국의 뉴스 편집 간부들을 심층 인터뷰한 결과, 방송사들이 뉴스에 UGC를 사용하는 데에는 위기적 사건이 발생했을 때 정부가 종종 언론 보도에 개입하며, 언론사와 기자가 그런 위기 보도의 경험이 많지 않다는 것이 크게 작용하고 있었다. 또한, 언론사의 전통적 작업 기준만으로는 UGC 및 시민의 뉴스 제작 참여를 관리하기 어렵다는 것도 발견되어, 방글라데시 언론사에 UGC를 관리하는 종합 대책이 필요함을 알려준다.

뉴스 빅데이터를 활용한 재난문자 뉴스 게재 경향 분석 (A Big Data Analysis of the News Trends on Wireless Emergency Alert Service)

  • 이현지;변윤관;장석진;최성종;오승희;이용태
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.726-734
    • /
    • 2019
  • 이 연구에서는 재난문자에 대한 뉴스 건수와 연관어에 대해 알아보았다. 뉴스는 한국언론진흥재단 뉴스 빅데이터 시스템인 빅카인즈를 활용하여 수집하였고, 연간 게재 기사, 재난종류에 따른 뉴스 빈도, 지진과 비 지진 간 뉴스 빈도, 연관어에 대한 분석을 실시하였다. 조사 결과에 따르면, '재난문자'관련 뉴스가 2016년에 182건으로 전년대비 약 20배 증가하는 성장세를 보였다. 재난문자 뉴스는 2016년 이래로 꾸준히 높은 수치를 보였다. 2016년은 지진의 비중이 매우 높았지만 2017년과 2018년은 지진의 비중이 낮아지고 비지진의 비중이 높아지는 것으로 나타났다. '재난문자' 연관어는 행정안전부(국가안전처, 행안부 포함)가 가장 비중 있게 다루어졌고, 그 다음으로 기상청과 국민도 비중 있게 다루어진 용어로 나타났다.

다중모드 특징을 사용한 뉴스 동영상의 앵커 장면 검출 기법 (Multi-modal Detection of Anchor Shot in News Video)

  • 유성열;강동욱;김기두;정경훈
    • 방송공학회논문지
    • /
    • 제12권4호
    • /
    • pp.311-320
    • /
    • 2007
  • 본 논문에서는 뉴스 동영상 정보의 생성을 위해 뉴스 단위의 기준이 되는 앵커 장면을 효과적으로 검출하는 기법을 제안한다. 우선 뉴스 동영상의 오디오 및 비디오 구성 요소에 대한 관찰을 통하여 앵커 장면 검출에 적합한 기본적인 특징들을 선택하였다. 제안 알고리듬에서는 색인의 정확도를 높이기 위해 몇몇 오디오 특징과 함께 비디오 특징으로서 움직임 특징을 함께 이용하였으며, 전체적인 구조는 '오디오 정지 구간 검출', '오디오 클러스터 분류', 그리고 '움직임 활동도와의 매칭'의 3단계로 구성된다. MPEG-2 방식으로 부호화된 뉴스 동영상에 대한 실험을 통해 제안 알고리듬의 성능이 만족스러움을 확인하였다.

The Effect of Forced Exposure to Crosscutting Information: What Is the Effect of Broadcast News Shows That Deliver Opposing Opinions?

  • Sangik Han;Sungjoong Kim
    • Asian Journal for Public Opinion Research
    • /
    • 제11권4호
    • /
    • pp.304-326
    • /
    • 2023
  • News shows often deliver crosscutting information to their audiences by inviting commentators from rival political parties. If these news shows foster the formation of informed and balanced views of the audience, mass media could provide countermeasures against political polarization. To test the effect of such news shows, this study conducted an experiment with two variants of a simulated radio talk show. In the partisan scenario, the two guest commentators' affiliations suggested their ideological orientation. In the non-partisan scenario, the commentators had neutral affiliations. We divided participants into two ideology groups, liberals and conservative, and compared each group's evaluation of the commentators in the two scenarios. Two multivariate analysis of variance (MANOVA) tests were conducted to analyze the effect of the perceived ideology of the commentators on respondents' attitudes toward the commentators' arguments depending on their own ideological inclinations. The analyses results did not support the hypothesis that anticipated partisan attitudes towards the commentators' arguments. It was only the liberal respondents who showed statistically significant different attitudes toward commentators' arguments in each of the two scenarios. The findings suggest that such broadcast shows do not automatically trigger partisan message processing and may help the audience to develop informed and balanced opinions. While the current study failed to find conclusive evidence to support the hypotheses, it also found that the perceived ideology of the information source may trigger partisan attitudes for certain types of issues. Future studies with different experiment designs are needed to investigate the issue further.

Speaker Tracking Using Eigendecomposition and an Index Tree of Reference Models

  • Moattar, Mohammad Hossein;Homayounpour, Mohammad Mehdi
    • ETRI Journal
    • /
    • 제33권5호
    • /
    • pp.741-751
    • /
    • 2011
  • This paper focuses on online speaker tracking for telephone conversations and broadcast news. Since the online applicability imposes some limitations on the tracking strategy, such as data insufficiency, a reliable approach should be applied to compensate for this shortage. In this framework, a set of reference speaker models are used as side information to facilitate online tracking. To improve the indexing accuracy, adaptation approaches in eigenvoice decomposition space are proposed in this paper. We believe that the eigenvoice adaptation techniques would help to embed the speaker space in the models and hence enrich the generality of the selected speaker models. Also, an index structure of the reference models is proposed to speed up the search in the model space. The proposed framework is evaluated on 2002 Rich Transcription Broadcast News and Conversational Telephone Speech corpus as well as a synthetic dataset. The indexing errors of the proposed framework on telephone conversations, broadcast news, and synthetic dataset are 8.77%, 9.36%, and 12.4%, respectively. Using the index tree structure approach, the run time of the proposed framework is improved by 22%.

뉴스 비디오 시퀀스에서 텍스트 시작 프레임 검출 방법의 비교 (Comparison of Text Beginning Frame Detection Methods in News Video Sequences)

  • 이상희;안정일;조강현
    • 방송공학회논문지
    • /
    • 제21권3호
    • /
    • pp.307-318
    • /
    • 2016
  • Overlay texts are artificially superimposed on the broadcasting videos by human producers. These texts provide additional information to the audiovisual content. Especially, the overlay texts in news video contain concise and direct description of the content. Therefore, it is most reliable clue for constructing a news video indexing system. To make this indexing system in the TV news program, it is important to detect and recognize the texts. This paper proposes the identification of the overlay text beginning frame to help the detection and recognition of the overlay text in news videos. Since all frames in the video sequences do not contain the overlay texts, the overlay text extraction from every frame is unnecessary and time-wasting. Therefore, to focus on only the frame containing the overlay text can be enhanced the accuracy of the overlay text detection. The comparative experiments of the text beginning frame identification methods were carried out with respect to Korean television news videos. Then the appropriate processing method is proposed.

뉴스 데이터를 활용한 재난문자 요구사항 분석 (Requirement Analysis of Korean Public Alert Service using News Data)

  • 이현지;변윤관;장석진;최성종
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.994-1003
    • /
    • 2020
  • 본 연구에서는 뉴스 데이터를 이용해 재난문자의 문제점에 대해 알아보았다. 이를 위해 한국언론진흥재단 뉴스 빅데이터 시스템을 통해 2005년 5월 15일부터 2020년 4월 30일까지의 '재난문자'의 주제어가 포함된 뉴스를 검색하여 자료를 수집하였다. 분석방법은 내용분석을 사용하였다. 조사 결과에 따르면, 재난문자 수신 문제점은 경보음, 내용, 기준, 빈도, 속도, 수신범위, 시간, 언어 등에 대한 것으로 범주화되었다. 재난문자 미수신 문제점은 권한, 단말기, 발송기준, 통신, 기타 등에 대한 것으로 범주화되었다. 재난문자 문제점에 대한 뉴스 게재 추이를 살펴보면, 최근 2~3년간 미수신 문제점에 대한 뉴스는 줄어드는 반면에 수신 문제점에 대한 뉴스는 많아지는 것으로 나타났다. 이는 재난문자에 대한 국민의 개선 요구가 수신 부분에 있다는 것을 말해준다. 특히, 내용, 빈도, 수신범위 문제에 대한 사회적 해결 요구가 급증한 상황이다.

한국 사행산업 관련 뉴스의 빅데이터 분석을 통한 인식 연구 (Study on Perceptions through Big data Analysis on Gambling related News in Korea)

  • 문혜정;김성경
    • 방송공학회논문지
    • /
    • 제22권4호
    • /
    • pp.438-447
    • /
    • 2017
  • 이 연구는 사행산업의 분야인 복권, 체육진흥투표권, 경마, 카지노에 대해 언론에서는 어떻게 다루어지고 있는지를 1990년부터 2015년까지의 뉴스데이터를 의미연결망 분석을 통해 밝혀보고자 하는 연구이다. 기사의 빈도와 연결성을 프레이밍과 시민관심 정도로 재조명 하여 기사에 대한 언론보도자의 의도와 시민의 인식차이를 밝히고, 이를 통해 정책적 특성과 개혁과제를 탐색하였다. 분석결과 복권의 경우 당첨번호, 당첨금, 조작의혹 등 당첨에 대한 부분이 주제인 '사회문제' 형태였으며, 체육진흥투표권의 경우에는 사업입찰, 불법사이트, 발매대상 등 주로 사업추진과 불법사이트에 대한 '의무정보' 종류였고, 경마의 경우 사업장, 홍보, 기사 등으로 사업홍보나 광고 관련 뉴스이었고, 마지막으로 카지노의 경우에는 불법, 도박장, 외국인 등 '주요정보'에 해당하는 논문이었다. 시대에 따라 1990년대에는 카지노, 2000년대에는 복권, 2010년대에는 경마에 대한 기사보도가 많아졌으며, 이에 대한 시민의 반응도 사업비리, 당첨, 시민운동 등의 차이가 있었다. 마지막으로 기사의 빈도와 연결성이 나타내는 프레이밍 정도와 시민의 관심은 '1. 홍보광고(경마), 2. 의무정보(스포츠베팅), 3. 사회이슈(복권), 4. 주요정보(카지노)' 네 가지로 구분되었으며 이 중 사고, 비리 등 주요기사로 구분되는 사회문제가 주요 공공의제로 형성되는 것을 확인할 수 있었다.