• Title/Summary/Keyword: 오류 삽입

Search Result 119, Processing Time 0.026 seconds

Automatic Generation of Training Data for Korean Speech Recognition Post-Processor (한국어 음성인식 후처리기를 위한 학습 데이터 자동 생성 방안)

  • Seonmin Koo;Chanjun Park;Hyeonseok Moon;Jaehyung Seo;Sugyeong Eo;Yuna Hur;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.465-469
    • /
    • 2022
  • 자동 음성 인식 (Automatic Speech Recognition) 기술이 발달함에 따라 자동 음성 인식 시스템의 성능을 높이기 위한 방법 중 하나로 자동 후처리기 연구(automatic post-processor)가 진행되어 왔다. 후처리기를 훈련시키기 위해서는 오류 유형이 포함되어 있는 병렬 말뭉치가 필요하다. 이를 만드는 간단한 방법 중 하나는 정답 문장에 오류를 삽입하여 오류 문장을 생성하여 pseudo 병렬 말뭉치를 만드는 것이다. 하지만 이는 실제적인 오류가 아닐 가능성이 존재한다. 이를 완화시키기 위하여 Back TranScription (BTS)을 이용하여 후처리기 모델 훈련을 위한 병렬 말뭉치를 생성하는 방법론이 존재한다. 그러나 해당 방법론으로 생성 할 경우 노이즈가 적을 수 있다는 관점이 존재하다. 이에 본 연구에서는 BTS 방법론과 인위적으로 노이즈 강도를 추가한 방법론 간의 성능을 비교한다. 이를 통해 BTS의 정량적 성능이 가장 높은 것을 확인했을 뿐만 아니라 정성적 분석을 통해 BTS 방법론을 활용하였을 때 실제 음성 인식 상황에서 발생할 수 있는 실제적인 오류를 더 많이 포함하여 병렬 말뭉치를 생성할 수 있음을 보여준다.

  • PDF

Detecting and correcting errors in Korean POS-tagged corpora (한국어 품사 부착 말뭉치의 오류 검출 및 수정)

  • Choi, Myung-Gil;Seo, Hyung-Won;Kwon, Hong-Seok;Kim, Jae-Hoon
    • Journal of Advanced Marine Engineering and Technology
    • /
    • v.37 no.2
    • /
    • pp.227-235
    • /
    • 2013
  • The quality of the part-of-speech (POS) annotation in a corpus plays an important role in developing POS taggers. There, however, are several kinds of errors in Korean POS-tagged corpora like Sejong Corpus. Such errors are likely to be various like annotation errors, spelling errors, insertion and/or deletion of unexpected characters. In this paper, we propose a method for detecting annotation errors using error patterns, and also develop a tool for effectively correcting them. Overall, based on the proposed method, we have hand-corrected annotation errors in Sejong POS Tagged Corpus using the developed tool. As the result, it is faster at least 9 times when compared without using any tools. Therefore we have observed that the proposed method is effective for correcting annotation errors in POS-tagged corpus.

A Method of Effective Error Correction for Burst Error in OFDM using RS signal (RS 부호를 이용한 OFDM에서 연집 오류에 효과적인 오류정정 기법)

  • Kim, Tae-Hoon
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.05a
    • /
    • pp.507-510
    • /
    • 2010
  • OFDM(Orthogonal Frequency Division Multiplexing)은 하나의 데이터 열(data stream)을 낮은 데이터 전송률을 갖는 작은 데이터로 나누고, 이들을 부반송파(subcarrier)를 통해 동시에 전송한다. OFDM이 차세대 전송방식으로 채택된 이유는 주파수 선택적 페이딩(frequency selective fading)이나 협대역(narrow band)간 간섭에 받는 영향이 적어 고속 통신이 가능하기 때문이다. 본 논문에서는 RS 부호(Reed-Solomon Code)를 사용하여 OFDM에서 대용량 데이터를 전송할 때 발생하기 쉬운 연집 오류(burst error)를 정정하도록 하였다. 또한 채널 사이에 파일롯 심볼(pilot symbol)을 삽입하여 채널 추정을 통한 신호의 타이밍 오류도 고려하였다.

  • PDF

A Method of Effective Error Correction for Burst Error in OFDM (OFDM에서 연집 오류에 효과적인 오류정정 기법)

  • Jung, Young-Hoon;Lee, Kwang-Hyung;Jun, Moon-Seog
    • Proceedings of the KAIS Fall Conference
    • /
    • 2007.11a
    • /
    • pp.248-251
    • /
    • 2007
  • OFDM(Orthogonal Frequency Division Multiplexing)은 하나의 데이터 열(data stream)을 낮은 데이터 전송률을 갖는 작은 데이터로 나누고, 이들을 부반송파(subcarrier)를 통해 동시에 전송한다. OFDM이 차세대 전송방식으로 채택된 이유는 주파수 선택적 페이딩(frequency selective fading)이나 협대역(narrow band)간 간섭에 받는 영향이 적어 고속 통신이 가능하기 때문이다. 본 논문에서는 RS 부호(Reed-Solomon Code)를 사용하여 OFDM에서 대용량 데이터를 전송할 때 발생하기 쉬운 연집 오류(burst error)를 정정하도록 하였다. 또한 채널 사이에 파일롯 심볼(pilot symbol)을 삽입하여 채널 추정을 통한 신호의 타이밍 오류도 고려하였다.

  • PDF

Implementation of Synchronizing Broadcasting System Using Audio Watermark (오디오 워터마크를 이용한 방송 동기화 시스템 구현)

  • 신동환;신승원;안종근;신영일;김종원;최종욱
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2001.11b
    • /
    • pp.181-185
    • /
    • 2001
  • 본 논문에서는 오디오 워터마킹 기술을 방송 동기화 시스템에 적용하여 방송시스템을 자동화하기 위한 시스템을 구현했다. 방송시스템은 대개의 경우 1개의 중앙방송과 다수의 지역방송국으로 구성된다. 방송동기화 시스템은 방송소재가 중앙방송에서 지방방송으로 전환하는 시점을 알리는 신호에 워터마크를 삽입하여 방송하고 다수의 지방 방송에서는 워터마크를 검출해서 방송소재의 전환을 자동으로 하고자 한다. 본 논문에서 구현한 방송동기화 시스템은 방송시스템의 특성을 중시하여 설계 제작되었다. 방송시스템의 오류는 바로 방송사고로 이어지는 만큼 동기신호를 잘못 검지하는 오류는 없어야 한다. 즉 워터마크가 없는 오디오에서 워터마크가 있다고 검출되는 경우가 0% 이어야 한다. 본 논문에서 제안된 알고리즘으로 실제 방송되는 라디오 신호를 갖고 실험해본 결과 위의 조건을 만족하고 다양한 환경 즉 압축 및 A/D, D/A, 노이즈 삽입에 대한 신뢰성 테스트를 수행하여 우수한 결과를 얻었다.

  • PDF

Copyright Authentication for Digital Watermarking using Error Backpropagation (오류 역전파 학습 알고리즘을 이용한 디지털 워터마킹에 대한 소유권 인증)

  • 최은주;서정의;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.580-582
    • /
    • 1998
  • 인터넷의 보급으로 인하여 디지털 데이터의 복제가 확산됨에 따라 멀티미디어 데이터에 대한 소유권 보호와 인증에 대한 문제가 대두되고 있는 실정이다. 본 논문에서는 디지털 영상을 다중해상도 표현이 가능한 웨이브릿 변환(Wavelet Transform)을 통하여 저주파수 영역에 인간 시각으로 지각 할 수 없는 워터마크를 삽입하고, 삽입된 워터마크의 영상을 인증하기 위한 방법으로 오류 역전파 학습 알고리즘(Error Backpropagation)을 이용한 신경회로망적 접근방법을 제안한다. 워터마크를 추출하기 위해서는 원영상이 필요하고, 내장된 워터마크가 손실 압축과 필터링 등의 일반적인 영상 처리에 강인함을 실험 결과를 증명하고, 제안한 신경회로망적 접근방법이 좋은 결과를 나타냄으로 실험을 통하여 증명하였다.

  • PDF

A Full-Capacity DCT-based Blind Watermarking (DCT 기반의 최대 용량 블라인드 워터마킹)

  • 최병철;김용철
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.5B
    • /
    • pp.669-676
    • /
    • 2001
  • 본 논문은 DCT 기반의 블라인드 워터마킹 방법에 관한 연구 결과이다. 본 논문에서 사용한 4096비트의 워터마크는 512x512 영상이 수용할 수 있는 최대 용량의 절반에 해당한다. 각 워터마크 비트는 8x8 DCT 블록의 12개의 계수에 확산 패턴을 이용하여 삽입하였다. 워터마크 삽입 과정에서, 워터마크 이득 계수는 비가시성과 견고성을 고려하여 최적화되었다. 워터마크 검출 과정에서는, 상관검출을 통하여 워터마크에 대한 예비판정을 하며, 이진가설 검증의 검증 과정을 통해서 예비판정에서의 검출 오류를 수정하였다. 검증 과정에서는 복원된 DCT계수를 이용한 가중치가 사용되었으며, 대부분의 예비 판정의 오류는 검증 과정에서 수정이 되었다. 실험 결과, 영상에 공격이 가해지지 않은 경우는 최종 검증 후에 BER이 0.5% 미만으로 낮아졌으며, 20% JPEG의 고압축에서도 BER이 9% 미만으로 산출되었다. 기존의 방법들과의 비교에서, 제안한 방법은 워터마크 검출 성능 및 워터마크 용량 측면에서 우수하였다.

  • PDF

Error Resilience Method of MPEG-2 Header Parameters by using LSB Coding for Robust DTV Video Transmission (견실한 DTV 영상 전송을 위해 LSB 부호화를 이용한 MPEG-2 헤러 정보의 오류 복원 방법)

  • Lim Tae-gyun;Lee Sang-hak
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.9 no.5
    • /
    • pp.1019-1024
    • /
    • 2005
  • MPEG-2 achieves high compression radio, by exploiting the temporal and spatial correlations in real image sequence, using the motion compensated prediction and the transform coding, respectively. However, as the image sequence is more highly compressed, the encoded bitstream becomes more vulnerable to transmission error over the noisy channels. Furthermore, er개rs in the headers are fatal to decoding processes, because the header parameters in the video coding standard include a lot of important information connected to the syntax elements, fables, and decoding process. In this paper, we propose a new error resilience method using LSB coding for header parameters in MPEG-2 coded video transmissions. The experimental results for football and susie video sequence demonstrate that the proposed error resilience method for header parameters in MPEG-2 bitstream has good performance.

A New Reversible Watermarking Method Based on 4 times-Embedding Using 8 points (8개의 점을 이용한 개선된 4중 임베딩)

  • Lee, Byeong-Yong;Kim, Hyoung-Joong;Sachnev, Vasiliy
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 2009.08a
    • /
    • pp.253-257
    • /
    • 2009
  • 정보가 가역적으로 숨기어 졌다는 말은, 숨기고자 하는 정보가 삽입된 컨텐츠에서 비밀 정보를 찾아내고 또한 원본 컨텐츠를 완벽하게 복구할 수 있다는 말이다. 여러 가지 컨텐츠에 정보를 숨길 수 있으나 그 중에서 특히 이미지에 정보를 숨기고자 할 때는 두 가지 목표가 있다. 첫째는, 숨기고자 하는 데이터의 용량을 극대화 시키는 것이고 둘째는, 정보를 숨긴 다음에 생긴 이미지와 원본 이미지와의 차이를 줄이는 것이다. 본 논문은 데이터를 삽입시키는 차분값으로서 예측 오류 값을 이용하여 정보를 숨기는 개선된 방법을 제안하려고 한다.

  • PDF

The Component Customization Test in the Chamois Framework (샤모아 프레임 워크의 컴포넌트 맞춤 테스트)

  • 이병희;최병주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.70-72
    • /
    • 2002
  • 컴포넌트 기반 구조의 프레임 워크인 샤모아 프레임 워크(Chamois Framework)는 다양한 컴포넌트 아키텍쳐중 COM(Component Object Model)과 Web Service로 개발되었다. 컴포넌트 기반 소프트웨어 개발(Component-Based Software Development)은 이미 작성된 소프트웨어 컴포넌트를 자신의 목적에 맞도록 재사용함으로써 여러 가지 위험 요소가 따를 수 있다. 따라서, 샤모아 프레임 워크에서 맞춤으로 변형된 컴포넌트에서 발생하는 오류를 테스트하기 위한 컴포넌트 맞춤 테스트 기법이 필요하다. 본 논문에서는 컴포넌트 맞춤 테스트 기법을 오류삽입 기반의 COM으로 확장하여 COM 컴포넌트 맞춤 테스트 기법을 샤모아 프레임 워크에 적용한 사례를 보인다.

  • PDF