• 제목/요약/키워드: automatic editing

검색결과 59건 처리시간 0.022초

기계번역 사후교정(Automatic Post Editing) 연구 (Automatic Post Editing Research)

  • 박찬준;임희석
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.1-8
    • /
    • 2020
  • 기계번역이란 소스문장(Source Sentence)을 타겟문장(Target Sentence)으로 컴퓨터가 번역하는 시스템을 의미한다. 기계번역에는 다양한 하위분야가 존재하며 APE(Automatic Post Editing)이란 기계번역 시스템의 결과물을 교정하여 더 나은 번역문을 만들어내는 기계번역의 하위분야이다. 즉 기계번역 시스템이 생성한 번역문에 포함되어 있는 오류를 수정하여 교정문을 만드는 과정을 의미한다. 기계번역 모델을 변경하는 것이 아닌 기계번역 시스템의 결과 문장을 교정하여 번역품질을 높이는 연구분야이다. 2015년부터 WMT 공동 캠페인 과제로 선정되었으며 성능 평가는 TER(Translation Error Rate)을 이용한다. 이로 인해 최근 APE에 모델에 대한 다양한 연구들이 발표되고 있으며 이에 본 논문은 APE 분야의 최신 동향에 대해서 다루게 된다.

양방향 RNN과 학술용어사전을 이용한 영문학술문서 교정 방법론 (Methodology of Automatic Editing for Academic Writing Using Bidirectional RNN and Academic Dictionary)

  • 노영훈;장태우;원종운
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.175-192
    • /
    • 2022
  • 자연어 처리 기술을 접목한 컴퓨터 보조 언어 학습 연구가 진행되고 있지만, 기존 영문교정은 일반적인 영어 문장을 기반으로 연구되어, 격식을 갖춘 문체와 전문적인 기술 용어를 사용하는 학술 영문의 경우 그 특성을 반영하지 못한 교정 결과를 제공한다. 또한 문장의 문법적 완성도 향상을 위한 다수의 기존 연구는 교정을 통한 문장 전달력 향상의 한계점이 존재한다. 따라서, 본 논문은 전문적인 기술 용어 사용을 기반으로 문장의 명확한 의미 전달을 목적으로 하는 학술 영문을 위한 자동 교정 방법론을 제안한다. 제안 방법론은 오탈자 교정과 문장 전달력 개선 두 단계로 구성된다. 오탈자 교정 단계는 입력된 오탈자와 문맥에 적합한 교정 단어를 제공한다. 문장 전달력 개선 단계는 원문과 교정문의 쌍으로부터 학습할 수 있는 양방향 순환신경망 기계번역 사후교정 모델을 기반으로 문장의 전달력을 개선한다. 실제 교정 데이터를 이용한 실험을 수행하였으며, 정량적·정성적 분석을 통해 제안 방법론의 우수성을 검증하였다.

머신러닝 기반의 영상 자동 편집 방법 및 시스템 (Video Automatic Editing Method and System based on Machine Learning)

  • 이승환;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.235-237
    • /
    • 2022
  • 영상 콘텐츠는, 길이에 따라 롱폼 영상 콘텐츠와 숏폼 영상 콘텐츠로 구분된다. 롱폼 영상 콘텐츠는 15분 이상 길이로 생성되며, 편집 없이 촬영 영상의 모든 프레임들이 포함되도록 한다. 숏폼 영상 콘텐츠는 1분이상 15분 이내로, 촬영 영상의 프레임들로부터 일부 프레임만 짧은 길이로 편집할 수 있다. 최근 1인 방송 시장의 성장으로 인하여, 시청자들을 늘리기 위한 숏폼 영상 콘텐츠에 대한 수요가 확대되고 있다. 따라서, 숏폼 영상 콘텐츠를 편집하여 생성하는 콘텐츠 편집 기술에 대한 연구가 필요하다. 본 연구는 영상, 음성, 동작을 포착하여 주요 장면의 숏폼 동영상을 생성하는 기술을 연구한다. 주요 장면의 숏폼 동영상은 머신 러닝을 통해 미리 학습된 하이라이트 추출 모델을 이용한다. 하이라이트 영상을 자동으로 생성하는 영상 자동 편집 시스템 및 방법은 숏폼 영상 콘텐츠의 핵심 기술이다. 머신러닝 기반의 영상 자동 편집 방법 및 시스템 연구는 1인 크리에이터들의 영상 편집에 투입되는 노력과 비용시간을 감소시켜, 경쟁력있는 콘텐츠 활동을 할 수 있도록 기여할 것이다.

  • PDF

핵심어 인식을 이용한 음성 자동 편집 시스템 구현 (Implementation of the Automatic Speech Editing System Using Keyword Spotting Technique)

  • 정익주
    • 음성과학
    • /
    • 제3권
    • /
    • pp.119-131
    • /
    • 1998
  • We have developed a keyword spotting system for automatic speech editing. This system recognizes the only keyword 'MBC news' and then sends the time information to the host system. We adopted a vocabulary dependent model based on continuous hidden Markov model, and the Viterbi search was used for recognizing the keyword. In recognizing the keyword, the system uses a parallel network where HMM models are connected independently and back-tracking information for reducing false alarms and missing. We especially focused on implementing a stable and practical real-time system.

  • PDF

객체기반 비디오 편집 시스템을 위한 불확실 영역기반 사용자 지원 비디오 객체 분할 기법 (Uncertain Region Based User-Assisted Segmentation Technique for Object-Based Video Editing System)

  • 유홍연;홍성훈
    • 한국멀티미디어학회논문지
    • /
    • 제9권5호
    • /
    • pp.529-541
    • /
    • 2006
  • 본 논문에서는 객체기반 비디오 부호화 또는 멀티미디어 편집을 위한 반지동 비디오 객체 분할방식을 제안한다. 반자동 객체분할은 사용자 지원에 의한 분할 방식으로, 비디오 시퀀스의 초기 프레임에서 사용자가 관심객체의 경계를 표시하고 이후의 영상 프레임의 객체를 배경으로부터 연속적으로 분리해 낸다. 제안된 방식은 부분적으로 사용자 조력에 의한 프레임내 분할과 완전 자동에 의한 프레임간 분할 처리과정으로 구성되는데, 영상 전체에 대해 연산을 수행하는 기존 방식과는 달리 객체 경계가 존재하는 영상영역 부분에서만 연산을 수행한다. 프레임내 분할은 사용자가 관심객체의 경계를 지정하고, 이 경계 주위 화소들의 유사성을 이용한 후처리에 의해 정확한 초기 객체를 구한다. 프레임간 분할에서는 이전 프레임에서 추출한 객체의 경계 정보에 근거하여 시간적 유사성을 구한 후 경계와 영역 추적에 의해 연속적으로 동영상 객체를 추출한다. 실험결과로부터 제안된 방식은 비디오 편집, 객체기반 비디오 압축 및 인덱싱 등의 멀미디어 응용에 사용 가능할 정도로 안정되고 정확한 객체추출을 수행함을 확인하였다. 이 결과를 바탕으로 다수의 편리한 기능을 포함한 비디오 편집시스템을 개발하였다.

  • PDF

전이학습 기반 기계번역 사후교정 모델 검증 (The Verification of the Transfer Learning-based Automatic Post Editing Model)

  • 문현석;박찬준;어수경;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.27-35
    • /
    • 2021
  • 기계번역 사후교정 (Automatic Post Editing, APE)이란 번역 시스템을 통해 생성한 번역문을 교정하는 연구 분야로, 영어-독일어와 같이 학습데이터가 풍부한 언어쌍을 중심으로 연구가 진행되고 있다. 최근 APE 연구는 전이학습 기반 연구가 주로 이루어지는데, 일반적으로 self supervised learning을 통해 생성된 사전학습 언어모델 혹은 번역모델이 주로 활용된다. 기존 연구에서는 번역모델에 전이학습 시킨 APE모델이 뛰어난 성과를 보였으나, 대용량 언어쌍에 대해서만 이루어진 해당 연구를 저 자원 언어쌍에 곧바로 적용하기는 어렵다. 이에 본 연구에서는 언어 혹은 번역모델의 두 가지 전이학습 전략을 대표적인 저 자원 언어쌍인 한국어-영어 APE 연구에 적용하여 심층적인 모델 검증을 진행하였다. 실험결과 저 자원 언어쌍에서도 APE 학습 이전에 번역을 한차례 학습시키는 것이 유의미하게 APE 성능을 향상시킨다는 것을 확인할 수 있었다.

뉴스비디오 편집시스템 (News Video Editing System)

  • 고경철;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2000년도 추계종합학술대회
    • /
    • pp.421-425
    • /
    • 2000
  • 뉴스 비디오의 효과적인 검색을 위해서는 비디오데이터로부터 의미 있는 정보들을 추출할 수 있는 비디오 처리 및 편집기술의 개발이 요구된다. 이를 위하여 정보 선진국들을 중심으로 비디오 편집 기술이 오래 전부터 연구되어 왔으며, 최근에는 실생활의 완벽한 실용화를 위하여 연구에 중점을 두고 있는 실정이다. 본 논문은 비디오 데이터의 종류에 따라 사용자가 임의의 알고리즘을 선택하여 장면전환 검출의 정확성과 효율성을 높일 수 있으며, 시스템의 자동/수동분류에 의한 장면전환검출과 편집 시스템을 통하여 사용자의 요구에 따라 비디오 데이터로부터 의미 있는 정보들을 추출하고 편집할 수 있는 시스템을 제안한다.

  • PDF

최신 기계번역 사후 교정 연구 (Recent Automatic Post Editing Research)

  • 문현석;박찬준;어수경;서재형;임희석
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.199-208
    • /
    • 2021
  • 기계번역 사후교정이란, 기계번역 문장에 포함된 오류를 자동으로 교정하기 위해 제안된 연구 분야이다. 이는 번역 시스템과 관계없이 번역문의 품질을 높이는 오류 교정 모델을 생성하는 목적을 가진 연구로, 훈련을 위해 소스문장, 번역문, 그리고 이를 사람이 직접 교정한 문장이 활용된다. 특히, 최신 기계번역 사후교정 연구에서는 사후교정 데이터를 통한 학습을 진행하기 이전에, 사전학습된 다국어 언어모델을 활용하는 방법이 적용되고 있다. 이에 본 논문은 최신 연구들에서 활용되고 있는 다국어 사전학습 언어모델들과 함께, 해당 모델을 도입한 각 연구에서의 구체적인 적용방법을 소개한다. 나아가 이를 기반으로, 번역 모델과 mBART모델을 활용하는 향후 연구 방향을 제안한다.

수목차폐율을 고려한 자동상관매칭 수치고도 결과 분석 (Analysis of Ground Height from Automatic Correlation Matching Result Considering Density Measure of Tree)

  • 어양담
    • Spatial Information Research
    • /
    • 제15권2호
    • /
    • pp.181-187
    • /
    • 2007
  • 수치고도자료를 생성하기 위해서, 항공기 혹은 위성에 탑재된 센서로부터 획득한 입체영상으로부터 자동상관매칭기법에 의해 고도값을 획득하는 연구가 수행되어 왔다. 자동상관매칭에 의한 결과값은 센서의 각도 및 수목 등에 의해 지표고도를 직접 추출하는데는 한계가 있고 영상내 지형지물 분포에 의해 고도값의 수정, 편집량이 결정된다. 본 연구는 수목차폐율과 수목고 자료가 자동상관매칭 고도 결과값에 미치는 영향을 분석하였다.

  • PDF

장르 특성 패턴을 활용한 매칭시스템 기반의 자동영상편집 기술 (Automatic Video Editing Technology based on Matching System using Genre Characteristic Patterns)

  • 문혜준;임양미
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.861-869
    • /
    • 2020
  • 본 논문은 영화 장르마다 나타나는 클라이맥스 패턴이 다름을 활용하여 사용자의 디바이스 내에 저장되어 있는 이미지들을 하나의 영상으로 자동생성해주는 애플리케이션 개발을 소개한다. 영화의 장르 특성 분류는 국내 영화 드라마, 액션, 공포와 국외 영화 드라마, 액션, 공포 장르를 분석하여 클라맥스 패턴 모델형을 만들었다. 클라이맥스 패턴은 영화의 특정 씬 부분에서 샷사이즈의 변화, 샷의 길이, 인서트샷 사용의 빈도를 특성 요소로 하였고, 결과를 시각화하였다. 장르별 시각화된 모델을 Firebase DB를 활용하는 템플릿으로 개발하였다. 사용자의 디바이스에 저장된 이미지를 선택하여 장르별 템플릿으로 개발된 클라이맥스 패턴 모델과 매칭하였다. 짧은 영상이지만 장르의 특성이 반영되어 감성스토리 영상을 자동생성할 수 있는 것이 본 애플리케이션의 특징이다. 최근 유튜브, 네이버와 같은 플랫폼 사업자들은 사용자가 스마트폰으로 직접 촬영한 사진이나 영상을 활용하여 자동으로 영상을 생성해주는 애플리케이션들을 매년 업그래이드하고 있으나, 영화와 같이 장르 특성을 갖는다거나, 스토리가 보이는 영상생성 기술을 포함한 애플리케이션은 아직 미흡하다. 제안한 자동영상편집은 감성전달이 가능한 영상편집 애플리케이션으로써의 발전 가능성이 있다고 예측한다.