• 제목/요약/키워드: 이미지 번역기

검색결과 6건 처리시간 0.018초

윈도우 기반의 광학문자인식을 이용한 영상 번역 시스템 구현 (An Implementation of a System for Video Translation on Window Platform Using OCR)

  • 황선명;염희균
    • 사물인터넷융복합논문지
    • /
    • 제5권2호
    • /
    • pp.15-20
    • /
    • 2019
  • 기계학습 연구가 발달함에 따라 번역 분야 및, 광학 문자 인식(Optical Character Recognition, OCR) 등의 이미지 분석 기술은 뛰어난 발전을 보였다. 하지만 이 두 가지를 접목시킨 영상 번역은 기존의 개발에 비해 그 진척이 더딘 편이다. 본 논문에서는 기존의 OCR 기술과 번역기술을 접목시킨 이미지 번역기를 개발하고 그 효용성을 검증한다. 개발에 앞서 본 시스템을 구현하기 위하여 어떤 기능을 필요로 하는지, 기능을 구현하기 위한 방법은 어떤 것이 있는지 제시한 뒤 각기 그 성능을 시험하였다. 본 논문을 통하여 개발된 응용프로그램으로 사용자들은 좀 더 편리하게 번역에 접근할 수 있으며, 영상 번역이라는 특수한 환경으로 한정된 번역기능에서 벗어나 어떠한 환경에서라도 제공되는 편의성을 확보하는데 기여할 수 있을 것이다.

Show, Attend and Tell 모델을 이용한 한국어 캡션 생성 (Korean Image Caption Generator Based on Show, Attend and Tell Model)

  • 김다솔;이계민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.258-261
    • /
    • 2022
  • 최근 딥러닝 기술이 발전하면서 이미지를 설명하는 캡션을 생성하는 모델 또한 발전하였다. 하지만 기존 이미지 캡션 모델은 대다수 영어로 구현되어있어 영어로 캡션을 생성하게 된다. 따라서 한국어 캡션을 생성하기 위해서는 영어 이미지 캡션 결과를 한국어로 번역하는 과정이 필요하다는 문제가 있다. 이에 본 연구에서는 기존의 이미지 캡션 모델을 이용하여 한국어 캡션을 직접 생성하는 모델을 만들고자 한다. 이를 위해 이미지 캡션 모델 중 잘 알려진 Show, Attend and Tell 모델을 이용하였다. 학습에는 MS-COCO 데이터의 한국어 캡션 데이터셋을 이용하였다. 한국어 형태소 분석기를 이용하여 토큰을 만들고 캡션 모델을 재학습하여 한국어 캡션을 생성할 수 있었다. 만들어진 한국어 이미지 캡션 모델은 BLEU 스코어를 사용하여 평가하였다. 이때 BLEU 스코어를 사용하여 생성된 한국어 캡션과 영어 캡션의 성능을 평가함에 있어서 언어의 차이에 인한 결과 차이가 발생할 수 있으므로, 영어 이미지 캡션 생성 모델의 출력을 한국어로 번역하여 같은 언어로 모델을 평가한 후 최종 성능을 비교하였다. 평가 결과 한국어 이미지 캡션 생성 모델이 영어 이미지 캡션 생성 모델을 한국어로 번역한 결과보다 좋은 BLEU 스코어를 갖는 것을 확인할 수 있었다.

  • PDF

ChatGPT 기반 한국어 Vision-Language Pre-training을 위한 고품질 멀티모달 데이터셋 구축 방법론 (High-Quality Multimodal Dataset Construction Methodology for ChatGPT-Based Korean Vision-Language Pre-training)

  • 성진;한승헌;신종훈;임수종;권오욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.603-608
    • /
    • 2023
  • 본 연구는 한국어 Vision-Language Pre-training 모델 학습을 위한 대규모 시각-언어 멀티모달 데이터셋 구축에 대한 필요성을 연구한다. 현재, 한국어 시각-언어 멀티모달 데이터셋은 부족하며, 양질의 데이터 획득이 어려운 상황이다. 따라서, 본 연구에서는 기계 번역을 활용하여 외국어(영문) 시각-언어 데이터를 한국어로 번역하고 이를 기반으로 생성형 AI를 활용한 데이터셋 구축 방법론을 제안한다. 우리는 다양한 캡션 생성 방법 중, ChatGPT를 활용하여 자연스럽고 고품질의 한국어 캡션을 자동으로 생성하기 위한 새로운 방법을 제안한다. 이를 통해 기존의 기계 번역 방법보다 더 나은 캡션 품질을 보장할 수 있으며, 여러가지 번역 결과를 앙상블하여 멀티모달 데이터셋을 효과적으로 구축하는데 활용한다. 뿐만 아니라, 본 연구에서는 의미론적 유사도 기반 평가 방식인 캡션 투영 일치도(Caption Projection Consistency) 소개하고, 다양한 번역 시스템 간의 영-한 캡션 투영 성능을 비교하며 이를 평가하는 기준을 제시한다. 최종적으로, 본 연구는 ChatGPT를 이용한 한국어 멀티모달 이미지-텍스트 멀티모달 데이터셋 구축을 위한 새로운 방법론을 제시하며, 대표적인 기계 번역기들보다 우수한 영한 캡션 투영 성능을 증명한다. 이를 통해, 우리의 연구는 부족한 High-Quality 한국어 데이터 셋을 자동으로 대량 구축할 수 있는 방향을 보여주며, 이 방법을 통해 딥러닝 기반 한국어 Vision-Language Pre-training 모델의 성능 향상에 기여할 것으로 기대한다.

  • PDF

생성적 적대 네트워크를 이용한 감성인식 학습데이터 자동 생성 (Automatic Generation of Training Corpus for a Sentiment Analysis Using a Generative Adversarial Network)

  • 박천용;최용석;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.389-393
    • /
    • 2018
  • 딥러닝의 발달로 기계번역, 대화 시스템 등의 자연언어처리 분야가 크게 발전하였다. 딥러닝 모델의 성능을 향상시키기 위해서는 많은 데이터가 필요하다. 그러나 많은 데이터를 수집하기 위해서는 많은 시간과 노력이 소요된다. 본 연구에서는 이미지 생성 모델로 좋은 성능을 보이고 있는 생성적 적대 네트워크(Generative adverasarial network)를 문장 생성에 적용해본다. 본 연구에서는 긍/부정 조건에 따른 문장을 자동 생성하기 위해 SeqGAN 모델을 수정하여 사용한다. 그리고 분류기를 포함한 SeqGAN이 긍/부정 감성인식 학습데이터를 자동 생성할 수 있는지 실험한다. 실험을 수행한 결과, 분류기를 포함한 SeqGAN 모델이 생성한 문장과 학습데이터를 혼용하여 학습할 경우 실제 학습데이터만 학습 시킨 경우보다 좋은 정확도를 보였다.

  • PDF

구한말 민중사상과 도교이미지, 그리고 도교서 언해 (Folk Ideas, Daoist Images, and Daoist Texts from the Late Joseon Dynasty)

  • 이봉호
    • 대순사상논총
    • /
    • 제36집
    • /
    • pp.201-225
    • /
    • 2020
  • 조선후기에 민중사상은 도교적 요소와 밀접한 관계를 맺고 있다. 『정감록』을 중심으로 한 민중사상은 '해도기병설'과 '남조선신앙', '미륵하생' 등으로 구체화되고, 이는 『정역』에 의해 개벽이라는 형태로 발전한다. 이들 민중사상에는 풍수와 도참의 내용들이 주를 이루고 있는데, 이는 도교의 방술 개념으로 이해될 수 있다. 다른 한편으로 철종 때부터 도교서들이 번역되기 시작하고, 고종에 의해서 국가의 국역사업으로 많은 도교서들이 번역, 간행된다. 이들 도교서의 성격은 선서류(善書類)이거나 보권류(寶卷類)이다. 문제는 이들 선서와 보권류의 도교서들이 청대 민란의 주요한 원인을 제공했다는 점이다. 이러한 점에서 국가사업으로 진행된 도교서들의 번역은 민란이나 변혁을 바라는 민중들에게 이론적 근거를 제공할 것인데, 왜 고종은 도교서 번역 사업을 국가적으로 시행했는가라는 질문을 제기할 수 있다. 이 질문을 해결하기 위해, 조선 후기의 민중사상을 정리하고, 그 내용들이 도교와 밀접한 관계임을 해명하였다. 또한 한국의 역사에서 도교는 국가적 위기에서 진호(鎭護)의 성격으로 등장해왔던 사실들을 정리하고, 임진왜란 당시에 도교가 호출되는 상황을 정리했다. 아울러 『홍길동전』과 『홍길동전』과 거의 동일한 서사를 갖는 야담(野談)의 내용들 속에 도교적 요소들이 있음을 해명하였다. 고종이 국권을 잃을 상황에서 도교 선서와 보권을 국역하고 보급한 것은 도교의 국가 진호적 성격을 인식하고, 도교를 통해 국권을 지키고자 한 의도임을 해명했다. 아울러 현재 한국의 상황에서 도교적 풍습과 관례는 고종의 도교 선서와 보권의 보급과 관련이 있음을 확인하였다.

『삼국유사』를 통해 본 분황사(芬皇寺)의 중대신라 불교미술 (Mid-Silla Buddhist Art of Bunhwangsa Temple Seen through the Record of Samgukyusa)

  • 최성은
    • 헤리티지:역사와 과학
    • /
    • 제47권4호
    • /
    • pp.136-161
    • /
    • 2014
  • 본고에서는 선덕여왕대에 창건되어 신라 왕실불교의 중심사찰이었던 분황사에 봉안되었던 중대신라기 불교조각과 벽화의 성격을 "삼국유사"의 기록을 바탕으로 유추해 보았다. "삼국유사"에는 분황사 관련하여 원효의 소조초상조각, 좌전 북벽의 천수대비상 벽화, 금동약사여래상에 대한 이야기가 실려 있다. 그 가운데 아들인 설총을 향해 얼굴을 돌렸다고 전하는 원효의 '고상(顧像)'은 설총이 만들었다는 초상조각으로 중국 남북조시대 이래 유행했던 유마거사상의 이미지를 모델로 하여 조성되었을 것으로 생각된다. 기본적으로 문수보살을 향해 고개를 옆으로 돌린 자세로 앉은 초당기 유마거사상의 모습이었을 것으로 추정되며, 나아가 석굴암 감실 유마거사상에서 보이는 이미지와 유사했을 것으로 생각된다. 분황사 좌전 북벽에 그려져 있던 천수대비상은 솔거(率去)의 작품으로 생각되고 있는데, 경덕왕대에 한기리에 사는 여인 희명의 눈먼 아이의 눈을 뜨게 했다는 영험함이 "삼국유사"에 기록되어 있다. 그들이 불렀다는 "도천수대비가"의 내용을 보면, 이 그림 속의 천수대비상은 눈이 그려져 있는 손을 천 개 가지고 있는 천수천안관음보살상이었다. 이 분황사 천수관음상을 '천수대비'로 불렀던 점에서 볼 때, 이 상은 당초(唐初)에 가범달마(伽梵達摩)가 번역한 "천수경"의 경궤에 따른 것으로 생각되며, 마찬가지로 '천수대비'로 불렸던 중생사와 백률사의 천수관음상 역시 같은 경궤에 의거한 상이었을 가능성이 크다고 생각된다. 경덕왕대에 조성된 분황사 약사여래상의 주조에는 30만 6700근의 동(銅)이 사용되었다고 기록되어 있다. 이처럼 많은 동이 사용된 것은 약사여래상 뿐 아니라 "약사경"에 언급된 약사여래의 권속 및 상징물과 관련이 있을 것으로 생각된다. 동본이역(同本異譯)의 여러 "약사경"에 공통적으로 나오는 약사신앙의 행법(行法)에는 7구의 약사불상을 조성하고 등명대를 설치하여 등(燈)을 밝히는 내용이 보인다. 또한 수대(隋代) 이래 나타났던 <약사여래변상>에 등장하는 약사여래의 협시(脇侍)로서는 일광 월광보살을 비롯해서 8대보살, 십이신장이 배치될 수 있다. 나라(奈良)시대에 창건된 신야쿠시지(新藥師寺)에는 7불 약사상과 그 권속의 여러 상들이 조성되었는데, 거의 비슷한 시기에 신라에서 이루어진 분황사의 불사(佛事)에서도 본존 약사불상 외에 관련된 여러 도상이 함께 조형화되었을 가능성도 배제할 수는 없을 것이다.