• 제목/요약/키워드: 영상 번역

검색결과 50건 처리시간 0.03초

감성형 콘텐츠 서비스를 위한 캐릭터 로봇 동기화 기술 개발 (Character Robot synchronization technology development for emotional contents service)

  • 정현철;김남진;최이권
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.217-220
    • /
    • 2011
  • 영상 압축 기술의 발전과 인터넷의 보급으로 사람들은 언제 어디서나 고화질의 미디어를 쉽게 접할 수 있게 되었다. 또한 미디어 플레이어에서 문자열의 출력을 지원함으로써 사용자들은 쉽게 영상의 자막을 만들고 볼 수 있는 환경이 만들어졌다. 그러나 문자는 번역을 위한 역할만 할 뿐 미디어에서 나타내고자 하는 감성을 전달하는 역할은 하지 못한다. 본 연구에서는 애니메이션 캐릭터와 콘텐츠 로봇을 사용하는 새로운 의미전달 기술을 적용한 감성형 콘텐츠 서비스를 제안한다. 제안하는 기술은 동기화 시나리오를 구성하여 미디어가 재생되는 동안 애니메이션 캐릭터 데이터를 제공하며, 또 다른 출력장치인 로봇과 동기화되어 상황에 따른 로봇의 움직임을 통해 시청자에게 내용 전달의 효과와 함께 감성 전달의 효율을 증대시켜주는 역할을 한다. 본 논문에서는 감성형 콘텐츠를 제작한 후 시현을 통해 감성 전달의 효율이 높아짐을 확인하였다.

  • PDF

비디오에 대한 말풍선 효과 합성 (Word-balloon effects on Video)

  • 이선영;이인권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.332-334
    • /
    • 2012
  • 최근 영화나 드라마 같은 미디어 데어터가 폭발적으로 증가하면서, 다양한 언어로 번역된 자막 데이터도 증가하고 있다. 이러한 자막은 대부분 화면 하단이나 우측에 위치가 고정되어 나타내는 방식을 취하고 있다. 그러나 이 방식에는 몇 가지 한계점을 가지고 있다. 자막과 등장인물의 얼굴이 거리가 먼 경우, 시청자의 시선이 분산되어 영상에 집중하기 어렵다는 점과 청각장애를 가진 사람의 경우 자막만으로는 누가 말하고 있는 대사인지 혼동이 온다는 점이다. 본 논문에서는 만화에서 대사를 전달하기 위해 사용하던 말풍선을 동영상의 자막을 나타내는데 사용하는 새로운 자막 시스템을 제안한다. 말풍선을 사용하면 말꼬리로 화자의 위치를 가리키고, 시청자의 시선을 화자의 얼굴 근처에 집중시킴으로써 기존 자막이 갖는 한계점을 개선시킬 수 있다. 본 연구의 결과물을 검증하기 위해 사용자 평가를 실시했고, 기존의 자막 방식에 비해 시선의 안정성과 흥미성, 정확도에서 더 낫다는 결과를 얻을 수 있었다.

음성·영상 신호 처리 알고리즘 사례를 통해 본 젠더혁신의 필요성 (Gendered innovation for algorithm through case studies)

  • 이지연;이혜숙
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.459-466
    • /
    • 2018
  • 젠더혁신은 연구개발의 전 과정에서 남녀의 생물학적, 인지적, 사회적 특성 및 행동방식의 차이에 의한 성 젠더 요소를 고려하여 남녀 모두를 위한 보다 나은 연구개발과 지식을 창출하는 과정을 의미한다. 본 논문의 연구목적은 ICT산업, 자동차 산업, 빅데이터, 로봇 산업 등에 활용할 수 있는 영상 음성신호처리에서 문헌연구 및 기존 자료를 분석하고 사례 조사를 통하여 젠더혁신의 중요성을 고찰하는 것이다. 본 연구에서는 젠더 연구를 기반으로 영상 음성신호처리의 관련된 최신 국내외 문헌을 검색하고 총 8편의 논문을 선정한다. 그리고 젠더분석 측면에서, 연구대상, 연구 환경, 연구 설계로 구분하여 살펴본다. 연구결과로써, 노인음성 신호처리, 기계학습과 젠더, 기계번역 기술, 안면 젠더인식 기술의 음성 영상신호 처리 알고리즘 논문 사례 분석을 통하여 기존의 알고리즘에 젠더편향성이 있음을 밝히고 이들 알고리즘 개발에서 상황에 맞는 성 젠더 분석이 필요함을 보인다. 또한 알고리즘 개발에 다양한 성 젠더 요소를 반영하는 젠더혁신 방법과 정책을 제안한다. 추후 ICT에서의 젠더혁신은 남녀 모두의 요구를 반영한 제품과 서비스를 개발로 새로운 시장 창출에 기여할 수 있다.

심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색 (Search of an Optimal Sound Augmentation Policy for Environmental Sound Classification with Deep Neural Networks)

  • 박진배;;배성호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.18-21
    • /
    • 2020
  • 심층 신경망은 영상 분류, 음성 인식, 그리고 문자 번역 등 다양한 분야에서 효과적인 성능을 보여주고 있다. 신경망의 구조 변화, 신경망 간의 정보 전달, 그리고 학습에 사용되는 데이터 증대 등의 확장된 연구를 통해 성능은 더욱 발전하고 있다. 그 중에서도 데이터 증대는 기존에 수집한 데이터의 변형을 통해 심층 신경망에 더 다양한 데이터를 제공함으로써 더욱 일반화된 신경망을 학습시기키는 것을 목표로 한다. 하지만 기존의 음향 관련 신경망 연구에서는 모델의 학습에 사용되는 데이터 증대 방법의 연구가 영상 처리 분야만큼 다양하게 이루어지지 않았다. 최근 영상 처리 분야의 데이터 증대 연구는 학습에 사용되는 데이터와 모델에 따라 최적의 데이터 증대 방법이 다르다는 것을 실험적으로 보여주었다. 이에 영감을 받아 본 논문은 자연에서 발생하는 음향을 분류하는데 있어서 최적의 데이터 증대 방법을 실험적으로 찾으며, 그 과정을 소개한다. 음향에 잡음 추가, 피치 변경 혹은 스펙트로그램의 일부 제한 등의 데이터 증대 방법을 다양하게 조합하는 실험을 통해 경험적으로 어떤 증대 방법이 효과적인지 탐색했다. 결과적으로 ESC-50 자연 음향 데이터 셋에 최적화된 데이터 증대 방법을 적용함으로써 분류 정확도를 89%로 향상시킬 수 있었다.

  • PDF

공간영상정보 관련 ISO와 OGC 표준현황과 활용을 위한 제언 (ISO and OGC Standards for Geo-spatial Image Information and Suggestions for Their Applications)

  • 이기원;강혜경
    • 대한원격탐사학회지
    • /
    • 제26권4호
    • /
    • pp.451-464
    • /
    • 2010
  • 최근 정보기술 기반의 공간정보 분야에서 국가 또는 국제 표준에 대한 실무 적용 사례가 증가하고 있다. 특히 공간영상정보 기반 콘텐츠 개발과 이러한 정보 자원들의 보급, 배포, 유통 등에 수요가 증가하고 있는 추세이므로 이를 뒷받침하는 핵심 요소로서 표준의 중요성이 갈수록 강조되고 있다. 그러나 우리나라의 경우 위성영상정보를 포함하는 공간영상정보처리 분야에서도 그 필요성에 비하여 아직까지는 표준에 대한 관심과 개발 및 적용을 위한 노력이 다소 미흡한 실정이다. 본 연구에서는 공간영상정보 분야에 국한하여 국내 표준의 현황과 함께 공간정보 분야의 주요 국제적인 표준기구인 ISO와 OGC에서 개발, 제정된 국제 표준 및 관련 표준화 동향을 정리하였다. 국내 표준과 국제 표준을 비교한 결과로 대부분의 국내 표준이 국제 표준기구의 표준을 번역, 수정하여 제정되고 있으나 체계적인 연구나 활용 방안 등이 마련되지 못하고 있어 표준 관련 기술의 축적 및 산업적 활용이 부진해 질 우려가 있는 것으로 나타났다. 따라서 이에 대한 문제점을 분석하고 이를 해결하기 위한 전략 및 방안 마련이 필요하고, 본 연구는 이러한 향후 연구의 기초 연구로 이용될 수 있다.

한류를 위한 In-Apps 방식의 e-pub player 개발 (E-pub player for K-POP)

  • 김시우;강지애;김유정;반소정;임유남;정지영;강혜린;윤인희;천선화
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.287-288
    • /
    • 2012
  • 본 논문에서는 소비자 스스로 검색하는 콘텐츠를 분석하여 그 중 인지도가 높은 콘텐츠를 제휴하여 서비스 를 제공한다. 인지도 높은 동영상 콘텐츠에 전자책을 제작하여 새로운 콘텐츠로 재제작 유료 서비스 추진 하고 인지도 높은 전자책 콘텐츠를 동영상과 함께 새로운 콘텐츠로 제작하여 유료 서비스 추진한다. 그리고 콘텐츠 보유 개인, 기업 및 단체와 제휴를 통한 서비스 추진할 수 있고 나아가 번역기를 통한 다국어서비스로 글로벌 콘텐츠 서비스 추진한다.

  • PDF

다중스레드 모델의 스레드 코드를 안전한 자바 바이트코드로 변환하기 위한 번역기 설계 (Design of Translator for generating Secure Java Bytecode from Thread code of Multithreaded Models)

  • 김기태;유원희
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.148-155
    • /
    • 2002
  • 다중스레드 모델은 데이터플로우 모델의 내부적인 병렬성, 비동기적 자필 가용성과 폰 노이만 모델의 실행 지역성을 결합하여 병렬처리 시스템의 성능을 향상시켰다. 이 모델은 프로그램의 실행을 위하여 컴파일러에 의해 생성된 스레드를 수행하며, 스레드의 생성 방법에 따라 자원 활용 빈도나 동기화 빈도와 같은 스레드의 질이 결정되는 특징이 있다. 하지만 다중스레드 모델은 실행 모델이 특정 플랫폼에 제한되는 단점을 가지고 있다. 이에 반해 자바는 플랫폼에 독립적인 특징을 가지고 있어 다중스레드 모델의 스레드 코드를 실행 단위인 자바 언어로 변환하면 다중스레드 모델의 특징을 여러 플랫폼에서 수정 없이 사용할 수 있게 된다. 자바는 원시 언어를 중간 언어 형태의 바이트코드로 변환하여 각 아키텍처에 맞게 설계된 자바 가상 머신이 설치된 시스템에서 자바 언어를 수행한다. 이러한 자바 언어의 바이트코드는 번역기의 중간 언어와 같은 역할을 수행하고, 이때 자바 가상 머신은 번역기의 후위부와 같은 역할을 한다. 스레드 코드에서 번역된 자바 바이트코드는 다양한 플랫폼에서 실행될 수 있다는 장점은 있지만 신뢰할 수 없다는 만점이 있다. 또한 자바 언어 자체의 문제에 의해 안전하지 못한 코드가 생성 될 수도 있다. 본 논문은 다중스레드 코드가 플랫폼에 독립적인 특성을 갖출 수 있도록 다중스레드 코드를 자바 가상 머신에서 실행 가능하도록 한다. 또한 번역시에 자바에서 발생할 수 있는 문제들을 고려하여 안전한 바이트코드를 생성한다. 즉, 다중스레드 모델의 스레드 코드를 플랫폼에 독립적이고 외부 공격으로부터 안전한 자바 바이트코드로 변환하는 번역기를 선계, 구현한다.구센타와 병원간에 임상정보와 유전체 분석정보의 공유가 필수적으로 발생하게 됨으로, 유전체 정보와 임상정보의 통합은 미래 의료환경에 필수기능이 될 것이다. 3) 각 생명공학 연구소에서 사용하는 첨단 분석 장비와 생명공학 정보시스템의 자동 연계가 필요하다. 현재 국내에는 전국적인 초고속정보망이 가동되어 웹을 기반으로 하는 생명정보의 공유는 기술적으로 문제가 될 수 없으나 임상정보의 유전체연구에 그리고 유전체연구정보의 임상활용은 다양한 문제를 내포하고 있다. 이에 영상을 포함한 환자정보의 유전체연구센터와 병원정보시스템과의 효율적인 연계통합 운영을 위해 국내에서는 초기 도입단계에 있는 국제적인 보건의료정보의 표준인 Health Level 7 (textural information 공유), DICOM (image 및 wave 공유), 관련 ISO표준, WHO의 ICD9/10 (질병분류), LOINC (검사 및 관련용어), SNOMED International (의학용어) 등을 활용하여야 한다.matrix. The prediction system gives about 50% of sensitivity and 98% of specificity, Based on the PID matrix, we develop a system providing several interaction information-finding services in the Internet. The system, named PreDIN (Prediction-oriented Database of Interaction Network) provides interacting domain finding

  • PDF

기록관리 분야에서 한국어 자연어 처리 기술을 적용하기 위한 고려사항 (Considerations for Applying Korean Natural Language Processing Technology in Records Management)

  • 김학래
    • 한국기록관리학회지
    • /
    • 제22권4호
    • /
    • pp.129-149
    • /
    • 2022
  • 기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.

Word2Vec 모델을 활용한 한국어 문장 생성 (Generating Korean Sentences Using Word2Vec)

  • 남현규;이영석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-212
    • /
    • 2017
  • 고도화된 머신러닝과 딥러닝 기술은 영상처리, 자연어처리 등의 분야에서 많은 문제를 해결하고 있다. 특히 사용자가 입력한 문장을 분석하고 그에 따른 문장을 생성하는 자연어처리 기술은 기계 번역, 자동 요약, 자동 오류 수정 등에 널리 이용되고 있다. 딥러닝 기반의 자연어처리 기술은 학습을 위해 여러 계층의 신경망을 구성하여 단어 간 의존 관계와 문장 구조를 학습한다. 그러나 학습 과정에서의 계산양이 방대하여 모델을 구성하는데 시간과 비용이 많이 필요하다. 그러나 Word2Vec 모델은 신경망과 유사하게 학습하면서도 선형 구조를 가지고 있어 딥러닝 기반 자연어처리 기술에 비해 적은 시간 복잡도로 고차원의 단어 벡터를 계산할 수 있다. 따라서 본 논문에서는 Word2Vec 모델을 활용하여 한국어 문장을 생성하는 방법을 제시하였다. 본 논문에서는 지정된 문장 템플릿에 유사도가 높은 각 단어들을 적용하여 문장을 구성하는 Word2Vec 모델을 설계하였고, 서로 다른 학습 데이터로부터 생성된 문장을 평가하고 제안한 모델의 활용 방안을 제시하였다.

  • PDF

Cadieux 모델에 기반한 Web Globalization 시스템 구현 (Implementation of Web Globalization System Based on Cadieux Model)

  • 이영미;서형국;이경일
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.252-258
    • /
    • 2003
  • Web Globalization(이하 WG)은 global e-biz의 핵심으로 인터넷에 남은 가장 큰 사업이라고 할 수 있다. WG은 국제 시장 대응을 위해 다국어 웹사이트를 구축 및 관리하는 일이며 업무의 복잡성으로 인해 다국어 프로세스 자동화와 관리 도구가 절실히 요구되는 분야이다. 이에 WG의 시장 및 기술 동향을 살펴보고, Cadieux 모델에 기반한 모비코앤시스메타(이하 MnS)의 새로운 WG 시스템을 설명하고자 한다. 본 연구에서는 e-biz 세계화의 가장 큰 특징인 빈번한 트랜잭션과 콘텐츠 번역 프로세스를 자동화함으로 높은 비용 효과 달성을 기본목표로 하였으며, 다국어 글로벌 커뮤니티 지원 기능과 복잡한 문서 및 동영상과 같은 멀티미디어 콘텐츠의 세계화가 가능하도록 설계되었다. 마지막으로 프로토타입인 iGLOBIZ 시스템을 실제 구현해 봄으로 기술 및 상업화 가능성을 확인하고 향후의 연구 방향을 모색해 보았다.

  • PDF