• 제목/요약/키워드: 미디어 내 이미지

검색결과 149건 처리시간 0.023초

국부적인 변형 검출을 위한 효율적인 워터마킹 (An Efficient Watermarking for Tamper Localization Proofing)

  • 우찬일;전세길
    • 전자공학회논문지 IE
    • /
    • 제43권2호
    • /
    • pp.87-92
    • /
    • 2006
  • 최근 들어 지적 재산권 보호와 멀티미디어 데이터 인증을 위하여 다양한 워터마킹 방법들이 제안되어 왔다. 이미지 인증을 위한 워터마킹에서 워터마크는 영상의 부당한 변형 검출을 위해서 영상 내에 삽입된다. 따라서, 인증과 무결성을 위한 워터마킹은 스케일링 및 크롭핑 등과 같은 영상 변형에 대하여 삽입된 워터마크가 쉽게 지워져야 한다. 본 논문에서는 계층적 구조를 사용하여 영상의 무결성 검증과 변형 위치 검출을 위한 fragile 워터마킹 방법을 제안한다. 제안 방법에서는 워터마크가 삽입되는 영상을 여러 레벨로 구성하여 각 레벨별로 영상을 여러 블록으로 나눈 후 각 블록에 대한 디지털 서명을 계산한다. 디지털 서명은 블록 내 모든 화소의 상위 7개의 비트들(MSBs)을 사용하여 계산한 후 각 블록 내에서 선택된 화소의 LSB에 삽입된다. 본 논문에서 제안한 방법에 대한 실험 결과는 제안 방법의 효율성을 나타낸다.

딥러닝 기반의 의료 OCR 기술 동향 (Trends in Deep Learning-based Medical Optical Character Recognition)

  • 윤성연;최아린;김채원;오수민;손서영;김지연;이현희;한명은;박민서
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.453-458
    • /
    • 2024
  • 광학 문자 인식(Optical Character Recognition, OCR)은 이미지 내의 문자를 인식하여 디지털 포맷(Digital Format)의 텍스트로 변환하는 기술이다. 딥러닝(Deep Learning) 기반의 OCR이 높은 인식률을 보여줌에 따라 대량의 기록 자료를 보유한 많은 산업 분야에서 OCR을 활용하고 있다. 특히, 의료 산업 분야는 의료 서비스 향상을 위해 딥러닝 기반의 OCR을 적극 도입하였다. 본 논문에서는 딥러닝 기반 OCR 엔진(Engine) 및 의료 데이터에 특화된 OCR의 동향을 살펴보고, 의료 OCR의 발전 방향에 대해 제시한다. 현재의 의료 OCR은 검출한 문자 데이터를 자연어 처리(Natural Language Processing, NLP)하여 인식률을 개선하였다. 그러나, 정형화되지 않은 손글씨(Handwriting)나 변형된 문자에서는 여전히 인식 정확도에 한계를 보였다. 의료 데이터의 데이터베이스(Database)화, 이미지 전처리(Pre-processing), 특화된 자연어 처리를 통해 더욱 고도화된 의료 OCR을 발전시키는 것이 필요하다.

문서 이미지 데이터 활용을 위한 지능형 OCR 기술 개발 (Development of Intelligent OCR Technology to Utilize Document Image Data)

  • 김상준;유동희;황소영;김민호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.212-215
    • /
    • 2022
  • 오늘날 소위 디지털 전환시대를 맞아, 많은 부분에서 빅데이터의 구축과 활용에 대한 필요성이 높아졌다. 오늘날에 많은 데이터가 디지털기기, 미디어 친화적으로 생산 및 보관되는 것과 달리, 과거 오랜 기간 데이터의 생산 및 보관은 활자 인쇄도서가 주를 이루었다. 따라서 오랜 기간 축적되어온 방대한 활자 인쇄도서를 빅데이터로써 활용하기 위한 광학 문자 판독(OCR: Optical Character Recognition) 기술의 필요성 역시 빅데이터의 필요성에 맞추어 함께 요구되었다. 본 연구에서는 도서 스캔 이미지의 정보를 각 문서 객체별로 세분화하여 그 구조와 내용을 디지털화하는 시스템을 제안한다. 제안 시스템은 크게 1) 문서객체(표, 수식, 그림, 본문)의 영역정보를 인식. 2)인식된 객체의 영역정보를 각각 표 처리, 수식 처리, 텍스트 처리 모듈로 OCR. 3) OCR로 처리된 문서 정보를 JSON형식으로 종합하여 반환하는 세 단계로 구성된다. 본 연구에서 제안하는 모델은 이러한 단계를 수행함에 있어 오픈소스로 공개된 프로젝트를 활용하되, 본 시스템의 목표에 맞추어 추가적인 학습과 개량을 거쳤다. 본 연구에서 제안한 지능형 OCR 시스템은 문서 이미지 내 4종(표, 수식, 이미지, 텍스트)의 객체인식과 처리에 있어 상용 소프트웨어 수준의 성능을 확인할 수 있었다.

  • PDF

하이라이트 검출을 위한 구간 분할 앙상블 모델 (Subdivision Ensemble Model for Highlight Detection)

  • 이한솔;이계민
    • 방송공학회논문지
    • /
    • 제25권4호
    • /
    • pp.620-628
    • /
    • 2020
  • 하이라이트를 자동으로 예측 하는 문제는 영상을 사람이 직접 편집하는 시간과 비용 문제를 해결하기 위해 필요한 기술이다. 본 논문에서는 하이라이트 구간 내에서 하이라이트 판단 여부에 영향을 주는 특정 부분에 집중하기 위해 앙상블 모델을 제안한다. 우리의 모델은 하나의 단일 모델만으로는 충분히 학습하기 어려운 중요한 정보를 앙상블을 통해 더 많은 유용한 특징들을 얻을 수 있다. 앙상블을 이루는 단일모델들은 오디오와 이미지 정보를 결합하여 다양한 영상의 특징들을 추출한다. 직접 수집한 e스포츠 경기 영상과 야구 경기 영상을 통해 하이라이트 예측 성능이 개선됨을 확인한다.

SHVC 및 MVC 통합 기반의 스케일러블 다시점 비디오 부호화 설계 및 구현 (Design and Implementation of Scalable Multi-view Video Coding Based on Integration of SHVC and MVC)

  • 정태준;서광덕
    • 방송공학회논문지
    • /
    • 제22권3호
    • /
    • pp.405-408
    • /
    • 2017
  • 다시점 이미지의 뷰포인트 간에 높은 유사도가 존재함을 바탕으로 MV-HEVC는 뷰포인트 내에서 전통적인 시간적 방향 예측 뿐만 아니라 뷰포인트 간에 예측을 수행함으로써 높은 부호화 효율을 얻는다. 본 논문에서는 HEVC를 기본 계층으로 사용하는 스케일러블다시점 비디오 부호화를 구현하기 위해 SHVC와 MVC를 통합 구현함을 제안한다. 실험결과에 의해 BD-PSNR 개선이 1.5dB에 이르고 동시에 BD-Bitrate를 50~60% 가량 줄일 수 있음을 확인하였다.

멀티미디어 검색을 위한 shot 경계 및 대표 프레임 추출 (Shot boundary Frame Detection and Key Frame Detection for Multimedia Retrieval)

  • 강대성;김영호
    • 융합신호처리학회논문지
    • /
    • 제2권1호
    • /
    • pp.38-43
    • /
    • 2001
  • 본 논문에서는 MPEG 비디오 스트림을 분석하여 DCT DC 계수를 추출하고 이들로 구성된 DC 이미지로부터 제안하는 robust feature를 이용하여 shot 검출을 수행한 후 각 feature들의 통계적 특성을 이용하여 스트림의 특징에 따라 weight를 부가하여 구해진 characterizing value의 시간 변화량을 구한다. 추해진 변화량의 local maxima와 local minima는 비디오 스트림에서 각각 가장 특징적인 frame과 평균적인 frame을 나타낸다. 이 순간의 shot을 구함으로서 효과적이고 빠른 시간 내에 key frame을 추출한다. 추출되어진 key frame에 대하여 원영상을 복원한 후, 색인을 위하여 다수의 parameter를 구하고, 사용자가 질의한 영상에 대해서 이들 파라메터를 구하여 key frame들과 가장 유사한 대표영상들을 검색한다. 실험결과 일반적인 방법보다 더 나은 결과를 보였고, 높은 검색율을 보였다.

  • PDF

스테레오 입체음향을 위한 머리 움직임 추정 (A Tracking of Head Movement for Stereophonic 3-D Sound)

  • 김현태;이광의;박장식
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1421-1431
    • /
    • 2005
  • 입체음향을 구현하는 방법은 두 가지가 있으며, 5.1 채널과 같은 서라운드 시스템(surround system)을 이용하는 방법과 2 채널의 바이노럴 시스템(binaural system)을 이용하는 방법이 있다. 바이노럴 시스템은 사람이 두 귀를 이용하여 음상을 정위하는 원리를 이용하는 방법이다. 일반적으로 라우더 스피커 시스템에서 각 채널사이에 발생하는 크로스토크(crosstalk)는 본래의 입체음향을 재생하기 위해서는 제거되어야만 한다. 이 문제를 해결하기 위해서는 머리의 움직임을 추정할 필요가 있다. 본 논문에서는 청취자의 머리 움직임을 제대로 추정하는 새로운 알고리즘을 제안한다. 제안하는 알고리즘은 얼굴과 눈의 영역 검출을 기본으로 한다. 얼굴 검출은 이미지의 밝기 값을 이용하고 눈 검출은 수학적 형태학(mathematical morphology)을 이용한다. 청취자의 머리가 움직일 때 얼굴 영역과 눈 사이의 경계선의 길이가 변한다. 이 정보를 이용하여 머리 움직임을 추정한다. 컴퓨터 시뮬레이션을 통해 제안하는 알고리즘이 +10오차 범위 내에서 머리의 움직임을 효율적으로 추정하는 것을 확인하였다.

  • PDF

중간 주파수 영역에서의 디지털 워터마킹 기법에 의한 홍채 및 지문 데이터 보호 연구 (A Study on Protection of Iris and fingerprint Data Based on Digital Watermarking in Mid-Frequency Band)

  • 정대식;박강령
    • 한국멀티미디어학회논문지
    • /
    • 제8권9호
    • /
    • pp.1227-1238
    • /
    • 2005
  • 최근 인터넷과 네트워크 기술의 발달로 디지털 콘텐츠(이미지, 음성, 동영상 등)의 불법적인 복제나 유통으로 인한 저작권 문제가 크게 대두되고 있다. 이런 저작권의 보호를 위해 콘텐츠 내에 저작권자의 정보를 삽입하여 저작물의 저작권을 보호하는 기술인 디지털 워터마킹 기술은 현재 널리 연구되고 있다. 이러한 디지털 워터마킹 기술을 생체 정보(지문, 홍채)에 적용하여, 저장되어 있던 생체 정보의 도난이나 도용 시에 발생 할 수 있는 문제를 방지하는 것이 본 연구의 목적이다. 이를 위해 본 논문에서는 주파수 영역에서의 워터마크 삽입 방법을 사용하였으며, 워터마크 삽입 전후의 인식률 차이를 비교 분석하였고, 일반적으로 생체 데이터에 대해 많이 가해지는 공격인 흐림 공격에 대한 워터마크의 강인성을 측정하였다. 실험결과 본 논문에서 제안하는 워터마킹 기법이 홍채 및 지문 영상에 대해 효과적으로 사용될 수 있음을 알 수 있었다.

  • PDF

간단한 얼굴 방향성 검출방법 (A Simple Way to Find Face Direction)

  • 박지숙;엄성용;조현희;정민교
    • 한국멀티미디어학회논문지
    • /
    • 제9권2호
    • /
    • pp.234-243
    • /
    • 2006
  • 최근 급속한 HCI(Human-Computer Interaction) 및 감시 기술의 발달로, 얼굴영상을 처리하는 다양한 시스템들에 대한 관심이 높아지고 있다. 그러나 이런 얼굴영상을 처리하는 시스템들에 대한 연구는 주로 얼굴인식이나 얼굴 표정분석과 같은 분야에 집중되었고, 얼굴의 방향성 검출과 같은 분야에는 많은 연구가 수행되지 못하였다. 본 논문은 두 눈썹과 아래 입술로 구성된 얼굴삼각형(Facial Triangle)이라는 특징을 이용하여 얼굴의 방향성을 쉽게 측정하는 방법을 제안한다. 특히, 하나의 이미지만을 사용하여 얼굴의 수평 회전각과 수직 회전각을 구하는 간단한 공식을 소개한다. 수평회전각은 좌 우 얼굴삼각형간의 면적비율을 이용하여 계산하고, 수직회전각은 얼굴삼각형의 밑변과 높이 비율을 이용하여 계산한다. 실험을 통해, 제안하는 방법은 오차범위 ${\pm}1.68^{\circ}$ 내에서 수평회전각을 구할 수 있었고, 수직회전각은 회전각이 증가할수록 오류가 줄어드는 경향을 보여주었다.

  • PDF

Web을 기반으로 한 대학교 도서관 시스템에 있어서 용이한 인터페이스에 관한 연구 (Study on the Convenient Interface to the University Web-based Library System)

  • 이현정;정재욱
    • 디자인학연구
    • /
    • 제15권1호
    • /
    • pp.93-100
    • /
    • 2002
  • 대학 web도서관은 web으로 도서관에 소장된 서지나 기타 자료의 검색, 대출, 반납에 관한 정보의 처리가 가능하도록 되어 있는 도서관의 형태이다. 정보화 사회에 진입 한 이후 네트워크와 멀티미디어란 것의 등장으로 인해 정보전달 및 획득의 수단과 과정에 있어서 엄청난 변화를 겪고 있다. 이미지 화, 동영상 화 된 방대한 멀티미디어 정보들이 네트 워크를 통해 정보 제공자와 정보 사용자간의 물리적 거리에 대한 한계를 느끼지 못하게 되었다. 하지만, 이에 따르는 문제점으로는 저작잔 인식부족, 인프라의 미비, 기술적, 신뢰성 등으로 인해 발전이 요구되는 상태이다. 본 논문에서는 국정 대학 평가 기준에 근거하여 20개 대학의 web기반 도서관 site에서, 각 시스템별 검색 형식과 user interface를 비교, 분석하였다. 이에 기초하여 web기반 대학 도서관의 실험적 user interface를 제작하고, 이 interface에 대한 설문조사 및 데이터를 수집, 정리, 분석하였다. 이 결과를 현재web기반 대학도서관의 일반검색 시스템의 인터페이스에 적용하여 도서의 위치, 도서의 대출 및 검색회수, 대학 web도서관 내에서의 도서구입에 대한 기능을 포함하는 새로운 user interface를 제안하였다.

  • PDF