• 제목/요약/키워드: 멀티미디어 변환

검색결과 780건 처리시간 0.027초

웨이블릿영역에서 영상융합에 의한 영상 워터마킹 기법 (An Image Watermarking Scheme by Image Fusion in the Wavelet Domain)

  • 김동현;최인호
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.443-453
    • /
    • 2008
  • 본 논문에서는 이진 로고영상의 1레벨 DWT(Discrete Wavelet Transform) 계수값을 워터마크로 사용하여 대상영상의 웨이블릿 영역의 동일 주파수 영역에 삽입하였다. 이것이 본 논문에서 제안한 영상융합이다. 워터마크는 웨이블릿 영역의 동일 주파수 영역에 삽입시 중요 계수들에 삽입된다. 중요 계수는 영상에서 중요한 윤곽선이나 중요 평탄 영역의 정보를 가지고 있다. 워터마크는 절대값이 임계값 이상인 중요계수들에 삽입된다. 강건성을 위해 워터마크의 삽입 가중치로 계수값들의 표준편차를 이용한다. 따라서 제안 기법은 영상에 적응적 기법이며, 워터마크가 삽입된 영상이 절단이나 필터링 또는 압축으로 왜곡되었을 때 제안된 두 가지 검출 알고리즘이 왜곡에 적응적으로 사용될 수 있다.

  • PDF

시계열 데이터 분류를 통한 음성 감정 인식 (Speech emotion recognition through time series classification)

  • 김기덕;김미숙;이학만
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.11-13
    • /
    • 2021
  • 본 논문에서는 시계열 데이터 분류를 통한 음성 감정 인식을 제안한다. mel-spectrogram을 사용하여 음성파일에서 특징을 뽑아내 다변수 시계열 데이터로 변환한다. 이를 Conv1D, GRU, Transformer를 결합한 딥러닝 모델에 학습시킨다. 위의 딥러닝 모델에 음성 감정 인식 데이터 세트인 TESS, SAVEE, RAVDESS, EmoDB에 적용하여 각각의 데이터 세트에서 기존의 모델 보다 높은 정확도의 음성 감정 분류 결과를 얻을 수 있었다. 정확도는 99.60%, 99.32%, 97.28%, 99.86%를 얻었다.

  • PDF

N-/멀티스크린 및 OTT 서비스시대의 미디어 생태계 변환의 여섯 가지 특징과 함의: 미국 사례 (Six Major Shifts and Implications of the Video Distribution Ecosystem in the Era of N-screen and OTT Services: A case of US media industry)

  • 한광접
    • 한국콘텐츠학회논문지
    • /
    • 제14권8호
    • /
    • pp.342-364
    • /
    • 2014
  • 본 논문의 목적은 N- 혹은 멀티스크린 기술의 발전 및 OTT서비스 환경에서 TV서비스 중심의 미디어 생태계 변화의 특징과 함의는 무엇인가? 라는 질문에 대한 해답을 찾으려는 것이다. 이를 위해 대체재/보완제의 위협 및 신규사업자의 위협에 초점을 맞추되, 현행의 복잡한 경쟁 관계를 매체간의 역사적 흐름 속에서 이해하려고 시도하였다. 분석의 틀로 한광접의 TPC모델을 이용해 연구관점과 연구범위를 크게 기술/산업(Technology), 정책(Policy) 및 소비자(Consumer)의 세 분야로 구분했다. 이 세 부분의 균형잡힌 연계성의 필요에도 불구하고, 연구의 초점은 시장분석에 맞추었다. 비디오 분배서비스시장을 새로운 인터넷/컴퓨터기반 신규사업자들의 시장진입과, 이에 대응하는 기존 미디어사업자들의 대응전략을 기존의 유료TV사업자들(IPTV/케이블TV/위성TV사업자)과 무료(공중파)TV네트워크사업자로 구분해 분석하였다. 이러한 분석을 바탕으로 전환의 특징을 통신부분의 파워쉬프트, 방송부분의 파워쉬프트, 통신망사업자와 OTT사업자의 전략적 제휴, 타임 쉬프트, 플레이스 쉬프트 및 비즈니스모델 쉬프트 등 여섯 가지로 정리하고, 이에 대한 시사점을 논의하였다.

GIS 웹 맵 서비스 구현을 위한 스마트 폰에서의 정보은닉 기법 (Information Hiding Technique in Smart Phone for the Implementation of GIS Web-Map Service)

  • 김진호;서용수;권기룡
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.710-721
    • /
    • 2010
  • 최근, 모바일 임베디드 기술의 발달로 인하여 일반 사용자가 멀티미디어콘텐츠를 손쉽게 제작하고 이를 GIS(geographic information system) 웹 맵과 연동하여 다양하게 응용 하는 매쉬업 서비스가 웹 2.0 인터넷환경에서 활발히 서비스되고 있다. 그러나 매쉬업 서비스에서 다뤄지는 콘텐츠는 웹 맵과 연동되어 GPS 좌표 정보와 같은 사용자의 공간상 이동 경로를 포함하는 새로운 형태의 콘텐츠인데 반해 해당 콘텐츠에 대한 지적 재산 및 사생활 보호를 위한 방법이 아직까지 존재하지 않는다. 본 논문에서는 GIS 웹 맵 매쉬업 서비스에서 사용자 사생활 보호와 불법 촬영자 추적을 위하여 모바일 카메라 폰을 통해 촬영된 이미지 내에 위치 정보와 사용자 정보를 은닉하는 기법을 제안하고 이를 스마트 폰에 구현하였다. 위치정보에 대하여 좌표 값의 오차 범위를 최소화하기 위해 비트 가중치를 고려하여 색차신호에 은닉하였으며, 부정 촬영자를 추적하기 위해 장비 고유번호, 전화번호, 촬영날짜 정보를 휘도신호에 대해 주파수도메인 상에 은닉하였다. 실험 결과 위치정보 삽입에서 다양한 영상처리에 대해서 신뢰할 수 있는 오차범위를 가짐을 확인할 수 있었고, 포맷변환 시에도 위치정보를 정확히 추출하였다. 휘도신호의 정보은닉 실험 결과 공격에 의해 훼손된 영상에 대하여 유사도 패턴 매칭을 통하여 삽입한 정보를 모두 검출 하였다.

경계선 강도 허프 변환에서 직선 왜곡의 최소화 방안 (Resolving Line Distortions in Edge Strength Hough Transform)

  • 허경용;최세운;박충식;우영운
    • 한국정보통신학회논문지
    • /
    • 제12권2호
    • /
    • pp.369-377
    • /
    • 2008
  • 허프 변환(Hough transform)은 영상에서 몇 개의 파라미터로 표현되는 기하학적 요소 추출을 위해 널리 사용되고 있는 방법 중 하나이다. 하지만 허프 변환은 영상의 한 픽셀이 허프 공간(Hough space)의 한 방정식에 대응되는 일대다 특성으로 인해 잡음에 민감한 특성을 갖는다. 이러한 잡음 민감성은 검출되는 직선의 개수뿐만이 아니라 검출된 직선의 품질에도 영향을 미칠 수 있다. 즉, 실제 직선에서 벗어난 직선이 검출되거나 하나의 실제 직선에 대해 여러 개의 직선이 검출되는 등의 직선 왜곡이 발생할 수 있다. 이러한 직선 왜곡은 잡음 이외에도 허프 공간의 설정, 특히 각 해상도의 설정에 영향을 받는다. 따라서 본 논문에서는 기존의 허프 변환에서 발생하는 이러한 직선 왜곡을 분석하고, 잡음 민감성을 줄이기 위해 제안된 경계선 강도 허프 변환(Edge Strength Hough Transform, ESHT)에서 이러한 왜곡이 적게 발생함을 보인다. 하지만 허프 공간의 크기는 허프 변환 이전에 정해지므로, 정해진 허프 공간에 대해 왜곡의 발생이 최소가 되도록 하는 방법을 제시한다. 또한 경계선 강도 허프 변환의 경계선 확장과 강도 설정 과정을 통해 경계선 강도 허프 변환에서만 발생할 수 있는 직선 왜곡을 분석하고 이를 해결하는 방법을 제시한다. 실험 결과에서는 제시한 방법이 직선의 왜곡이 감소하는 것을 확인하였다.

이동형 단말기 사용자를 위한 축구경기 비디오의 시청경험 향상 방법 (Raising Visual Experience of Soccer Video for Mobile Viewers)

  • 안일구;고재승;김원준;김창익
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권3호
    • /
    • pp.165-178
    • /
    • 2007
  • 최근 멀티미디어 신호처리 및 통신 기술의 발전에 힘입어 작은 LCD 패널을 통한 스포츠경기 시청이 증가하고 있다. 하지만 멀티미디어 단말에 방송되는 대부분의 영상들은 주로 경제적인 이유로 일반 TV나 HDTV 용으로 제작되어 단순히 크기만을 변환하거나 추가적인 편집 없이 녹화되고 있는 실정이다. 이는 작은 이동형 단말 사용자들이 경기화면 내의 상황을 인식하는데 있어서 많은 불편함을 겪는다. 예를 들어, 원거리 샷 카메라 기법으로 찍힌 축구 경기 동영상의 경우, 운동장 내의 공과 선수들은 매우 작아서 알아보기가 힘든 경우가 발생한다. 또한 경기 진행 시간이나 점수를 포함하는 점수상자(scorebox)의 내용 역시 시청자가 쉽게 알아보기 힘들다. 따라서 소형 디스플레이 시청자들의 원활한 이해를 위한 지능형 디스플레이 기술이 필요하다. 이를 위한 핵심기술의 하나가 관심 영역을 자동으로 결정하고 확대하여 보여주는 일이다. 여기서 관심영역이란 시청자들이 화면 내에서 다른 부분에 비해 더욱 관심을 갖게 되는 영역을 말하며 축구경기 비디오의 경우, 주로 상단 모서리에 존재하는 점수상자나 원거리 샷에서의 공을 둘러싼 주변영역 등이 해당된다. 본 논문에서 우리는 이동형 단말기 시청자들을 위한 시청경험 향상을 위한 방법을 제안한다. 경기장면에서 관심영역의 추출을 위해 화면 내에서 시각적으로 현저한 부분의 검출에 관심을 갖는 방법 대신, 축구 경기 비디오 고유의 특징을 이용하는 도메인 한정적인 접근법을 이용한다. 제안된 시스템은 크게 두 가지 모듈 관심영역 결정, 점수상자 추출로 구성된다. 실험 결과를 통해 제안된 알고리즘이 이동형 단말기상에서 지능형 디스플레이를 위한 좋은 해결책임을 보이고자 한다.

MPEG-7 시각 정보 기술자의 인덱싱 및 결합 알고리즘 (Algorithms for Indexing and Integrating MPEG-7 Visual Descriptors)

  • 송치일;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.1-10
    • /
    • 2007
  • 본 논문에서는 MPEG-7 시각 정보 기술자인 Dominant Color와 Contour Shape 기술자에 대한 새로운 인덱싱 알고리즘을 제안한다. Dominant Color 기술자에서 사용되는 비교 연산 식은 가우스 혼합 모델에 기초하고 있기 때문에 기술자의 각 속성들을 하나의 칼라 히스토그램 형태로 변형시켜서 인덱스로 사용한다. Contour Shape 기술자는 두 단계 형태의 알고리즘을 사용하는데, 첫 번째 단계에서는 글로벌 변수인 Eccentricity와 Circularity를 사용한 대략적인 비교를 통해서 비슷하지 않은 이미지 오브젝트를 배제시키고 두 번째 단계에서 남겨진 오브젝트들과 질의 오브젝트들간의 Peak 변수를 사용한 비교 연산을 통해 인덱싱을 수행한다. 또한 본 논문은 효율적인 멀티미디어 데이타 검색을 위해서 두 가지의 MPEG-7 시각 정보 기술자 결합 알고리즘을 제안한다. 첫 번째 결합 알고리즘은 가중치를 확률로 변환해서 반영하는 것이고 두 번째는 가중치를 각 비교 연산 결과값의 중요도로 간주하는 방법이다. 실험을 통해서 결과를 분석해 보면 근사화를 통한 인덱스 생성으로 100%의 정확도를 유지 할 수는 없지만 논문에서 제안된 각 기술자의 인덱싱 알고리즘과 기술자들의 결합 알고리즘은 기본 검색 알고리즘과 비교했을 때 매우 빠른 속도 향상을 보여주었다. 본 논문에서 제안된 알고리즘은 MPEG-7을 사용하는 검색 시스템의 데이타베이스 구축에 효율적으로 사용될 수 있다.

스마트 크로스 플랫폼을 위한 스마트 가상기계의 설계 및 구현 (Design and Implementation of the Smart Virtual Machine for Smart Cross Platform)

  • 한성민;손윤식;이양선
    • 한국멀티미디어학회논문지
    • /
    • 제16권2호
    • /
    • pp.190-197
    • /
    • 2013
  • 최근 국내외 플랫폼 업체와 이동통신사들이 서로 다른 스마트 플랫폼을 채택하여 사용함으로 인해 개발자는 하나의 스마트 콘텐츠를 서비스하기 위하여 각각의 스마트 플랫폼 특성에 맞추어 콘텐츠를 개발하거나 변환 작업을 해야 한다. 하지만, 기존의 스마트 콘텐츠를 다른 스마트 플랫폼으로 이식하기 위한 변환 작업에 많은 시간과 비용이 소모되고 있다. 이런 이유로 최근에 개발 언어의 제약 없이 한번 프로그램을 작성하면 어떤 플랫폼에서도 실행할 수 있는 OSMU(One Source Multi Use)의 핵심기술인 스마트 크로스 플랫폼(Smart Cross Platform) 또는 하이브리드 플랫폼(Hybrid Platform)에 관한 관심이 높아져 폰갭(PhoneGap), HTML5를 기반으로 한 센차터치(Sencha Touch)와 같은 시스템이 소개되고 있다. 본 논문에서는 플랫폼에 의존적인 기존의 Android나 iOS, Windows Phone과 달리 스마트 기기에 탑재되어 플랫폼에 독립적으로 응용 프로그램을 다운로드하여 실행할 수 있는 스마트 크로스 플랫폼 기반의 스마트 가상기계(Smart Virtual Machine)를 개발하였다. 스마트 가상기계는 Java 언어를 사용하는 썬 마이크로시스템스사의 JVM이나 C/C++/C# 언어를 사용하는 마이크로소프트사의 .NET 프레임워크와 같은 기존 기술들과 차별적으로 C/C++와 Java 언어를 모두 지원하여 콘텐츠 개발자들로 하여금 개발 언어 선택의 제한 없이 스마트 콘텐츠를 개발 할 수 있는 환경을 제공하여 준다.

하수관거 공간DB 구축을 위한 ESRI 공간 파일의 오라클 공간DB 자동 변환 기법 (The Method for Transforming the Shape File in ESRI into the Oracle Spatial DB for the Spatial DB Construction of the Drainage System)

  • 김기욱;황현숙;김창수
    • 한국멀티미디어학회논문지
    • /
    • 제12권7호
    • /
    • pp.989-996
    • /
    • 2009
  • 최근 도시 침수 방재를 위한 전자재해지도 시스템 구축을 위해 GIS(Geographic Information System)의 활용이 증가하고 있다. 전자재해지도 시스템은 과거 침수지역 및 침수예상지역을 수문학적 모델을 이용하여 분석하고, 침수 위험지역에 대한 정보를 지도를 통해 사용자에게 보석주기 위한 시스템으로 자연재해대책을 통해 작성 지침을 공시하고, 법제화를 추진하고 있다. 전자재해지도의 침수 예측시스템을 구축하기 위해서는 SWMM(Storm Water Management System)등의 유출모형과 침수예측모델을 통한 침수위험지역을 분석하고, 이를 가시화하는 모듈이 개발되어야 하며, 이를 위해서 도로, 건물 등의 도시시설물과 맨홀, 하수관 등의 도시 관거시스템에 대한 공간 데이터와 유출모형을 통한 수문분석 결과 데이터가 공간 데이터베이스에 구축되어야 한다. 따라서 본 논문에서는 하수관거 및 도시시설물에 대한 공간 데이터를 구축하기 위해 수치지도 데이터로 가장 널리 사용되는 데이터 형식인 ESRI사의 Shape File을 이용하여 공간 데이터를 자동으로 생성하는 기법에 대한 연구를 수행한다. 이를 위해 ESRI Shape File을 오라클 공간 데이터베이스로 자동 변환하기 위한 알고리즘을 제시하고, 생성된 하수관거 공간 데이터베이스와 연계하여 침수위험지역정보를 가시화하는 프로토타입 시스템을 개발한다.

  • PDF

DCT영역에서 스크램블된 이진 위상 컴퓨터형성홀로그램을 이용한 디지털 영상 워터마킹 기술 (Digital Image Watermarking Technique using Scrambled Binary Phase Computer Generated Hologram in Discrete Cosine Transform Domain)

  • 김철수
    • 한국멀티미디어학회논문지
    • /
    • 제14권3호
    • /
    • pp.403-413
    • /
    • 2011
  • 본 논문에서는 DCT 영역에서 스크램블된 이진 위상 컴퓨터형성홀로그램을 이용한 디지털 영상 워터마킹 기술을 제안하였다. 워터마크 삽입과정은 워터마크로 사용되는 은닉영상 대신 은닉영상을 손실 없이 재생할 수 있는 이진 위상 컴퓨터홀로그램을 생성하고 이를 스크램블기법으로 암호화 하여 워터마크로 사용한다. 그리고 암호화된 워터마크에 가중치 함수를 곱하고 호스트영상의 DCT 영역에서 DC성분에 삽입한 후 IDCT를 수행한다. 워터마크의 추출은 워터마킹된 영상과 원래의 호스트영상의 DCT계수 차이를 구하고, 삽입시 적용한 가중치 함수를 나눈 후 디스크램블링 하여 복호화 한다 그리고 복호화된 워터마크를 역푸리에 변환하여 은닉영상을 재생한다 마지막으로 원래의 은닉영상과 복호화된 은닉영상과의 상관을 통해 워터마크의 존재여부를 결정한다. 제안된 워터마킹 기술은 이진 값으로 구성된 은닉영상의 홀로그램정보를 이용하고 스크램블링 암호화 기법을 활용하였음으로 기존의 어떠한 워터마킹 기술보다 압축, 잡음 및 절단과 같은 다양한 외부공격에 안전하고 견실한 특징을 가지고 있음을 컴퓨터시뮬레이션을 통해 그 장점들을 확인하였다.