• 제목/요약/키워드: 4D객체

검색결과 254건 처리시간 0.029초

인터랙티브 모바일 증강현실 콘텐츠 저작도구 설계 및 구현 (Design and Implementation of Interactive Authoring Tool for Mobile Augmented Reality Content)

  • 전지영;전지윤;홍민;염효섭;최영환;최유주
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.25-37
    • /
    • 2015
  • 본 연구에서는 모바일 환경에서 사용자가 원하는 마커 위에 2D 이미지, 3D 모델, 동영상과 같은 가상객체를 증강시키고 인터랙션 이벤트를 연결시켜 주는 모바일 증강현실 콘텐츠 빌더(MARB ; Moblie AR contents Builder, 이하 MARB)를 개발하였다. MARB은 사용자가 원하는 마커 위에 다양한 가상객체를 증강시켜주며, 마커에 따른 여러 인터랙션 이벤트를 선택적으로 제공한다. 또한 모바일 환경에서 간편하게 구동하기 위해 모바일 콘텐츠 형태로 개발되었으며, 모바일기기에 설치하면 간단한 GUI(Graphical User Interface)를 이용한 저작이 가능하다. MARB은 기존 개발자뿐만 아니라 일반 사용자가 모바일 콘텐츠를 자유롭게 저작할 수 있도록 하여 다양한 모바일 증강현실 콘텐츠를 원하는 사용자들에 의해 다방면적으로 활용될 것으로 기대되며, 모바일 증강현실 시장 확장에 걸림돌이 되고 있는 모바일 증강현실 콘텐츠 개발의 어려움을 극복하는데 기여할 것으로 예상된다.

MPEG-H 3D 오디오 표준 복호화기 구조 및 연산량 분석 (MPEG-H 3D Audio Decoder Structure and Complexity Analysis)

  • 문현기;박영철;이용주;황영수
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.432-443
    • /
    • 2017
  • MPEG-H 3D 오디오 표준은 UHDTV 등의 초고해상도 방송서비스에 대응하는 실감음향 서비스의 제공을 목표로 한다. 이를 위해 본 표준은 다채널 신호, 객체 신호, 장면 기반 신호의 부호화/복호화 기술과 다양한 재생 환경에서 3차원 오디오 제공을 위한 렌더링 기술, 후처리 기술 등 방대한 기술을 통합하였다. 본 표준의 참조 소프트웨어 복호화기는 여러 모듈들이 결합된 구조로 다양한 모드에서 동작이 가능하며, 각 모듈들이 독립된 실행파일로 순차적으로 실행되어 실시간 처리가 불가능하다. 본 논문에서는 MPEG-H 3D 오디오의 코어 복호화기, 포맷 변환기, 객체 렌더러, 바이노럴 렌더러의 각 함수를 동적 라이브러리화 및 통합하여 프레임 기반 복호화가 가능하도록 하였다. 또한 MPEG-H 3D 오디오의 각 모드별 연산량을 측정하여 다양한 하드웨어 플랫폼에서 적합한 모드를 선택하기 위한 참고 자료를 제공한다. 연산량 분석 결과, 한국 방송 표준에 포함된 저연산량 프로파일은 채널 신호로 렌더링을 할 경우 QMF 합성 연산의 2.8배에서 12.4배의 연산량을 가지며, 바이노럴 렌더링을 할 경우 QMF 합성 연산의 4.1배에서 15.3배의 연산량을 가진다.

가상 세계 매핑기법을 이용한 비디오 GIS (Video GIS using Virtual World Mapping Technique)

  • 김성수;이성호;김경옥;이종훈
    • 대한공간정보학회지
    • /
    • 제10권4호
    • /
    • pp.31-39
    • /
    • 2002
  • 본 논문에서는 3차원 데이터베이스와 4S-Van에서 획득된 GPS 관련 데이터를 이용하여 사용자에게 비디오내의 지리 객체들의 정보를 제공해 줄 수 있는 미디어 GIS 시스템 구조를 제안한다. 비디오내의 지리객체에 대한 지리정보 서비스를 위해 실세계 비디오와 3차원 그래픽 세계를 매핑할 수 있는 가상세계 매핑(VWM)이라는 새로운 상호 운용적인 지리데이터 서비스 개념을 소개한다. 제안한 기법은 임의의 비디오 프레임에 대한 3차원 가상공간을 재구성하여 지리정보 및 속성정보를 쉽게 검색해 낼 수 있다. 또한, 2차원, 3차원, 미디어 데이터간의 상호연계 및 운용기능을 제공함으로써 기존의 지리정보 시스템 분야의 새로운 패러다임을 제시한다. 제안하는 시스템은 별도의 이미지 처리과정 없이도 비디오 스트림을 통해 지리정보를 제공할 수 있다는 장점이 있다. 제안하는 기법으로 비디오 영상을 스트리밍하면서 클라이언트가 지리 정보서비스를 받을 수 있는 GeoVideo 서버 및 웹을 통해 서비스를 제공하는 GeoVideo 클라이언트 시스템을 구현하였다.

  • PDF

딥러닝 기반 달 표면 모사 환경 실시간 객체 인식 및 매칭 시스템 개발 (Development of System for Real-Time Object Recognition and Matching using Deep Learning at Simulated Lunar Surface Environment)

  • 나종호;공준호;이수득;신휴성
    • 터널과지하공간
    • /
    • 제33권4호
    • /
    • pp.281-298
    • /
    • 2023
  • 달 현지 탐사를 위해 무인 이동체에 대한 연구가 지속적으로 이루어져 있으며 달 지상 관심 지역의 정확한 위치 및 맵핑을 위한 실시간 정보화 작업이 요구되고 있다. 딥러닝 영상 처리 분석 기술을 실제 로버에 적용하기 위해 소프트웨어의 통합과 최적화에 대한 연구가 필요하며 본 연구에서는 가상의 달 기지 건설현장의 영상을 실시간 분석하여 핵심 객체의 공간 정보를 자동으로 수치화하는 방안에 대한 기초 연구가 진행되었다. 본 연구를 통해 이미 구축된 영역 분할 기반 객체 인식 알고리즘을 경계 상자 기반 객체 인식알고리즘으로 변경하여 객체 인식 정확도 및 추론 속도를 개선하는 작업이 이루어졌으며, 대용량 데이터 기반 객체 매칭 학습을 위해 Batch Hard Triplet Mining 기법을 도입하고, 학습 및 추론에 대한 최적화 연구가 수행되었다. 또한 개선된 객체 인식 및 동일 객체 매칭 소프트웨어를 통합하고, 입력 이미지 내 동일 객체 자동 매칭을 시각화하는 소프트웨어를 개발하였으며, 위성 모사 촬영 영상 내 객체를 학습 데이터로, 이동체 촬영 영상 내 객체를 추론 데이터로 사용하여 동일 객체 매칭의 학습 및 추론이 이루어졌다. 본 연구의 결과는 이동체의 연속 촬영 영상을 기반 3차원 공간 정보를 구현 및 관심 공간 내 객체 위치 설정에 활용할 수 있을 것으로 사료되며, 향후 달 기지 건설 현장에서의 영상 기반 시공 모니터링 및 제어를 위한 자동 현장 및 주요 대상물 공간 정보 구축 시스템과의 연계에 기여할 것으로 기대된다.

2차원 영상으로부터 3차원 영상을 모델링하는 기술 동향

  • 조형래;박구만
    • 방송과미디어
    • /
    • 제26권4호
    • /
    • pp.23-39
    • /
    • 2021
  • 2차원 영상을 3차원 모델 영상으로 변환하는 방식이 다양하게 발전해오고 있다. 딥러닝의 발전 중 특히 GAN의 다양한 연구는 2차원 영상의 생성뿐만 아니라 다양한 3차원 영상의 생성에도 진전을 보였다. 본 고에서는 2차원 영상을 3차원 영상으로 변환하는 연구의 필요성을 바탕으로 관련 연구의 내용과 동향을 분석하였다. 주요 내용으로는 딥러닝 기반의 3차원 객체인식, 2D로부터 3D 변환을 위한 신경망에 대한 연구, 생성적 기법을 적용한 연구, 3D 모델링 도구 등이 포함된다. 관련 연구의 전반적인 흐름을 고려했을 때 향후 3D 모델링의 정교한 표현력 향상, 고속의 고해상도 렌더링, 편리한 온라인 접근성 등을 예상하게 된다. 관련 산업 종사자들에게는 생성시간의 단축을 가져올 수 있고 일반인은 전문적인 3D 기술이 없어도 우수한 3D 모델을 생성하고 활용할 수 있을 것으로 기대한다.

능동모양모델 알고리듬을 위한 삼차원 모델생성 기법 (Three-dimensional Model Generation for Active Shape Model Algorithm)

  • 임성재;정용연;호요성
    • 대한전자공학회논문지SP
    • /
    • 제43권6호
    • /
    • pp.28-35
    • /
    • 2006
  • 통계적 데이터를 이용하여 모양 변이가 가능한 능동모양모델(Active Shape Model, ASM)은 이차원 영상의 분할 및 인식에 성공적으로 사용되고 있다. 삼차원 모델 기반 기법은 객체 경계의 인식 및 묘사(delineating)를 위한 더욱 현실적인 모양 억제력(constraint)을 갖는다는 점에서 이차원 모델 기반 기법에 비해 좋은 결과를 가져온다. 그러나 삼차원 모델 기반 기법을 위해서는 분할된 객체들의 집합인 훈련(training) 데이터로부터 삼차원 모양모델을 생성하는 것이 가장 중요하고 필수적인 단계이며, 현재까지도 커다란 도전 과제로 남아있다. 삼차원 모양모델 생성에서 가장 중요한 단계는 포인트 분산모델(PDM)을 생성하는 것이다. PDM 생성을 위해서는 상응하는 특징점(landmark)을 모든 훈련 데이터의 대응하는 위치에서 선택해야 한다. 그러나 현재까지 많이 사용되는 특징점의 수동 선택 기법은 시간이 많이 소비되며, 많은 오류를 발생한다. 본 논문에서는 삼차원 통계적 모양모델의 생성을 위한 새로운 자동 기법을 제안한다. 주어진 삼차원 훈련 모양 데이터에서, 삼차원 모델은 다음 방법에 의해 생성된다. 1) 훈련 모양 데이터의 거리 변환(distance transform)으로부터 평균(mean) 모양 생성, 2) 평균 모양에서 자동적으로 특징점을 선택하기 위한 사면체(tetrahedron) 기법 사용, 3) 거리 표식(distance labeling) 기법을 통한 각 훈련 모양에서 특징점의 전파(propagating). 본 논문에서는 50명의 복부 CT 영상으로부터 간(liver)을 위한 삼차원 모델을 생성하고, 평가를 위i괘 정확성과 밀집도(compactness)를 조사한다. 기존의 삼차원 모델 생성 기법들은 객체의 모양과 기하학적 및 위상학적으로 심각한 제한을 갖지만, 본 논문에서 제안한 기법은 위와 같은 제한 없이 어느 데이터 집합에도 적용할 수 있다.3mW이며, 시제품 ADC의 칩 면적은 $0.47mm^2$ 이다. 각각 56dB, 65dB이고, 전력 소모는 1.2V 전원 전압에서 각각 4.8mW, 2.4mW이며 제작된 ADC의 칩 면적은 $0.8mm^2$이다.quential scan) 알고리즘과 성능을 비교한다. 실험결과, 제안된 알고리즘은 순차 검색에 비하여 최대 13.2배까지 성능이 향상되었으며, 인덱스의 개수 k가 증가함에 따라 검색 성능도 함께 증가하였다.라서 보다 안전성과 효율성이 뛰어난 2차 대사물질을 찾아내는 연구와 아울러 방제기능이 있는 물질의 생합성경로를 구명하고 대사공학적으로 이용하므로 병해충에 저항성이 있고 잡초 방제효과를 갖는 형질전환 식물을 육성하는 연구가 지속적으로 이루어져야 할 것이다.{\sim}83.8%$ 범위(範圍)를 차지 하였다. 5) 칼슘 섭취량(攝取量)은 권장량 500 mg 에 비(比)하여 양구지역(楊口地域) 아동(兒童)이 $282.4{\sim}355.0mg$이었고 여주지역(麗州地域) 아동(兒童)이 $284.6{\sim}429.0mg$ 이었다. 6) 철(鐵) 섭취량(攝取量)은 권장량 10mg에 비(比)하여 양구지역(楊口地域) 아동(兒童)이 $6.0{\sim}12.1mg$ 범위(範圍)이었고 여주지역(麗州地域) 아동(兒童)이 $6.4{\sim}16.7mg$ 범위(範圍)로 상당수의 아동(兒童)이 권장량에 미달(未達) 되었다. 7) 비터민 A 섭취량(攝取量)은 양구지역(楊口地域)이 $703.4{\sim}1495.6\;IU$ 범위(範圍)이었고 여주지역(麗州地域) 아동(兒童)이 $750.5{\sim}1521.2\;IU$ 범위(範圍)로서 ${\beta}-carotene$으로서의 권장량 5100 I.U,에 비(比)하여 매우 부족되었다

실감방송을 위한 3차원 오디오 기술 (Three Dimensional Audio Technologies for Realistic Broadcasting)

  • 장대영;서정일;이태진;박기윤;강경옥
    • 전자통신동향분석
    • /
    • 제19권4호통권88호
    • /
    • pp.53-62
    • /
    • 2004
  • 차세대 방송 서비스는 입체감있는 3차원 AV 콘텐츠와 자연스럽게 사용자와 인터랙션하는 대화형 콘텐츠를 기반으로 하는 실감방송으로 변화되어 갈 것으로 예상된다. 이러한 실감방송 서비스에서는 현장감을 효율적으로 나타낼 수 있는 음상 정위 및 음장 재현 등 3차원 오디오 기술과 사용자 인터랙션을 위한 객체기반 오디오 처리 기술들이 필요하다. 본 고에서는 이러한 현장감과 사용자 인터랙션을 통하여 가상현실에 근접한 서비스를 제공하기 위한 대표적인 3차원 오디오 기술의 개발 동향을 살펴본다. 우선 3차원 오디오 기술의 기본 개념 및 개요를 기술하며, 이러한 3차원 오디오 기술에 기반한 대화형 3차원 오디오 기술 개발에 대한 최근 동향을 살펴보고, 국내에서 개발하고 있는 객체기반 3차원 오디오 기술에 대하여 간략히 설명한다.

MPEG-4 IPMP 저작 도구 개발 (Development of MPEG-4 IPMP Authoring Tool)

  • 김광용;홍진우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.75-78
    • /
    • 2003
  • MPEG-4 표준은 저작자가 정지영상, 텍스트, 2D/3D 그래픽스, 오디오, 심지어 임의형의 비디오 등과 같이 다양한 형태의 객체들을 개별적으로 구성하고 이들을 시/공간자적으로 다루기 용이하게 해 준다. 이와 같은 객체 기반 코딩 특성에 의해서 대화형 방송 콘텐츠를 제작하는데 가장 유용한 방식으로 고려할 수 있다. 피러나, 콘텐츠의 제작, 전송, 소비 관전에서 고려해 달 때, 콘텐츠 제작자 또는 저작권자의 보호 및 관리가 필요하게 되었다. 이에 따라 최근에는 OPIMA (Open Platform Initiative for Multimedia Access), SDMI (Secure Digital Music Initiative) and MPEG(Moving Picture Expert Group) OPIMATfMr(Intellectual Property Management & Protection)와 같은 국제 표준 단체들이 콘텐츠 보호 및 관리에 대한 관심을 가지게 되었다. 특히, MPEG의 경우에 MPEG-4 IPMP를 표준화하여 디지털 콘텐츠와 저작권에 대한 보호를 체계적이고 효과적으로 다루는 연구를 가장 활발히 해오고 있다. 이 논문에서 우리는 MPEG-4 콘텐츠 저작자가 MPEG-4 규격에 맞게 보호화 된 객체 기반 방송용 콘텐츠를 쉽고 편리하게 제작학 수 있도록 하기 위한 MPEG씨 콘텐츠 및 저자권 보호를 위한 MPEG-4 IPMP 저작 도구를 제안하고자 한다. 제안한 MPEG-4 콘텐츠 및 저작권 보호 저작 도구는 저작자에게 친근한 사용자 인터페이스를 제공하여 편집 및 수정이 용이한 텍스트 포맷인 IPMP회된 XMT(extensible Mpeg-4 Textual format) 파일을 생성한다. 또한, 콘텐츠 전송 및 저장의 효율성을 위해 이진 포멧인 IPMP화된 MP4 파일을 생성할 수 있다.으로써, 에러 이미지가 가지고 있는 엔트로피에 좀 근접하게 코딩을 할 수 있게 되었다. 이 방법은 실제로 Arithmetic Coder를 이용하는 다른 압축 방법에 그리고 적용할 수 있다. 실험 결과 압축효율은 JPEG-LS보다 약 $5\%$의 압축 성능 개선이 있었으며, CALIC과는 대등한 압축률을 보이며, 부호화/복호화 속도는 CALIC보다 우수한 것으로 나타났다.우 $23.87\%$($18.00\~30.91\%$), 갑폭 $23.99\%$($17.82\~30.48\%$), 체중 $91.51\%$($58.86\~129.14\%$)이였으며 성장율은 사육 온도구간별 차는 없었다.20 km 까지의 지점들(지점 2에서 지점 6)에서 매우 높은 값을 보이며 이는 조석작용으로 해수와 담수가 강제혼합되면서 표층퇴적물이 재부유하기 때문이라고 판단된다. 영양염류는 월별로 다소의 차이는 있으나, 대체적으로 지점 1과 2에서 가장 낮고, 상류로 갈수록 점차 증가하며 지점 7 상류역이 하류역에 비해 높은 농도이다. 월별로는 7월에 규산염, 용존무기태질소 및 암모니아의 농도가 가장 높은 반면에 용존산소포화도는 가장 낮다. 그러나 지점 14 상류역에서는 5월에 측정한 용존무기태질소, 암모니아, 인산염 및 COD 값이 7월보다 다소 높거나 비슷하다. 한편 영양염류와 COD값은 대체적으로 8월에 가장 낮으나 용존산소포화도는 가장 높다.출조건은 $100^{\circ}C$에서 1분간의 고온단시간 추출이 적합하였다. 증가를 나타내었는데, 저장기간에 따른 물성의 변화는 숭어에 비하여 붕장어가 적었다.양식산은 aspartic acid 및 proline이 많았다. 또한 잉어는 천연산이

  • PDF

Generalization과 Filtering을 이용한 무선 지도 데이터베이스의 동적 생성 기법 (Dynamic Generation Methods of the Wireless Map Database using Generalization and Filtering)

  • 김미란;최진오
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.367-376
    • /
    • 2001
  • 이동 매제를 통한 진자지도 서비스는 전송 정보의 용량이 크고 출력 장치의 자원을 많이 요구하기 때문에 기존의 지도 데이터베이스를 그대로 사용하여 서비스할 수 없는 문제점이 있다. 또한 무선 서비스 전용 지도 데이터베이스를 별도로 구축하는 것은 막대한 중복 비용이 발생하므로 받아들이기 어렵다. 본 논문에서는 기존의 지도 데이타베이스로부터 무선 서비스에 적합한 지도를 동적으로 생성하는 새로운 기법을 제시한다. 이 기법은 기존 지도의 데이타 크기를 줄이기 위한 generalization과 생성된 지도의 데이타 크기가 임계값을 넘지 않도록 제어하는 filtering을 수행한다. Generalization은 레이어를 통합하는 단계, 세부 객체를 간소화하는 단계, 그리고 사용자 인터페이스를 처리하는 단계로 나누어 처리된다. Filtering은 약도에 포함된 객체를 카운터하는 모듈과 검색 객체와 거리에 따른 중요도로 선택하는 모듈로 데이터 크기를 대역폭 임계값 이내로 처리한다.

  • PDF

딥 러닝을 이용한 실감형 콘텐츠 특징점 추출 및 식별 방법 (A Feature Point Extraction and Identification Technique for Immersive Contents Using Deep Learning)

  • 박병찬;장세영;유인재;이재청;김석윤;김영모
    • 전기전자학회논문지
    • /
    • 제24권2호
    • /
    • pp.529-535
    • /
    • 2020
  • 4차 산업의 주요 기술로 실감형 360도 영상 콘텐츠가 주목받고 있다. 전 세계 실감형 360도 영상 콘텐츠의 시장 규모는 2018년 67억 달러에서 2020년 약 700억 달러까지 증가될 것이라고 전망하고 있다. 하지만 대부분 실감형 360도 영상 콘텐츠가 웹하드, 토렌트 등의 불법 유통망을 통해 유통되고 있어 불법복제로 인한 피해가 증가하고 있다. 이러한 불법 유통을 막기 위하여 기존 2D 영상은 불법저작물 필터링 기술을 사용하고 있다. 그러나 초고화질을 지원하고 두 대 이상의 카메라를 통해 촬영된 영상을 하나의 영상에 담는 실감형 360도 영상 콘텐츠의 특징 때문에 왜곡 영역이 존재하여 기존 2D 영상에 적용된 기술을 그대로 사용하기엔 다소 무리가 있다. 또한, 초고화질에 따른 특징점 데이터량 증가와 이에 따른 처리 속도 문제와 같은 기술적 한계가 존재한다. 본 논문에서는 이러한 문제를 해결하기 위하여 왜곡이 심한 영역을 제외한 객체 식별 영역을 선정하고, 식별 영역에서 딥 러닝 기술을 이용하여 객체를 인식하고 인식된 객체의 정보를 이용하여 특징 벡터를 추출하는 특징점 추출 및 식별 방법을 제안한다. 제안한 방법은 기존에 제안 되었던 스티칭 영역을 이용한 실감형 콘텐츠 특징점 추출방법과 비교하여 성능의 우수성을 보였다.