• 제목/요약/키워드: Visual Information processing

검색결과 1,075건 처리시간 0.027초

ATSC-M/H 기반의 융합형 3DTV를 위한 양안시차 고속 추정 알고리즘 (Fast Algorithm for Disparity Estimation in ATSC-M/H based Hybrid 3DTV)

  • 이동희;김성훈;이주영;강동욱;정경훈
    • 방송공학회논문지
    • /
    • 제19권4호
    • /
    • pp.521-532
    • /
    • 2014
  • 3D 방송시스템에 대한 다양한 연구 가운데 ATSC-M/H 기반의 융합형 3DTV 방식은 HD 화질의 좌영상과 모바일 화질의 우영상을 결합하는 서비스 호환 3DTV 시스템으로서 이 방식에서는 좌우 영상 사이에 상대적인 화질 차이가 존재하며 이를 해결하기 위해 조건부 대체 알고리즘(Conditional Replenishment Algorithm)이 제안되었다. 조건부 대체 알고리즘에서는 좌우영상 사이의 양안시차 벡터를 추정하고 양안시차 보상된 HD 좌영상과 단순 확장된 모바일 우영상을 선택적으로 사용함으로써 우영상의 화질을 개선한다. 그러나 이 알고리즘은 여러 계층의 양안시차를 추정하는 과정에서 매우 많은 계산이 필요하기 때문에 이를 실제적으로 구현하기 위해서는 고속 알고리즘의 개발이 요구된다. 본 논문에서는 양안시차 벡터의 특성을 고려하여 전역 탐색 대신에 SDSP(Small Diamond Search Pattern) 탐색 방법을 사용하고 탐색의 초기위치를 예측하는 방법을 제안하며 특정 조건 하에서 양안시차 벡터 추정을 생략하는 조기종료 모드를 함께 적용함으로써 복원 영상의 화질을 유지하면서도 조건부 대체 알고리즘의 속도를 향상시키는 기법을 제안하고 모의실험을 통해 이의 성능을 검증하였다.

Depth+RGB 카메라 기반의 수직 리그를 이용한 고화질 디지털 홀로그래픽 비디오 생성 시스템의 구 (System Implementation for Generating High Quality Digital Holographic Video using Vertical Rig based on Depth+RGB Camera)

  • 구자명;이윤혁;서영호;김동욱
    • 방송공학회논문지
    • /
    • 제17권6호
    • /
    • pp.964-975
    • /
    • 2012
  • 본 논문에서는 최근 관심이 고조되고 있는 3차원 입체 비디오 처리 기술의 최종 목표인 디지털 홀로그램을 생성하는데 필요한 객체의 좌표와 색상정보가 들어있는 RGB 영상와 깊이 영상을 획득하여 디지털 홀로그램으로 변환하는 시스템을 제안한다. 먼저, 가시광선과 적외선의 파장을 이용하여 파장에 따라 투과율이 달라지는 콜드 미러를 사용하여 같은 시점을 갖는 RGB와 깊이 영상을 얻는다. 카메라 시스템이 갖는 다양한 왜곡을 없애기 위한 보정과정을 거친 후에 해상도가 서로 틀린 RGB 영상과 깊이 영상의 해상도를 조절한다. 그리고 깊이 정보를 이용하여 디지털 홀로그램으로 구현할 객체를 추출한다. 마지막으로 컴퓨터 생성 홀로그램 (computer-generated hologram, CGH) 알고리즘을 이용하여 추출한 객체를 디지털 홀로그램으로 변환한다. 제안한 시스템의 각 알고리즘은 C/C++/CUDA로 구현하였고, LabView 환경에서 이들을 통합하였다. 고속화를 위하여 홀로그램을 생성하는 것은 범용 그래픽처리유닛(general-purpose computing on graphics processing unit, GPGPU)를 이용하였다. 제안한 시스템을 이용하여 생성한 디지털 홀로그램은 기존의 것보다 더욱 우수한 화질을 가진다는 것을 확인하였다.

인공지능기술의 IoT 통합보안관제를 위한 데이터모델링 (Data Modeling for Cyber Security of IoT in Artificial Intelligence Technology)

  • 오영택;조인준
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.57-65
    • /
    • 2021
  • 산업 전 분야에 4차 산업혁명의 신기술인 IoT(Internet of Things), AI(Artificial Intelligence), Bigdata 등이 융합되어 새로운 가치를 창출하는 초연결 지능정보사회가 도래되고 있다. 모든 것이 네트워크에 연결되어 데이터가 폭발적으로 증가하고, 인공지능이 스스로 학습하여 지적 판단 기능까지도 가능하다. 특히 사물인터넷은 언제 어디서나 어느 것과도 연결될 수 있는 새로운 통신환경을 제공함에 따라 모든 것들이 연결되는 초 연결을 가능케 하고 있다. 인공지능 기술은 인간이 가진 지각, 학습, 추론, 자연어처리 등의 능력을 컴퓨터가 실행할 수 있도록 구현되고 있다. 인공지능은 기계학습, 딥러닝(Deep leearning), 자연어처리, 음성인식, 시각인식 등 첨단기술을 개발하는 방향으로 발전되고 있으며, 안전, 의료, 국방, 금융, 복지 등의 다양한 응용 분야에 특화된 소프트웨어와 머신러닝(Machine learning), 클라우드(Cloud) 기술을 포함하고 있다. 이를 통해 인간의 편의와 새로운 가치를 제공하기 위해 산업 전반의 다양한 분야에 활용된다. 하지만, 이와는 반대로 지능적이고 정교해진 사이버 위협들이 증가하고 신기술의 기술적 안전성 확보와 같은 잠재적 역기능들을 동반함에 따라 이에 대한 대응이 필요한 시점이다. 본 논문에서는 이러한 역기능을 해결하기 위한 하나의 방안으로 인공지능기술을 활용하여 IoT 통합보안관제 가능하도록 새로운 데이터모델링(Data modelling) 방안을 제안하였다.

깊이 이미지를 이용한 타이어 표면 결함 검출 방법에 관한 연구 (A Study on Tire Surface Defect Detection Method Using Depth Image)

  • 김현석;고동범;이원곡;배유석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권5호
    • /
    • pp.211-220
    • /
    • 2022
  • 최근 4차 산업혁명으로 촉발된 스마트공장에 관한 연구가 활발히 진행되고 있다. 이에 따라 제조업에서는 강건한 성능의 딥러닝 기술을 바탕으로 생산성 향상과 품질 향상을 위해 다양한 연구를 진행 중이다. 본 논문은 타이어 제조공정의 육안검사 단계에서 타이어 표면 결함을 검출하는 방법에 관한 연구로서 3D 카메라를 통해 취득한 깊이 이미지를 이용한 타이어 표면 결함 검출 방법을 소개한다. 본 연구에서 다루는 타이어 표면 깊이 이미지는 타이어 표면의 얕은 깊이로 인해 발생되는 낮은 깊이 대비와 데이터 취득 환경으로 인해 기준 깊이 값의 차이가 발생하는 문제가 있다. 그리고 제조업의 특성상 검출 성능과 함께 실시간으로 처리될 수 있는 성능을 지닌 알고리즘이 요구된다. 따라서, 본 논문에서는 타이어 표면 결함 검출 알고리즘이 복잡한 알고리즘 파이프라인으로 구성되지 않도록 상대적으로 단순한 방법들을 통해 깊이 이미지를 정규화하는 방법을 연구하였으며 검출 성능과 속도를 모두 만족할 수 있는 딥러닝 방법인 YOLO V3를 이용하여 일반적인 정규화 방법과 본 논문에서 제안하는 정규화 방법의 비교 실험을 진행하였다. 실험의 결과로 본 논문에서 제안한 정규화 방법으로 mAP 0.5 기준 약 7% 성능이 향상된 것을 확인하였으며 본 논문에서 제시한 방법이 효과적임을 보였다.

D4AR - A 4-DIMENSIONAL AUGMENTED REALITY - MODEL FOR AUTOMATION AND VISUALIZATION OF CONSTRUCTION PROGRESS MONITORING

  • Mani Golparvar-Fard;Feniosky Pena-Mora
    • 국제학술발표논문집
    • /
    • The 3th International Conference on Construction Engineering and Project Management
    • /
    • pp.30-31
    • /
    • 2009
  • Early detection of schedule delay in field construction activities is vital to project management. It provides the opportunity to initiate remedial actions and increases the chance of controlling such overruns or minimizing their impacts. This entails project managers to design, implement, and maintain a systematic approach for progress monitoring to promptly identify, process and communicate discrepancies between actual and as-planned performances as early as possible. Despite importance, systematic implementation of progress monitoring is challenging: (1) Current progress monitoring is time-consuming as it needs extensive as-planned and as-built data collection; (2) The excessive amount of work required to be performed may cause human-errors and reduce the quality of manually collected data and since only an approximate visual inspection is usually performed, makes the collected data subjective; (3) Existing methods of progress monitoring are also non-systematic and may also create a time-lag between the time progress is reported and the time progress is actually accomplished; (4) Progress reports are visually complex, and do not reflect spatial aspects of construction; and (5) Current reporting methods increase the time required to describe and explain progress in coordination meetings and in turn could delay the decision making process. In summary, with current methods, it may be not be easy to understand the progress situation clearly and quickly. To overcome such inefficiencies, this research focuses on exploring application of unsorted daily progress photograph logs - available on any construction site - as well as IFC-based 4D models for progress monitoring. Our approach is based on computing, from the images themselves, the photographer's locations and orientations, along with a sparse 3D geometric representation of the as-built scene using daily progress photographs and superimposition of the reconstructed scene over the as-planned 4D model. Within such an environment, progress photographs are registered in the virtual as-planned environment, allowing a large unstructured collection of daily construction images to be interactively explored. In addition, sparse reconstructed scenes superimposed over 4D models allow site images to be geo-registered with the as-planned components and consequently, a location-based image processing technique to be implemented and progress data to be extracted automatically. The result of progress comparison study between as-planned and as-built performances can subsequently be visualized in the D4AR - 4D Augmented Reality - environment using a traffic light metaphor. In such an environment, project participants would be able to: 1) use the 4D as-planned model as a baseline for progress monitoring, compare it to daily construction photographs and study workspace logistics; 2) interactively and remotely explore registered construction photographs in a 3D environment; 3) analyze registered images and quantify as-built progress; 4) measure discrepancies between as-planned and as-built performances; and 5) visually represent progress discrepancies through superimposition of 4D as-planned models over progress photographs, make control decisions and effectively communicate those with project participants. We present our preliminary results on two ongoing construction projects and discuss implementation, perceived benefits and future potential enhancement of this new technology in construction, in all fronts of automatic data collection, processing and communication.

  • PDF

WSOLA를 이용한 동영상 미세배속 재생 서비스에 대한 콘텐츠별 배속 선호도 분석 연구 (A Study about the Users's Preferred Playing Speeds on Categorized Video Content using WSOLA method)

  • 김이길
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권2호
    • /
    • pp.291-298
    • /
    • 2015
  • 빠르게 발전하는 IT환경 속에서 이제 동영상 콘텐츠는 TV를 통한 일방 시청이 아니라 언제 어디서든 다양한 단말에서 볼 수 있는 VOD (Video on Demand) 형태로 발전하고 있다. 이러한 동영상 시청형태의 변화는 디지털이란 특성 때문에 동영상의 재생 속도 또한 다양하게 조절할 수 있다는 부가적인 장점을 사용자에게 제공 한다. 지루하고 따분한 동영상 콘텐츠는 빠르게 돌려보고 흥미 있는 장면은 느리게 천천히 볼 수 있는 동영상 미세배속 재생 기능은 오늘날 다양한 동영상 플레이어에서 제공되고 있다. 동영상 미세배속 재생 시 동영상 콘텐츠 내용의 정확한 이해를 위해서는 시각정보 못지않게 음성정보 청취가 중요한데 정상속도 보다 빠르거나 느린 재생 시 발생하는 음성의 왜곡을 줄이기 위한 음성미세배속 기술들이 음성처리 분야에서 꾸준히 발전되어 왔다. 본 논문에서는 이중 WSOLA와 같은 우수한 음성미세배속 알고리즘에 대해 알아보고 동영상 시청 시 이러한 기능 제공이 실제 얼마나 사용자 니즈(needs)에 부합하는 지 분석해보고자 한다. 특히, 동영상 콘텐츠를 사용자의 콘텐츠 소비 목적에 따라 종류별로 구분하여 재생 배속의 선호도를 조사하고 그 결과를 분석해 봄으로써 동영상 미세배속 기능 제공시 콘텐츠별 소비 목적에 맞게 재생 배속을 제공하는 것이 필요하다는 것을 제안하고자 한다.

내용 기반 영상 검색을 위한 에지 기반의 공간 기술자 (Edge-based spatial descriptor for content-based Image retrieval)

  • 김낙우;김태용;최종수
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.1-10
    • /
    • 2005
  • 오늘날 급격한 멀티미디어 정보의 증가에 따라 영상에서의 시각적 특성을 이용하여 멀티미디어 데이터를 검색하는 내용 기반 영상 검색 기법에 대한 관심이 크게 늘어나고 있다. 본 논문에서는 효과적인 영상 검색을 위한 새로운 접근으로서 edge correlogram과 color coherence vector를 이용한 에지 기반의 공간 기술자를 제안한다. 우선 color vector angle기법을 이용하여 주어진 영상을 고주파 성분과 저주파 성분의 영상으로 나눈다. 저주파 성분의 영상에서는 color coherence vector를 이용하여 평탄 화소의 공간적인 색상 분포를 추출함으로써 이를 평탄 영역에서의 특징 정보로서 활용한다. 반면, 고주파 성분의 영상에서는 edge correlogram으로부터 에지 화소들 간의 분포를 추출하여 이를 에지 영역에서의 특징 정보로 이용한다. 제안된 방법은 색상 간의 지엽적인 특성과 전체적인 특성을 모두 가지고 있기 때문에, 영상 간의 비교에 있어서 영상의 모양과 크기의 급격한 변화로 인한 오검출 등에 매우 강건하다. 또한, 영상에서의 구조적인 특징을 이용함으로써 복잡한 영상에 대해서도 간단하고 유연한 특징을 제공한다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 알고리즘이 최근의 여러 히스토그램 정밀화 기법에 비하여 더 효과적임을 보여준다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용하였다.

웨어러블 가속도 기기 측정에 의한 수면/비수면 동적 분류 (Sleep/Wake Dynamic Classifier based on Wearable Accelerometer Device Measurement)

  • 박재현;김대훈;구본화;고한석
    • 전자공학회논문지
    • /
    • 제52권6호
    • /
    • pp.126-134
    • /
    • 2015
  • 최근 현대인들의 스트레스 증가로 인하여 수면 장애에 대한 문제가 부각되면서 수면의 질에 대한 관심이 급증하고 있다. 이러한 수면 장애는 정밀한 진단을 위해서 긴 시간과 높은 비용을 요구하는 수면다원검사를 수행하여야 한다. 따라서 실생활에서 낮은 비용으로 손쉽게 수면의 효율을 측정하는 가속도 센서가 내장된 손목 착용형 장비가 활용 가능한 방안으로 부각되고 있다. 하지만 가속도 데이터를 이용한 기존의 수면/비수면 구간 분류 방식은 개별 시점의 가속도 값만을 이용해 수면/비수면 상태를 구분하기 때문에 수면 중 간헐적 움직임과 비수면 중 미세한 움직임이 발생한 구간에서 오분류율이 높은 약점이 있다. 본 논문에서는 분류과정에서 인근 시점간의 SVM 분류기 스코어의 유사성을 고려하는 동적 분류기를 이용함으로써 앞에서 언급한 문제에 효과적으로 대처할 수 있음을 보인다. 제안하는 알고리즘의 실생활 적용가능 여부 판단을 위하여 50개 데이터 세트에 대해 구간 구분을 수행하여 정확도 88.9%, 민감도 88.9%, 특이도 88.5%의 결과를 얻었다.

발달성 읽기 장애 진단을 위한 단어/비단어 읽기 검사와 글자기호감별검사의 표준화 연구 (STANDARDIZATION OF WORD/NONWORD READING TEST AND LETTER-SYMBOL DISCRIMINATION TASK FOR THE DIAGNOSIS OF DEVELOPMENTAL READING DISABILITY)

  • 조수철;이정범;정동선;신성웅
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제14권1호
    • /
    • pp.81-94
    • /
    • 2003
  • 목 적:발달성 읽기 장애는 정상적인 읽기 능력의 현저한 발달 저하나 지속적인 오류를 보이는 질환이며, 학령기 아동의 $3{\sim}7$%에서 관찰된다. 기존에 사용되는 기초학습기능검사의 단점을 보완하고 발달성 읽기 장애의 진단과 평가를 위해 단어/비단어 읽기 검사와 글자기호감별검사의 신뢰도와 타당도를 검증하였다. 방 법:DSM-IV의 진단 기준과 임상적인 판단에 근거하여 읽기 장애 아동 63명(평균 연령 10.48세)과 정상 아동 77명(평균 연령 10.33세)을 대상으로 하였다. 이들에게 기초학습기능검사의 읽기 I과 II목을 실시하였고, 단어/비단어 읽기 검사와 글자기호감별검사를 시행하였다. 단어/비단어 읽기 검사는 각 100문항씩의 익숙한 단어와 의미를 갖지 않는 생소한 비단어를 각각 1.2초와 2.4초안에 읽도록 하여, 이를 통해 자동화된 음운 처리 능력과 의식적인 글자-음소 처리 능력을 평가하였다. 글자기호감별검사를 통해 읽기 장애 환자들이 오류를 일으키는 거울상 반전 글자들의 조합을 판별하는 능력을 검사하였다. 이들 검사의 내적 일치도 등의 신뢰도 검사와 공존타당도, 구성타당도, 판별타당도 등을 검증하였다. 결 과:단어/비단어 읽기 검사는 내적 일치도가 0.96으로서 신뢰할 수 있고, 기초학습기능검사와 0.94의 공존타당도를 나타내었으며, 단어와 비단어 모두 발달성 읽기 장애와 정상 아동을 통계적으로 구분할 수 있었고, 판별 분석에서 원집단에 속한 83.0%를 정확하게 판별할 수 있었다. 글자기호감별검사는 내적 일치도가 0.86으로서 신뢰할 수 있고, 기초학습기능검사와 0.86의 공존타당도를 나타내었으며, 요인 분석 결과 안구 운동 거울상 처리, 전반적 정확성, 거울상 반전 오류, 정지상 처리, 전반적 기민성 부족, 부주의-충동성 등의 여섯 요인으로 구성되어 있었다. 글자기호감별검사의 각 항목 별로 발달성 읽기 장애와 정상 아동을 통계적으로 구분할 수 있었으며, 판별분석에서 원집단에 속한 대상의 87.3%를 정확하게 판별할 수 있었다. 결 론:발달성 읽기 장애 아동은 읽기 과정의 자동적인 시각-의미 연결 기전과 의식적인 형태소-음소 상응 규칙 적용 능력 모두에서 장애를 보였으며, 거울상 반전 오류 등 시각적 정보 처리 기능의 장애도 나타내었다. 이들 장애는 단어/비단어 읽기 검사와 글자기호감별검사를 통해 신뢰할 수 있고 타당성 있게 구분하고 평가할 수 있었다.

  • PDF

호텔링 변환을 이용한 자동차 번호판 인식시스템에 관한 연구 (License Plate Recognition System Using Hotelling Transform)

  • 김태우;강용석
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권1호
    • /
    • pp.29-35
    • /
    • 2009
  • 본 논문에서는 차량의 후면에서 촬영한 영상을 이용하여 효과적으로 번호판을 추출하고, 그 안에 표기된 문자를 인식하는 방법을 제안한다. 기존의 연구방법은 전체영상에 대하여 전처리를 수행하여 에지(edge)영상을 구하여 이진화 한다. 이진화된 영상에서 허프(Hough)변환을 수행하여 수평, 수직선을 구하고, 번호판의 특징을 이용하여 번호판 영역을 추출한다. 이 방법의 문제점은 처리시간이 많이 소요되므로 실시간처리가 곤란하다는 점과 야간관 같이 명암상태가 불규칙하고 영상에서 번호판 테두리가 나타나지 않으면 번호판 영역추출을 할 수 없다는 점이다. 또한 차량의 후면에서 촬영한 영상에서 번호판 영역의 명암값 변화의 특성을 이용하여 번호판 영역에서 숫자폭, 배경영역과 숫자영역의 명암차를 조사하여 숫자영역임을 확인하고, 확인된 숫자와 숫자사이의 거리를 조사하여 번호판 영역을 추출한다. 본 연구는 기존방법의 번호판 테두리 훼손에 따른 번호판 영역추출 실패의 문제점을 해결하고 시간 소요의 문제를 실시간안에 처리 함으로써 실용적 응용이 가능하다. 실험 결과 100장의 샘플영상으로 실험한 결과 멀리 있는 자동차 영상에서도 자동으로 번호판을 판독할 수 있었으며, 번호판 추출에 실패한 영상은 13%를 나타내었고, 문자인식에 실패한 영상은 0.4%의 결과를 나타내었다.

  • PDF