• 제목/요약/키워드: 영상 대비 향상

검색결과 319건 처리시간 0.025초

개인화기 조준 능력 향상 관점에서의 추적 기법의 성능평가 (Evaluation of Tracking Performance: Focusing on Improvement of Aiming Ability for Individual Weapon)

  • 김상훈;윤일동
    • 방송공학회논문지
    • /
    • 제18권3호
    • /
    • pp.481-490
    • /
    • 2013
  • 본 논문에서는 실제 전장에서 전투수행 중인 병사의 개인화기 조준 능력 향상 관점에서 추적기법의 성능평가를 하였다. 실제 전장에서는 짧은 시간동안 전투를 하는 것뿐만 아니라 며칠에 걸쳐서 실시되는 경우도 있다. 이와 같이 장시간 지속되는 작전 중에서 다양한 요소에 의해서 지속적으로 병사의 신체능력이 감소된다. 이렇게 손실되는 신체능력을 보완하기 위하여 시각추적 기술을 화기의 조준경에 적용하여 적 병사 이동상황을 자동적으로 추적하고 이로 인해 감소된 조준능력을 향상시키기 위한 실험을 하였다. 최신영상 추적 기법들 중에서 최적의 것을 결정하기 위하여, 겹침 현상, 카메라 이동, 크기변화, 저대비 영상, 조명변화 등의 특징이 포함된 여러 실제 전장 영상으로 그 성능을 평가하였다. VTD (Visual Tracking Decomposition)[2]가 정확도에서 IVT (Incremental learning for robust Visual Tracking)[7]가 속도 평가에서 가장 우수하였으며 종합적으로는 MIL (Multiple Instance Learning)[1]이 가장 우수한 결과를 보여 주었다. 이러한 성능평가 결과는 시각추적기술이 적용된 조준경이 실제 전장에서 전투수행을 하면서 신체능력이 감소된 병사의 전투력을 보완할 가능성이 있다는 것을 보여 준다.

초음파 볼륨에서 웨이브렛 변환을 이용한 전립선 객체 추출 (Prostate Object Extraction in Ultrasound Volume Using Wavelet Transform)

  • 오종환;김상현;김남철
    • 전자공학회논문지SC
    • /
    • 제43권3호
    • /
    • pp.67-77
    • /
    • 2006
  • 본 논문에서는 웨이브렛 변환과 SVM 분류기를 이용하여 3차원 초음파 볼륨으로부터 전립선 객체를 추출하는 방법을 제안한다. 제안한 방법에서는 웨이브렛 변환의 수평 수직 방향의 상세 영상들의 평균치들로부터 웨이브렛 변환 모듈러스 영상을 구함으로써 잡음전력 대비 전립선 윤곽에 대한 국부 최대치들의 첨예도가 큰 모듈러스 영상을 얻을 수 있다. 또한 전립선의 밝기 변이 특성 및 전립선 내외부의 질감 차이 등을 특징으로 한 SVM 분류기를 이용함으로써 전립선 윤곽 추출의 정확도를 크게 향상시킬 수 있다. 실험 결과, 제안한 방법을 이용하여 전립선 윤곽을 찾을 경우 전문가에 의하여 추출된 윤곽과 비교하여 절대 평균 거리가 1.89로 나타났다.

영상 화질 측정을 위한 픽셀 강도 영역의 새로운 광적응 효과 모델: 이론 및 적용 (A Novel Luminance Adaptation Effect Model in Pixel Intensity Domain for Image Quality Assessment: Theory and Application)

  • 배성호;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.78-80
    • /
    • 2015
  • 광적응(Luminance Adaptation; LA) 효과는 영상의 배경 밝기에 따른 왜곡에 대한 시각 인지 민감도가 달라지는 특성을 의미한다. 기존 영상 화질 측정(Image Quality Assessment; IQA) 방법들은 베버의 법칙(Weber' s law) 모델을 이용하여 LA 효과를 IQA 방법에 반영해왔다. 그러나, 이러한 IQA 방법들에 있어서 베버의 법칙 기반 LA 효과 모델은 다음 두 가지 이유로 부정확하게 동작한다: (i) 전통적인 베버의 법칙 모델은 실제 광도(luminance)에 대한 인지 민감도 응답값을 정확히 반영할 수 없다는 것이 밝혀졌다, (ii) 대부분 IQA 방법들은 픽셀 강도 영역에서 계산되지만, 베버의 법칙과 같은 LA 효과 모델들은 광도 영역에서 개발되었다. 따라서 광도와 픽셀 강도간 비선형 관계로 인해 IQA 방법에 반영된 베버의 법칙 기반 LA 효과 모델들은 부정확하게 동작한다. 이 문제를 해결하기 위해, 본 논문에서 처음으로 픽셀 강도 영역에서의 LA 모델을 이론적으로 유도한다. 본 논문에서 제안하는 픽셀 강도 영역에서의 LA 효과 모델은 감마 교정 함수(Gamma correction function)와 광도 영역에서의 LA 효과 모델인 제곱-법칙(power-law) 모델을 기반으로 하는 테일러 급수 확장 근사화를 통해 유도된다. 제안하는 픽셀 강도 영역 LA 효과 모델의 효과를 검증하기 위해, 제안하는 LA 효과 모델을 PSNR 에 도입하여 광범위한 실험을 수행한다. 실험 결과, 제안하는 LA 효과 모델 기반 PSNR 은 PSNR 및 베버의 법칙 기반 PSNR 대비 괄목할 만한 주관적 화질 예측 성능 향상을 보였다.

  • PDF

동영상 스트리밍 서비스의 QoS유지를 위한 듀얼 트랜스코딩 기법 (A Dual Transcoding Method for Retaining QoS of Video Streaming Services under Restricted Computing Resources)

  • 오두환;노원우
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권7호
    • /
    • pp.231-240
    • /
    • 2014
  • 스트리밍 서비스에 사용되는 트랜스코딩 서버는 동시에 다수의 트랜스코딩 요청을 처리한다. 하지만 트랜스코딩 연산의 부하가 높기 때문에 단일 서버가 수용할 수 있는 요청 개수는 제한적일 수밖에 없다. 본 논문에서는 단일 서버의 트랜스코딩 성능을 높이고자 CPU 기반 트랜스코더와 GPU 기반 트랜스코더를 동시에 사용하는 듀얼 트랜스코딩 방법을 제안한다. 듀얼 트랜스코딩 방법은 트랜스코딩 요청을 처리하기 전에 워크로드를 예측하여 해당 요청에 대한 QoS유지가 가능한지 판단한다. QoS유지가 가능하다고 판단되면 CPU 또는 GPU 트랜스코더 중 보다 적합한 타입의 장치에 작업을 할당함으로써 연산 자원의 효율성을 높인다. 성능 평가 결과 듀얼 트랜스코딩 기법은 기존 방식 대비 최대 1.84배의 성능 향상을 이루었다. 결과적으로 단일 서버가 보다 많은 사용자의 요청을 QoS 유지 하에 제공할 수 있게 되었다.

H.264/AVC를 위한 CAVLC 엔트로피 부/복호화기의 VLSI 설계 (VLSI architecture design of CAVLC entropy encoder/decoder for H.264/AVC)

  • 이대준;정용진
    • 한국통신학회논문지
    • /
    • 제30권5C호
    • /
    • pp.371-381
    • /
    • 2005
  • 본 논문에서는 동영상의 실시간 부/복호화를 위한 하드웨어 기반의 CAVLC 엔트로피 부/복호화기 구조를 제안한다. H.264/AVC의 무손실 압축 기법인 내용기반 가변길이 부호화(Context-based Adaptive Variable Length Coding)는 이전 표준의 기법과 다른 알고리즘을 채용하여 높은 부호화 효율과 복잡도를 가지고 있다. 이를 하드웨어 구조로 설계하기 위하여 메모리 재사용 기법을 적용하여 리소스를 최적화 하였으며, 지금까지 제시된 여러 엔트로피 부/복호화 구조 중 휴대용 기기에 적합한 성능 대비 리소스를 가지는 구조를 선택하고 이를 병렬 처리 구조로 설계하여 부호화 성능을 향상시켰다. 구현된 전체 모듈은 Altera사의 Excalibur 디바이스를 이용하여 검증하고 삼성 STD130 0.18um CMOS Cell Library를 이용하여 합성 및 검증하였다. 이를 ASIC으로 구현할 경우 부호화기는 150Mhz 동작주파수에서 CIF 크기의 동영상을 초당 300프레임 이상 처리하며 복호화기는 140Mhz 동작주파수에서 CIF 크기의 동영상을 초당 250 이상 처리할 수 있다. 본 결과는 하드웨어 기반의 H.264/AVC 실시간 부호화기와 복호화기를 설계하기에 적합한 하드웨어 구조임을 보여준다.

효율적인 보조 정보 생성을 통한 깊이지도 기반의 분산 다시점 비디오 코딩 기법 (Depth Map Based Distributed Multi-view Video Coding Scheme through an Efficient Side Information Generation)

  • 유지환;이동석;김태준;유지상
    • 한국통신학회논문지
    • /
    • 제34권10B호
    • /
    • pp.1093-1103
    • /
    • 2009
  • 본 논문에서는 효율적인 보조 정보 생성을 통한 새로운 분산 다시점 비디오 코딩 기법을 제안한다. 분산 비디오 코딩은 원영상과 디코더에서 생성한 보조 정보 간의 오차를 채널 코딩 기법으로 정정한다. 따라서 보조 정보를 정확히 만들수록 분산 비디오 코딩의 성능은 좋아지게 된다. 제안한 기법에서는 깊이지도를 기반으로 하는 다시점 비디오 코딩에 분산 비디오 코딩 기법을 적용한다. 또한 깊이지도를 이용한 3차원 워핑을 통해 인접한 시점의 영상으로부터 보조 정보를 생성하고, 3차원 워핑과 시간 축 상의 인접한 영상을 이용하는 MCTI(motion compensated temporal interpolation)를 효율적으로 혼합하여 사용한다. 실험 결과 제안한 기법으로 생성한 보조 정보는 MCTI와 3차원 위핑을 따로 사용한 방법보다 평균 0.97dB의 PSNR이 향상되었음을 알 수 있었다. 또한 R-D 곡선 상에서 동일 PSNR 대비 평균 8.01%의 비트율이 감소되었다.

색상과 얼굴 특징 정보를 이용한 얼굴 추적 (Face Tracking Using Face Feature and Color Information)

  • 이경호
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권11호
    • /
    • pp.167-174
    • /
    • 2013
  • 본 논문에서는 컬러 영상에서 얼굴을 추적하는 시스템을 구현하였다. 얼굴 추적은 영상 내에 존재하는 얼굴 영역을 컴퓨터의 기능을 이용하여 찾아내는 작업으로 로봇 시각 시스템 등에 필요한 기능이다. 그러나 입력되는 영상에 존재하는 피부색 범위 화소추출과 같은 단순한 수행으로는 얼굴 추적에 어려움이 있다. 피부색은 빛의 조건에 의해 다른 색으로 표현될 뿐 아니라 피부색은 얼굴 뿐 아니라 손과 발 등 다양한 곳에 존재하기 때문에 얼굴을 추적하기 위한 다른 조치가 필요하다. 본 논문에서는 피부색 추출을 위한 함수를 사용하되 효율 향상을 위한 조명 보정을 수행하였고 또 피부색 범위 내에서 추출된 피부색 블록에서 눈 코 입의 특징을 찾아 얼굴로 확정하는 전 과정을 수행하는 시스템을 구현하였다. 제안된 조명 보정은 피부색 추출에 초점을 맞추어 변형 sine 함수로 인간 시각에는 도움이 되지 않더라도 피부색 추출에는 약4% 정도의 개선을 보였으며, 얼굴의 특징들의 추출에는 다양한 색 공간에서 다양한 표현 값들을 증폭하거나 축소, 대비시킴으로서 얼굴 특징들을 추출되게 하여 얼굴로 판단하여 얼굴 추적을 하여, 얼굴이 잘 추적되게 하였다.

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

HEVC의 공간적 상관성 기반 고속 부호화 깊이 및 참조영상 결정 방법 (Spatial Correlation Based Fast Coding Depth Decision and Reference Frame Selection in HEVC)

  • 이상용;김동현;김재곤;최해철;김진수;최진수
    • 방송공학회논문지
    • /
    • 제17권5호
    • /
    • pp.716-724
    • /
    • 2012
  • 본 논문에서는 HEVC(High Efficiency Video Coding) 부호화 속도 향상을 위한 최대 부호화깊이 및 참조영상 고속결정 방법을 제안한다. 본 논문에서는 계산 복잡도 감소와 속도향상을 위하여 크게 두 가지 방법을 제안한다. 첫 번째 방법에서는 LCU(Largest Coding Unit)내 각 CU(Coding Unit)의 최대 부호화 깊이를 제한하며, 이때 공간적인 상관성을 기반으로 주변 LCU에서 사용된 최대 부호화 깊이와 율-왜곡 비용을 이용한다. 두 번째 방법에서는 각 CU의 다양한 PU(Prediction Unit) 중, 화면간 예측을 수행하는 PU에 대해서 참조영상을 제한하며, 이때 상위 깊이 PU의 움직임 정보를 이용한다. 제안하는 방법은 항상 최대 깊이까지 부호화를 수행하는 것을 적응적으로 제한하고, 상당한 복잡도를 요구하는 움직임 예측을 수행하는 PU의 참조영상 수를 제한함으로써 계산 복잡도를 감소시킬 수 있으며, 기존의 HEVC 참조 소프트웨어인 HM6.1 대비 약 1.2% 정도의 비트율이 증가하면서 약 39%의 복잡도 감소 효과를 얻을 수 있었다.

전신 뼈 검사에서 Wide Beam Reconstruction 기법의 유용성 (Utility of Wide Beam Reconstruction in Whole Body Bone Scan)

  • 김정열;강청구;박민수;박훈희;임한상;김재삼;이창호
    • 핵의학기술
    • /
    • 제14권1호
    • /
    • pp.83-89
    • /
    • 2010
  • UltraSPECT사의 Wide Beam Reconstruction (WBR)은 노이즈(Noise)와 조준기의 광속 확산 함수 효과(Beam spread function effect)를 제거하고 환자와의 거리를 자동적으로 보상하여 높은 해상도와 대조도를 제공할 수 있어 영상 획득 시간을 짧게 할 수 있고 상당한 영상 질 향상에 도움을 준다고 보고되고 있다. 이에 본 연구에서는 핵의학 분야에서 가장 흔히 이용되는 전신 뼈 스캔에 대해 WBR의 임상적 적용에 대한 유용성을 알아보고자 한다. XpressBone (WBR)의 성능 실험을 위하여 NEMA에서 제공하는 방법에 의하여 선원(Line source)과 SPECT Phantom을 이용하여 공간 분해능을 측정 분석하였다. 실험방법은 선원의 총 계수치를 200 kcps에서 300 kcps로 변화시켜 측정하였으며, SPECT Phantom은 매트릭스 크기를 변화시켜 측정하여 공간분해능에 대한 분석을 하였다. 또한 2009년 1월부터 2009년 9월까지 본원을 내원하여 뼈 스캔을 시행 받은 환자 40명을 두 군으로 나누어 임상 연구를 시행하였다. 1군은 $^{99m}Tc$-HDP 740 MBq (20mCi)를 투여하고 검사속도(20, 30 cm/min)를 변화시켰고, 2군은 동일한 검사속도에서 $^{99m}Tc$-HDP의 투여량을 변화시켜 영상을 획득하여 Standard data와 WBR기법으로 재구성한 영상을 비교 평가하였다. 분석방법은 대퇴골체부에서 뼈와 연부조직간 섭취비(Femur to tissue ratio: FTR)를 측정한 정량적인 분석과 핵의학과 전문의와 5년 이상의 실무경험을 가진 방사선사가 육안적인 분석을 하여 비교 평가하였다. 성능 실험에서 선원을 사용하여 실험한 결과 Planar WBR data는 Standard data에 비하여 분해능이 약 10% 향상되었으며, WBR 반치폭(Full-Width at Half-Maximum)은 16% 향상되었다(Standard data 8.45, WBR data 7.09). SPECT Phantom에서는 약 50%의 분해능이 향상되었으며, WBR 반치폭은 50% 향상되었다(Standard data 3.52, WBR data 1.65). 임상 연구에서는 $^{99m}Tc$-HDP 투여량을 고정시키고 검사속도를 20cm/min과 30 cm/min로 변화시킨 1군에서 Standard data와 WBR data의 전신 뼈 스캔 전면 영상에서 뼈 대비 연부조직간 섭취비는 통계적으로 유의한 차이를 보이지 않았다 (p=0.07). 검사속도를 고정하고 $^{99m}Tc$-HDP 투여량을 변화시킨 2군에서는 Standard data와 WBR data간의 전신 뼈 스캔전면 영상에서는 통계적으로 유의한 차이를 보이지 않았다 (p=0.458). 영상의 육안적 분석에서도 두 군 간 유의한 차이를 보이지 않았다(p>0.05). NEMA test 결과 WBR 기법의 영상에서 분해능이 향상되는 결과를 나타내었고, 임상 실험에서는 기존 재구성 방법에서의 동일한 해상도를 가지면서도 검사시간을 단축시킬 수 있었으며 방사성의약품의 투여량도 줄일 수 있었다. 이미 알려진 바와 같이 WBR은 노이즈를 감소시켜 신호 대 잡음비를 증강시키는 새로운 영상 재구성 방법임을 확인 할 수 있으며 동일한 검사속도에서 투여량을 감소시킬 수 있어 수신자의 피폭선량 경감과 검사시간을 단축할 수 있었으며 임상 현장에서 유용하게 이용되리라 사료된다.

  • PDF