Search | Korea Science

Phoneme Recognition using Temporal and Spectral Features based on Spikegram (스파이크그램 기반의 주파수 및 시간 특성을 이용한 음소 인식)

Han, Seokhyeon;Kim, Jaewon;An, Soonho;Shin, Seonghyeon;Park, Hochong
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2019.06a
- /
- pp.156-157
- /
- 2019
본 논문에서는 스파이크그램 기반의 주파수 및 시간 특성을 이용한 음속 인식 방법을 제안한다. 기존의 MFCC 특성은 프레임 단위의 평균 특성이기 때문에 시간 해상도가 낮고, 짧은 음소의 특성을 반영하기에는 어렴움이 있다. 반면, 스파이크그램은 청각 모델을 기반으로 샘플 단위로 계산하기 때문에높은 시간 해상도를 가진다. 고 해상도의 스파이크그램을 분석하면 음소 인식에 특화된 특성 벡터를 추출할 수 있다. 추출된 특성으로 심층 신경망을 학습시켜 음소 인식기를 구현하였고, TMIT 테이터 세트로 성능을 평가하였다. 성능 평가를 통하여 스파이크그램 기반의 새로운 시간-주파수 특성을 사용하여 MFCC 특성과 유사한 성능의 음소인식이 가능한 것을 확인하였다.
PDF

Stabilization Assessment of Drone-Projected Image based on Sensor Information (드론 탑재형 프로젝터를 위한 센서정보 기반 프로젝션 영상 안정화 평가 방법)

Choi, Eunbin;Park, Younghyeon;Jeon, Byeungwoo
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2019.06a
- /
- pp.264-266
- /
- 2019
드론에 프로젝터를 탑재한 드론 프로젝터 시스템을 활용한 이동형 프로젝션 디스플레이를 사용할 경우, 드론의 비행시 발생하는 흔들림이 그대로 프로젝터에 전달되기 때문에 프로젝터에 의해 투영된 영상에 왜곡이 발생하게 된다. 본 논문에서는 종래에 사용되던 드론의 비행정보 기반 투영영상 변환행렬을 실제 영상에 적용해보고 비행 움직임에 의해 발생하는 실제 투영영상에서 발생하는 오차를 평가하기 위한 방법을 제안한다.
PDF

Image similarity evaluation algorithm based on Similarity condition of triangles between feature points (특징점 간 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘)

Lee, Inhong;Kang, Jeonho;Kim, Kyuheon
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2019.06a
- /
- pp.313-316
- /
- 2019
IT기술의 발전으로 다양한 디바이스들이 출현하고 있고, 디바이스들의 디스플레이 크기와 해상도가 증가하는 경향을 보임에 따라 파노라마 영상에 대한 필요성이 대두되고 있다. 현 상황에서 영상 소비 목적과 사용 디바이스에 맞는 영상을 제공하기 위하여 불특정 해상도를 가진 영상들을 정합하여 파노라마 영상을 제작하는 것이 필수적이다. 이와 같은 파노라마 영상을 제작하기 위해서는 영상 간 스티칭 기술이 필요하며, 해당 스티칭 기술은 영상 전체에 대한 정보를 사용하기 때문에 많은 시간이 소요된다. 이러한 문제점을 해결하기 위하여, 스티칭 대상 영역을 특정하는 영상 간 공간유사도 평가를 활용하면 스티칭 시간의 감소를 가져올 수 있다. 본 논문에서는 추출된 특징점을 대상으로 삼각형 닮음 조건을 적용하여 영상 간 공간유사도를 평가하는 알고리즘을 개발하고자 한다.
PDF

Compression Error Compensation Method for Multi-Resolution Feature Map (다해상도 피처 맵 압축 손상 보상 방법)

Kwon, Naseong;Lee, Minhun;Choi, Hansol;Park, Seungjin;Oh, Seoung-Jun;Kim, Younhee;Lee, Jooyoung;Jeong, SeYoon;Sim, Donggyu
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2022.06a
- /
- pp.1343-1345
- /
- 2022
본 논문에서는 다해상도 피라미드 피처 맵 압축 손상 보상 방법을 제안한다. 본 논문에서 제안하는 방법은 패킹된 C-레이어 피처 맵을 비디오 코덱으로 압축할 때, 저해상도 계층의 원본 피처 맵과 복원된 피처 맵 간의 차분 값을 구해 이를 고해상도 계층의 피처 맵에 더해줌으로써 부호화 과정에서 발생하는 오차를 보상하는 방법이다. 본 논문에서 제안하는 방법의 성능을 평가하기 위하여 OpenImageV6 데이터셋 중 1000 장에 대해 객체 검출 성능을 평가하였다. 본 논문에서 제안하는 피처 맵 압축 방법은 C-레이어 피처 맵 압축 방법 대비 bpp 와 mAP 의 BD-rate 관점에서 35.10%의 성능 향상을 보인다.
PDF

Security Threat Factors and Improvement Methods in Enterprise Hybrid Applications (기업용 하이브리드 애플리케이션 보안 위협 요소 및 대응방안 연구)

Lee, Yoonjae;Oh, Junseok;Kim, Yongwon;Lee, Bong Gyou
- Proceedings of the Korea Information Processing Society Conference
- /
- 2011.11a
- /
- pp.531-534
- /
- 2011
본 연구의 목적은 차세대 MEAP 환경에서의 보안 평가 모델을 제시하는 것이다. 기업용 애플리케이션 개발환경은 PES 및 MEAP을 거쳐 완벽한 OSMP구현을 위한 HTML5 환경으로 발전하고 있다. 이와 더불어 보안의 위협도 증대되고 있으나, HTML5 환경에서의 보안에 대한 연구는 미흡한 실정이다. 이러한 문제에 대비하기 위해서는 기존 개발환경의 보안 특징을 살펴볼 필요가 있다. 본 연구에서는 보안위협요소를 Back-End System, Client, Developer, OS 4가지로 도출한 후, 이에 해당하는 보안 위협 문제들을 살펴보고 보안 평가 모델을 제시하였다. 본 모델은 단계별 보안이슈를 포함하고 있으며, 향후 HTML5 시대에 논의될 보안 이슈의 방향성을 제시한다는데 그 의미가 있다. 따라서 본 연구는 기업형 하이브리드 애플리케이션 개발을 준비하는 기업 및 연구자에게 시사점을 제공할 것으로 기대된다.
https://doi.org/10.3745/PKIPS.y2011m11a.531 인용 PDF

Improving Attention-based Video Highlight Prediction (어텐션 기반 비디오 하이라이트 예측 알고리즘의 개선)

Yoon, Wonbin;Hwang, Junkyu;Lee, Gyemin
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- fall
- /
- pp.314-317
- /
- 2021
하이라이트 영상은 원본 영상의 중요한 장면들을 짧은 시간 안에 감상할 수 있게 도와준다. 특히나 경기 시간 긴 축구나 야구 그리고 e-스포츠의 시청자들에게 있어, 하이라이트 영상의 효용성은 더욱 증가한다. 하이라이트 영상 추출의 자동화로 방송사나 온라인 플랫폼은 비용 절감과 시간 절약의 이점을 얻을 수 있다. 따라서 본 논문에서는 스포츠 영상에서 자동으로 하이라이트 구간을 추출하는 모델을 제안한다. 제안하는 모델은 멀티 헤드 어텐션 매커니즘과 LSTM 네트워크의 결합으로 구성된다. 해당 매커니즘의 여러 헤드를 통해 어텐션을 다양한 관점에서 진행한다. 이로 인해 영상의 전체적인 맥락과 장면 간의 유기적 관계를 다양한 관점에서 파악할 수 있다. 또한 오디오와 이미지 정보를 함께 이용하여 모델을 학습한다. 학습한 모델의 평가는 e-스포츠 경기 영상을 이용하여 평가한다.
PDF

Learning data production technique for visual optimization of generative models (생성모델의 시각적 최적화를 위한 학습데이터 제작기법)

Cho, Hyeongrae;Park, Gooman
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- fall
- /
- pp.13-14
- /
- 2021
본 논문은 생성모델의 학습데이터 제작기법에 대한 실험 및 결과와 향후 관련 연구의 방향을 기술한다. GAN으로 대표되는 생성모델이 아티스트에게 얼마만큼의 만족도와 영감을 주는지를 비교 실험 및 평가하기 위해서는 정제된 학습데이터가 필요하다. 하지만 현실적으로 아티스트의 작품은 데이터 세트를 만들기에는 그 수가 적고 인공지능이 학습하기에도 정제되어있지 않다. 2차 가공작업을 통하여 아티스트의 원본 작업과 유사한 데이터 세트의 구축은 생성모델의 성능향상을 위해 매우 중요하다. 연구의 결과 생성모델이 표현하기 어려운 스타일의 작가 작품을 선정한 뒤 최적의 학습데이터를 만들기 위한 다양한 실험과 기법을 통해 구축한 데이터 세트를 생성모델 알고리즘에 적용하고 실험을 통해 창작자의 작품제작 의도인 작가 진술에 최대한 유사한 이미지의 생성과 더 나아가 작가가 생각하지 못했던 창조적 모방의 결과물을 도출하였고 작가평가를 통해 높은 만족도를 얻었다.
PDF

Benchmark Dataset Generation for 360-degree Image Applications (360° 영상 응용을 위한 벤치마크 데이터 생성 연구)

Lee, Jongsung;Lee, Yeejin
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2021.06a
- /
- pp.112-115
- /
- 2021
최근 가상현실 및 증강 현실에 대한 관심도가 높아지면서, 깊이 추정, 객체 인식, 영상 분할 등의 다양한 컴퓨터 비전 알고리즘을 360° 영상에 적용하는 연구가 활발히 진행되고 있다. 이 중, 다수의 RGB 카메라를 활용하여 3 차원 정보를 추출하는 깊이 추정 기술은 보다 나은 몰입감을 제공하기 위한 핵심 기술이다. 그러나 깊이 추정 알고리즘의 객관적 성능 평가를 위한 정제된 360° 영상 데이터셋은 극히 부족하며, 이로 인하여 관련 분야 연구에 한계가 있다. 따라서 본 논문에서는 객관적인 알고리즘 성능 평가가 가능하며, 정제된 360° 동영상 데이터셋을 제안하고, 추후 다양한 360° 영상 응용 알고리즘 개발에 활용하고자 한다.
PDF

Research on audio bandwidth extension using residual signal replication (잔차 신호 복제 기반 오디오 대역 확장 방법)

Lim, Wootaek;Beack, Seungkwon;Lee, Taejin
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2021.06a
- /
- pp.57-60
- /
- 2021
오디오 대역 확장 기술은 저 해상도의 오디오 신호를 고 해상도의 오디오 신호로 복원 또는 생성해 내는 기술이다. 이와 관련하여 오디오 코덱에서는 고 대역 오디오 신호의 저 비트 부호화를 위해 사람이 청각이 둔감하게 인지하는 고 대역의 오디오 신호에 대해 실제 신호에 대한 양자화를 수행하지 않고, 코딩 되어 전송된 저 대역 신호와 고 대역의 파라미터를 이용하여 신호를 합성하는 스펙트럼 대역 복제 기술이 널리 사용된다. 본 연구에서는 선형 예측 기반의 주파수 대역 복제 방법을 통해 추가 정보를 활용한 오디오 대역 확장을 수행하고 신경망 기반의 오디오 신호 개선을 통해 복제된 신호의 개선 가능성을 검토하였다. 실험 평가는 MPEG 에서 코덱 평가용으로 사용되는 테스트 시퀀스를 사용하였으며, 실험 결과 제안하는 방법을 적용하여 기존 오디오 대역 확장 기술 대비 성능이 향상됨을 확인하였다.
PDF

Performance Evaluation of AHDR Model using Channel Attention (채널 어텐션을 이용한 AHDR 모델의 성능 평가)

Youn, Seok Jun;Lee, Keuntek;Cho, Nam Ik
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2021.06a
- /
- pp.335-338
- /
- 2021
본 논문에서는 기존 AHDRNet에 channel attention 기법을 적용했을 때 성능에 어떠한 변화가 있는지를 평가하였다. 기존 모델의 병합 망에 존재하는 DRDB(Dilated Residual Dense Block) 사이, 그리고 DRDB 내의 확장된 합성곱 레이어 (dilated convolutional layer) 뒤에 또다른 합성곱 레이어를 추가하는 방식으로 channel attention 기법을 적용하였다. 데이터셋은 Kalantari의 데이터셋을 사용하였으며, PSNR(Peak Signal-to-Noise Ratio)로 비교해본 결과 기존의 AHDRNet의 PSNR은 42.1656이며, 제안된 모델의 PSNR은 42.8135로 더 높아진 것을 확인하였다.
PDF

Search Result 1,297, Processing Time 0.034 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)