• 제목/요약/키워드: feature coding

검색결과 203건 처리시간 0.025초

CompressAI 를 활용한 객체 검출 네트워크 피쳐 맵 압축 (Object Detection Network Feature Map Compression using CompressAI)

  • 도지훈;이주영;김연희;최진수;정세윤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.7-9
    • /
    • 2021
  • 본 논문은 Detectron2 [1]에서 지원하는 객체 검출 임무 수행 네트워크의 과정 중에서 추출한 피쳐 맵을 신경망 기반으로 압축하는 방법을 제안한다. 이를 위해, 신경 망 기반 영상 압축을 지원하는 공개 소프트웨어인 CompressAI [2] 모델 중 하나인 bmshj2018-hyperprior 의 압축 네트워크를 활용하여 임무 수행 네트워크의 과정 중 스탬 레이어(stem layer)에서 추출된 피쳐 맵을 압축하도록 학습시켰다. 또한, 압축 네트워크의 입력 피쳐 맵의 너비와 높이 크기가 64 의 배수가 되도록 객체 검출 네트워크의 입력 영상 보간 값을 조정하는 방법도 제안한다. 제안하는 신경망 기반 피쳐 맵 압축 방법은 피쳐 맵을 최근 표준이 완료된 차세대 압축 표준 방법인 VVC(Versatile Video Coding, [3])로 압축한 결과에 비해 큰 성능 향상을 보이고, VCM 앵커와 유사한 성능을 보인다.

  • PDF

유도전동기의 고장 진단을 위한 효과적인 특징 추출 방법 (An Effective Feature Extraction Method for Fault Diagnosis of Induction Motors)

  • 흥 뉘엔;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권7호
    • /
    • pp.23-35
    • /
    • 2013
  • 본 논문은 고장 분류 시스템을 위해 진동 신호로부터 특징 벡터를 자동적으로 추출하는 효과적인 기법을 제안한다. 기존의 멜-주파수 캡스트럼 계수는 진동신호의 노이즈에 민감하여 분류 정확도를 감소시키는 단점이 있다. 이러한 문제를 해결하기 위해 본 논문은 4단계 필터 뱅크로 구성된 스펙트럴 엔벨로프 캡스트럼 계수 분석을 제안하며, 4단계는 (1) 모든 진동 신호의 스펙트럴 엔벨로프를 기술하기 위한 선형 예측 코딩 알고리즘 사용 단계, (2) 일반적인 스펙트럴 모양을 얻기 위해 모든 엔벨로프의 평균화 단계, (3) 평균 엔벨로프와 그 주파수의 최대값을 찾기 위한 기울기 하강 방법 사용 단계, (4) 엔벨로프의 주파수 사이의 거리로부터 계산된 중앙값을 얻는데 사용되는 비 중첩 필터 뱅크 단계로 구성된다. 이4-단계필터뱅크는 특징벡터를 추출하기위해 캡스트럼 계수 계산에 사용된다. 마지막으로 유도전동기의 결함 형태를 구분하기 위해 이러한 특수 파라미터를 사용하는 다중 계층 서포트 벡터 머신을 사용한다. 모의실험 결과, 제안하는 방법은 약 99.65%의 분류 성능을 보이며, 동시에 기존 방법들보다 우수한 성능을 보인다.

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

  • 이강규;윤원중;박규식
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.29-37
    • /
    • 2005
  • 본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.

해양 지리정보 피쳐 카탈로그 작성에 관한 연구 (Development of a Feature Catalogue for Marine Geographic Information)

  • 홍상기;윤석범
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.101-117
    • /
    • 2004
  • GIS 데이터의 효율적인 활용을 위해서는 GIS 데이타에 대한 표준화가 필수적이라 할 수 있다. 국제표준화기구 산하 지리정보전문위윈회(ISO/TC211)에서 제정중인 ISO 19100 시리즈 표준들과 OpenGIS 컨소시엄에서 만들어내고 있는 각종 명세서(Specifications)는 표준화를 통한 지리정보의 상호운용성(Interoperability) 확보를 목표로 하고 있다. 해양GIS 분야의 표준화도 이런 맥락에서 시급한 과제중의 하나라고 할 수 있다. 다양한 해양GES 사업에서 구축되는 데이터에 대해 일관된 의미를 사용함으로써 각 사업간 연계를 원활히 하고 시스템 간 상호운용성을 확보할 수 있도록 하기 위해서는 해양지리성보에 대한 공통 피쳐 카탈로그(Feature Catalogue)가 필요하다. 본 논문에서는 피쳐 카탈로그의 전반석인 개념 및 구성방법에 대해 논의하고 국내외의 다양한 분야와 기관에서 공통적으로 사용되는 해양지리정보 피쳐들의 목록을 조사 분석하였다. 그리고 국가지리정보시스템(NGIS)에서 사용되고 있는 피쳐들의 목록을 조사.분석하여 해양지리정보시스템(Marine Geographic Information System)과 국가지리정보시스템에서 공통적으로 사용되는 피쳐들의 목록을 종합하여 분석하였다. 이런 분석을 토대로 해양 지리정보 공통 피쳐들을 도출하고 피쳐의 분류체계, 코드체계를 제시하였으며, 도출된 피쳐들을 공통피쳐 카탈로그로 작성하는 방식에 대해서 설명하였다. 또한 도출된 피쳐들을 표준 등록소에 등록할 수 있는 XML 스키마를 개발하였으며 XML 스키마를 토대로 피쳐들을 표준 등록소에 등록할 수 있는 등록 도구를 개발하였다.cm^3$로 가정했을 때, 경상분지의 화강암류의 압력평균값이 약 $0.73{\sim}3.16kbar$의 범위를 가졌고, 경상분지내 백악기 화강암류의 정치 깊이는 $2.6{\sim}11.4km$범위를 가졌다. 이는 경상분지 화강암류에 대해 유추된 기존의 정성적인 생각과 일치한다는 것을 알 수 있었고, 각섬석의 $Al^T$함량을 이용한 여러 경험적, 실험적인 압력계가 많은 제한점이 있지만 경상분지의 백악기 불국사화강암류에는 정성적으로 유효함을 알 수 있었다. 우리는 최종적으로 경상분지내 백악기 화강암류는 천부관입 암체이고 노출된 화강암류가 천부지각이라는 것을 알 수 있었다. 것이 아니라 낙관적 예측을 수행하는 경향이 있음을 발견할 수 있었다.원밭, 화산회밭으로 6개 유형으로 분류할 경우 각각의 분포면적은 41.9%, 23.3%, 17.5%, 13.9%, 1.1. 2.2% 이었다. 도시화 및 도로확대 등 다양한 토지이용 및 지형개변으로 과거의 토양정보가 많이 변경되었다. 그래서, 앞으로는 인공위성자료 및 항공사진을 이용하여 빠르고 쉽게 활용할 수 있는 토양조사 방법개발과 기 구축된 토양도의 수정, 보완 작업이 필요한 절실히 요구되고 있는 현실이다.브로 출시에 따른 마케팅 및 고객관리와 관련된 시사점을 논의한다.는 교합면에서 2, 3, 4군이 1군에 비해 변연적합도가 높았으며 (p < 0.05), 인접면과 치은면에서는 군간 유의차를 보이지 않았다 이번 연구를 통하여 복합레진을 간헐적 광중합시킴으로써 변연적합도가 향상될 수 있음을 알 수 있었다.시장에 비해 주가가 비교적 안정적인 수준을 유지해 왔다고

  • PDF

EIV와 MLP를 이용한 뇌파 기반 운전자의 졸음 감지 시스템 (Electroencephalogram-Based Driver Drowsiness Detection System Using Errors-In-Variables(EIV) and Multilayer Perceptron(MLP))

  • 한형섭;송경영
    • 한국통신학회논문지
    • /
    • 제39C권10호
    • /
    • pp.887-895
    • /
    • 2014
  • 졸음운전은 전체 교통사고 원인 중 큰 비중을 차지하며 그 위험성이 음주운전보다도 크다고 알려져 있다. 따라서 운전자의 졸음을 판단하고 경고하는 시스템 개발에 대한 관심이 높아지고 있으며, 뇌파를 분석하는 것이 운전자의 피로와 졸음을 감지하는데 효과적이라는 연구결과들이 발표되었다. 본 논문은 짧은 시간에 높은 해상도를 가지는 auto-regressive 모델 기법 중 잡음에 강인한 errors-in-variables(EIV) 방법을 이용하여 특징벡터를 추출하고, 다층신경망(multilayer perceptron; MLP)에 적용하여 운전자의 상태를 각성, 천이, 졸음의 세 가지 상태로 분류하는 졸음 감지 시스템을 제안한다. 생체신호의 측정 환경에 따른 성능을 평가하기 위해 높은 진단률을 갖도록 하는 EIV차수를 결정하고, 잡음에 대한 강인성을 확인하기 위해 신호대 잡음비(signal-to-noise ratio; SNR)에 따른 성능을 선형 예측 부호화(linear predictive coding; LPC) 방법과 비교하였다. 이 결과로부터 제안한 EIV와 MLP를 결합한 졸음 감지 시스템은 기존의 LPC와 MLP를 이용한 시스템에 대해 우수한 성능을 얻을 수 있음을 확인하였다.

MPEG-21 및 H.264/AVC SVC 기반 동적 비디오 적응 방법 (Dynamic and Interoperable Adaptation of SVC for QoS-Enabled Streaming)

  • 최해철;김재곤
    • 한국콘텐츠학회논문지
    • /
    • 제12권4호
    • /
    • pp.10-19
    • /
    • 2012
  • 근래의 이종 네트워크 환경에서 비디오를 안정되게 전송하기 위해서는 네트워크 특성, 단말기 성능, 사용자 선호도 등의 소비 환경을 고려한 비디오 적응 방법이 요구되며, 비디오 부호화에서의 스케일러빌러티는 그 요구조건을 만족시키기 위한 좋은 해결책이다. 본 논문에서는 H.264/AVC SVC 스트림을 MPEG-21 디지털 아이템 적응(Digital Item Adaptation, DIA) 도구를 이용하여 네트워크 환경, 단말의 성능, 사용자 선호도에 따라 동적(dynamic)으로 비디오 콘텐츠를 적응시키는 방법을 제안한다. 실험에서는 이종망 네트워크 환경을 모델링하여 대역폭이 최대 62%의 변화가 있는 경우에도 제안한 방법으로 지연이 거의 없이 실시간으로 비트율을 적응할 수 있음을 보인다.

대화형 복수시점 영상콘텐츠 저작시스템 설계 및 구현 (Design and Implementation of Interactive Multi-view Visual Contents Authoring System)

  • 이인재;최진수;기명석;정세윤;문경애;홍진우
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.458-470
    • /
    • 2006
  • 본 논문에서는 MPEG-4 Systems 기반 복수시점 영상 서비스를 위한 저작 기술에 대해 제안한다. MPE-4는 이전의 MPEG-l/2 등의 비디오 정보 압축 규격과 달리, 사용자와 콘텐츠 간의 객체 기반 대화형(interactivity) 기능에 대한 다양한 방법을 포함하고 있다. 따라서 MPEG-4 Systems 규격은 현재까지 개발된 표준들 중에서 복수시점 영상 서비스가 제공하려고 하는 목적에 가장 잘 부합하는 기능을 제공하고 있다. 본 논문에서는 MPEG-4 Systems 표준 기술을 기반으로 제공될 수 있는 복수시점 영상 서비스에 대해 기술하였고, 해당 서비스를 제공하기 위한 MPEG가 장면 기술(scene description) 프로파일을 제안하였다. 또한 제안된 프로파일에 기반을 둔 대화형 복수시점 영상콘텐츠 저작시스템을 설계하고 구현하였으며, 실험결과를 통해 그 가능성을 보여 주었다.

인공호흡기 사용 환자들에게 제공된 예비적 정보에 대한 내용분석의 측정자간 신뢰도 (Interrater Reliability in the Content Analysis of Preparatory Information for Mechanically Ventilated Patients)

  • 김화순
    • 기본간호학회지
    • /
    • 제5권2호
    • /
    • pp.269-279
    • /
    • 1998
  • In nursing research that the data is collected through clinical observation, analysis of clinical recording or coding of interpersonal interaction in clinical areas, testing and reporting interrater reliability is very important to assure reliable results. Procedures for interrater reliability in these studies should follow two steps. The first step is to determine unitizing reliability, which is defined as consistency in the identification of same data elements in the record by two or more raters reviewing the same record. Unitizing reliability have been rarely reported in previous studies. Unitizing reliability should be tested before progressing to the next step as precondition. Next step is to determine interpretive reliability. Cohen's kappa is a preferable method of calculating the extent of agreement between observer or judges because it provides beyond-chance agreement. Despite its usefulness, kappa can sometimes present paradoxical conclusions and can be difficult to interpret. These difficulties result from the feature of kappa which is affected in complex ways by the presence of bias between observers and by true prevalence of certain categories. Therefore, percentage agreement should be reported with kappa for adequate interpretation of kappa. The presence of bias should be assessed using the bias index and the effect of prevalence should be assessed using the prevalence index. Researchers have been reported only global reliability reflecting the extent to which coders can consistently use the whole coding system across all categories. Category-by-category reliability also need to be reported to inform the possibility that some categories are harder to use than others.

  • PDF

문서화상에 대한 RDM 합성 알고리즘 및 디지틀 서명에의 응용 (A study on RDM algorithm for document image and application to digital signature)

  • 박일남;이대영
    • 한국통신학회논문지
    • /
    • 제21권12호
    • /
    • pp.3056-3068
    • /
    • 1996
  • 본 논문에서는 문서 화상에 비트를 합성하는 방법으로 RDM 알고리즘을 제안한 후 이를 이용하여 FAX 문서에 직접 서명을 실행하는 디지틀 서명 방식을 제안한다. 본 알고리즘은 비트를 합성하기 위해 기주사된 복수개의 참조 주사선중 키에 의해 선택된 주사선의 변화화소와 부호화 주사선의 변화화소의 거리의 우기성과 부호화 주사선의 부호장의 우기성을 이용하여 합성 비트열에 따라 거리와 부호장을 신축조작하는 방법으로 한 번에 2 비트씩 합성을 실행한다. 이는 앞서 제시한 방식에 비해 서명의 확산이 가능하므로 부분 서명에 의해 문서 전체에 대한 서명이 구현되어 서명 속도가 개선되며 합성 전제조건의 제거로 합성 가능량이 증가한다. 또한 제안하는 디지틀 서명구조에 의해 디지틀 서명의 제 3조건인 송신자 부인 봉쇄를 구현한다. 디지틀 서명된 송신 문서는 원 문서와 시각적으로 구분이 어려워 제 3자에게는 통상의 문서교환으로 인식될 것이다.

  • PDF

Improving the Availability of Scalable on-demand Streams by Dynamic Buffering on P2P Networks

  • Lin, Chow-Sing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권4호
    • /
    • pp.491-508
    • /
    • 2010
  • In peer-to-peer (P2P) on-demand streaming networks, the alleviation of server load depends on reciprocal stream sharing among peers. In general, on-demand video services enable clients to watch videos from beginning to end. As long as clients are able to buffer the initial part of the video they are watching, on-demand service can provide access to the video to the next clients who request to watch it. Therefore, the key challenge is how to keep the initial part of a video in a peer's buffer for as long as possible, and thus maximize the availability of a video for stream relay. In addition, to address the issues of delivering data on lossy network and providing scalable quality of services for clients, the adoption of multiple description coding (MDC) has been proven as a feasible resolution by much research work. In this paper, we propose a novel caching scheme for P2P on-demand streaming, called Dynamic Buffering. The proposed Dynamic Buffering relies on the feature of MDC to gradually reduce the number of cached descriptions held in a client's buffers, once the buffer is full. Preserving as many initial parts of descriptions in the buffer as possible, instead of losing them all at one time, effectively extends peers’ service time. In addition, this study proposes a description distribution balancing scheme to further improve the use of resources. Simulation experiments show that Dynamic Buffering can make efficient use of cache space, reduce server bandwidth consumption, and increase the number of peers being served.