• Title/Summary/Keyword: 데이터 증대

Search Result 1,492, Processing Time 0.028 seconds

Search of an Optimal Sound Augmentation Policy for Environmental Sound Classification with Deep Neural Networks (심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색)

  • Park, Jinbae;Kumar, Teerath;Bae, Sung-Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.18-21
    • /
    • 2020
  • 심층 신경망은 영상 분류, 음성 인식, 그리고 문자 번역 등 다양한 분야에서 효과적인 성능을 보여주고 있다. 신경망의 구조 변화, 신경망 간의 정보 전달, 그리고 학습에 사용되는 데이터 증대 등의 확장된 연구를 통해 성능은 더욱 발전하고 있다. 그 중에서도 데이터 증대는 기존에 수집한 데이터의 변형을 통해 심층 신경망에 더 다양한 데이터를 제공함으로써 더욱 일반화된 신경망을 학습시기키는 것을 목표로 한다. 하지만 기존의 음향 관련 신경망 연구에서는 모델의 학습에 사용되는 데이터 증대 방법의 연구가 영상 처리 분야만큼 다양하게 이루어지지 않았다. 최근 영상 처리 분야의 데이터 증대 연구는 학습에 사용되는 데이터와 모델에 따라 최적의 데이터 증대 방법이 다르다는 것을 실험적으로 보여주었다. 이에 영감을 받아 본 논문은 자연에서 발생하는 음향을 분류하는데 있어서 최적의 데이터 증대 방법을 실험적으로 찾으며, 그 과정을 소개한다. 음향에 잡음 추가, 피치 변경 혹은 스펙트로그램의 일부 제한 등의 데이터 증대 방법을 다양하게 조합하는 실험을 통해 경험적으로 어떤 증대 방법이 효과적인지 탐색했다. 결과적으로 ESC-50 자연 음향 데이터 셋에 최적화된 데이터 증대 방법을 적용함으로써 분류 정확도를 89%로 향상시킬 수 있었다.

  • PDF

Search for Optimal Data Augmentation Policy for Environmental Sound Classification with Deep Neural Networks (심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색)

  • Park, Jinbae;Kumar, Teerath;Bae, Sung-Ho
    • Journal of Broadcast Engineering
    • /
    • v.25 no.6
    • /
    • pp.854-860
    • /
    • 2020
  • Deep neural networks have shown remarkable performance in various areas, including image classification and speech recognition. The variety of data generated by augmentation plays an important role in improving the performance of the neural network. The transformation of data in the augmentation process makes it possible for neural networks to be learned more generally through more diverse forms. In the traditional field of image process, not only new augmentation methods have been proposed for improving the performance, but also exploring methods for an optimal augmentation policy that can be changed according to the dataset and structure of networks. Inspired by the prior work, this paper aims to explore to search for an optimal augmentation policy in the field of sound data. We carried out many experiments randomly combining various augmentation methods such as adding noise, pitch shift, or time stretch to empirically search which combination is most effective. As a result, by applying the optimal data augmentation policy we achieve the improved classification accuracy on the environmental sound classification dataset (ESC-50).

Web 상에서의 정보검색기법에 관한 고찰

  • 김준오
    • Proceedings of the Korea Database Society Conference
    • /
    • 1997.10a
    • /
    • pp.270-281
    • /
    • 1997
  • 현재 기업 뿐 아니라 개인에도 정보의 중성이 증대되고 있는 실정이다. 특히, 정보기술의 활용과 빠른 컴퓨팅 환경의 변화 및 인터넷이라는 네트웍을 기반으로 다양한 정보를 접할 수 있게 됨으로써 필요한 정보를 보다 빠르게 검색해야 하는 필요성이 생기게 되었다. 지금까지는 다양하고 방대한 데이터들을 정보의 형태로 가공하여 DB를 중심으로 유용한 정보를 제공하였지만, 이제는 효과적인 정보의 활용을 위해 정보검색의 중요성이 증대되고 있다. 즉, 흩어져 있는 데이터를 정보의 형태로 변환시키는 것보다 그 정보를 효율적이고 빠르게 검색하여 한차원 높은 'Knowledge' 로써의 역할을 하느냐가 중요하게 된것이다. 본 논문에서는 각 정보들의 검색을 위해 사용되고 있는 기존의 검색기법인 SQL-Based 검색, Full text 검색과 새로 소개되고 있는 Parametric 검색에 대해서 고찰하여보고 다양한 정보의 유형에 대해 효과적인 검색을 위한 방안을 제시하고자 한다.

  • PDF

A study on the performance improvement of learning based on consistency regularization and unlabeled data augmentation (일치성규칙과 목표값이 없는 데이터 증대를 이용하는 학습의 성능 향상 방법에 관한 연구)

  • Kim, Hyunwoong;Seok, Kyungha
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.167-175
    • /
    • 2021
  • Semi-supervised learning uses both labeled data and unlabeled data. Recently consistency regularization is very popular in semi-supervised learning. Unsupervised data augmentation (UDA) that uses unlabeled data augmentation is also based on the consistency regularization. The Kullback-Leibler divergence is used for the loss of unlabeled data and cross-entropy for the loss of labeled data through UDA learning. UDA uses techniques such as training signal annealing (TSA) and confidence-based masking to promote performance. In this study, we propose to use Jensen-Shannon divergence instead of Kullback-Leibler divergence, reverse-TSA and not to use confidence-based masking for performance improvement. Through experiment, we show that the proposed technique yields better performance than those of UDA.

NAND Flash Memory System Management for Lifetime Extension (낸드 플래시 메모리 시스템의 Lifetime 증대를 위한 관리 방법 설계)

  • Park, Yi-Hyun;Lee, Jae-Bin;Kim, Geon-Myung;Lim, Seung-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.23-25
    • /
    • 2019
  • 낸드 플래시 메모리(NAND Flash Memory)는 컴퓨터 시스템의 대용량 저장장치를 위한 소자로써, 대용량화의 주요 원인으로는 메모리 셀(Cell) 당 저장할 수 있는 비트 수를 증가시킴으로써 집적도를 증가시킨 것이다. 그러나, 이러한 집적도의 증가는 에러의 증가를 가져와서 저장장치에서 가장 중요한 신뢰성이 급격하게 저하하는 요인이며, 저장장치의 생명주기(Lifetime)을 감소시키게 된다. 기존에 낸드 플래시 메모리 저장장치의 Lifetime을 증대시키기 위해서 P/E cycle을 고려하여 데이터 영역의 일부를 점점 더 ECC 영역으로 변경시키는 방식을 적용한 바가 있다. 이러한 방식은 데이터 영역의 감소로 인한 저장장치 내에서 관리되는 호스트-플래시 간 데이터 관리 크기의 미스매치로 인한 여러 가지 오버 헤드를 생성한다. 본 연구에서는 P/E cycle에 따른 데이터 영역의 ECC 영역으로의 전환을 통한 Lifetime을 증가시키는 방식에 있어서, 오버헤드를 줄이기 위한 캐쉬 관리 구조 및 매핑 관리 구조에 대한 설계를 진행하였다. 이러한 설계를 낸드 플래시 메모리 기반 저장장치에 적용할 경우, LifeTime을 증대시키기 위해서 ECC를 데이터 영역으로 확장하는 방식을 사용할 때 저하될 수 있는 일반 읽기 및 쓰기의 성능 저하를 어느 정도 감소시켜줄 수 있을 것으로 기대한다.

KLIMEX(KAIST LIve MPEG-2 EXtension) for high performance videoconferencing (KLIMEX(KAIST LIve MPEG-2 EXtension)를 이용한 고성능 화상회의 시스템)

  • 박승범;전길남
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.476-478
    • /
    • 2000
  • 인터넷의 급속한 수요의 증대와 단말 시스템 성능의 향상은 네트웍 멀티미디어의 사용과 성능에 대한 관심을 증대시키고 있다. 결과적으로 고 대역폭의 네트웍과 고 수준의 시스템을 요구하는 멀티미디어 데이터를 이용한 응용개발이 가능하게 되었다. H.261과 같은 기존의 화상회의 시스템에서 사용되는 비디오 코덱은 상대적으로 낮은 대역폭의 네트웍에서의 사용을 목적으로 설계되었다. MPEG-2 비디오 데이터는 해상도, 대역폭, 및 유연성을 갖춘 고 수준의 비디오 데이터로서 VOD나 영상전송시스템과 같은 응용에서 사용되어질 비디오 데이터로서 많은 연구와 개발이 진행되어지고 있다. 이 논문에서는 KLIMEX(KAIST LIve MPEG-2 EXtenstion)를 구성 및 구현하여 MPEG-2 비디오 데이터를 실시간으로 처리할 수 있도록 하였고 화상회의 운용툴인 vic[\ulcorner]에 통합하여 MPEG-2 비디오 데이터의 전송과 수신이 가능하도록 시스템을 구성하였다. KLIMEX를 구성은 인코딩, 디코딩과 패킷타이징을 핵심모듈로 하고 있고, 각 모듈의 구현상에서 요구사항, 성능향상의 방안과 화상회의 운용툴과의 통합에 대해서 논의 및 분석을 제시한다. MPEG-2를 이용한 네트웍 응용의 다양한 연구는 여기서 제시하는 KLIMEX와 통합시스템 프로토타입을 이용하여 고성능 화상회의 시스템의 연구에 적용할 수 있다.

  • PDF

The Analysis and Design of EMS Component for RFID Middleware (RFID 미들웨어를 위한 EMS 컴포넌트의 분석 및 설계)

  • Ahn Sungwoo;Park Jaekwan;Seok Suwook;Hong Bonghee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.271-273
    • /
    • 2005
  • 많은 글로벌 기업들이 비용절감 및 효율성 증대를 위하여 RFID 시스템을 도입하거나 도입을 적극 검토 중에 있다. RFID 시스템으로부터 획득된 수많은 정보들이 기업의 업무효율을 증대시킬 수 있도록 하기 위해서는 상위 응용 서비스에서 RFID 데이터를 효율적으로 사용할 수 있도록 리더와 응용 서비스 간의 중계 역할을 할 수 있는 RFID 미들웨어의 역할이 매우 중요하다. 이러한 요구사항에 맞춰 최근 EPCglobal에서는 RFID 미들웨어인 ALE(Application Level Event)를 제시하고 있다. ALE는 RFID 리더에 의해 읽혀진 EPC 이벤트 데이터를 실시간으로 수집하여 원본 데이터의 오류를 보정한 후에 사용자와 응용 서비스의 요구에 따라 특정 이벤트 데이터를 필터링하여 보고하는 역할을 한다. 본 논문에서는 ALE의 실시간 EPC 이벤트 데이터 처리를 위한 EMS(Event Management System) 컴포넌트를 제시하며 EMS에 대한 요구사항을 분석하고 설계하였다. EMS 컴포넌트는 RFID 리더를 통해서 끊임없이 들어오는 스트링 형태의 EPC 이벤트 데이터를 블록킹 없이 수집하는 역할을 한다. 또한, RFID 리더에서 수집한 데이터의 보정 및 필요 데이터 추출을 위한 다양한 필터링 기능을 제공함으로써 수집된 데이터의 정확성을 높이며 신속한 데이터 제공을 가능하게 한다.

  • PDF

소상공인 창업자의 자금공급 확대를 위한 빅데이터 활용 방안연구

  • Lee, Ju-Hui;Dong, Hak-Rim
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2018.04a
    • /
    • pp.67-74
    • /
    • 2018
  • 소상공인 창업자들이 자금조달의 대부분을 은행 대출에 의존하고 있는 가운데 소규모 자금 조달을 필요로 하는 이들을 위해 핀테크 기반의 새로운 금융서비스를 통해 소상공인 창업자의 금융 공급을 확산할 필요가 있다. 이러한 환경 변화 패러다임에서 본 연구는 빅데이터와 핀테크 솔루션의 활용이 소상공인의 매출과 금융지원에 미치는 영향을 살펴보기 위해 실제로 공공과 민간의 상권빅데이터자료를 수집하여 분석을 수행하였다. 이를 통해 소상공인에 대한 금융혜택 증대를 위한 사업장의 매출증대 등 소상공인 창업자의 사업성 평가에 필요한 주요변수들을 상권빅데이터를 실증적으로 분석하여 효과성을 검증하는 것이 본 연구의 목적이다. 특히 자금의 대부분을 정책자금을 통해 조달하는 소상공인들이 일반 은행에서도 중소기업 대출의 하나로 비중 있게 이루어질 수 있도록 기존에 활용되지 못한 빅데이터 변수들을 탐색하여 소상공인의 경쟁력 향상을 위한 효율적인 금융지원이 가능함을 확인하고자 하였다. 본 연구에서는 소상공인 창업자의 대출 등 금융지원 확대를 위한 사업성 평가에 상권빅데이터의 활용 가능성이 있는지를 중심으로 문헌적 연구방법 연구와 실증적 분석을 병행하였다. 본 연구는 핀테크와 빅데이터의 활용이 향후 소상공인 자금 조달의 발전 방향이 어떻게 되어야하는지를 모색해야하며, 소상공인을 포함하는 중소기업 신용평가방식의 발전 방향을 구체적으로 모색되어야 할 시점임을 의미하고 있다.

  • PDF

공간 데이터 마이닝을 활용한 은행고객분석 -강남서초구를 중심으로-

  • 최경희;황철수
    • Proceedings of the KGS Conference
    • /
    • 2003.05a
    • /
    • pp.199-202
    • /
    • 2003
  • 정보기술과 컴퓨터 기술의 급속한 성장에 따른 데이터의 양적 증가로 최근 다양한 분야에서 과학적이고 정교한 분석이 요구되고 있다. 특히 은행분야는 금융환경과 소비자의 태도변화로 오래 전부터 축적해온 고객에 대한 방대한 데이터를 효과적으로 분석하여 이를 통한 사업성 증대를 뫼하고 있다 대부분의 은행의 고객 데이터 분석에서는 고객의 거래 정보나 인구통계 정보 분석이 대부분을 차지한다. (중략)

  • PDF

Job Classifying method based on Data Traits for Increased Efficiency of Computational Resources in Distributed Environment (분산 환경에서 계산 자원의 효율 증대를 위한 데이터 특성 기반의 작업 분류방법)

  • Moon, Sung-Hwan;Kim, Jae-Kwon;Kim, Tae-Young;Choi, Jeong-Seok;Cho, Kyu-Cheol;Lee, Jong-Sik
    • Journal of the Korea Society for Simulation
    • /
    • v.23 no.4
    • /
    • pp.219-228
    • /
    • 2014
  • Various computational resources in distributed environment are to build a high-performance computing environments through virtualization technology. Recently, there is a growing need for a complicated process due to the improvement of the user-level application, which has led to demand for high-performance computing. The requested job from users is composed of data. And because of each data has own characteristics, the classifier may consider the features of data. In this paper, we propose Job Classifying method based on Data Traits for Increased Efficiency of Computational Resources in Distributed Environment (JCDT). JCDT classifies the job by data traits of the users' request, is expected to improve the job processing time and increase the processing speed of the calculation resources.