• 제목/요약/키워드: 데이터 증대

검색결과 1,477건 처리시간 0.036초

심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색 (Search of an Optimal Sound Augmentation Policy for Environmental Sound Classification with Deep Neural Networks)

  • 박진배;;배성호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.18-21
    • /
    • 2020
  • 심층 신경망은 영상 분류, 음성 인식, 그리고 문자 번역 등 다양한 분야에서 효과적인 성능을 보여주고 있다. 신경망의 구조 변화, 신경망 간의 정보 전달, 그리고 학습에 사용되는 데이터 증대 등의 확장된 연구를 통해 성능은 더욱 발전하고 있다. 그 중에서도 데이터 증대는 기존에 수집한 데이터의 변형을 통해 심층 신경망에 더 다양한 데이터를 제공함으로써 더욱 일반화된 신경망을 학습시기키는 것을 목표로 한다. 하지만 기존의 음향 관련 신경망 연구에서는 모델의 학습에 사용되는 데이터 증대 방법의 연구가 영상 처리 분야만큼 다양하게 이루어지지 않았다. 최근 영상 처리 분야의 데이터 증대 연구는 학습에 사용되는 데이터와 모델에 따라 최적의 데이터 증대 방법이 다르다는 것을 실험적으로 보여주었다. 이에 영감을 받아 본 논문은 자연에서 발생하는 음향을 분류하는데 있어서 최적의 데이터 증대 방법을 실험적으로 찾으며, 그 과정을 소개한다. 음향에 잡음 추가, 피치 변경 혹은 스펙트로그램의 일부 제한 등의 데이터 증대 방법을 다양하게 조합하는 실험을 통해 경험적으로 어떤 증대 방법이 효과적인지 탐색했다. 결과적으로 ESC-50 자연 음향 데이터 셋에 최적화된 데이터 증대 방법을 적용함으로써 분류 정확도를 89%로 향상시킬 수 있었다.

  • PDF

심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색 (Search for Optimal Data Augmentation Policy for Environmental Sound Classification with Deep Neural Networks)

  • 박진배;;배성호
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.854-860
    • /
    • 2020
  • 심층 신경망은 영상 분류 그리고 음성 인식 등 다양한 분야에서 뛰어난 성능을 보여주었다. 그 중에서 데이터 증대를 통해 생성된 다양한 데이터는 신경망의 성능을 향상하게 시키는 데 중요한 역할을 했다. 일반적으로 데이터의 변형을 통한 증대는 신경망이 다채로운 예시를 접하고 더 일반적으로 학습되는 것을 가능하게 했다. 기존의 영상 분야에서는 신경망 성능 향상을 위해 새로운 증대 방법을 제시할 뿐만 아니라 데이터와 신경망의 구조에 따라 변화할 수 있는 최적의 데이터 증대 방법의 탐색 방법을 제안해왔다. 본 논문은 이에 영감을 받아 음향 분야에서 최적의 데이터 증대 방법을 탐색하는 것을 목표로 한다. 잡음 추가, 음의 높낮이 변경 혹은 재생 속도를 조절하는 등의 증대 방법들을 다양하게 조합하는 실험을 통해 경험적으로 어떤 증대 방법이 가장 효과적인지 탐색했다. 결과적으로 자연 음향 데이터 세트 (ESC-50)에 최적화된 데이터 증대 방법을 적용함으로써 분류 정확도를 향상하게 시킬 수 있었다.

Web 상에서의 정보검색기법에 관한 고찰

  • 김준오
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.270-281
    • /
    • 1997
  • 현재 기업 뿐 아니라 개인에도 정보의 중성이 증대되고 있는 실정이다. 특히, 정보기술의 활용과 빠른 컴퓨팅 환경의 변화 및 인터넷이라는 네트웍을 기반으로 다양한 정보를 접할 수 있게 됨으로써 필요한 정보를 보다 빠르게 검색해야 하는 필요성이 생기게 되었다. 지금까지는 다양하고 방대한 데이터들을 정보의 형태로 가공하여 DB를 중심으로 유용한 정보를 제공하였지만, 이제는 효과적인 정보의 활용을 위해 정보검색의 중요성이 증대되고 있다. 즉, 흩어져 있는 데이터를 정보의 형태로 변환시키는 것보다 그 정보를 효율적이고 빠르게 검색하여 한차원 높은 'Knowledge' 로써의 역할을 하느냐가 중요하게 된것이다. 본 논문에서는 각 정보들의 검색을 위해 사용되고 있는 기존의 검색기법인 SQL-Based 검색, Full text 검색과 새로 소개되고 있는 Parametric 검색에 대해서 고찰하여보고 다양한 정보의 유형에 대해 효과적인 검색을 위한 방안을 제시하고자 한다.

  • PDF

일치성규칙과 목표값이 없는 데이터 증대를 이용하는 학습의 성능 향상 방법에 관한 연구 (A study on the performance improvement of learning based on consistency regularization and unlabeled data augmentation)

  • 김현웅;석경하
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.167-175
    • /
    • 2021
  • 준지도학습(semi-supervised learning)은 목표값이 있는 데이터와 없는 데이터를 모두 이용하는 학습방법이다. 준지도학습에서 최근에 많은 관심을 받는 일치성규칙(consistency regularization)과 데이터 증대를 이용한 준지도학습(unsupervised data augmentation; UDA)은 목표값이 없는 데이터를 증대하여 학습에 이용한다. 그리고 성능 향상을 위해 훈련신호강화(training signal annealing; TSA)와 신뢰기반 마스킹(confidence based masking)을 이용한다. 본 연구에서는 UDA에서 사용하는 KL-정보량(Kullback-Leibler divergence)과 TSA 대신 JS-정보량(Jensen-Shanon divergene)과 역-TSA를 사용하고 신뢰기반 마스킹을 제거하는 방법을 제안한다. 실험을 통해 제안된 방법의 성능이 더 우수함을 보였다.

낸드 플래시 메모리 시스템의 Lifetime 증대를 위한 관리 방법 설계 (NAND Flash Memory System Management for Lifetime Extension)

  • 박이현;이재빈;김건명;임승호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.23-25
    • /
    • 2019
  • 낸드 플래시 메모리(NAND Flash Memory)는 컴퓨터 시스템의 대용량 저장장치를 위한 소자로써, 대용량화의 주요 원인으로는 메모리 셀(Cell) 당 저장할 수 있는 비트 수를 증가시킴으로써 집적도를 증가시킨 것이다. 그러나, 이러한 집적도의 증가는 에러의 증가를 가져와서 저장장치에서 가장 중요한 신뢰성이 급격하게 저하하는 요인이며, 저장장치의 생명주기(Lifetime)을 감소시키게 된다. 기존에 낸드 플래시 메모리 저장장치의 Lifetime을 증대시키기 위해서 P/E cycle을 고려하여 데이터 영역의 일부를 점점 더 ECC 영역으로 변경시키는 방식을 적용한 바가 있다. 이러한 방식은 데이터 영역의 감소로 인한 저장장치 내에서 관리되는 호스트-플래시 간 데이터 관리 크기의 미스매치로 인한 여러 가지 오버 헤드를 생성한다. 본 연구에서는 P/E cycle에 따른 데이터 영역의 ECC 영역으로의 전환을 통한 Lifetime을 증가시키는 방식에 있어서, 오버헤드를 줄이기 위한 캐쉬 관리 구조 및 매핑 관리 구조에 대한 설계를 진행하였다. 이러한 설계를 낸드 플래시 메모리 기반 저장장치에 적용할 경우, LifeTime을 증대시키기 위해서 ECC를 데이터 영역으로 확장하는 방식을 사용할 때 저하될 수 있는 일반 읽기 및 쓰기의 성능 저하를 어느 정도 감소시켜줄 수 있을 것으로 기대한다.

KLIMEX(KAIST LIve MPEG-2 EXtension)를 이용한 고성능 화상회의 시스템 (KLIMEX(KAIST LIve MPEG-2 EXtension) for high performance videoconferencing)

  • 박승범;전길남
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.476-478
    • /
    • 2000
  • 인터넷의 급속한 수요의 증대와 단말 시스템 성능의 향상은 네트웍 멀티미디어의 사용과 성능에 대한 관심을 증대시키고 있다. 결과적으로 고 대역폭의 네트웍과 고 수준의 시스템을 요구하는 멀티미디어 데이터를 이용한 응용개발이 가능하게 되었다. H.261과 같은 기존의 화상회의 시스템에서 사용되는 비디오 코덱은 상대적으로 낮은 대역폭의 네트웍에서의 사용을 목적으로 설계되었다. MPEG-2 비디오 데이터는 해상도, 대역폭, 및 유연성을 갖춘 고 수준의 비디오 데이터로서 VOD나 영상전송시스템과 같은 응용에서 사용되어질 비디오 데이터로서 많은 연구와 개발이 진행되어지고 있다. 이 논문에서는 KLIMEX(KAIST LIve MPEG-2 EXtenstion)를 구성 및 구현하여 MPEG-2 비디오 데이터를 실시간으로 처리할 수 있도록 하였고 화상회의 운용툴인 vic[\ulcorner]에 통합하여 MPEG-2 비디오 데이터의 전송과 수신이 가능하도록 시스템을 구성하였다. KLIMEX를 구성은 인코딩, 디코딩과 패킷타이징을 핵심모듈로 하고 있고, 각 모듈의 구현상에서 요구사항, 성능향상의 방안과 화상회의 운용툴과의 통합에 대해서 논의 및 분석을 제시한다. MPEG-2를 이용한 네트웍 응용의 다양한 연구는 여기서 제시하는 KLIMEX와 통합시스템 프로토타입을 이용하여 고성능 화상회의 시스템의 연구에 적용할 수 있다.

  • PDF

RFID 미들웨어를 위한 EMS 컴포넌트의 분석 및 설계 (The Analysis and Design of EMS Component for RFID Middleware)

  • 안성우;박재관;석수욱;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.271-273
    • /
    • 2005
  • 많은 글로벌 기업들이 비용절감 및 효율성 증대를 위하여 RFID 시스템을 도입하거나 도입을 적극 검토 중에 있다. RFID 시스템으로부터 획득된 수많은 정보들이 기업의 업무효율을 증대시킬 수 있도록 하기 위해서는 상위 응용 서비스에서 RFID 데이터를 효율적으로 사용할 수 있도록 리더와 응용 서비스 간의 중계 역할을 할 수 있는 RFID 미들웨어의 역할이 매우 중요하다. 이러한 요구사항에 맞춰 최근 EPCglobal에서는 RFID 미들웨어인 ALE(Application Level Event)를 제시하고 있다. ALE는 RFID 리더에 의해 읽혀진 EPC 이벤트 데이터를 실시간으로 수집하여 원본 데이터의 오류를 보정한 후에 사용자와 응용 서비스의 요구에 따라 특정 이벤트 데이터를 필터링하여 보고하는 역할을 한다. 본 논문에서는 ALE의 실시간 EPC 이벤트 데이터 처리를 위한 EMS(Event Management System) 컴포넌트를 제시하며 EMS에 대한 요구사항을 분석하고 설계하였다. EMS 컴포넌트는 RFID 리더를 통해서 끊임없이 들어오는 스트링 형태의 EPC 이벤트 데이터를 블록킹 없이 수집하는 역할을 한다. 또한, RFID 리더에서 수집한 데이터의 보정 및 필요 데이터 추출을 위한 다양한 필터링 기능을 제공함으로써 수집된 데이터의 정확성을 높이며 신속한 데이터 제공을 가능하게 한다.

  • PDF

소상공인 창업자의 자금공급 확대를 위한 빅데이터 활용 방안연구

  • 이주희;동학림
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2018년도 춘계학술대회
    • /
    • pp.67-74
    • /
    • 2018
  • 소상공인 창업자들이 자금조달의 대부분을 은행 대출에 의존하고 있는 가운데 소규모 자금 조달을 필요로 하는 이들을 위해 핀테크 기반의 새로운 금융서비스를 통해 소상공인 창업자의 금융 공급을 확산할 필요가 있다. 이러한 환경 변화 패러다임에서 본 연구는 빅데이터와 핀테크 솔루션의 활용이 소상공인의 매출과 금융지원에 미치는 영향을 살펴보기 위해 실제로 공공과 민간의 상권빅데이터자료를 수집하여 분석을 수행하였다. 이를 통해 소상공인에 대한 금융혜택 증대를 위한 사업장의 매출증대 등 소상공인 창업자의 사업성 평가에 필요한 주요변수들을 상권빅데이터를 실증적으로 분석하여 효과성을 검증하는 것이 본 연구의 목적이다. 특히 자금의 대부분을 정책자금을 통해 조달하는 소상공인들이 일반 은행에서도 중소기업 대출의 하나로 비중 있게 이루어질 수 있도록 기존에 활용되지 못한 빅데이터 변수들을 탐색하여 소상공인의 경쟁력 향상을 위한 효율적인 금융지원이 가능함을 확인하고자 하였다. 본 연구에서는 소상공인 창업자의 대출 등 금융지원 확대를 위한 사업성 평가에 상권빅데이터의 활용 가능성이 있는지를 중심으로 문헌적 연구방법 연구와 실증적 분석을 병행하였다. 본 연구는 핀테크와 빅데이터의 활용이 향후 소상공인 자금 조달의 발전 방향이 어떻게 되어야하는지를 모색해야하며, 소상공인을 포함하는 중소기업 신용평가방식의 발전 방향을 구체적으로 모색되어야 할 시점임을 의미하고 있다.

  • PDF

공간 데이터 마이닝을 활용한 은행고객분석 -강남서초구를 중심으로-

  • 최경희;황철수
    • 대한지리학회:학술대회논문집
    • /
    • 대한지리학회 2003년도 춘계학술대회
    • /
    • pp.199-202
    • /
    • 2003
  • 정보기술과 컴퓨터 기술의 급속한 성장에 따른 데이터의 양적 증가로 최근 다양한 분야에서 과학적이고 정교한 분석이 요구되고 있다. 특히 은행분야는 금융환경과 소비자의 태도변화로 오래 전부터 축적해온 고객에 대한 방대한 데이터를 효과적으로 분석하여 이를 통한 사업성 증대를 뫼하고 있다 대부분의 은행의 고객 데이터 분석에서는 고객의 거래 정보나 인구통계 정보 분석이 대부분을 차지한다. (중략)

  • PDF

분산 환경에서 계산 자원의 효율 증대를 위한 데이터 특성 기반의 작업 분류방법 (Job Classifying method based on Data Traits for Increased Efficiency of Computational Resources in Distributed Environment)

  • 문성환;김재권;김태영;최정석;조규철;이종식
    • 한국시뮬레이션학회논문지
    • /
    • 제23권4호
    • /
    • pp.219-228
    • /
    • 2014
  • 분산 환경에 존재하는 다양한 이기종의 계산 자원은 가상화 기술을 통해 통합된 고성능 컴퓨팅 환경을 구축한다. 최근, 사용자 수준의 향상으로 인해 복잡한 응용 작업의 처리에 대한 요구가 증가하고 있으며, 이는 고성능 컴퓨팅에 대한 수요로 이어지고 있다. 사용자가 요구하는 각각의 작업에는 데이터가 포함되어 있고, 각각의 데이터는 고유의 특성을 가지고 있으므로, 작업의 분류와 처리는 데이터의 특성이 고려되어야 한다. 본 논문에서는 분산 환경에서 계산 자원의 효율 증대를 위한 데이터 특성 기반의 작업 분류방법(JCDT : Job Classifying method based on Data Traits for Increased Efficiency of Computational Resources in Distributed Environment) 을 제안한다. 제안하는 JCDT 는 사용자가 요구하는 작업이 지닌 데이터의 특성을 기반으로 작업을 분류하여, 계산 자원의 효율 증대와 작업 처리속도를 향상시킬 수 있을 것으로 기대한다.