• 제목/요약/키워드: 데이터부족문제

검색결과 539건 처리시간 0.03초

무선 센서 네트워크 환경에서 기계 학습을 이용한 데이터 추론에 관한 연구 (A Study on Data Inference using Machine Learning in WSN Environment)

  • 정용진;조경우;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.571-573
    • /
    • 2018
  • 무선 센서 네트워크 환경에서 센서 노드로부터 수집되는 데이터의 소실은 센서 노드의 히든노드 및 전력 부족 등의 문제로 발생된다. 이러한 문제를 해결하기 위해 효율적으로 망을 유지하기 위한 연구가 활발히 진행되어 왔으나, 망 유지가 불가능한 상황의 연구는 전무하다. 따라서 망 유지가 불가능한 상황에서의 소실된 데이터를 추론하기 위한 연구가 필요하다. 본 논문에서는 소실된 데이터를 추론하기 위해 특정 도시의 미세 먼지 데이터를 이용한다. 기계 학습을 통해 축적된 데이터의 분석 및 소실된 데이터의 추론 가능성을 확인한다.

  • PDF

협업 클라우드 환경에서의 요청 패턴 기반 자원 공급 기법 (Request Pattern based Resource Provisioning Method in Cloud Collaboration Environment)

  • 강동기;김병상;윤찬현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.127-129
    • /
    • 2012
  • 고용량 멀티미디어 및 대용량 콘텐츠와 같은 트래픽이 급속도로 증가하고 사용자들의 다양한 요구사항이 발생함에 따라 기존의 단일 클라우드 서비스 환경의 자원 부족 문제가 대두되고 있다. 이를 극복하기 위해 협업 클라우드 환경이 제안되었는데, 이는 이종의 클라우드 서비스 환경을 통합하여 부족한 자원 문제를 해결하고, 클라우드 서비스 제공자들의 이익을 최대화시키는 것에 목적을 두고 있다. 본 논문에서는 협업 클라우드 환경에서 각 데이터 센터내의 자원을 최적으로 분배하고 입력되는 사용자 요청 패턴을 반영할 수 있는 수익 함수 모델을 제안하고 이에 따라 각 서비스 제공자들의 이익이 증가함을 보인다.

아바타 수어 서비스를 위한 한국어-한국수어 변환 기술 연구 (Study on Korean-Korean Sign language Translation Technology for Avatar Sign language Service)

  • 최지훈;이한규;안충현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.459-460
    • /
    • 2020
  • 한국수화언어가 2016년 2월 제정된 한국수화언어법(약칭, 한국수어법)을 통해 한국어와 동일한 대한민국 공식 언어로 인정받았지만, 사회적 인식 부족과 서비스 비용 문제로 널리 사용되지 못하고 있다. 그리고 일상생활에서 접하는 많은 한국어 정보들 조차도 농인들은 쉽게 이해하기 어렵기 때문에 정보 접근에 대한 차별성 문제가 지속적으로 언급되고 있다. 이를 해결하기 위한 대안으로 아바타를 이용한 수어 서비스가 대두되고 있지만, 한국어-한국수어 번역을 위한 자연어처리 기술의 한계로 인해 일기예보와 같이 탬플릿 기반의 서비스에 국한되거나 비수지신호 표현에 대한 기술 부족으로 인해서 서비스 상용화까지 도달하지 못하고 있는 상황이다. 본 논문에서는 딥러닝 기반으로 한국어에서 한국수어로 변환하기 위한 병렬 말뭉치 데이터 전사 및 변환 시스템 설계 방법을 제안하고자 한다.

  • PDF

피로수명 계산용 Off-Line 전산 프로그램 개발

  • 김종석
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1997년도 춘계학술발표회논문집(2)
    • /
    • pp.526-531
    • /
    • 1997
  • 기존의 발전소 피로수명 평가 프로그램들은 On-Line Fatigue Analysis애 중점을 두고 개발되어 운전 초기부터 Transient모니터링 프로그램이 설치되는 시점까지의 Transient 데이터가 확보되지 않은 오래된 발전소의 경우 전 수명기간 동안의 피로수명 계산에 어려움이 많다. 따라서 본 연구에서는 특별한 경우를 제외하고는 Off-Line 계산을 하는 것이 경제적이고 피로수명 평가에 문제가 되지 않는다고 판단하여 Transient 모니터링을 용해 Transient 종류를 파악하고 이를 데이터베이스화 한뒤 충분한 시간을 가지고 Transient 이력 과 응력데이타를 조합하여 CUF를 계산하는 등 프로그램 기능의 모듈화를 시도하여 필요한 기능을 지속적으로 보완 개발해 나갈 수 있도록 하였다. 본 Software는 국내 원전이 Transient Counting이나 피로분석의 전산화와 관련한 경험이 부족하고 또 외국 프로그램을 도입하여 사용하기에는 과거 데이터가 부족하여 활용에 어려움이 많을 것을 고려하여 기존의 수작업에 의한 Fatigue Evaluation 의 불편함을 보완하고 On-Line Analysis의 필요성과 Off-Line Analysis외 경제성을 적절히 조합하여 현재 발전소 환경에서 가장 적절히 사용할 수 있도록 개발 을 추진하였고 향후 필요한 기능은 지속적으로 보완함으로써 발전소 수명관리에 유용하게 사용될 것이다.

  • PDF

전이 학습과 SHAP 분석을 이용한 설명가능한 동물 울음소리 분류 기법 (Explainable Animal Sound Classification Scheme using Transfer Learning and SHAP Analysis)

  • 이재승;문재욱;박성우;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.768-771
    • /
    • 2024
  • 인간의 산업 활동으로 인하여 동물들의 생존이 위협받으면서, 동물의 서식 분포를 효과적으로 파악할 수 있는 자동 야생동물 모니터링 기술의 필요성이 점점 더 커지고 있다. 그중에서도 동물 소리 분류 기술은 시각적으로 식별이 어려운 동물에게도 효과적으로 적용할 수 있는 장점으로 인하여 널리 사용되고 있다. 최근 심층학습 기반의 분류 모델들이 좋은 판별 성능을 보여주고 있어 동물 소리 분류에 많이 사용되고 있지만, 희귀종과 같이 개체 수가 적어 데이터가 부족한 경우에는 학습이 제대로 이루어지지 않을 수 있다. 또한, 이러한 모델들은 모델 내부에서 일어나는 추론 과정을 알 수 없어 결과를 완전히 신뢰하고 사용하는 데 제약이 따른다. 이에 본 논문에서는 전이 학습을 통해 데이터 부족 문제를 고려하고, SHAP을 이용하여 분류 모델의 추론 과정을 해석하는 설명가능한 동물 소리 분류 기법을 제안한다. 실험 결과, 제안하는 기법은 지도 학습을 한 경우보다 분류 성능이 향상됨을 확인하였으며, SHAP 분석을 통해 모델의 분류 근거를 이해할 수 있었다.

  • PDF

이미지 생성 모델을 이용한 패턴 결함 데이터 증강에 대한 연구 (A Study of Pattern Defect Data Augmentation with Image Generation Model)

  • 김병준;서용덕
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.79-84
    • /
    • 2023
  • 이미지 생성 모델은 다양한 분야에 적용되어 데이터 부족 문제와 시간 및 비용 문제를 극복하고 있다. 그러나 규칙적 패턴 이미지에서의 이미지 생성과 해당 데이터의 결함 검출에는 한계를 가진다. 본 논문에서는 이미지 생성 모델의 패턴 이미지 생성의 가능성을 확인하고 OLED 패널의 결함 검출을 위한 데이터 증강에 적용하였다. OLED 결함 검출 모델을 학습하기 위해 필요한 데이터는 OLED 패널의 높은 비용 문제로 실제 데이터 세트를 확보하기 어렵다. 그렇기 때문에 해당 데이터 세트를 확보한다 하더라도 여러가지 결함 유형을 정의하고 분류하는 작업이 필요하다. 이를 위한 가상의 기반 데이터 세트를 획득할 OLED 패널 결함 데이터 획득 시스템을 소개하고, 이미지 생성 모델로 해당 데이터를 증강한다. 또, 확산모델에서의 패턴 이미지 생성의 어려움을 확인하여 가능성을 제안하고, 이미지 생성 모델 이용한 데이터 증강 및 결함 검출 데이터 증강의 제한 사항을 개선하였다.

SDN 스위치의 효율적인 TCAM 사용을 위한 플로우 엔트리 클러스터링 기법 (Flow Entry Clustering for Space-Efficient TCAM utilization in SDN Switches)

  • 이용승;염상길;김동수;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.196-198
    • /
    • 2014
  • 최근 차세대 네트워크 패러다임으로 주목받는 소프트웨어 정의 네트워킹 (SDN)에서는 네트워크를 컨트롤 플레인과 데이터 플레인으로 나누고 중앙집중형 제어를 통해 효과적이고 유연한 네트워크 관리를 가능하게 한다. 하지만 잦은 컨트롤 이벤트 발생으로 인한 컨트롤러 및 컨트롤 채널의 부하와 거대한 플로우 엔트리 크기로 인한 스위치 내 TCAM(Temary Content Addressable Memory) 메모리 부족문제 등의 본질적인 문제로 실제 네트워크 적용 시 확장성 문제가 야기된다. 이러한 문제를 해결하기 위해 기존의 연구들은 컨트롤러의 연산능력을 향상시키거나, 컨트롤 이벤트의 발생을 줄이는데 초점이 맞춰져 왔으며, 한정적인 TCAM 공간의 효율적인 사용에 대한 연구는 부족한 상황이다. 따라서 본 논문에서는 효율적인 TCAM 자원 활용을 위한 플로우테이블 관리 기법을 제안한다. 제안 기법은 플로우 엔트리의 클러스터링을 통해 플로우 엔트리를 특성에 따라 그룹화하고 사용빈도를 기준으로 분할 및 병합을 수행함으로써 스위치 내의 가용한 플로우 수를 최대화한다.

베이지안 접근법을 이용한 입력변수 및 근사모델 불확실성 하에서의 신뢰성 분석 (Reliability Analysis under Input Variable and Metamodel Uncertainty using Bayesian Approach)

  • 안다운;원준호;최주호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2009년도 정기 학술대회
    • /
    • pp.97-100
    • /
    • 2009
  • 신뢰성 분석은 불확실성으로 인한 제품의 성능 변동을 안전확률이나 파괴확률로 정량화 하여 설계에 이용하기 위해 연구되어 왔다. 불확실성은, 데이터의 양에 따라-물질의 본질적인 특성으로서의 많은 데이터가 주어진 경우의 물리적 불확실성과 부족한 데이터에서의 인식론적 불확실성으로 구분되고, 불확실성을 갖는 대상에 따라-입력변수 및 근사모델 불확실성으로 구분된다. 물리적 불확실성에 대한 연구는 많이 진행되어 왔지만, 실제 산업현장에는 부족한 데이터로 인한 인식론적 불확실성이 지배적이며 이에 대한 연구는 최근에서야 진행되고 있다. 불확실성을 고려하는 신뢰성 기반 설계에는 효율성을 위해 실제모델을 대체하는 근사모델이 이용되는데, 근사모델법 자체에 대한 연구는 많이 진행되어 왔으나, 근사모델 이기 때문에 존재하는 불확실성을 고려한 연구는 최근에서야 연구되기 시작하였다. 본 연구에서는 베이지안 접근법에 기반하여 입력변수 및 근사모델 불확실성을 통합 고려하는 새로운 신뢰성 분석 기법을 제시하고 수치예제를 통해 타당성을 증명한 후, 이를 공학문제에 적용한다.

  • PDF

적은 양의 데이터에 적용 가능한 계층별 데이터 증강 알고리즘 (A layered-wise data augmenting algorithm for small sampling data)

  • 조희찬;문종섭
    • 인터넷정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.65-72
    • /
    • 2019
  • 데이터 증강(Data Augmentation)은 적은 양의 데이터를 바탕으로 다양한 알고리즘을 통해 데이터의 양을 늘리는 기술이다. 현실문제를 해결하기 위해 기계학습 및 딥러닝 기법을 사용하는 경우, 데이터 셋이 부족한 경우가 많다. 데이터의 부족은 모델 학습 시, 데이터 셋의 특징을 잘 반영하지 못하는 것 이외에도 과소적합 및 과적합에 빠질 위험이 크다. 따라서 본 논문에서는 오토인코더와 고유값 분해를 기반으로 하는 데이터 증강 기법을 통해 데이터를 증강 시키고 이를 심층 신경망의 각 층 마다 적용하여, 심층 신경망을 효과적으로 사전 학습하는 방법을 제시한다. 이후, WOBC 데이터와 WDBC 데이터에 대해 실험을 통하여 논문에서 제안하는 방법이 분류 정확도를 향상시키는지 측정하고 기존 연구들과 비교함으로써 제안한 방법이 실질적으로 의미가 있는 데이터를 생성하고 모델의 학습에 효과적임을 보인다.

비디오 데이터 보강을 이용한 인물 개체 분할 (Human Instance Segmentation using Video Data Augmentation)

  • 전현진;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.532-534
    • /
    • 2022
  • 본 논문에서는 미생 드라마 비디오들을 토대로 구축한 비디오 인물 개체 분할 데이터 집합인 MHIS를 소개하고, 등장인물 클래스 간의 심각한 데이터 불균형 문제를 효과적으로 해결하기 위한 새로운 비디오 데이터 보강 기법인 CDVA를 제안한다. 기존의 비디오 데이터 보강 기법들과는 달리, 새로운 CDVA 보강 기법은 비디오의 시공간적 맥락을 충분히 고려해서 부족한 인물 클래스의 훈련 비디오 데이터들을 추가 생성함으로써, 비디오 개체 분할 신경망 모델의 성능을 효과적으로 개선시킬 수 있다. 본 논문에서는 정량 및 정성 실험들을 통해, 제안 비디오 데이터 보강 기법의 우수성을 입증한다.