• 제목/요약/키워드: 정보불균형

검색결과 593건 처리시간 0.03초

대화에서 멀티태스크 학습을 이용한 감정 및 화행 분류 (Emotion and Speech Act classification in Dialogue using Multitask Learning)

  • 신창욱;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.532-536
    • /
    • 2018
  • 심층인공신경망을 이용한 대화 모델링 연구가 활발하게 진행되고 있다. 본 논문에서는 대화에서 발화의 감정과 화행을 분류하기 위해 멀티태스크(multitask) 학습을 이용한 End-to-End 시스템을 제안한다. 우리는 감정과 화행을 동시에 분류하는 시스템을 개발하기 위해 멀티태스크 학습을 수행한다. 또한 불균형 범주 분류를 위해 계단식분류(cascaded classification) 구조를 사용하였다. 일상대화 데이터셋을 사용하여 실험을 수행하였고 macro average precision으로 성능을 측정하여 감정 분류 60.43%, 화행 분류 74.29%를 각각 달성하였다. 이는 baseline 모델 대비 각각 29.00%, 1.54% 향상된 성능이다. 본 논문에서는 제안하는 구조를 이용하여, 발화의 감정 및 화행 분류가 End-to-End 방식으로 모델링 가능함을 보였다. 그리고, 두 분류 문제를 하나의 구조로 적절히 학습하기 위한 방법과 분류 문제에서의 범주 불균형 문제를 해결하기 위한 분류 방법을 제시하였다.

  • PDF

제품에 대한 부정적 정보 공개의 단기적 효과에 대한 연구 (The Short-Term Effect of Low-Quality Sellers' Voluntary Information Disclosure)

  • 허승
    • 융합정보논문지
    • /
    • 제11권1호
    • /
    • pp.80-90
    • /
    • 2021
  • 본 논문은 시장에서 저품질의 제품을 판매하는 판매자가 언제, 그리고 어떠한 방식으로 품질에 대한 정보를 공개함으로써 이윤을 증대시킬 수 있을지를 이해하고자 한다. 이를 위해 본 논문은 제품의 품질 및 가격, 고객의 위험 인식 수준, 위험과 관련된 비용, 위험에 대한 민감도 등의 요소를 반영한 새로운 이론 모델 분석을 통해 저품질의 제품을 판매하는 판매자가 품질에 대한 부정적인 정보를 자발적으로 공개하여도 고객이 인식하는 위험 수준을 충분히 감소시킬 수만 있다면 단기간에 수요를 증대시킬 수 있음을 보여준다. 또한 본 이론 모델은 이러한 정보 공개가 고객의 위험 수준을 어떻게 조정하느냐에 따라 시장 전체 수요와 경쟁 제품의 수요까지도 증대시킬 수 있다는 점을 보여준다. 본 논문의 연구결과는 제품의 부정적 요소에 대한 정보를 관리하는 마케팅 실무자 뿐 아니라 시장에서의 정보 불균형으로 인해 생기는 여러 문제점들을 해결하고자 하는 정책 담당자에게도 유의미한 시사점을 제공해 줄 것으로 기대된다.

구급서비스의 지역 불균형: 부산시 119 구급활동일지 분석 (Local Imbalance of Emergency Medical Services(EMS): Analyses on 119 EMS Activity Reports of Busan)

  • 이달별
    • 한국지리정보학회지
    • /
    • 제23권3호
    • /
    • pp.161-173
    • /
    • 2020
  • 이 연구는 부산소방재난본부의 119 구급활동일지를 이용하여 부산의 구급서비스의 지역적 불균형을 조사하였다. 2017년 구급신고 자료를 집계구 단위로 취합하여 구급서비스의 수요(신고건수, 인구대비 신고건)와 공급(신고건수, 인구대비 신고건수, 현장도착시간의 평균·변동계수·이상치, 관할구역 외 출동건수)의 공간분포를 GIS 공간통계분석 중 핫스팟분석을 이용하여 분석하였다. 분석결과는 구급서비스의 수요와 공급 모두 집중적으로 나타나는 핫스팟지역과 콜드스팟지역이 명확하게 구분되었으며, 이는 부산 내 구급서비스의 수요 뿐 아니라 공급이 지역적으로 불균형함을 의미한다. 특히 원도심과 그 주변지역과 부산시 외곽지역에서의 구급수요 및 공급에서 극명한 차이를 보였다.

Solar-CTP : 모바일 싱크 기반 태양 에너지 수집형 무선 센서 네트워크를 위한 향상된 CTP (Solar-CTP : An Enhanced CTP for Solar-Powered Wireless Sensor Networks Using a Mobile Sink)

  • 정석현;강민재;노동건
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권4호
    • /
    • pp.77-82
    • /
    • 2020
  • 무선 센서 네트워크(WSN)는 제한된 배터리 자원으로 인해 수명이 짧다는 근본적인 문제뿐 아니라, 고정된 위치의 싱크로 인한 싱크 주변 노드의 에너지 소비가 비정상적으로 증가하는 에너지 불균형 문제도 가지고 있다. 이를 해결하고자, 최근에는 태양 에너지 수집형 노드를 사용하여 에너지를 지속적으로 수집함으로써 배터리 자원 제약 문제를 해결하고, 또한 모바일 싱크를 활용하여 고정된 싱크 노드 근처의 에너지 불균형 문제를 해결하려는 연구들이 활발히 진행되고 있다. 기존의 고정된 싱크 및 배터리 기반의 WSN을 위하여 제안된 유명한 데이터 수집 기법인 CTP(Collection Tree Protocol)도 이와 같은 에너지 제약 및 에너지 사용 불균형 문제는 고려하지 않고 설계되었는데, 따라서 정전 노드 발생 및 트리 구조의 루프화와 같은 네트워크의 안정성(Reliablilty)이 심각하게 저하되는 문제를 내포하고 있었다. 이를 해결하고자, 본 논문에서는 모바일 싱크와 태양에너지 수집형 노드로 구성된 WSN을 위한 향상된 CTP 기법(Solar-CTP)을 제안한다. 제안된 Solar-CTP기법에서는 수집 에너지 및 사용 에너지양 예측을 통해 노드 동작 모드를 결정한다. 아울러 싱크의 주기적인 이동으로 싱크 주변 노드의 에너지 불균형 문제를 해결한다. 성능검증을 통해 기존 CTP에 비해 Solar-CTP의 정전 노드의 수가 줄어들고, 싱크의 데이터 수집량이 향상된 것을 확인하였다.

MarSel : 대용량 SNP 일배체형 데이터에 대한 연관불균형기반의 tagSNP 선택 시스템 (MarSel : LD based tagSNP Selection System for Large-scale SNP Haplotype Dataset)

  • 김상준;여상수;김성권
    • 정보처리학회논문지A
    • /
    • 제13A권1호
    • /
    • pp.79-86
    • /
    • 2006
  • 최근 인간의 다양성과 SNP과의 연관연구에 드는 비용을 줄이기 위해서, 최소의 tagSNP을 선택하는 문제를 해결하기 위한 연구가 이루어지고 있다. 일반적으로 많은 수의 SNP들을 여러 블록으로 분할하여 각 블록 내에서 tagSNP을 선택하는 접근방법이 사용되고 있다. 본 논문에서 구현된 MarSel은 기존의 블록분할 접근 방법의 문제로 볼 수 있는 생물학적 의미의 부족을 해결하고자, 연관불균형(Linkage Disequilibrium, LD)의 개념을 도입한 시스템이다. 기존의 접근방법에서는 생물학적으로 재조합(recombination)이 일어나지 않는 연속된 구간에서도 여러 블록으로 나누어지는 문제가 생겼던 반면, MarSel에서는 연관불균형 계수 |D'|에 의해서 연속된 구간이 하나의 블록으로 유지된 상태에서 tagSNP을 선택하게 된다. 또한 MarSel에서는 각 블록 내에서 tagSNP을 선택 할 때에 엔트로피(entropy) 기반의 최적해 알고리즘을 이용함으로써 최소한의 tagSNP 선택을 보장하게 되며, 기존의 구현된 시스템들보다 더 많은 양의 데이터를 효율적으로 처리할 수 있도록 구현되었기 때문에 염색체 레벨의 연관 연구도 가능하게 해준다.

불균형 데이터 분류를 위한 딥러닝 기반 오버샘플링 기법 (A Deep Learning Based Over-Sampling Scheme for Imbalanced Data Classification)

  • 손민재;정승원;황인준
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권7호
    • /
    • pp.311-316
    • /
    • 2019
  • 분류 문제는 주어진 입력 데이터에 대해 해당 데이터의 클래스를 예측하는 문제로, 자주 쓰이는 방법 중의 하나는 주어진 데이터셋을 사용하여 기계학습 알고리즘을 학습시키는 것이다. 이런 경우 분류하고자 하는 클래스에 따른 데이터의 분포가 균일한 데이터셋이 이상적이지만, 불균형한 분포를 가지고 경우 제대로 분류하지 못하는 문제가 발생한다. 이러한 문제를 해결하기 위해 본 논문에서는 Conditional Generative Adversarial Networks(CGAN)을 활용하여 데이터 수의 균형을 맞추는 오버샘플링 기법을 제안한다. CGAN은 Generative Adversarial Networks(GAN)에서 파생된 생성 모델로, 데이터의 특징을 학습하여 실제 데이터와 유사한 데이터를 생성할 수 있다. 따라서 CGAN이 데이터 수가 적은 클래스의 데이터를 학습하고 생성함으로써 불균형한 클래스 비율을 맞추어 줄 수 있으며, 그에 따라 분류 성능을 높일 수 있다. 실제 수집된 데이터를 이용한 실험을 통해 CGAN을 활용한 오버샘플링 기법이 효과가 있음을 보이고 기존 오버샘플링 기법들과 비교하여 기존 기법들보다 우수함을 입증하였다.

공공기술 사업화를 위한 CTGAN 기반 데이터 불균형 해소 (Resolving CTGAN-based data imbalance for commercialization of public technology)

  • 황철현
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.64-69
    • /
    • 2022
  • 공공기술 사업화는 정부가 주도하는 과학기술의 혁신과 R&D 성과를 민간에 이전하는 것으로 경제 성장을 주도하는 핵심 성과로 인식되고 있다. 따라서 기술 이전을 활성화시키기 위해 성공 요인을 식별하거나 사업화 가능성이 높은 공공기술과 수요기업을 매칭하는 다양한 기계학습의 방법들이 연구되고 있다. 하지만 공공기술 사업화 데이터는 표 형태로 구성되어 있고, 성공-실패 비율이 큰 차이를 보이는 불균형 상태이기 때문에 기계학습 성능이 높지 않는 문제점을 가지고 있다. 이 논문에서는 표 형태로 구성된 공공기술 데이터에서 불균형을 해소하기 위해 CTGAN을 활용하는 방법을 제시한다. 또한 제시된 방법의 효과를 검증하기 위해 실제 공공기술 사업화 데이터를 활용하여 통계적 접근방법인 SMOTE와 비교 실험을 수행하였다. 다수의 실험 사례에서 CTGAN은 공공기술 사업화 성공사례를 안정적으로 예측하는 것을 확인하였다.

데이터셋 유형 분류를 통한 클래스 불균형 해소 방법 및 분류 알고리즘 추천 (Class Imbalance Resolution Method and Classification Algorithm Suggesting Based on Dataset Type Segmentation)

  • 김정훈;곽기영
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.23-43
    • /
    • 2022
  • AI(Artificial Intelligence)를 다양한 산업에서 접목하기 위해 알고리즘 선택에 대한 관심이 증가하고 있다. 알고리즘 선택은 대부분 데이터 과학자의 경험에 의해 결정되는 경우가 많다. 하지만 경험이 부족한 데이터 과학자의 경우 데이터셋 특성 기반의 메타학습(meta learning) 을 통해 알고리즘을 선택한다. 기존의 알고리즘 추천은 선정 과정이 블랙박스이기 때문에 어떠한 근거에 의해 도출되는지 알 수 없었다. 이에 따라 본 연구에서는 k-평균 군집분석을 활용하여 데이터셋 특성에 따라 유형을 나누고 적합한 분류 알고리즘과 클래스 불균형 해소 방법을 탐색한다. 본 연구 결과 네 가지 유형을 도출하였으며 데이터셋 유형에 따라 적합한 클래스 불균형 해소 방법과 분류 알고리즘을 추천하였다.

수급 불균형을 고려한 전력망의 최적 자원 할당을 위한 일치 기반의 분산 알고리즘 (Consensus-Based Distributed Algorithm for Optimal Resource Allocation of Power Network under Supply-Demand Imbalance)

  • 임영훈
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권6호
    • /
    • pp.440-448
    • /
    • 2022
  • 최근 분산 에너지 자원들의 도입으로 전력망의 최적 자원 할당 문제의 중요성이 강조되고 있고, 대규모 전력망의 방대한 양의 데이터를 처리하기 위해 분산 자원 할당 기법이 요구되고 있다. 최적 자원 할당 문제에서 각 발전기의 발전 용량의 한계로 인하여 수급의 균형이 만족하는 경우를 고려한 연구는 많이 진행되고 있지만, 총 요구량이 최대 발전 용량을 초과하는 경우인 수급 불균형을 고려한 연구는 아직 미미한 실정이다. 본 논문에서는 수급 균형인 상황뿐만 아니라 수급 불균형 상황을 고려하여 전력망의 최적 자원 할당을 위한 일치 기반의 분산 알고리즘을 제안한다. 제안하는 분산 알고리즘은 수급 균형을 만족하는 경우에는 최적의 자원을 할당하고, 수급이 불균형한 경우에는 부족한 자원의 양을 계측할 수 있도록 설계하였다. 마지막으로 모의실험을 통하여 제안된 알고리즘의 성능을 검증하였다.

검증데이터 기반의 차별화된 이상데이터 처리를 통한 데이터 불균형 해소 방법 (Resolving data imbalance through differentiated anomaly data processing based on verification data)

  • 황철현
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.179-190
    • /
    • 2022
  • 데이터 불균형은 한 분류의 데이터 수가 다른 분류에 비해 지나치게 크거나 작은 현상을 의미하며. 이로 인해 분류 알고리즘을 활용하는 기계학습에서 성능을 저하시키는 주요 요인으로 제기되고 있다. 데이터 불균형 문제 해결을 위해서 소수 분포 데이터를 증폭하는 다양한 오버 샘플링(Over Sampling) 방법들이 제안되고 있다. 이 가운데 SMOTE는 가장 대표적인 방법으로 소수 분포 데이터의 증폭 효과를 극대화하기 위해 데이터에 포함된 잡음을 제거(SMOTE-IPF)하거나, 경계선만을 강화(Borderline SMOTE) 시키는 다양한 방법들이 출현하였다. 이 논문은 소수분류 데이터를 증폭하는 전통적인 SMOTE 방법에서 이상데이터(Anomaly Data)에 대한 처리방법개선을 통해 궁극적으로 분류성능을 높이는 방법을 제안한다. 제안 방법은 실험을 통해 기존 방법에 비해 상대적으로 높은 분류성능을 일관성 있게 제시하였다.