• 제목/요약/키워드: unbalanced data

검색결과 325건 처리시간 0.027초

전기철도 시스템의 불평형 해석 (Analysis of Voltage Unbalance on Electric Railway System)

  • 이한민;김길동
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 전문대학교육위원
    • /
    • pp.184-190
    • /
    • 2005
  • The railway characteristic, which is concerned, as most utilities is unbalance produced by the large single-phase loads. Here are two theoretical concerns associated with unbalanced loads. First, generator rotor heating resulting from unbalanced current flow, Second, there is the possibility of motor overheating in industrial plants, due to the unbalanced voltage. Therefore, the exact assessment of the voltage unbalance must be carried out preferentially as well as load forecast at stages of designing and planning for the electric railway system. This paper proposes a new analysis model to more effectively estimate voltage unbalance. Numerous distributed circuits in the electric railway system are composed by components. The entire system can be easily modeled by the combination of four-port representation of each component in parallel and/or series. Simulation results using the model are compared with field data, and it verifies the accuracy of the proposed model.

  • PDF

Semi-supervised Software Defect Prediction Model Based on Tri-training

  • Meng, Fanqi;Cheng, Wenying;Wang, Jingdong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.4028-4042
    • /
    • 2021
  • Aiming at the problem of software defect prediction difficulty caused by insufficient software defect marker samples and unbalanced classification, a semi-supervised software defect prediction model based on a tri-training algorithm was proposed by combining feature normalization, over-sampling technology, and a Tri-training algorithm. First, the feature normalization method is used to smooth the feature data to eliminate the influence of too large or too small feature values on the model's classification performance. Secondly, the oversampling method is used to expand and sample the data, which solves the unbalanced classification of labelled samples. Finally, the Tri-training algorithm performs machine learning on the training samples and establishes a defect prediction model. The novelty of this model is that it can effectively combine feature normalization, oversampling techniques, and the Tri-training algorithm to solve both the under-labelled sample and class imbalance problems. Simulation experiments using the NASA software defect prediction dataset show that the proposed method outperforms four existing supervised and semi-supervised learning in terms of Precision, Recall, and F-Measure values.

문서의 불균등 분포를 고려한 단어 불순도 기반 특징 선택 방법 (An Enhanced Feature Selection Method Based on the Impurity of Words Considering Unbalanced Distribution of Documents)

  • 강진범;양재영;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.804-816
    • /
    • 2007
  • 기계 학습 과정에서 수집된 많은 정보들 중에는 학습하고자 하는 개념과 관련이 없거나 중복된 정보를 가진 경우가 많다. 또한 자료 자체에 오류가 있기도 하다. 이와 같이 학습 모델 생성을 위해 수집된 정보를 신뢰할 수 없다면, 학습 과정에서도 정확한 지식 습득이 어렵다. 그래서 기계 학습은 학습 과정에서 정확한 지식 습득을 위해 특징 선택 방법을 사용한다. 특징 선택은 학습할 클래스와 관련이 없거나 중복된 정보를 학습 모델 생성 이전에 제거함으로써 학습 알고리즘의 성능을 향상시킨다. 기존의 특징선택 방법들은 적절한 특징을 선택하기 위하여 문서가 균등하게 분포되어 있다고 가정한다. 하지만, 실제로는 그렇지 않으며, 문서의 수 또는 문서의 길이가 모두 동일한 학습 예제를 준비하는 것도 매우 어렵다. 본 논문에서는 보다 효율적으로 특징을 선택하기 위해 클래스 별 단어의 불순도와 문서의 불균등 분포를 고려한 특징 선택 방법을 제안한다. 클래스를 대표할 수 있는 특징 후보들을 단어의 불순도 측정을 통해 얻고, 문서의 불균등 분포를 고려하여 특징을 선택한다. 실험을 통해 보다 좋은 성능을 보임을 입증한다.

초등학교 5.6학년 학생의 체질량 지수에 따른 신체상 인지, 의식적 식이제한 및 영양불균형 신체증상 (Perceived Body Image, Intentional Caloric Restriction and Physical Manifestations of Unbalanced Nutrition according to Body Mass Index in Fifth and Sixth Grade Elementary School Students)

  • 김보환;최지혜
    • Child Health Nursing Research
    • /
    • 제15권4호
    • /
    • pp.359-366
    • /
    • 2009
  • Purpose: This study was done to identify perceived body image, intentional caloric restriction and physical manifestations of unbalanced nutrition according to the Body Mass Index (BMI) in elementary school students. Methods: The research design was a cross-sectional descriptive study. Data collection was done by using a structured questionnaire that consisted of 34 items. Participants were 151 students in 5th and 6th grades of elementary schools in Gangwon province. Frequency and percentage, one-way ANOVA, and $\chi^2$-test with SPSS WIN 12.0 were used to analyze the data. Results: In elementary school students, over-weight/obesity and normal weight groups reported that they would be satisfied with a thinner body image compared to the present image. The score for intentional caloric restriction was significantly higher in the over-weight/obesity group than in the under-weight group. In physical manifestations of unbalanced nutrition, students in the under-weight group frequently were pale and had dry skin, whereas the over-weight/obesity group reported frequent upper respiratory symptoms. Conclusion: The results suggest that elementary school students need to develop the perception of an adequate body image and to avoid inadequate caloric intake if promotion of the child's growth and development is to be without physical manifestations of unbalanced nutrition.

광 디스크 장치에서 광량 차동증폭에 의한 디스크 진동 검출 방안에 관한 연구 (A Study on Vibration Detection Method of Disc by Differential Amplifying Optical Power in Optical Disc Media)

  • 김진선;곽경섭
    • 한국멀티미디어학회논문지
    • /
    • 제5권2호
    • /
    • pp.215-221
    • /
    • 2002
  • 광 디스크 장치에서 고배속 모우드로 언밸런스 디스크가 동작될 경우, 진동으로 인한 포커스 및 트래킹 서보가 불안정해져 데이터 검색 시간 지연 및 불안정 동작을 야기한다. 본 논문에서는 이러한 문제점을 해결할 수 있는 방법을 제안한다. 일반적으로 광 디스크 장치에서 사용되고 있는 3 빔 방식의 광 픽업(Piek-up)의 경우, 면진동이나 편심이 있는 디스크 동작시 메인 빔에 따른 포토 다이오드 상의 광 스폿의 위치도 변화된다. 이러한 특성을 이용하여 언밸런스 디스크 동작시 광픽업의 포토 다이오드 A와 C에 수신되는 광량은 디스크의 언밸런스량에 따라 결정되어진다. 따라서 포토다이오드에 수신되는 A와 C의 광량의 변화를 차동 증폭함으로써 디스크의 언밸런스량 검출이 가능하다. 본 연구에서는 고배속 모우드에서 포커스 및 트래킹 서보의 최소 특성을 분석하고, 디스크의 언밸런스량을 전기적인 신호로 검출하는 방법과 검출된 언밸런스량에 따라 광 픽업의 스핀들 모터(Swindle Motor)의 회전수를 조절함으로써 안정적이고 정확한 데이터 검색이 가능한 하드웨어 및 펌웨어 구조를 제안하였다.

  • PDF

수송문제의 최적해 (Optimal Solution for Transportation Problems)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.93-102
    • /
    • 2013
  • 본 논문은 수송 문제의 최적 해를 찾는 방법을 제안하였다. 수송 문제는 공급량과 요구량이 동일한 균형 수송과 공급량과 요구량이 다른 불균형 문제로 구분된다. 수송문제의 최적 해를 얻는 대표적인 TSM은 먼저, 불균형 수송 문제인 경우 가상의 행이나 열을 추가하여 균형 수송 문제로 변환시킨다. 다음으로 NCM, LCM, VAM 등 다양한 방법을 적용하여 초기 해를 구한다. 마지막으로 초기 해가 최적 해인지 검증하는 MODI를 적용한다. 따라서 최적 해를 구하는 과정이 복잡하다. 제안된 방법은 불균형을 균형 수송 문제로 변환하는 과정을 거치지 않고 직접 적용한다. 또한, 초기 해가 최적해인지 검증하는 과정도 수행하지 않는다. 제안된 방법은 첫 번째로, 행에 대해 공급량을 비용 오름차순으로 요구량을 만족하도록 배정한다. 두 번째로, 각 열에 대해 배정된 량이 요구량을 초과하는 순으로 배정량을 조정한다. 배정량 조정 방법은 다음 수행 순위 열의 비용과의 차이인 손실비용이 가장 큰 셀에 우선 배정하고 나머지 셀에 대해서는 배정량을 조정한다. 조정된 배정량은 요구량을 만족하지 못하는 수행 순위 오름차순 셀들에 추가된다. 모든 열에 대해 배정량이 조정되면 마지막으로 행의 최소 비용에 미 배정되었거나 열의 최대 비용에 배정된 경우 배정량을 상호 교환하는 방법으로 추가 조정한다. 불균형 배송 2개와 균형 배송 13개 데이터에 제안된 방법을 적용한 결과 모두 최적 해를 구하는데 성공하였다. 또한, 기존의 방법들이 최적해를 구하지 못한 4개 데이터에 대해서 추가로 최적 해를 구하였다. 따라서 제안된 방법은 수송 문제에 대해 일반화된 단일 방법으로 적용할 수 있을 것이다.

고압전동기용 진동 감시 시스템의 계수 추출기법 성능 분석 (The Performance Analysis of the Parameter Extracting Technique for the Vibration Monitoring System in High Voltage Motor)

  • 박정철;이달호
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.529-536
    • /
    • 2019
  • 본 논문에서는 회전체의 특징 파라미터들을 추출하기 위한 센서의 신호들을 수집하여 추출기법의 성능을 분석하고자 한다. 이를 위해, 모형 시험을 수행하기 위한 진동 테스트 리그를 개발하여 정상적으로 운전하에서의 신호특성을 분석하였다. 그 결과, 가속도 센서에서 측정한 불평형 질량에 따른 가속도 센서에서 측정된 원 데이터 진폭의 변화는 나타나지 않는 것으로 판단된다. FFT를 수행하여 불평형량이 증가함에 따라 회전 주파수인 20Hz의 진폭이 크게 증가하는 것을 알 수 있었다. 속도 센서의 불평형량 변화에 따른 분석결과도 가속도 센서와 같이 1X 하모닉 성분이 크게 증가하였다.정렬불량의 변화시 가속도 센서 데이터에는 특별한 진폭의 변화가 없었으며, Envelope 데이터의 경우 2X(40Hz)의 진폭이 정렬불량의 정도에 따라 증가되었다. 정렬불량의 변화시 속도 센서도 가속도 센서와 유사한 결과를 보였으며 주파수 스펙트럼에서 부하의 증가에 따라 600Hz에서 피크가 감소되었다.

SMOTE와 Light GBM 기반의 불균형 데이터 개선 기법 (Imbalanced Data Improvement Techniques Based on SMOTE and Light GBM)

  • 한영진;조인휘
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권12호
    • /
    • pp.445-452
    • /
    • 2022
  • 디지털 세상에서 불균형 데이터에 대한 클래스 분포는 중요한 부분이며 사이버 보안에 큰 의미를 차지한다. 불균형 데이터의 비정상적인 활동을 찾고 문제를 해결해야 한다. 모든 트랜잭션의 패턴을 추적할 수 있는 시스템이 필요하지만, 일반적으로 패턴이 비정상인 불균형 데이터로 기계학습을 하면 소수 계층에 대한 성능은 무시되고 저하되며 예측 모델은 부정확하게 편향될 수 있다. 본 논문에서는 불균형 데이터 세트를 해결하기 위한 접근 방식으로 Synthetic Minority Oversampling Technique(SMOTE)와 Light GBM 알고리즘을 이용하여 추정치를 결합하여 대상 변수를 예측하고 정확도를 향상시켰다. 실험 결과는 Logistic Regression, Decision Tree, KNN, Random Forest, XGBoost 알고리즘과 비교하였다. 정확도, 재현율에서는 성능이 모두 비슷했으나 정밀도에서는 2개의 알고리즘 Random Forest 80.76%, Light GBM 97.16% 성능이 나왔고, F1-score에서는 Random Forest 84.67%, Light GBM 91.96% 성능이 나왔다. 이 실험 결과로 Light GBM은 성능이 5개의 알고리즘과 비교하여 편차없이 비슷하거나 최대 16% 향상됨을 접근 방식으로 확인할 수 있었다.

불균형 일원랜덤효과모형에서 EQDGs를 이용한 MIVQUE 추정량 비교 (Comparison of MIVQUE Estimators Using EQDGs for the One-way Random Model with Unbalanced Data)

  • 정병철
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.411-420
    • /
    • 2005
  • 본 논문에서는 불균형 일원랜덤효과모형에서 분산성분에 대한 MIVQUE 추정량들의 효율에 대하여 연구하였다. MIVQUE 추정량에 대한 초기 추정치로 3가지 추정치가 사용되었으며 이들을 이용하여 얻어지는 MIVQUE 추정량의 효율성을 척도화된 추정량의 경험적 분위수를 이용하는 EQDGs 플롯을 이용하여 비교하였다. 모의실험 결과 집단간 분산의 초기치를 0으로 하고 집단내 분산의 초기치를 1로 사용한 MIVQUE 추정량의 효율이 추정량의 안정성 관점에서 다른 초기치를 사용한 MIVQUE 추정량에 비하여 약간 효율적인 것으로 나타났다.

불균형 이원분류자료 분석과 가설검정 (Analysis of variance and hypothesis testing with unbalanced data)

  • 장석환
    • 응용통계연구
    • /
    • 제3권2호
    • /
    • pp.39-53
    • /
    • 1990
  • 분균형자료의 분석과 가설검정을 위하여 표본수 $n_{ij}$$n_{ij}>0$인 경우와 ${n_{1j}}{/geq}0$인 경우의 인위적인 이원분류자료를 써서 여러 가지 모형하에서 주효과와 교호작용에 대한 변동을 계산하는 방법을 Searle의 R($\mid$)표기법을 이용하여 검토하였고 이들 변동과 일반적으로 널리 쓰이는 가설과의 관계를 실증적으로 재검토하였다.

  • PDF