• 제목/요약/키워드: class imbalance

검색결과 118건 처리시간 0.023초

이러닝 활용 다문화교육에 대한 결혼이민자의 수요 분석 및 지원 방안 (Support plan and analysis of demand for multicultural education using e-learning by marriage immigrants)

  • 안성훈
    • 정보교육학회논문지
    • /
    • 제16권1호
    • /
    • pp.131-142
    • /
    • 2012
  • 본 논문에서는 학력이 낮은 결혼이민자들에게 이러닝을 통하여 학력을 제공할 수 있는 방안을 연구하였다. 현재 한국은 남아 선호 사상에 따른 성비 불균형과 한국 여성들의 농.산.어촌 생활 기피로 외국인과 결혼하는 한국 남성들이 급속히 증가하고 있는 추세이다. 이에 한국 정부에서는 결혼이민자에게 한국어교육과 직업교육을 비롯한 다양한 사회 적응 교육을 실시하고 있으나 결혼이민자의 대부분은 가정 및 직장 생활의 부담 때문에 제대로 교육을 받지 못하고 있는 실정이다. 따라서 본 연구에서는 결혼이민자들에게 이러닝을 통해 한국어교육과 직업교육을 실시하는 방안을 연구하였다. 이를 위해 먼저 결혼이민자들의 이러닝을 통한 다문화교육에 대한 설문 조사를 실시하여 그 결과를 분석하였다. 그 결과, 결혼이민자들은 대부분 이러닝을 선호하는 것으로 나타났으며, 출신 국적과 거주지역에 따라 원하는 교육내용에 대한 차이가 있는 것으로 나타났다. 이에 따라 본 논문에서는 이러한 분석 결과를 바탕으로 이러닝 교육과정을 국적별로 편성하고 지역의 실정에 맞게 운영할 수 있는 방안, 이러닝 교육내용을 한국어교육 중심으로 편성하는 방안, 결혼이민자들의 장점을 살릴 수 있는 직업교육 마련 방안 등의 결혼이민자에 대한 이러닝 지원 방안을 제안하였다. 이와 같은 본 연구의 결과는 결혼이민자들이 우리 사회의 소외계층으로 전락하지 않고 당당한 일원으로 정착하는데 도움이 될 것으로 기대한다.

  • PDF

신용카드 불법현금융통 적발을 위한 축소된 앙상블 모형 (Illegal Cash Accommodation Detection Modeling Using Ensemble Size Reduction)

  • 이화경;한상범;지원철
    • 지능정보연구
    • /
    • 제16권1호
    • /
    • pp.93-116
    • /
    • 2010
  • 불법현금융통 적발모형 개발에 앙상블 접근방법을 사용하였다. 불법현금융통은 국내 신용카드사의 손익에 영향을 미치며 최근 국제화되고 있음에도 불구하고 학문적인 접근이 이루어지지 않았다. 부정행위 적발모형(Fraud Detection Model, FDM)은 데이터 불균형 문제로 인하여 좋은 성능을 얻기 어려운데, 다수의 모형을 결합하는 앙상블이 대안으로 제시되어 왔다. 앙상블에 포함된 모형들의 다양성이 보장된다면 단일모형에 비해 더 좋은 성능을 보인다는 점은 이미 인정되고 있으며, 최근 연구 결과는 학습된 모든 기본모형들을 사용하는 것보다 적절한 기본모형들만 선택하여 앙상블에 포함시키는 것이 바람직하다는 것이다. 본 논문에서는 효과적인 불법현금융통 적발을 위하여 축소된 앙상블 기법을 사용하는데, 정확성과 다양성 척도를 사용하여 앙상블에 참여할 기본모형을 선택하는 것이다. 다양성은 앙상블을 구성하는 기본모형들 사이의 불일치 (Disagreement or Ambiguity)를 의미하는데, FDM에 내재된 데이터 불균형문제를 고려하여 두 가지 측면에 중점을 두었다. 첫째, 학습 자료의 추출 과정에서 다양성을 확보하기 위한 소수 범주의 과잉추출 방법과 적절한 훈련 방법에 대해 설명하였다. 둘째, 소수범주에 초점을 맞추어 기존의 다양성 척도를 효과적인 척도로 변형시키고, 전진추가법과 후진소거법의 동적 다양성 계산법을 도입하여 앙상블에 참여할 기본모형을 평가하였다. 실험에 사용된 학습 알고리즘은 신경망, 의사결정수와 로짓 회귀분석이었으며, 동질적 앙상블과 이질적 앙상블을 구성하여 성능평가를 하였다. 실험결과 불법현금융통 적발모형에 있어 축소된 앙상블은 모든 기본모형이 포함된 앙상블과 성능 차이가 없었다. 축소된 앙상블은 앙상블 구성의 복잡성을 감소시키고 구현을 용이하게 한다는 점에서 FDM에서도 유력한 모형 수립 접근방법이 될 수 있음을 보였다.

에두아르도 갈레아노의 작품에 나타난 신자유주의의 폭력성 (The Violence of Neoliberalism Represented in the Works of Eduardo Galeano)

  • 유왕무
    • 비교문화연구
    • /
    • 제41권
    • /
    • pp.199-227
    • /
    • 2015
  • 본고에서는 신자유주의의 폭력성으로 인해 라틴아메리카가 얼마나 많은 피해를 감수해 왔는지를 에두아르도 갈레아노의 작품을 통해 살펴보고자 한다. 1980년대 중반부터 시작된 신자유주의는 많은 나라에서 다양한 문제점을 드러내고 있다. 미국과 국제금융기관은 금융위기에 빠진 라틴아메리카 국가들에 자신들의 프로그램과 조정계획을 강요하였다. 그 결과 라틴아메리카에서는 사회적 불평등이 심화되고 사회 복지대신 투자 환경이 중요시되고, 사회적 안전 대신 금융 안정이 우선시되었다. 노동의 유연성으로 인해 중산층도 붕괴되었다. 신분상승의 기회를 박탈당한 빈민층에서는 폭력이 일상화되었다. 그래서 갈레아노는 자유주의가 중시하는 생산성의 가치에 대한 재검토 필요성을 제기한다. 갈레아노는 동시에 신자유주의의 군사화도 경계한다. 신자유주의는 평화를 가장하여 국경 없는 다국적 전쟁을 유발하기 때문이다. 미국이 '마약과의 전쟁'을 명분으로 라틴아메리카를 폭력의 장으로 변질시킨 점을 예로 든다. 신자유주의의 시장 자유화와 이익 극대화 정책은 세계의 환경오염에도 지대한 공헌을 하고 있다. 그러나 대기업과 국제기구가 협동으로 벌이는 환경파괴행위는 겉으로 드러나지 않는다. 녹색 가면을 쓰고 있기 때문이다. 갈레아노는 녹색 가면 뒤에 숨어있는 그들의 허위의식을 드러내려 노력한다. 갈레아노는 신자유주의 정책으로 인해 폭력이 일상화된 라틴아메리카의 모습을 그의 작품에서 간결하지만 날카로운 필체로 잘 그려내고 있다.

한국어 학습 모델별 한국어 쓰기 답안지 점수 구간 예측 성능 비교 (Comparison of Korean Classification Models' Korean Essay Score Range Prediction Performance)

  • 조희련;임현열;이유미;차준우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.133-140
    • /
    • 2022
  • 우리는 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 문제에서 세 개의 딥러닝 기반 한국어 언어모델의 예측 성능을 조사한다. 이를 위해 총 304편의 답안지로 구성된 실험 데이터 세트를 구축하였는데, 답안지의 주제는 직업 선택의 기준('직업'), 행복한 삶의 조건('행복'), 돈과 행복('경제'), 성공의 정의('성공')로 다양하다. 이들 답안지는 네 개의 점수 구간으로 구분되어 평어 레이블(A, B, C, D)이 매겨졌고, 총 11건의 점수 구간 예측 실험이 시행되었다. 구체적으로는 5개의 '직업' 답안지 점수 구간(평어) 예측 실험, 5개의 '행복' 답안지 점수 구간 예측 실험, 1개의 혼합 답안지 점수 구간 예측 실험이 시행되었다. 이들 실험에서 세 개의 딥러닝 기반 한국어 언어모델(KoBERT, KcBERT, KR-BERT)이 다양한 훈련 데이터로 미세조정되었다. 또 두 개의 전통적인 확률적 기계학습 분류기(나이브 베이즈와 로지스틱 회귀)도 그 성능이 분석되었다. 실험 결과 딥러닝 기반 한국어 언어모델이 전통적인 기계학습 분류기보다 우수한 성능을 보였으며, 특히 KR-BERT는 전반적인 평균 예측 정확도가 55.83%로 가장 우수한 성능을 보였다. 그 다음은 KcBERT(55.77%)였고 KoBERT(54.91%)가 뒤를 이었다. 나이브 베이즈와 로지스틱 회귀 분류기의 성능은 각각 52.52%와 50.28%였다. 학습된 분류기 모두 훈련 데이터의 부족과 데이터 분포의 불균형 때문에 예측 성능이 별로 높지 않았고, 분류기의 어휘가 글쓰기 답안지의 오류를 제대로 포착하지 못하는 한계가 있었다. 이 두 가지 한계를 극복하면 분류기의 성능이 향상될 것으로 보인다.

이수식 TBM 데이터와 랜덤포레스트를 이용한 일축압축강도 분류 예측에 관한 연구 (A Study on the Prediction of Uniaxial Compressive Strength Classification Using Slurry TBM Data and Random Forest)

  • 강태호;최순욱;이철호;장수호
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.547-560
    • /
    • 2023
  • 최근 국내외에서 기계학습 기법으로 TBM 굴진 데이터와 지반데이터를 분석하는 지반 분류예측 연구가 증가하고 있다. 본 연구에서는 다양한 분야에서 널리 사용되고 있는 머신러닝 기법들 중 의사결정트리 기반 랜덤포레스트 모델을 3곳의 이수식 TBM 현장에서 획득한 기계 데이터와 지반 데이터에 적용하여 일축압축강도에 대한 다중 분류예측 연구를 하였다. 일축압축강도의 다중 분류 예측을 위해서 학습과 테스트 데이터를 7:3으로 분할하였으며, 최적의 파라미터를 선정을 위해서 분할 교차검증을 포함하는 그리드 서치를 활용하였다. 의사 결정 트리를 기반으로 한 랜덤 포레스트를 사용하여 일축압축강도 분류 학습을 수행한 결과, 다중 분류 예측 모델의 정확도는 학습 세트와 테스트 세트에서 각각 0.983 및 0.982로 모두 높게 나타났다. 다만, 클래스 간 데이터 분포의 불균형으로 인하여 클래스 4에서는 재현율이 낮게 평가되었다. 다양한 현장에서 획득한 일축압축강도의 측정 데이터양을 늘리는 연구가 필요한 것으로 판단된다.

대구지역 치기공과 학생의 취업률 향상과 치과기공사의 인력수급에 관한 연구 (A Study on the Improvement of Employment Rate of Dental Technology School Graduates in Daegu and the Supply and Demand of Dental Technician Work Forces)

  • 이종도;정영해
    • 대한치과기공학회지
    • /
    • 제31권1호
    • /
    • pp.37-54
    • /
    • 2009
  • The purpose of this thesis is to address the imbalance between supply and demand of dental lab technicians and to propose its solutions by analyzing the improvement of employment rate of graduates of dental technology schools in Daegu area and the supply and demand of the technician workforce. Preliminary and full-scale surveys were performed from Aug. 10 to Oct. 10 in 2008 on 150 junior students of dental technology schools who finished their on-the-job-training and 150 dental technicians who were working for dental laboratory in Daegu by self-assessment questionnaire. Followings are the findings of this study. First, regarding the gender of the dental technicians, 32.7% of respondents were female 67.3% were male. Concerning age, respondents younger than 29 years-old occupied the highest percentage(39.3%). With respect to the lab technology school they graduated, DaeguHealthCollege took the largest proportion of 87.3%. With regard to interpersonal relationship at the school, 58.0% of respondents felt their relationship 'smooth'. Second, about the motive of choosing to be a lab technician, the biggest proportion of the respondents(34.7%) replied that 'because it is professional'. Regarding the degree of satisfaction about the profession, 'so-so' was the answer with the biggest percentage(51.3%) followed by 'satisfied'(32.0%) and 'unsatisfied'(16.7%). It showed that respondents were generally satisfied with their major. Third, regarding relevance of on-the-job-training with 'preparation for the employment', highest percentage of both students and lab technicians(50.0%) replied 'so-so'. With respect to 'necessity of practical education', highest percentage of the students and lab technicians replied 'relating didactic education in college to the real world' with 52.7% and 40.7% respectively. With regard to 'the aim of on-the-sport-training', 'practical training of didactic education' was chosen by 54.0% and 47.3% respectively. Fourth, with regard to the 'types of college education advantageous for the employment', both students and lab technicians groups chose 'practical training' with the highest percentage. Concerning 'helpfulness of clinical training on employment', students answered 'so-so' and 'helpful' by 50.0% and 42.7% respectively and dental technicians replied similarly by 50.0% and 46.0% respectively. Fifth, with regard to the influence of financial factors on the supply and demand of dental technician(question #1), 68.0% of respondents agreed that 'salary plays key role in the supply and demand of the work force'. Concerning the question about working condition, respondents requested better working environment. With reference to interpersonal relationship at the laboratory, respondents replied that interpersonal relationship affects the duration of the employment it was found out that there were many conflicts with colleagues or dental office. Sixth, regarding the satisfaction about their profession according to the characteristics of the respondents more respondents were 'satisfied'(10.30 points) with their profession and 'unsatisfied' were 9.47 points and the difference was statistically significant(p<0.05). According to the findings of this study, practical education on campus and on-the-job-training are as important as didactic education at class due to the characteristics of dental technology major. It was found that more practical training is related to higher employment rate. Therefore, efficiency of on-the-job-training by college education should be increased raise employment rate of the graduates and reduce the unemployment. Up-to-date information needs to be promptly delivered and future vision should be presented to the students to raise their satisfaction about the profession. In addition, to reduce dental technician's frequent change of their workplace after facing with the reality of the profession after graduation, related organizations should make an effort to present better future than now.

  • PDF

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용 (Research on ITB Contract Terms Classification Model for Risk Management in EPC Projects: Deep Learning-Based PLM Ensemble Techniques)

  • 이현상;이원석;조보근;이희준;오상진;유상우;남마루;이현식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.471-480
    • /
    • 2023
  • 국내 건설수주 규모는 2013년 91.3조원에서 2021년 총 212조원으로 특히 민간부문에서 크게 성장하였다. 국내외 시장 규모가 성장하면서, EPC(Engineering, Procurement, Construction) 프로젝트의 규모와 복잡성이 더욱 증가되고, 이에 프로젝트 관리 및 ITB(Invitation to Bid) 문서의 위험 관리가 중요한 이슈가 되고 있다. EPC 프로젝트 발주 이후 입찰 절차에서 실제 건설 회사에게 부여되는 대응 시간은 한정적일 뿐만 아니라, 인력 및 비용의 문제로 ITB 문서 계약 조항의 모든 리스크를 검토하는데 매우 어려움이 있다. 기존 연구에서는 이와 같은 문제를 해결하고자 EPC 계약 문서의 위험 조항을 범주화하고, 이를 AI 기반으로 탐지하려는 시도가 있었으나, 이는 레이블링 데이터 활용의 한계와 클래스 불균형과 같은 데이터 측면의 문제로 실무에서 활용할 수 있는 수준의 지원 시스템으로 활용하기 어려운 상황이다. 따라서 본 연구는 기존 연구와 같이 위험 조항 자체를 정의하고 분류하는 것이 아니라, FIDIC Yellow 2017(국제 컨설팅엔지니어링 연맹 표준 계약 조건) 기준 계약 조항을 세부적으로 분류할 수 있는 AI 모델을 개발하고자 한다. 프로젝트의 규모, 유형에 따라서 세부적으로 검토해야 하는 계약 조항이 다를 수 있기 때문에 이와 같은 다중 텍스트 분류 기능이 필요하다. 본 연구는 다중 텍스트 분류 모델의 성능 고도화를 위해서 최근 텍스트 데이터의 컨텍스트를 효율적으로 학습할 수 있는 ELECTRA PLM(Pre-trained Language Model)을 사전학습 단계부터 개발하고, 해당 모델의 성능을 검증하기 위해서 총 4단계 실험을 진행했다. 실험 결과, 자체 개발한 ITB-ELECTRA 모델 및 Legal-BERT의 앙상블 버전이 57개 계약 조항 분류에서 가중 평균 F1-Score 기준 76%로 가장 우수한 성능을 달성했다.

한국형 동반성장 정책의 방향과 과제 (The Policy of Win-Win Growth between Large and Small Enterprises : A South Korean Model)

  • 이장우
    • 중소기업연구
    • /
    • 제33권4호
    • /
    • pp.77-93
    • /
    • 2011
  • 본 연구는 최근 사회경제적 이슈가 되고 있는 동반성장의 개념과 실천 방향에 대해 논의하고자 한다. 이를 위해 동반성장의 정책적 개념을 살펴보고 유사한 개념인 상생협력과 공생발전과도 비교 분석하고자 한다. 또한 동반성장을 통해 글로벌 경쟁력을 만들어 낸 선진국 사례들로부터 교훈을 찾아내고 우리의 사회 문화적 특성에 맞는 한국형 모델을 제안하고자 한다. 한국형 동반성장 모델은 미국의 시장중심형, 일본의 문화기반형, 유럽의 정책주도형 등의 장점을 융합할 필요가 있다. 이를 위해 한국형 모델은 공동체적 에너지를 창출해내는 한국인의 잠재력 활용, 통제와 자율의 융합형 제도 개선, 미래지향적 협력관계를 위한 기업들의 행동변화 등 세 가지 요인을 핵심으로 할 필요가 있다. 한국형 모델의 실현을 위해 필요한 정부의 역할과 과제, 그리고 동반성장위원회의 역할에 대해서도 논의하고자 한다.