• 제목/요약/키워드: 분할 학습

검색결과 897건 처리시간 0.027초

지능형 알고리즘을 이용한 재질별 검정색 플라스틱 분류기 설계 (Design of Classifier for Sorting of Black Plastics by Type Using Intelligent Algorithm)

  • 박상범;노석범;오성권;박은규;최우진
    • 자원리싸이클링
    • /
    • 제26권2호
    • /
    • pp.46-55
    • /
    • 2017
  • 본 연구에서는 레이저유도붕괴분광(Laser Induced Breakdown Spectroscopy, LIBS)을 이용하여 방사형 기저함수 신경회로망(Radial Basis Function Neural Networks, RBFNNs) 분류기 설계방법론을 개발하고 실제 폐소형가전제품의 플라스틱 분류 시스템에 적용하였다. ABS, PP, PS와 같은 검정색 플라스틱을 구별하기 위해, 지능형 알고리즘 중 하나인 방사형 기저함수 신경회로망 분류기를 설계하였다. 획득한 입력변수는 주성분 분석법(Principal Component Analysis, PCA)을 이용하여 축소시켰으며, 군집화기법 중 하나인 K-means 클러스터링 방법을 이용해 여러 그룹으로 분할하였다. 전체 데이터는 학습 데이터와 테스트 데이터를 4:1의 비율로 나누었으며, 제안된 분류기의 성능 및 신뢰도를 평가하기 위하여 5-FCV(5-Fold Cross Validation) 기법을 사용하였다. 입력변수와 클러스터의 개수가 각각 5개인 경우, 제안된 분류기의 분류 성능은 96.78%로 나타났다. 또한, 제안된 분류기는 다른 분류기들과 비교하였을 경우 분류 성능의 관점에서 우수성을 보여주었다.

지중가온이 백침계 오이의 측지 발생에 미치는 영향 (Effect of Soil Heating on Lateral Shooting in White Spined Cucumber.)

  • 이상규;성기철;김광용;고관달
    • 한국생물환경조절학회:학술대회논문집
    • /
    • 한국생물환경조절학회 2001년도 봄 학술발표논문집
    • /
    • pp.71-72
    • /
    • 2001
  • 최근 수출오이의 재배 면적이 계속증가 추세에 있어 '99년 현재 143ha에 달하고 있다. 그러나 수출오이는 국내 오이와 재배방법이 상당히 달라 국내 오이는 주지착과형이지만 수출오이는 측지착과형으로 측지의 발생여부에 따라 수확량의 차이가 심하다. 따라서 수출오이의 성공여부는 측지발생을 어느정도 시키느냐에 달려 있다고 해도 과언이 아니다. 그런데 수출오이의 재배시기는 우리나라에서 재배환경이 가장 불량한 겨울철(10-2월)로, 저온 및 투광량 부족 등으로 인하여 측지발생율이 매우 저조하다. 따라서 본 시험은 수출오이의 측지 발생율을 높이고자 지중가온기 설치 여부에 따른 효과를 구명하고자 실시하였다. 그 결과, 생육(Table 1)은 접수의 줄기 직경이 지중가온 처리시 10.22mm로, 무가온의 8.64mm보다 굵었고, 엽장과 엽폭에 있어서도 지중가온 처리가 무가온 처리보다 좋았다. 곡과 발생수에 있어서도 지중가온 처리는 주당 0.73개가 발생하였으나, 무가온은 1.26개가 발생되어 지중가온 처리시 무가온에 비해서 생육이 좋아지고, 곡과 발생이 적었다. 주당 측지발생수(Table 2)는 지중가온구가 13.7개였고, 무가온구는 11.7개로 지중가온을 하면 측지발생수가 증가함을 알수 있었다. 또한 상품수확과수에 있어서도 지중가온구는 주당 45개인데 반해 지중무가온구는 38개였으며 따라서 전체적인 수량이 10a당 8,100kg으로, 무가온구의 6,840kg보다 18%의 증수효과가 있었다. 따라서 수출오이재배시 지중가온을 하면, 측지발생수가 증가하고 특히 장측지(Fig. 1)가 다수 발생하여 측지 수확과수가 증가하며, 곡과 등 기형과 발생이 감소하여 상품수량이 증가되므로써 기존 지중 무가온 재배에 비해 14% 소득향상 효과를 기대할 수 있다.시 생장이 둔화되었다. 밀폐시킨 삼각플라스크에서 자라는 Cell은 상태도 좋지 않고 전반적인 증식량도 적었다. Cell은 환기정도에 민감한 것으로 판단되며 삼각플라스크에서 약 35일 정도의 생장 주기를 가지는 것으로 사료된다. 배양 3주까지는 플라스틱 뚜껑으로 밀폐시킨 bottle에서 가장 많은 체세포배를 얻었다. Air filter를 달아 2일 마다 신선한 공기를 넣어 주었을 때는 배의 발달이 많이 늦어져 배양 3주째에 다른 처리보다 배의 수가 훨씬 적었다. 체세포배가 발달하는 동안에는 산소를 많이 요구하지 않으나 성숙하는 동안에는 산소를 많이 요구하는 것으로 생각된다.적인 것으로 나타났다. 다만, 곡선형은 물론 직선형에서도 열교환 튜브의 배치밀도, 튜브 길이 및 두께 등의 변화에 따른 최적화 연구가 수반되어야 할 것으로 판단된다.에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.x factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.0$\mu$M이 적당하며, 초기배발달을 유기할 때의 효과적인 cysteamine의 농도는 25~50$\mu$M인 것으로 판단된다.N)A(N)/N을 제시하였다(A(N)=N에 대한 A값). 위의 실험식을 사용하여 헝가리산 Zempleni 시료(15%$S_{XRD}$)의 기본입자분포로부터 %$S_{XRD}

  • PDF

무선인터넷 환경에서의 개인화상품추천에이전트 (A Personalized Product Recommendation Agent on Mobile Internet)

  • 이승화;이은석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.145-147
    • /
    • 2004
  • 본 논문에서는 무선인터넷 환경에 적합한 개인화된 상품추천에이전트를 제안한다. 기존에 유선인터넷상의 많은 개인화 추천시스템에서는 초기 사용자 모델링을 위해 사용자에게 수많은 질의를 하고 응답을 요구하였다. 그러나 이러한 방식은 무선인터넷 환경에서 정보 전송량에 따른 높은 사용요금을 고려할 때 적용하기 힘든 방식이다. 본 제안 시스템은 사용자의 Social data률 이용하여 사용자를 비슷한 연령과 성별 그룹으로 나누고, 해당 그룹에서 구매율이 높은 상품을 우선 제시한 후, 사용자 행동을 모니터링 하여 암시적(Implicit)피드백을 통해 프로파일을 생성함으로써, 번거로운 질의-응답 과정 없이도 초기 사용자 모델링을 수행할 수 있다. 프로파일 생성 이후에는 이를 기반으로 하여 사용자몰 유사한 취향을 가진 그룹으로 다시 군집화한 후 협력적 추천을 하게 되며, 프로파일에는 해당 상품의 최종 카테고리명과 키워드를 수집함으로써, 상품의 브랜드와 규격정보를 반영한 추천이 가능하다. 또한 추천 상품과 사용자의 구매데이터와의 비교를 수행하여 사용자가 해당상품을 구매하였을 경우, 상품에 대한 취향정보는 그대로 유지하고 관련 상품을 추천하되, 구매한 상품이 중복 추천되지 않도록 하였다. 시스템 평가를 위해 프로토타입을 구현하여, 다수의 사용자에게 시스템을 이용하며 관심품목을 체크하도록 하였고. 추천횟수가 반복되며 히트율이 증가하는 결과를 통해 시스템의 학습속도와 성능을 평가하였다. 그리고 쇼핌몰에서 구매경험이 있는 사용자의 기존 구매데이터와 Social data를 이용한 초기 제시상품을 역으로 비교하여 오랜 시간과 비용 발생 없이도 초기 프로파일 생성의 유효성을 증명하였다. 포함하는 XML 질의에 대해서도 웹에서 캐쉬를 이용한 처리가 효율적임을 확인하였다.키는데 목적이 있다.RED에 비해 향상된 성능을 보여주었다.웍스 네트워크상의 다양한 디바이스들간의 네트워크 다양화와 분산화 기능을 얻을 수 있었고, 기존의 고가의 해외 솔루션인 Echelon사의 LonMaker 소프트웨어를 사용하지 않고도 국내의 순수 솔루션인 리눅스 기반의 LonWare 3.0 다중 바인딩 기능을 통해 저 비용으로 홈 네트워크 구성 관리 서버 시스템 개발에 대한 비용을 줄일 수 있다. 기대된다.e 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아

  • PDF

토양수분 위성자료의 공간상세화에 관한 연구 (A Study on Spatial Downscaling of Satellite-based Soil Moisture Data)

  • 신대윤;이양원;박문성
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.414-414
    • /
    • 2017
  • 토양수분은 지면환경에서 일어나는 수문 및 에너지 순환을 이해하는 데 있어 중요한 기상인자이다. 토양수분 현장관측은 땅속에 매설된 센서에 의해 상당히 정확하게 이루어지만, 관측점 수가 충분치 않아 공간적 연속성을 확보하지 못하는 어려움이 존재한다. 이에 광역적 및 연속적 관측이 가능한 마이크로파 위성센서가 토양수분 정보 획득을 위한 보조수단으로서 그 중요성이 부각되고 있다. 마이크로파 위성센서는 구름 등 기상조건의 제약을 받지 않으며, 1978년 이래 현재까지 여러 위성에 의해 25 km 및 10 km 해상도의 전지구 토양수분자료가 생산되어 왔다. 마이크로파 센서를 이용한 토양수분자료는 동일지점에 대하여 하루 2회 정도 산출되므로 적절한 시간분해능을 가지지만, 공간해상도가 최고 10 km로서 지역규모의 수문분석에 적용하기에는 충분치 않다. 이러한 토양수분자료의 공간해상도 문제 해결을 위하여 다양한 지면환경요소를 활용한 통계적 다운스케일링이 대안으로 제시되었다. 최근의 선행연구들은 대부분 방정식을 이용한 결합모형을 통해 통계적 다운스케일링을 수행하였는데, 회귀식과 같은 선형결합뿐 아니라 신경망이나 기계학습 등의 비선형결합에서도, 불가피하게 발생할 수밖에 없는 잔차(residual)로 인하여 다운스케일링 전후의 공간분포 패턴이 달라져버리는 문제를 안고 있었다. 회귀분석에 잔차의 공간내삽을 결합시킨 회귀크리깅(regression kriging)은 잔차보정을 통해 이러한 문제를 해결함으로써 다운스케일링 전후의 공간분포 일관성을 보장하는 기법이다. 이 연구에서는 회귀크리깅을 이용하여 일자별 AMSR2(Advanced Microwave Scanning Radiometer 2) 토양수분 자료를 10 km에서 1 km 해상도로 다운스케일링하고, 다운스케일링 전후의 자료패턴 일관성을 평가한다. 지면온도(LST), 지면온도상승률(RR), 식생온도건조지수(TVDI)는 일자별로 DB를 구축하였고, 식생지수(NDVI), 수분지수(NDWI), 지면알베도(SA)는 8일 간격으로 DB를 구축하였다. 이러한 8일 간격의 자료를 일자별로 변환하기 위하여 큐빅스플라인(cubic spline)을 이용하여 시계열내삽을 수행하였다. 또한 상이한 공간해상도의 자료는 최근린법을 이용하여 다운스케일링 목표해상도인 1 km에 맞도록 변환하였다. 우선 저해상도 스케일에서 추정치를 산출하기 위해서는 저해상도 픽셀별로 이에 해당하는 복수의 고해상도 픽셀을 평균화하여 대응시켜야 하며, 이를 통해 6개의 설명변수(LST, RR, TVDI, NDVI, NDWI, SA)와 AMSR2 토양수분을 반응변수로 하는 다중회귀식을 도출하였다. 이식을 고해상도 스케일의 설명변수들에 적용하면 고해상도 토양수분 추정치가 산출되는데, 이때 추정치와 원자료의 차이에 해당하는 잔차에 대한 보정이 필요하다. 저해상도 스케일로 존재하는 잔차를 크리깅 공간내삽을 통해 고해상도로 변환한 후 이를 고해상도 추정치에 부가해주는 방식으로 잔차보정이 이루어짐으로써, 다운스케일링 전후의 자료패턴 일관성이 유지되는(r>0.95) 공간상세화된 토양수분 자료를 생산할 수 있다.

  • PDF

메타분석을 이용한 간호 대학생의 학업 관련 만족도 중재프로그램의 효과 (A Meta-analysis of the effects of Academic-related Satisfaction Intervention Programs for Nursing Students in Korea)

  • 김미나;김영아
    • 한국산학기술학회논문지
    • /
    • 제20권10호
    • /
    • pp.218-228
    • /
    • 2019
  • 본 연구는 국내 간호 대학생을 대상으로 수행된 학업 관련 만족도 중재프로그램을 고찰하고 메타분석하여 근거기반 자료를 제공하기 위해 수행되었다. 메타분석에 포함된 자료는 2001년부터 2018년 7월까지 발표된 25편의 실험연구로서 연구의 설계는 무작위 대조군 연구가 1편, 비무작위 대조군 연구가 24편이었다. 연구대상자는 간호학과 1~4학년 재학생으로, 이론수업 및 실습수업에서 중재프로그램이 수행되었다. 표본크기는 실험군 1182(평균 47.3), 대조군 1137(평균 45.5)명이었고, 중재프로그램의 구성은 1~16주/1~16회/1회기 당 7~240분으로 이루어졌다. 결과변수로는 전공만족도, 학습만족도, 교내실습만족도, 임상실습만족도가 있었으며, 교내실습만족도(Hedges' g=0.876[95% CI: 0.405, 1.346])와 임상실습만족도(Hedges' g=0.515[95% CI: 0.312, 0.718]) 및 전체 학업 관련 만족도(Hedges' g=0.630[95% CI: 0.371, 0.889])는 통계적으로 유의미한 중간 수준 이상의 효과크기가 확인되었다. 본 연구의 결과는 간호 대학생들의 학업 관련 만족도 중재프로그램을 다룬 선행연구들을 통합적으로 정리하여 객관적 결과를 확인하였다는데 의의가 있다.

딥러닝 기반 항생제 내성균 감염 예측 (Antibiotics-Resistant Bacteria Infection Prediction Based on Deep Learning)

  • 오성우;이한길;신지연;이정훈
    • 한국전자거래학회지
    • /
    • 제24권1호
    • /
    • pp.105-120
    • /
    • 2019
  • 세계보건기구(WHO)를 비롯해 세계 각국의 정부기관은 항생제 오남용에 따른 항생제 내성균 감염에 대해 심각하게 경고하며 이를 예방하기 위한 관리와 감시를 강화하고 있다. 하지만 감염을 확인하기 위한 감염균 배양에 수일의 시간이 소요되면서 격리와 접촉주의를 통한 감염확산 방지 효과가 떨어져 선제적 조치를 위한 신속하고 정확한 예측 및 추정방법이 요구되고 있다. 본 연구는 Electronic Health Records에 포함된 질병 진단내역과 항생제 처방내역을 neural embedding model과 matrix factorization을 통해 embedding 하였고, 이를 활용한 딥러닝 기반분류 예측 모형을 제안하였다. 항생제 내성균 감염의 주요 원인인 질병과 항생제 정보를 embedding하여 환자의 기본정보와 병원이용 정보에 추가했을 때 딥러닝 예측 모형의 f1-score는 0.525에서 0.617로 상승하였고, 딥러닝 모형은 Super Learner와 같은 기존 기계학습 모형보다 더 나은 성능을 보여주었다. 항생제 내성균 감염환자의 특성을 분석한 결과, 감염환자는 동일한 질병을 진단받은 비감염환자에 비교해 J01 계열 항생제 사용이 많았고 WHO 권고기준(DDD)을 크게 벗어나는 오남용 청구사례가 6.3배 이상 높게 나타났으며 항생제 오남용과 항생제 내성균 감염간의 높은 연관성이 발견되었다.

타 직업군으로부터의 사이버보안 전문인력으로의 직무전환을 위한 재교육과정 설계 연구 (A Study on the Design of Re-training Courses for Nurturing Cybersecurity Professionals from Other Occupational Groups)

  • 지주연;박상호;유하랑;장항배
    • 융합보안논문지
    • /
    • 제18권1호
    • /
    • pp.43-60
    • /
    • 2018
  • 최근 제 4차 산업혁명이 도래함에 따라서 기존 산업환경이 기술중심 구조에서 가치중심으로 확장되는 산업융합 환경으로 변화함에 따라 보안위험 또한 융 복합적으로 변화하여 그 범위가 커지고 있다. 이러한 변화에 따라 사이버보안 전문인력의 수요는 매년 증가하고 있지만, 이에 비하여 공급은 매우 부족한 실정이다. 향후 2020년 까지 21,704명의 사이버보안 전문인력이 필요한 것으로 조사되고 있으나, 신규 인력 공급은 11,850명에 그쳐 9,854명의 신규 인력 공급이 부족할 것으로 전망되고 있다. 이러한 수급차 문제를 해결하기 위한 방법으로는 사이버보안 전공교육을 통한 신규인력 양성방법에 관한 연구에 비해 타 직업군의 재직자나 타 학문분야 전공자를 대상으로 하는 재교육형 인력양성방법에 관한 연구는 상대적으로 부족한 실정이다. 따라서 본 논문에서는 국내 교육기관 중 가장 규모가 크고 배출 인력이 많은 인문 사회계열의 대표 전공분야들을 선정하여 각 전공분야의 공통교육과정을 분석한 후, 기존 선행연구를 통해 도출된 사이버보안 전문인력 양성과정과 비교한다. 이를 통해 각 전공분야별 배출인력이 사이버보안 전문인력이 되기 위해 어떠한 과목들에 대한 재교육(추가교육)이 필요할 것인지 분석하여 사이버보안 전문인력 양성을 위한 재교육과정을 설계하고자 한다. 본 연구결과를 활용하여 타 직업군의 재직자나 타 학문분야 전공자를 대상으로 사이버보안 전문인력 재교육과정 운영 시, 교육대상자들에게 필요한 역량을 효율적으로 학습할 수 있게 하는 기초자료로 활용될 것으로 기대되며, 사이버보안 전문인력의 수급차 해소에 기여할 것으로 예상된다.

  • PDF

가르기와 모으기에서의 0의 취급에 대한 고찰 (A Study on Separating and Joining Including Zero)

  • 이화영
    • 한국초등수학교육학회지
    • /
    • 제22권2호
    • /
    • pp.183-198
    • /
    • 2018
  • 본 논문은 모으기와 가르기 활동에서 0의 처리에 대한 시사점을 찾기 위해 모으기와 가르기 활동을 이론적으로 고찰하고 7개국의 교과서와 5차 교육과정부터 2015 개정 교육과정에 따른 우리나라 수학 교과용 도서를 분석하였다. 모으기는 덧셈과 유사한 정의와 성질을 지니지만, 가르기는 정의하기 어려우며 뺄셈과 유사한 성질을 지닌다고 보기 어렵다. 연산의 의미상으로는 모으기와 가르기는 '부분-부분-전체(part-part-whole)' 상황으로 볼 수 있으나 덧셈과 뺄셈 상황의 일부분에 해당한다고 볼 수 있다. 외국 교과서를 분석한 결과, 싱가포르와 말레이시아 교과서에서는 0을 이미 학습한 후 0을 모으기와 가르기 활동에서 포함하나, 그 밖의 국가들은 0을 모으기와 가르기 활동에서 포함하지 않는 것으로 확인되었다. 우리나라 교과서에서는 0을 포함하지 않도록 일관되게 제시해 왔으나, 교사용 지도서에서는 0의 처리 여부에 대해 일관되지 않음을 확인할 수 있었다. 이에 따라, 학생 수준을 고려하여 모으기와 가르기에서 0을 포함하지 않고 도입하고자 할 때에는 이에 적절한 상황 맥락 제시가 필요하며, 교사용 지도서에서도 보다 일관성 있는 제시가 필요함을 제안하였다.

  • PDF

일반학생, 영재학생, 예비교사, 현직교사의 다전략 수학 문제해결 전략 분석 (An Analysis on the Mathematical Problem Solving Strategies of Ordinary Students, Gifted Students, Pre-service Teachers, and In-service Teachers)

  • 박만구
    • 한국학교수학회논문집
    • /
    • 제21권4호
    • /
    • pp.419-443
    • /
    • 2018
  • 본 연구의 목적은 일반학생, 영재학생, 예비교사, 현직교사들의 다전략을 가진 수학 문제해결 전략을 분석하여 각 그룹 간의 해결 전략을 비교하여 수학 문제해결 학습 및 지도에 대한 시사점을 얻고자 하는 것이다. 본 연구를 위하여 서울시 초등학교 6학년 일반학생 98명, 초등 영재학생 96명, 초등 예비교사 72명, 초등학교 현직교사 60명을 선정하여 '닭과 돼지' 문제를 제시하고, 30분 동안 자유롭게 문제를 해결하면서 해결 전략을 제시하도록 하였다. 연구의 결과, 영재학생들이 일반학생에 비하여 상대적으로 다양한 해결 전략과 시간적으로 효율적인 전략을 사용하고, 다른 그룹에 비하여 가장 많은 다양한 전략을 사용하였다. 그리고 4가지 이상의 전략을 제시한 비율은 각각 일반학생은 1%, 영재학생 54%, 예비교사 42%, 현직교사 43%로 전략의 다양성에서 영재학생, 현직교사, 예비교사, 일반학생들의 순서로 높게 나타났다. 그리고 개인별로 가장 많은 문제해결 전략의 제시는 일반학생 4가지, 현직교사 6가지, 예비교사 7가지, 영재학생 8가지 순서로 나타났다. 제언으로, 학생들과 교사들에게 다전략을 가지는 양질의 다양한 수학 문제해결 경험의 제공, 문제해결 전략에서 시간적 효율성 추구, 다전략 문제의 개발 및 현장에 보급하여 활용하도록 하는 방안 등을 주장하였다. 후속 연구로, 다전략의 수학 문제를 교실수업에 적용하면서 보다 학생들의 의사소통 및 협력적 문제해결에 대한 협력적 문제해결에 대한 심층적인 연구와 다양한 전략을 평가할 수 있는 방안이 필요하다고 주장하였다. 그리고 이런 연구 결과를 수업연구 방법 등을 활용하여 교사연수에 적극 반영하여, 교사들이 다양한 수준의 학생들의 문제해결지도에서 효과적으로 활용하도록 할 필요가 있음을 제안하였다.

부분 단어 토큰화 기법을 이용한 뉴스 기사 정치적 편향성 자동 분류 및 어휘 분석 (Automatic Classification and Vocabulary Analysis of Political Bias in News Articles by Using Subword Tokenization)

  • 조단비;이현영;정원섭;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 미등록어 수가 감소되는 것을 확인하였다. 분류 실험에서 가장 성능이 좋은 임베딩 모델을 이용하여 정치적 인물을 기반한 어휘를 추출하였으며 각 성향의 정치적 인물 벡터와의 평균 유사도를 통해 어휘의 편향성을 검증하였다.