• 제목/요약/키워드: 머신 데이터

검색결과 1,185건 처리시간 0.036초

형태소 임베딩과 SVM을 이용한 뉴스 기사 정치적 편향성의 자동 분류 (Automatic Bias Classification of Political News Articles by using Morpheme Embedding and SVM)

  • 조단비;이현영;박지훈;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.451-454
    • /
    • 2020
  • 딥러닝 기술을 이용한 정치적 성향의 편향성 분류를 위하여 신문 뉴스 기사를 수집하고, 머신러닝을 위한 학습 데이터를 구축하였다. 학습 데이터의 구축은 보수 성향과 진보 성향을 대표하는 6개 언론사의 뉴스에서 정치적 성향을 이진 분류 데이터로 구축하였다. 뉴스 기사의 수집 방법으로 최근 이슈들 중에서 정치적 성향과 밀접하게 관련이 있는 키워드 15개를 선정하고 이에 관한 뉴스 기사들을 수집하였다. 그 결과로 11,584개의 학습 및 실험용 데이터를 구축하였으며, 정치적 편향성 분류를 위한 머신러닝 모델을 설계하였다. 머신러닝 기법으로 학습 및 실험을 위해 형태소 단위의 임베딩을 이용하여 문장 및 문서 임베딩으로 확장하였으며, SVM(Support Vector Machine)을 이용하여 정치적 편향성 분류 실험을 수행한 결과로 75%의 정확도를 달성하였다.

주택가격 예측을 위한 주요 특성 분석 (Analysis of Important Features for Predicting House Prices)

  • 김준완;백승준;백주련
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.27-29
    • /
    • 2023
  • 불안정한 부동산 가격은 지속적인 사회 문제로 거론되고 있는데 이는 부동산 매매 가격을 예측할 수 있는 정확한 지표가 체계적이고 구체적으로 확립되지 않았기 때문이다. 본 논문은 가격변동에 주요하게 영향을 미치는 특성을 파악하여 가격 예측 지표로 활용하기 위해 머신러닝 모델을 적용하여 특성 분석을 수행한다. 이를 위해 한국부동산원에서 제공하는 2021년 10월부터 2022년 9월까지 1년간의 역 주변 500M 이내 거래 데이터 약 30만 6천 개를 어떠한 과정으로 전처리하여 머신러닝 모델에 적용하였는지 기술한다.

  • PDF

서포트 벡터 머신 알고리즘을 활용한 연속형 데이터의 다중인자 차원축소방법 적용 (Support vector machine and multifactor dimensionality reduction for detecting major gene interactions of continuous data)

  • 이제영;이종형
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1271-1280
    • /
    • 2010
  • 인간의 질병과 가축의 특성에 영향을 주는 유전자들의 상호작용을 규명하는 방법으로 전통적인 통계방법들이 사용되었지만, 유전자와 같은 고차원의 데이터에는 적합하지 않았다. 따라서 다중인자 차원축소방법이 제안되었다. 다중인자 차원축소방법은 모형에 대한 가정이 필요하지 않는 비모수적 방법으로 이분형 자료에 적용 가능 하지만, 연속형 데이터에는 적용할 수 없는 단점이 있다. 따라서 본 연구에서는 일반화 분류 성능이 뛰어난 서포트 벡터 머신 알고리즘을 통해 연속형 자료를 가공하여 다중인자 차원축소방법에 적용하였다. 아울러 한우의 6번 염색체내 6개의 후보 단일염기다형성을 대상으로 연속형 자료인 실제 한우의 경제형질에 서포트 벡터 머신을 이용한 다중인자 차원축소방법을 적용함으로써 한우의 경제형질에 연관된 우수 유전자 상호작용의 조합을 규명하였다.

취수원 수질예측을 위한 성층 물리변수 활용 데이터 기반 모델링 연구 (A Study on Data-driven Modeling Employing Stratification-related Physical Variables for Reservoir Water Quality Prediction)

  • 장현준;정지영;주경원;이충성;김성훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.143-143
    • /
    • 2023
  • 최근 대청댐('17), 평림댐('19) 등 광역 취수원에서 망간의 먹는 물 수질기준(0.05mg/L 이하) 초과 사례가 발생되어, 다수의 민원이 제기되는 등 취수원의 망간 관리 중요성이 부각되고 있다. 특히, 동절기 전도(Turn-over)시기에 고농도 망간이 발생되는 경우가 많은데, 현재 정수장에서는 망간을 처리하기 위해 유입구간에 필터를 설치하고 주기적으로 교체하는 방식으로 처리하고 있다. 그러나 단기간에 고농도 망간 다량 유입 시 처리용량의 한계 등 정수장에서의 공정관리가 어려워지므로 사전 예측에 의한 대응 체계 고도화가 필요한 실정이다. 본 연구는 광역취수원인 주암댐을 대상으로 망간 예측의 정확도 향상 및 예측기간 확대를 위해 다양한 머신러닝 기법들을 적용하여 비교 분석하였으며, 독립변수 및 초매개변수 최적화를 진행하여 모형의 정확도를 개선하였다. 머신러닝 모형은 수심별 탁도, 저수위, pH, 수온, 전기전도도, DO, 클로로필-a, 기상, 수문 자료 등의 독립변수와 화순정수장에 유입된 망간 농도를 종속변수로 각 변수에 해당하는 실측치를 학습데이터로 사용하였다. 그리고 데이터기반 모형의 정확도를 개선하기 위해서 성층의 수준을 판별하는 지표로서 PEA(Potential Energy Anomaly)를 도입하여 데이터 분석에 활용하고자 하였다. 분석 결과, 망간 유입률은 계절 주기에 따라 농도가 달라지는 것을 확인하였고 동절기 전도시점과 하절기 장마기간 난류생성 시기에 저층의 고농도 망간이 유입이 되는 것을 분석하였다. 또한, 두 시기의 망간 농도의 변화 패턴이 상이하므로 예측 모델은 각 계절별로 구축해 학습을 진행함으로써 예측의 정확도를 향상할 수 있었다. 다양한 머신러닝 모델을 구축하여 성능 비교를 진행한 결과, 동절기에는 Gradient Boosting Machine, 하절기에는 eXtreme Gradient Boosting의 기법이 우수하여 추론 모델로 활용하고자 하였다. 선정 모델을 통한 단기 수질예측 결과, 전도현상 발생 시기에 대한 추종 및 예측력이 기존의 데이터 모형만 적용했을 경우대비 약 15% 이상 예측 효율이 향상된 것으로 나타났다. 본 연구는 머신러닝 모델을 활용한 망간 농도 예측으로 정수장의 신속한 대응 체계 마련을 지원하고, 수처리 공정의 효율성을 높이는 데 기여할 것으로 기대되며, 후속 연구로 과거 시계열 자료 활용 및 물리모형과의 연결 등을 통해 모델의 신뢰성을 제고 할 계획이다.

  • PDF

빅데이터 분석에 기반한 아동학대의 이해 -머신러닝 알고리즘 개발 기초연구- (Understanding Child Abuse Based on Big Data Analysis -A Basic Study on the Development of Machine Learning Algorithm-)

  • 배정호;범은애
    • 사물인터넷융복합논문지
    • /
    • 제8권4호
    • /
    • pp.57-63
    • /
    • 2022
  • 본 연구의 목적은 아동학대 예방을 위한 방안 마련의 일환으로 빅데이터 분석과 머신러닝 알고리즘을 활용한 정책개발의 기초자료를 제공하는데 있다. 아동학대 예방을 위한 머신러닝 알고리즘 개발을 위한 빅데이터 분석을 위해 학술데이터베이스와 사회관계망서비스 자료를 빅데이터로 정의하고 빈도, 연관어, 감성분석을 시행하였다. 연구결과 예방적 아동학대 알고리즘은 학술빅데이터 분석에 나타난 아동학대 관련 세 주체 피해아동, 가해양육자, 정부당국의 관점에서 아동학대 예방을 위한 데이터 수집 및 공유 네트워크 시스템 마련을 통해 개발이 가능할 것이다. 또한 아동학대 피해아동의 특성에서 자아개념 저하 등으로 우울 및 불안이 나타남을 단서로 영유아 자아존중감 및 우울, 불안 검사를 제도화함으로써 가능할 것이다. 아동학대 예방을 위한 빅데이터 수집 및 분석, 알고리즘 개발 연구의 지속적 진행을 제안하며 아동학대 예방을 위한 실효적 정책 마련이 실현되어 아동학대범죄가 근절되기를 기대한다.

머신러닝 적용 과일 수확시기 예측시스템 설계 및 구현 (Design and Implementation of Fruit harvest time Predicting System based on Machine Learning)

  • 오정원;김행곤;김일태
    • 스마트미디어저널
    • /
    • 제8권1호
    • /
    • pp.74-81
    • /
    • 2019
  • 최근에 머신 러닝 기술은 의료, 제조, 마케팅, 금융, 방송, 농업 등 사회 전반에 많은 영향을 미치고 있고 미래에도 인류의 생활에 많은 도움을 줄 것으로 예상된다. 본 논문에서는 인류의 생존에 가장 큰 영향을 주는 먹거리 즉, 농업 분야에 머신러닝기술을 적용하는 방법을 연구한다. 농업 분야에 IoT(Internet of Things) 기술을 접목하는 스마트 팜 (Smart Farm) 분야는 생육환경을 실시간으로 모니터링 하여 농작물의 생육환경을 최적으로 유지 하는 방법을 중점적으로 연구한다. 최근 KT에서 출시된 기가 스마트 팜 솔루션 2.0 에서는 머신러닝 기술을 사용하여 온실내의 온습도를 최적으로 유지하는 기술에 머신러닝을 적용하였다. 기존의 스마트 팜 분야 연구가 생육환경 조절에 중점을 두어 생산성 증대에 집중되어 있지만 본 연구에서는 과일을 최상의 품질 상태에서 수확하여 좋은 가격으로 출하할 수 있도록 수확시기에 머신러닝을 적용하는 방법을 연구한다. 스마트 팜 분야에 머신러닝 기술을 적용하기 위해서는 풍부한 빅 데이터의 확보가 무엇보다 중요하므로 정확한 머신러닝 기술을 적용하기 위해서는 지속적으로 빅 데이터 수집이 가능해야 한다. 본 논문에서 수확시기 예측에 필요한 인자로는 온실 내에서 재배되는 과일의 색상 값과 무게 값, 내부 온습도 값을 색상센서 와 무게센서, 온습도센서를 사용하여 실시간으로 수집하여 확보한다. 본 논문에서 제안하는 FPSML은 유사 과일 재배에 반복적으로 사용할 수 있는 아키텍처를 제공하며 지속적으로 빅 데이터가 축적될수록 보다 정밀한 수확시기를 예측할 수 있다.

서포트 벡터 머신을 이용한 실시간 얼굴 학습 방법 (Real Time Face Training Method Using Support Vector Machine)

  • 이일용;안정호;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.547-549
    • /
    • 2003
  • 근래 패턴인식 분야에 서포트벡터머신(Support Vector Machine)이 많이 사용되어지고 있다. 서포트벡터머신이 전통적인 패턴인식 방법론에 비해 우수한 성능을 보이고 있지만. 적은 클래스의 숫자, 문자 인식과는 달리 클래스의 수가 많고. 고정되어있지 않은 얼굴인식에서는 새로운 클래스가 등록될때마다 학습을 반복해야 한다. 그러나, 서포트벡터의 특성상 학습시의 계산의 복접성 때문에 실시간 학습은 사실상 불가능하다. 이에 이 논문에서는 서포트벡터머신을 이용한 실시간 얼굴인식 시스템에서의 빠른 학습방법을 제안했다. 이 시스템은 다중 클래스 인식방법 중 일대다(One Per Class)방법을 채택했으며. 캠브리지(Cambridge) ORL 얼굴 데이터를 임의적로 11개의 실험 데이터 셋으로 변형한 후 실험 및 평가해 본 결과 빠른 학습능력을 보임과 동시에 인식률에서도 별 차이가 없는 것을 확인할 수 있었다.

  • PDF

가상 머신 기반 단말을 위한 이동성 제어에 관한 연구 (A Study on VM-based Terminal Mobility Management)

  • 홍강운;정일구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.523-525
    • /
    • 2013
  • 본 논문은 가상 머신 기반 단말을 위한 이동성 제어 매커니즘을 제안한다. 제안된 매커니즘은 AIMS와 같은 기존의 이동성 관리 기술과의 비교를 위해 이동성 제어 절차를 개선한다. 구체적으로, 가상 머신 기반 단말로의 위치 등록 메시지와 데이터 전송시의 이동 단말과 가상 머신 기반 단말 간의 메시지가 새롭게 추가된다. 제안된 매커니즘은 기존 분산 이동성 관리 기술의 문제점을 개선할 수 있다.

자율 분산 이동 로봇 시스템을 위한 머신비젼 (Machine Vision for Distributed Autonomous Robotic System)

  • 김대욱;박창현;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.94-97
    • /
    • 2004
  • 독립된 자율로봇에서 머신비젼의 구동을 위해 본 논문에서는 DARS(Distributed Autonomous Robotic System)에 적용하기 위한 디지털 이미지 프로세싱을 연구하고, DARS의 개별 로봇에 이를 임베디드화하는 것을 연구한다. 따라서 로봇을 구동하기 위해 필요한 데이터를 CMOS 카메라로부터 수신하여 영상을 스캔한 후, 원영상을 신경망 알고리즘을 통해 클러스터링하여 필요한 데이터를 추출한다. 또 이를 사용자 컴퓨터 단말기 상에 디스플레이하고, 최종적으로 DARS의 자율 이동 로봇이 영상 데이터를 인지하여 특정한 선택 동작을 수행하도록 한다.

  • PDF

증권 금융 상품 거래 고객의 이탈 예측 및 원인 추론 (A Securities Company's Customer Churn Prediction Model and Causal Inference with SHAP Value)

  • 나광택;이진영;김은찬;이효찬
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.215-229
    • /
    • 2020
  • 산업 분야를 막론하고 머신러닝의 관심이 매우 높아지고 있으나, 머신러닝이 지닌 설명 불가능성은 여전히 문제로 남아있어 적극적인 업무 적용에 어려움이 있다. 본고에서는 증권사 금융 고객을 대상으로 이탈예측 모델 개발 사례를 소개하고 SHAP Value 기법을 사용하여 설명 가능한 머신러닝 모델 개발 시도와 해석 가능성 도출에 대한 연구 결과를 소개한다. 총 6가지 고객이탈 모델을 비교 분석하였으며, SHAP Value와 고객의 자산 변화에 따른 유형 분류 및 데이터 분석을 통해 고객 이탈 원인을 추론한다. 본 연구 결과를 토대로, 향후 마케팅 담당자의 실제 고객 마케팅 수행에 있어 원인 추론이 가능한 이탈 예측 결괏값을 사용하고 고객별 마케팅 여부를 점검하는 등의 종합적 판단 지표로 활용할 수 있을 것으로 판단된다.