• 제목/요약/키워드: 머신러닝 교육

검색결과 107건 처리시간 0.024초

머신 러닝을 사용한 개인화된 뉴스 추천 시스템 (Personalized News Recommendation System using Machine Learning)

  • 펭소니;양예선;박두순;이혜정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.385-387
    • /
    • 2022
  • With the tremendous rise in popularity of the Internet and technological advancements, many news keeps generating every day from multiple sources. As a result, the information (News) on the network has been highly increasing. The critical problem is that the volume of articles or news content can be overloaded for the readers. Therefore, the people interested in reading news might find it difficult to decide which content they should choose. Recommendation systems have been known as filtering systems that assist people and give a list of suggestions based on their preferences. This paper studies a personalized news recommendation system to help users find the right, relevant content and suggest news that readers might be interested in. The proposed system aims to build a hybrid system that combines collaborative filtering with content-based filtering to make a system more effective and solve a cold-start problem. Twitter social media data will analyze and build a user's profile. Based on users' tweets, we can know users' interests and recommend personalized news articles that users would share on Twitter.

보편적 빅데이터와 빅데이터 교육의 방향성 연구 - 빅데이터 전문가의 인식 조사를 기반으로 (Study on the Direction of Universal Big Data and Big Data Education-Based on the Survey of Big Data Experts)

  • 박윤수;이수진
    • 정보교육학회논문지
    • /
    • 제24권2호
    • /
    • pp.201-214
    • /
    • 2020
  • 최근 데이터 관련 법안이 개정되면서 빅데이터의 활용 분야는 점차 확장되고 있으며, 빅데이터 교육에 대한 관심이 증가하고 있다. 그러나 빅데이터를 활용하기 위해서는 높은 수준의 지식과 스킬이 필요하고, 이를 모두 교육하기에는 오랜 시간과 많은 비용이 소요된다. 이에 본 연구를 통해 산업 현장에서 사용되는 광범위한 영역의 빅데이터를 보편적 빅데이터(Universal Big Data)로 정의하고, 대학교 수준에서 보편적 빅데이터를 교육하기 위해서 중점적으로 교육해야 할 지식 영역을 산출하고자 한다. 이를 위해 빅데이터 관련 산업에 종사하는 전문인력을 구분하기 위한 기준을 마련하고, 설문 조사를 통해 빅데이터에 대한 인식을 조사했다. 조사 결과에 의하면 전문가들은 컴퓨터과학에서 의미하는 빅데이터보다 광범위한 범위의 데이터를 빅데이터로 인식하고 있었으며, 빅데이터의 가공 과정에 반드시 빅데이터 처리 프레임워크 또는 고성능 컴퓨터가 필요한 것은 아니라고 인식하고 있었다. 이는 빅데이터를 교육하기 위해서는 컴퓨터과학(공학)적 지식과 스킬보다는 빅데이터의 분석 방법과 응용 방법을 중심으로 교육해야 한다는 것을 의미한다. 분석 결과를 바탕으로 본 논문에서는 보편적 빅데이터 교육을 위한 새로운 패러다임을 제안하고자 한다.

하천 내 지표 피복 분류를 위한 Sentinel-2 영상 기반 랜덤 포레스트 기법의 적용성 연구 - 내성천을 사례로 - (Application study of random forest method based on Sentinel-2 imagery for surface cover classification in rivers - A case of Naeseong Stream -)

  • 안성기;이찬주;김용민;최훈
    • 한국수자원학회논문집
    • /
    • 제57권5호
    • /
    • pp.321-332
    • /
    • 2024
  • 하천 공간의 지표 피복 현황 파악은 하천 관리 및 홍수 재해 예방에 필수적이다. 기존 조사 방법은 전문가에 의한 식생 판독을 통한 식생도 작도 방법이나 식생지수를 활용하는 방법이 활용되어 왔으나, 역동적으로 변화하는 하천 환경을 반영하기에 한계가 있다. 이러한 배경에서 본 연구는 내성천을 대상으로 위성영상 자료를 활용한 랜덤 포레스트 기법을 활용하여 다수 연도의 하천 내 식생 분포를 파악하고, 적용성을 검토하였다. 원격탐사 자료 Sentinel-2 위성 영상을 사용하였으며, 지상 참값(ground truth)은 2016년 내성천 지표 피복 자료를 활용하였다. 랜덤 포레스트 머신러닝 알고리듬을 활용하여 미리 선정된 10개 샘플링 영역으로부터 분류군 별로 1,000개의 표본을 추출하여 훈련 및 검증하였으며, 민감도 분석, 연도별 지표 피복 분석, 정확도 분석을 통하여 적용성을 평가하였다. 연구 결과, 검증 자료 기반의 정확도는 85.1%로 나타났다. 트리 수, 샘플 수, 하천 구역에 대한 민감도 분석 결과, 각각 30개, 800개, 하류에서 효율성이 높았다. 지표 분류 유형은 6개 항목에서 높은 정확도를 보여 지표 피복 분류 결과가 실제 하천 환경을 잘 반영하는 것으로 나타났다. 정확도 분석 결과, 전체 샘플 중 14.9%의 경계오류와 내부오류를 확인하였으며, 지표 피복 분류 중 산발 식생과 초본 식생을 제외한 항목들은 높은 정확도를 보였다. 본 연구에서는 단일 하천을 대상으로 적용하였지만, 보다 정확하고 많은 자료의 구축을 위해서는 다수의 하천에 대해 지표 피복 분류 기법의 적용이 요구된다.

유아들의 안전한 스마트폰 사용 환경 및 콘텐츠 추천 시스템 개발 (The Study of the System Development on the Safe Environment of Children's Smartphone Use and Contents Recommendations)

  • 이경아;박은영
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.845-852
    • /
    • 2018
  • 본 연구에서는 디지털 세대를 위한 스마트폰 중독 방지 런처와 다중지능 및 집단지성을 활용한 머신 러닝 기반 콘텐츠 추천 시스템을 개발하였다. 이를 통해 어린 자녀의 디지털 기기 과다 사용을 불안해하는 부모들에게 편리한 디지털 양육 경험을 제공하고 자녀에게는 즐겁고 안전한 학습 환경과 학습 능률을 제고하는 적응 형 개별 디지털 학습법을 제시한다. 제안하는 앱은 시간제한 설정과 더불어 유해 콘텐츠와 스마트폰 중독의 위험으로부터 자녀를 보호하는 게이미피케이션 런처이다. 수많은 교육용 콘텐츠 및 앱 중에서 선택이 어려운 부모들에게 아이들의 학습 및 활동 정보를 수집 분석하여 빅 데이터 기반의 학습 분석 리포트를 제공 하고 집단지성을 통한 추천 알고리즘으로 자녀에게 필요한 콘텐츠를 추천하는 시스템으로 구성된다.

음질, 운율, 발음 특징을 이용한 마비말장애 중증도 자동 분류 (Automatic severity classification of dysarthria using voice quality, prosody, and pronunciation features)

  • 여은정;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.57-66
    • /
    • 2021
  • 본 논문은 말 명료도 기준의 마비말장애 중증도 자동 분류 문제에 초점을 둔다. 말 명료도는 호흡, 발성, 공명, 조음, 운율 등 다양한 말 기능 특징의 영향을 받는다. 그러나 대부분의 선행연구는 한 개의 말 기능 특징만을 중증도 자동분류에 사용하였다. 본 논문에서는 음성의 장애 특성을 효과적으로 포착하기 위해 마비말장애 중증도 자동 분류에서 음질, 운율, 발음의 다양한 말 기능 특징을 반영하고자 하였다. 음질은 jitter, shimmer, HNR, voice breaks 개수, voice breaks 정도로 구성된다. 운율은 발화 속도(전체 길이, 말 길이, 말 속도, 조음 속도), 음높이(F0 평균, 표준편차, 최솟값, 최댓값, 중간값, 25 사분위값, 75 사분위값), 그리고 리듬(% V, deltas, Varcos, rPVIs, nPVIs)을 포함한다. 발음에는 음소 정확도(자음 정확도, 모음 정확도, 전체 음소 정확도)와 모음 왜곡도[VSA(vowel space area), FCR (formant centralized ratio), VAI(vowel articulatory index), F2 비율]가 있다. 본 논문에서는 다양한 특징 조합을 사용하여 중증도 자동 분류를 시행하였다. 실험 결과, 음질, 운율, 발음 특징 세 가지 말 기능 특징 모두를 분류에 사용했을 때 F1-score 80.15%로 가장 높은 성능이 나타났다. 이는 마비말장애 중증도 자동 분류에는 음질, 운율, 발음 특징이 모두 함께 고려되어야 함을 시사한다.

가상화 시스템에서 Virtio와 SR-IOV 적용에 대한 단일 및 다중 네트워크 성능 평가 및 분석 (Performance Evaluation and Analysis on Single and Multi-Network Virtualization Systems with Virtio and SR-IOV)

  • 이재학;임종범;유헌창
    • 정보처리학회 논문지
    • /
    • 제13권2호
    • /
    • pp.48-59
    • /
    • 2024
  • 하드웨어 자체적으로 가상화를 지원하는 기능들이 추가됨에 따라 다양한 작업 유형을 가진 사용자 어플리케이션들이 가상화 시스템에서 효율적으로 운용되고 있다. 가상화 지원 기능 중 SR-IOV는 PCI 장치에 대한 직접 접근을 통해 하이퍼바이저 또는 운영체제 개입을 최소화하여 시스템 성능을 높이는 기술로 베어-메탈 시스템 대비 비교적 긴 I/O 경로 및 사용자 영역과 커널 영역에 대한 빈번한 컨텍스트 스위칭 등 가상화 계층의 추가로 낮은 네트워크 성능을 가진 가상화 시스템에서 네트워크 I/O 가속화를 실현하게 해준다. 이러한 성능적 이점을 이용하기 위해 가상머신 또는 컨테이너와 같은 인스턴스에 SR-IOV를 접목할 시 최적의 네트워크 I/O 성능을 도출할 수 있는 네트워크 자원 관리 정책이 활발히 연구되고 있다. 본 논문은 I/O 가속화를 실현하는 SR-IOV의 네트워크 성능을 1) 네트워크 지연 시간, 2) 네트워크 처리량, 3) 네트워크 공정성, 4) 성능간섭, 5) 다중 네트워크와 같은 측면으로 세밀한 성능 평가 및 분석을 Virtio와 비교하여 진행한다. 본 논문의 기여점은 다음과 같다. 첫째, 가상화 시스템에서 Virtio와 SR-IOV의 네트워크 I/O 과정을 명확히 설명했으며, 둘째, Virtio와 SR-IOV의 네트워크 성능을 다양한 성능 메트릭을 기반으로 분석하였다. 셋째, 가상머신 밀집도가 높은 환경에서 SR-IOV 네트워크에 대한 시스템 오버헤드 및 이에 대한 최적화 가능성을 실험으로 확인하였다. 본 논문의 실험 결과 및 분석들은 스마트 팩토리, 커넥티드-카, 딥러닝 추론 모델, 크라우드 소싱과 같은 네트워크 집약적인 서비스들을 운용하는 가상화 시스템에 대한 네트워크 자원 관리 정책에 활용될 것으로 기대된다.

미국 정보 대학의 데이터사이언스 학위 현황 연구 (Degree Programs in Data Science at the School of Information in the States)

  • 박형주
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.305-332
    • /
    • 2022
  • 본 연구의 목적은 문헌정보학 프로그램이 있는 정보 대학에서 수여하는 데이터사이언스 학위의 현황을 알아보는 것이다. 데이터 수집의 대상은, 2022년 미국도서관협회의 인가를 받은 문헌정보학 프로그램이 있는 64개의 대학에서 수여하는 데이터사이언스 학위였다. 분석의 대상은 각 대학의 데이터사이언스 학위 과정, 부전공, 세부 전공, 수료증, 취업 후 예상 진로, 취업률 등이었다. 교과 분석을 위해 미국 정보 대학에서 제시한 교과목 명, 교과 설명, 중점 교육 분야를 분석했다. 데이터사이언스를 학위 명으로 개설한 대학은 총 8개 정보 대학의 12개 학위였으며, 학사 학위 5개, 석사 학위 6개, 박사 학위 1개였다. 개설된 교과의 주제는 데이터사이언스 입문, 정보검색, 데이터마이닝, 데이터베이스, 데이터와 인문학, 머신 러닝, 메타데이터, 연구 방법론, 데이터 분석 및 시각화, 실습/캡스톤, 윤리 및 보안, 이용자, 정책, 큐레이션 및 관리였다. 대부분의 대학은 전통적인 문헌정보학 교과를 개설하지 않고 있었다. 정보 대학이 제시한 졸업 후 예상 취업 진로는 데이터사이언티스트, 데이터 엔지니어, 데이터 분석가 등이었다. 본 연구의 결과는 정보학의 관점에서 데이터사이언스 학위 과정, 세부 전공, 수료증 또는 교과과정 개발 및 개정을 위한 논의에 활용될 수 있는 기초 자료로 활용되기를 기대한다.