• 제목/요약/키워드: Learning with AI

검색결과 820건 처리시간 0.033초

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.

제2형 당뇨병 환자의 1일과 3일 평균 식이섭취량의 일관성과 혈당, 당화혈색소, 체질량지수, 지질과의 관련성 (Consistency of 1-day and 3-day average dietary intake and the relationship of dietary intake with blood glucose, hbA1c, BMI, and lipids in patients with type 2 diabetes)

  • 이대은;이해정;이상은;이민진;강아름
    • Journal of Korean Biological Nursing Science
    • /
    • 제25권1호
    • /
    • pp.20-31
    • /
    • 2023
  • Purpose: This study aimed to determine the consistency of 1-day and 3-day average dietary intake using the 24-hour diet recall method and to investigate the relationship of diet intake with physiological indicators potentially associated with diabetic complications in patients with diabetes. Methods: This study conducted a secondary data analysis using pretest data of a nursing intervention study entitled "Development of deep learning based AI coaching program for diabetic patients with high risk and examination of its effects." Data were analyzed through descriptive analysis, one-way repeated-measures analysis of variance, and Pearson correlation coefficients using SPSS 26.0. Results: The average total daily calorie intake over 3 days was 1,494.48 ± 436.47 kcal/day: 1,510.90 ± 547.76 kcal/day on the first day, 1,414.22 ± 527.58 kcal/day on the second day, 1,558.34 ± 645.83 kcal/ day on the third day, showing significant differences (F = 3.59, p = .031). The correlation coefficient between the 1-day and 3-day average dietary intake was 0.41-0.77 for each nutrient and 0.62-0.80 for each food group. Vegetable intake showed negative correlations with body mass index (BMI; r = -.19, p = .023) and triglycerides (r = -.18, p = .036), whereas dairy intake was positively associated with low-density lipoprotein-cholesterol (LDL; r = -0.18, p = .034) and triglycerides (r = .40, p<.001). Conclusion: This study demonstrated that 1-day dietary intake was highly correlated with 3-day average dietary intake using the 24-hour diet recall method. Food groups showed significant associations with physiological indicators of potential diabetic complications such as BMI, triglycerides, and LDL levels. Further studies are needed to improve the knowledge base on the relationships between physiological indicators and food groups.

x-vector를 이용한 다화자 음성합성 시스템 (A Multi-speaker Speech Synthesis System Using X-vector)

  • 조민수;권철홍
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.675-681
    • /
    • 2021
  • 최근 인공지능 스피커 시장이 성장하면서 사용자와 자연스러운 대화가 가능한 음성합성 기술에 대한 수요가 증가하고 있다. 따라서 다양한 음색의 목소리를 생성할 수 있는 다화자 음성합성 시스템이 필요하다. 자연스러운 음성을 합성하기 위해서는 대용량의 고품질 음성 DB로 학습하는 것이 요구된다. 그러나 많은 화자가 발화한 고품질의 대용량 음성 DB를 수집하는 것은 녹음 시간과 비용 측면에서 매우 어려운 일이다. 따라서 각 화자별로는 소량의 학습 데이터이지만 매우 많은 화자의 음성 DB를 사용하여 음성합성 시스템을 학습하고, 이로부터 다화자의 음색과 운율 등을 자연스럽게 표현하는 기술이 필요하다. 본 논문에서는 화자인식 기술에서 사용하는 딥러닝 기반 x-vector 기법을 적용하여 화자 인코더를 구성하고, 화자 인코더를 통해 소량의 데이터로 새로운 화자의 음색을 합성하는 기술을 제안한다. 다화자 음성합성 시스템에서 텍스트 입력에서 멜-스펙트로그램을 합성하는 모듈은 Tacotron2로, 합성음을 생성하는 보코더는 로지스틱 혼합 분포가 적용된 WaveNet으로 구성되어 있다. 학습된 화자 임베딩 신경망에서 추출한 x-vector를 Tacotron2에 입력으로 추가하여 원하는 화자의 음색을 표현한다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.

딥러닝 기반 터널 영상유고감지 시스템 개발 연구 (Development of a deep-learning based tunnel incident detection system on CCTVs)

  • 신휴성;이규범;임민진;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제19권6호
    • /
    • pp.915-936
    • /
    • 2017
  • 본 논문에서는 2016년을 기준으로 강화된 터널 방재시설 설치 및 관리지침과, 점차 강화되고 있는 터널 CCTV설치 터널등급 기준과 터널 영상유고감지 시스템의 설치 운용에 대한 요구의 증가 상황을 정리해 보고하였다. 그럼에도, 가동중인 알고리즘 기반의 터널 영상유고감시 시스템의 정상 인지율은 50%가 채 되지 않는 것으로 파악되었으며, 그에 대한 주원인은 터널 내 낮은 조도, 심한 먼지로 인한 영상 선명도 저하, 낮은 CCTV 설치위치로 인한 이동객체의 겹침현상 등으로 파악되었다. 따라서, 본 연구에서는 이러한 열악한 조건에서도 영상유고 정상 인지율을 확보할 수 있는 딥러닝 기반 영상유고감지 시스템을 개발하였으며, 이에 대한 이론적 배경 제시와 시스템의 타당성 검토 연구가 진행되었다. 개발 시스템의 타당성 검토 연구는 터널 방재시설 및 관리지침 내 영상유고감지 항목중 정지 및 역주행 차량을 감지하는 주요 정보인 차량 객체 인식과 보행자 감지를 중심으로 진행되었다. 또한, (1) 동일 터널 내에서 학습과 추론이 이루어 지는 경우와 (2) 다양한 터널의 영상 정보를 통합 학습하고, 각 터널의 영상유고감지에 투입되는 경우, 두개의 시나리오를 설정하여 타당성 검토를 진행하였다. 두 시나리오 모두 일정 시간의 학습 자료와 유사한 상황에 대해서는 열악한 터널환경과 무관하게 그 감지성능이 80% 이상으로 우수하나, 추가 학습 없이 학습된 시간 구간과 멀어질수록 그 추론 성능은 상대적으로 낮은 40% 수준으로 떨어짐을 알 수 있었다. 그러나, 시간이 지남에 따라 자동으로 누적되어 확장되는 영상유고 빅데이터를 반복적으로 학습함으로써, 설치된 영상유고감지 시스템의 보완이나 보정절차 없이도 자동으로 그 영상유고감지 성능이 향상될 수 있음을 보였다.

가족유사성 접근을 통한 과학 PCK 변화 탐색 (Exploring Changes in Science PCK Characteristics through a Family Resemblance Approach)

  • 곽영순
    • 대한지구과학교육학회지
    • /
    • 제15권2호
    • /
    • pp.235-248
    • /
    • 2022
  • 학령인구의 급격한 감소, 학생의 교육과정 선택권 확대 등과 같은 미래 교육환경 변화에 따라 과학교사의 전문성인 PCK에도 변화가 요청된다. 즉, 기존 합의-PCK를 구성하는 범주 및 과학 PCK의 특성은 고정된 것이 아니어서 새로운 범주와 특성이 추가될 수 있다. 본 연구의 목적은 비트겐슈타인의 가족유사성 접근을 통해 미래 교육환경 변화에 대처하기 위해 요구되는 과학 PCK의 잠재성의 영역을 '가족유사성 과학 PCK'의 형태로 탐구하려는 것이다. 이를 위해 3개의 초점집단을 대상으로 심층면담을 진행하였다. 초점집단 심층면담에서는 미래사회와 교육환경 변화로 인해 2030년-2045년의 가까운 미래 학교의 과학교사에게 요구되는 과학 PCK가 어떻게 달라질 것인지를 논의하였다. 심층면담을 토대로 질적 분석을 실시함과 동시에 기존 합의-PCK와 차별화되는 가족유사성-PCK의 특성을 분석하기 위해 심층면담 텍스트에 대한 언어네트워크(semantic network) 분석을 시행하였다. 연구결과에서 미래사회 교사의 역할기대가 변함에 따라 새롭게 요청되는 과학교사의 가족유사성-PCK의 특징을 PCK 구성 영역별로 살펴보았다. 미래학교 과학교사에게 요구되는 가족유사성-PCK에 대한 언어 네트워크 분석결과를 살펴보면, 가족유사성-PCK는 출발점에 해당하는 기존 합의-PCK로부터 그 외연이 확장되면서 새로운 PCK요소가 추가되는 것으로 나타났다. 가족유사성-PCK의 양태를 살펴보면, [인공지능-융복합지식-콘텐츠-디지털], [지역사회-네트워크-인적자원-관계], [기술-탐구-가상현실-연구], [자기주도학습-협업-공동체] 등이 뚜렷한 네트워크 군집을 형성하면서 미래학교의 과학교사의 전문성을 형성, 강화되고 있는 것으로 나타났다. 연구결과를 토대로 미래학교 과학교사 전문성의 변화 동향과 대처 방안을 결론으로 제안하였다.

초-고해상도 영상 스타일 전이 (Super High-Resolution Image Style Transfer)

  • 김용구
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.104-123
    • /
    • 2022
  • 신경망 기반 스타일 전이 기법은 영상의 고차원적 구조적 특징을 반영하여 높은 품질의 스타일 전이 결과를 제공함으로써 최근 크게 주목받고 있다. 본 논문은 이러한 신경망 기반 스타일 전이의 GPU 메모리 제한에 따른 해상도 한계에 대한 문제를 다룬다. 신경망 출력이 가진 제한적 수용장 특징을 바탕으로, 부분 영상 기반의 스타일 전이 손실함수 경사도 연산이 전체 영상을 대상으로 구한 경사도 연산과 동일한 결과를 생성할 수 있을 것으로 기대할 수 있다. 이러한 아이디어를 기반으로, 본 논문에서는, 스타일 전이 손실함수의 각 구성 요소에 대한 경사도 연산 구조를 분석하고, 이를 통해 부분 영상의 생성 및 패딩에 대한 필요조건을 구하고, 전체 영상의 신경망 출력에 좌우되는 경사도 연산 요구 데이터를 확인하여 구조화함으로써 재귀적 초고해상도 스타일 전이 알고리즘을 개발하였다. 제안된 기법은, 사용하는 GPU 메모리가 처리할 수 있는 크기로 초고해상도 입력을 분할하여 스타일 전이를 수행함으로써, GPU 메모리 한계에 따른 해상도 제한을 받지 않으며, 초고해상도 스타일 전이에서만 감상할 수 있는 독특한 세부 영역의 전이 스타일 특징을 제공할 수 있다.

머신러닝 기법을 이용한 약물 분류 방법 연구 (A Study on the Drug Classification Using Machine Learning Techniques)

  • Anmol Kumar Singh;Ayush Kumar;Adya Singh;Akashika Anshum;Pradeep Kumar Mallick
    • 산업과 과학
    • /
    • 제3권2호
    • /
    • pp.8-16
    • /
    • 2024
  • 본 논문에서는 인구통계학적, 생리학적 특성을 기반으로 환자에게 가장 적합한 약물을 예측하는 것을 목표로 하는 약물 분류 시스템을 제시한다. 데이터 세트에는 적절한 약물을 결정하기 위한 목적으로 연령, 성별, 혈압(BP), 콜레스테롤 수치, 나트륨 대 칼륨 비율(Na_to_K)과 같은 속성들이 포함된다. 본 연구에 사용된 모델은 KNN(K-Nearest Neighbors), 로지스틱 회귀 분석 및 Random Forest이다. 하이퍼파라미터를 최적화하기 위해 5겹 교차 검증을 갖춘 GridSearchCV를 활용하였으며, 각 모델은 데이터 세트에서 훈련 및 테스트 되었다. 초매개변수 조정 유무에 관계없이 각 모델의 성능은 정확도, 혼동 행렬, 분류 보고서와 같은 지표를 사용하여 평가되었다. GridSearchCV를 적용하지 않은 모델의 정확도는 0.7, 0.875, 0.975인 반면, GridSearchCV를 적용한 모델의 정확도는 0.75, 1.0, 0.975로 나타났다. GridSearchCV는 로지스틱 회귀 분석을 세 가지 모델 중 약물 분류에 가장 효과적인 모델로 식별했으며, K-Nearest Neighbors가 그 뒤를 이었고 Na_to_K 비율은 결과를 예측하는 데 중요한 특징인 것으로 밝혀졌다.

캠페인 효과 제고를 위한 자기 최적화 변수 선택 알고리즘 (Self-optimizing feature selection algorithm for enhancing campaign effectiveness)

  • 서정수;안현철
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.173-198
    • /
    • 2020
  • 최근 온라인의 비약적인 활성화로 캠페인 채널들이 다양하게 확대되면서 과거와는 비교할 수 없을 수준의 다양한 유형들의 캠페인들이 기업에서 수행되고 있다. 하지만, 고객의 입장에서는 중복 노출로 인한 캠페인에 대한 피로감이 커지면서 스팸으로 인식하는 경향이 있고, 기업입장에서도 캠페인에 투자하는 비용은 점점 더 늘어났지만 실제 캠페인 성공률은 오히려 더 낮아지고 있는 등 캠페인 자체의 효용성이 낮아지고 있다는 문제점이 있어 실무적으로 캠페인의 효과를 높이고자 하는 다양한 연구들이 지속되고 있다. 특히 최근에는 기계학습을 이용하여 캠페인의 반응과 관련된 다양한 예측을 해보려는 시도들이 진행되고 있는데, 이 때 캠페인 데이터의 다양한 특징들로 인해 적절한 특징을 선별하는 것은 매우 중요하다. 전통적인 특징 선택 기법으로 탐욕 알고리즘(Greedy Algorithm) 중 SFS(Sequential Forward Selection), SBS(Sequential Backward Selection), SFFS(Sequential Floating Forward Selection) 등이 많이 사용되었지만 최적 특징만을 학습하는 모델을 생성하기 때문에 과적합의 위험이 크고, 특징이 많은 경우 분류 예측 성능 하락 및 학습시간이 많이 소요된다는 한계점이 있다. 이에 본 연구에서는 기존의 캠페인에서의 효과성 제고를 위해 개선된 방식의 특징 선택 알고리즘을 제안한다. 본 연구의 목적은 캠페인 시스템에서 처리해야 하는 데이터의 통계학적 특성을 이용하여 기계 학습 모델 성능 향상의 기반이 되는 특징 부분 집합을 탐색하는 과정에서 기존의 SFFS의 순차방식을 개선하는 것이다. 구체적으로 특징들의 데이터 변형을 통해 성능에 영향을 많이 끼치는 특징들을 먼저 도출하고 부정적인 영향을 미치는 특징들은 제거를 한 후 순차방식을 적용하여 탐색 성능에 대한 효율을 높이고 일반화된 예측이 가능하도록 개선된 알고리즘을 적용하였다. 실제 캠페인 데이터를 이용해 성능을 검증한 결과, 전통적인 탐욕알고리즘은 물론 유전자알고리즘(GA, Genetic Algorithm), RFE(Recursive Feature Elimination) 같은 기존 모형들 보다 제안된 모형이 보다 우수한 탐색 성능과 예측 성능을 보임을 확인할 수 있었다. 또한 제안 특징 선택 알고리즘은 도출된 특징들의 중요도를 제공하여 예측 결과의 분석 및 해석에도 도움을 줄 수 있다. 이를 통해 캠페인 유형별로 중요 특징에 대한 분석과 이해가 가능할 것으로 기대된다.

Generative Adversarial Network-Based Image Conversion Among Different Computed Tomography Protocols and Vendors: Effects on Accuracy and Variability in Quantifying Regional Disease Patterns of Interstitial Lung Disease

  • Hye Jeon Hwang;Hyunjong Kim;Joon Beom Seo;Jong Chul Ye;Gyutaek Oh;Sang Min Lee;Ryoungwoo Jang;Jihye Yun;Namkug Kim;Hee Jun Park;Ho Yun Lee;Soon Ho Yoon;Kyung Eun Shin;Jae Wook Lee;Woocheol Kwon;Joo Sung Sun;Seulgi You;Myung Hee Chung;Bo Mi Gil;Jae-Kwang Lim;Youkyung Lee;Su Jin Hong;Yo Won Choi
    • Korean Journal of Radiology
    • /
    • 제24권8호
    • /
    • pp.807-820
    • /
    • 2023
  • Objective: To assess whether computed tomography (CT) conversion across different scan parameters and manufacturers using a routable generative adversarial network (RouteGAN) can improve the accuracy and variability in quantifying interstitial lung disease (ILD) using a deep learning-based automated software. Materials and Methods: This study included patients with ILD who underwent thin-section CT. Unmatched CT images obtained using scanners from four manufacturers (vendors A-D), standard- or low-radiation doses, and sharp or medium kernels were classified into groups 1-7 according to acquisition conditions. CT images in groups 2-7 were converted into the target CT style (Group 1: vendor A, standard dose, and sharp kernel) using a RouteGAN. ILD was quantified on original and converted CT images using a deep learning-based software (Aview, Coreline Soft). The accuracy of quantification was analyzed using the dice similarity coefficient (DSC) and pixel-wise overlap accuracy metrics against manual quantification by a radiologist. Five radiologists evaluated quantification accuracy using a 10-point visual scoring system. Results: Three hundred and fifty CT slices from 150 patients (mean age: 67.6 ± 10.7 years; 56 females) were included. The overlap accuracies for quantifying total abnormalities in groups 2-7 improved after CT conversion (original vs. converted: 0.63 vs. 0.68 for DSC, 0.66 vs. 0.70 for pixel-wise recall, and 0.68 vs. 0.73 for pixel-wise precision; P < 0.002 for all). The DSCs of fibrosis score, honeycombing, and reticulation significantly increased after CT conversion (0.32 vs. 0.64, 0.19 vs. 0.47, and 0.23 vs. 0.54, P < 0.002 for all), whereas those of ground-glass opacity, consolidation, and emphysema did not change significantly or decreased slightly. The radiologists' scores were significantly higher (P < 0.001) and less variable on converted CT. Conclusion: CT conversion using a RouteGAN can improve the accuracy and variability of CT images obtained using different scan parameters and manufacturers in deep learning-based quantification of ILD.