• 제목/요약/키워드: AI learning data

검색결과 794건 처리시간 0.026초

텍스트 마이닝을 이용한 인공지능 활용 신약 개발 연구 동향 분석 (Analysis of Research Trends in New Drug Development with Artificial Intelligence Using Text Mining)

  • 남재우;김영준
    • 생명과학회지
    • /
    • 제33권8호
    • /
    • pp.663-679
    • /
    • 2023
  • 본 리뷰 논문은 2010년부터 2022년까지의 인공지능을 활용한 신약개발 관련 연구동향을 분석하여 정리하였다. 이러한 분석을 통해 2,421개 연구의 초록을 코퍼스로 구성하고, 전처리를 거쳐 빈도가 높고 연결 중심성이 높은 단어를 추출하였다. 분석 결과 2010-201년과 2020-2022년 단어빈도 추이는 비슷한 것으로 구분되어 나타났다. 연구 방법으로는 2010년부터 2020년까지 머신 러닝을 활용한 연구가 많이 진행되었고, 2021년부터는 딥러닝을 활용한 연구가 증가하고 있다. 이러한 연구를 통해 이루어지고 있는 인공지능 활용연구 동향에 대해 분야별로 살펴보고 관련 연구의 장점, 문제점, 도전과제 등을 살펴보았다. 파악되어진 연구 동향은 2021년 이후로 약물의 재배치를 인공지능 활용 연구, 항암제 개발을 위한 컴퓨터 활용 연구, 임상시험에 인공지능 적용 연구 등과 같이 인공지능 적용 분야가 확대되고 있다는 점이다. 이러한 과정을 통해 향후 이루어질 것으로 예상되는 인공지능 활용 신약개발 연구의 전망에 대해 간략히 제시하였다. 위의 인공지능 기술 발전과 함께 바이오와 의료데이터의 신뢰성과 안전성이 확보되어진다면 인공지능 활용 신약개발의 방향이 개인 맞춤형 의료와 정밀의료 분야로 진행되어질 것으로 판단하기에 이에 대한 지속적인 노력이 필요하리라 본다.

Sentinel-1 SAR 영상을 활용한 국내 내륙 수체 학습 데이터셋 구축 및 알고리즘 적용 연구 (A Study of Development and Application of an Inland Water Body Training Dataset Using Sentinel-1 SAR Images in Korea)

  • 이어루;정형섭
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1371-1388
    • /
    • 2023
  • 지구온난화로 인해 촉발된 기후변화가 홍수와 같은 수재해의 빈도와 규모를 증가시키며 국내 또한 장마와 집중호우로 인한 수재해가 증가하는 추세를 보인다. 이에 광범위한 수재해에 대해 효과적인 대응 및 기후 변화에 따른 선제적 대처가 필수적이며 이는 위성레이더 영상을 통해 가능하다. 본 연구에서는 Sentinel-1 위성 레이더 영상으로부터 국내 수체의 특성을 반영하기 위해 한강권역과 낙동강 권역의 일부 수체 영역에 대해 수체 학습 데이터셋 1,423장을 구축하였다. 정밀한 데이터 어노테이션(Annotation)을 위해 다양한 상황에 따른 구축 기준 문서를 작성한 뒤 진행하였다. 구축이 완료된 데이터셋을 딥러닝 모델 중 U-Net에 적용하여 수체 탐지 결과를 분석하였다. 최종적으로 학습된 모델을 학습과에 활용되지 않은 수체 영역에 적용하여 결과를 분석함으로써 전 국토 수체 모니터링의 가능성을 확인하였다. 분석 결과 구축된 수체 영역의 대해서는 F1-Score 0.987, Intersection over Union (IoU) 0.955의 높은 정확도로 수체를 탐지할 수 있었으며, 학습 및 평가에 활용되지 않은 다른 국내 수체 영역에 대해서도 동일하게 F1-Score 0.941, IoU 0.89의 높은 수체 탐지 결과를 나타냈다. 두 결과 모두 전반적으로 일부 그림자 영역과 폭이 좁은 하천에서 오류가 관찰되었으나, 그 외에는 정밀하게 수체를 탐지하였다. 이러한 연구 결과는 수재해 피해 규모 및 수자원 변화 모니터링에 중요한 기여를 할 것으로 기대된다. 추후 연구에서는 보다 다양한 수체 특성을 가진 데이터셋을 추가 구축한다면 오분류한 영역을 개선할 수 있을 것으로 기대되며, 전 국토의 수체를 효율적으로 관리 및 모니터링하는데 활용될 것으로 사료된다.

기계학습 기반 전력망 상태예측 모델 성능 유지관리 자동화 기법 (Management Automation Technique for Maintaining Performance of Machine Learning-Based Power Grid Condition Prediction Model)

  • 이해성;이병성;문상근;김준혁;이혜선
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제6권4호
    • /
    • pp.413-418
    • /
    • 2020
  • 초기 학습 데이터의 과적합으로 인한 전력망 상태예측 모델의 성능 감소를 방지하고 예측모델의 예측 정확도 유지를 통한 계속적인 현장활용을 위해서는 기계학습 모델의 예측 정확도를 지속적으로 관리할 필요가 있다. 이를 위해, 본 논문에서는 다양한 요인에 의해 끊임없이 변화하는 전력망 상태 데이터의 특성을 고려하여 예측모델의 정확성과 신뢰성을 높이고 현장 적용 가능한 수준의 품질을 유지하기 위한 기계학습 기반 전력망 상태예측 모델의 성능 유지관리 자동화 기법을 제안한다. 제안 기법은 워크플로우 관리 기술의 적용을 통해 전력망 상태예측 모델 성능 유지관리를 위한 일련의 태스크들을 워크플로우의 형태로 모델링하고 이를 자동화하여 업무를 효율화 하였다. 또한, 기존 기술에서는 시도되지 않았던 학습데이터의 통계적 특성 변화 정도와 예측의 일반화 수준을 모두 고려한 예측모델의 성능 평가를 통해 성능 결과의 신뢰성을 확보하고 이를 통해 예측 모델의 정확도를 일정 수준으로 유지관리하고 더욱 성능이 우수한 예측모델의 신규 개발이 가능하다. 결과적으로 본 논문에서 제안하는 전력망 상태예측 모델 성능 유지관리 자동화 기법을 통해 예측모델의 성능 저하문제를 해결하여 분산자원 연계 등 외부 환경의 변화에 유연한 예측모델 관리를 통해 정확성과 신뢰성이 보장된 예측 모델의 지속적인 활용이 가능하다.

CNN 은닉층 증가에 따른 인공지능 정확도 평가: 뇌출혈 CT 데이터 (Evaluation of Artificial Intelligence Accuracy by Increasing the CNN Hidden Layers: Using Cerebral Hemorrhage CT Data)

  • 김한준;강민지;김은지;나용현;박재희;백수은;심수만;홍주완
    • 한국방사선학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-6
    • /
    • 2022
  • 딥러닝은 다량의 데이터 속에서 핵심적인 내용을 요약해 학습하는 알고리즘의 집합으로 의료영상 분야에서 병변을 진단하는 목적으로 사용되기 위해 발전하고 있다. 본 논문에서는 뇌출혈 진단 정확성을 평가하기 위해 CNN을 이용해 뇌실질 CT 영상과 뇌출혈이 의심되는 뇌실질 CT의 진단 정확도를 도출하였다. 은닉층 수에 따른 정확도를 비교한 결과 은닉층이 증가할수록 정확도가 높아졌다. 본 연구에서 도출된 CT 뇌출혈 유무 분석 결과는 앞으로 의료영상 분야와 인공지능 접목에 관한 연구에서 기초 자료로 사용될 것으로 사료된다.

IoT 기반 교통사고 실시간 인지방법론 연구 (A Study on the Real-time Recognition Methodology for IoT-based Traffic Accidents)

  • 오성훈;전영준;권영우;정석찬
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.15-27
    • /
    • 2022
  • 최근 5년간 차량 단독사고 교통사고 치사율이 전체 사고보다 4.7배 높은 것으로 집계되고 있으며, 차량 단독사고를 즉각적으로 감지하고 대응할 수 있는 시스템 구축이 필요하다. 본 연구는 가드레일에 충격과 차량 진입 감지 IoT(Internet of Thing) 센서를 부착하여 가드레일 충격 발생 시 사고 현장의 영상을 인공지능 기술을 통해 분석하고 구조기관에 전송하여 빠른 구조작업을 수행하여 피해를 최소화 시킬 수 있는 방법론을 제시한다. 해당 구간 내 차량 진입과 가드레일 충격 감지를 위한 IoT 센서 모듈과 차량 이미지 데이터 학습을 통한 인공지능 기반 객체 탐지 모듈을 구현하였다. 그리고, 센서 정보와 영상 데이터 등을 통합적으로 관리하는 모니터링 및 운영 모듈도 구현하였다. 시스템 유효성 검증을 위하여 충격 감지 전송속도와 자동차 및 사람 객체 탐지 정확도, 센서 장애감지 정확도를 측정한 결과, 모두 목표치를 충족하였다. 향후에는 실제 도로에 적용하여 실데이터를 적용한 유효성을 검증하고 상용화할 계획이다. 본 시스템은 도로 안전 향상에 이바지할 것이다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.

데이터 확장을 통한 토지피복분류 U-Net 모델의 성능 개선 (The Performance Improvement of U-Net Model for Landcover Semantic Segmentation through Data Augmentation)

  • 백원경;이명진;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1663-1676
    • /
    • 2022
  • 최근 딥러닝을 활용한 토지피복분류 기법 연구가 다수 수행되고 있다. 그런데 양질의 토지피복 학습데이터를 충분하게 구축되지 못하여 성능이 저하되는 양상이 확인되었다. 이에 따라 본 연구에서는 데이터 확장 기법의 적용을 통한 토지피복분류 성능의 향상을 확인하였다. 분류 모델로는 U-Net이 활용되었으며 AI Hub에서 제공하는 토지피복 위성 이미지 자료를 연구자료로 활용하였다. 원본 데이터로 학습한 모델과 데이터 확장 기법이 적용된 데이터로 학습한 모델의 픽셀 정확도는 각각 0.905와 0.923이었으며 평균 F1 스코어는 각각 0.720과 0.775로 데이터 확장 기법을 적용하였을 때가 보다 우수한 성능을 나타내는 사실을 확인할 수 있었다. 또한 원본 학습데이터를 활용하여 학습한 모델의 경우 건물, 도로, 논, 밭, 산림, 비대상 지역 클래스에 대한 F1 스코어가 0.770, 0.568, 0.733, 0.455, 0.964 그리고 0.830이었으며, 데이터 확장을 적용하였을 때에 각 클래스에 대한 F1 스코어는 각각 0.838, 0.660, 0.791, 0.530, 0.969 그리고 0.860으로 모든 클래스에 대해 데이터 확장이 성능향상에 유효하다는 사실을 확인하였다. 또한, 클래스 균형에 대한 고려없이 데이터 확장을 적용했음에도 불구하고 데이터 불균형에 의한 클래스별 성능 왜곡을 완화할 수 있다는 사실을 확인할 수 있었다. 이는 절대적인 학습데이터의 양이 증가했기 때문이라 판단된다. 본 연구 결과는 다양한 영상 처리 분야에서 데이터 확장 기법의 중요성과 효과를 증명하는 기반 자료의 역할을 수행할 것으로 기대한다.

터널 구조물 안전점검을 위한 이미지 데이터 취득 및 데이터 구조화 방법 (Image-Data-Acquisition and Data-Structuring Methods for Tunnel Structure Safety Inspection)

  • 성현석;고준섭
    • 한국지반공학회논문집
    • /
    • 제40권1호
    • /
    • pp.15-28
    • /
    • 2024
  • 본 연구에서는 터널 구조물 내부 이미지 데이터를 취득하는 방법과 이미지 데이터의 구조화를 위한 방법을 제안하였다. 터널 구조물 내부 이미지 데이터 취득 조건을 개선함으로써 AREA TYPE의 터널 스캐닝에서 고화질의 이미지 데이터를 얻을 수 있다. 데이터 취득 조건을 개선하기 위해 터널 상부에 터널의 길이 방향 레일을 설치하고 설치된 레일을 이동하며 터널 구조물 전체의 이미지 데이터를 취득할 수 있도록 설계하였다. 본 연구는 거리 20m, 해상도 3840×2160 및 해상도 720×480의 조건에서 0.5mm 균열 모사선을 식별하였다. 또한 취득된 이미지 데이터를 이미지 타일 단위로 관리하기 위한 이미지 데이터 구조화 방법을 제안하였다. 터널의 이미지 데이터 구조화를 위해 적용인자 (취득 이미지의 해상도와 터널의 크기)를 관계식에 대입하여 터널의 이미지 데이터를 구조화할 수 있다. 실험을 통해 터널 길이 1,000m, 폭 20m 터널의 이미지 데이터는 해상도와 정밀도에 따라 최소중첩률 0.02%에서 8.36% 구해지며 로컬좌표계의 크기는 (14×15)에서 (36×34)로 나타났다.

NLP와 BiLSTM을 적용한 조세 결정문의 분석과 예측 (Tax Judgment Analysis and Prediction using NLP and BiLSTM)

  • 이영근;박구락;이후영
    • 디지털융복합연구
    • /
    • 제19권9호
    • /
    • pp.181-188
    • /
    • 2021
  • 일반인에게 난해한 법률분야를 이해하기 쉽고 예측 가능 할 수 있도록 인공지능을 적용한 법률 서비스에 대한 연구의 중요성이 대두되고 있다. 본 연구에서는 조세심판원의 결정정보를 수집하고 데이터 처리와 자체 학습을 통한 모델을 구축하여 사용자의 질의에 맞는 답변을 예측하기 위한 시스템을 제안한다. 제안 모델은 웹크롤링을 통해서 조세 결정문의 정보 수집 및 자연어 처리과정을 통하여 유용한 데이터를 추출하고, 최적화된 산출물을 Word2Vec의 Fast Text 알고리즘을 적용하여 단어의 벡터를 생성하였다. 2017년부터 2019년까지 총 11,103건의 정보를 수집하고 분류하였으며 RNN 기술의 BiLSTM을 적용하여 자체학습을 통한 결과 예측 프로그램을 구축하여 70%정확도로 실증하였다. 향후 다양한 법률시스템으로 활용성을 기대할 수 있으며 보다 효율적인 적용을 위한 연구와 정확도 향상을 위한 연구가 계속되어야 한다.

A Study on GAN Algorithm for Restoration of Cultural Property (pagoda)

  • Yoon, Jin-Hyun;Lee, Byong-Kwon;Kim, Byung-Wan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.77-84
    • /
    • 2021
  • 오늘날 문화재 복원은, 기존 자료와 전문가에 의존하는 것과 더불어 최신 IT 기술을 적용하여 복원하고 있다. 하지만 새로운 자료가 나와서 기존 복원이 틀리게 되는 경우, 복원하는데 너무 오랜 시간이 걸릴 때도 있다. 그리고 예상과 다른 결과가 나올 가능성도 있다. 이에 우리는 중요 문화재의 복원을 인공지능을 이용하여 빠르게 복원을 해 보고자 한다. 최근에 Generative Adversarial Networks(GANs) 알고리즘에서 DcGAN[2] 알고리즘이 나오면서 이미지 생성, 복원 분야가 지속해서 발전하고 있다. 이에 본 연구에서는 다양한 GAN 알고리즘을 문화재 복원에 GAN 알고리즘을 적용해 보았다. DcGAN과 StyleGAN을 적용하였으며, 유의미한 결과를 얻었다. GAN 알고리즘 중 DCGAN과 Style GAN 알고리즘을 실험한 결과 DCGAN 알고리즘은 학습이 진행되었으며, 낮은 해상도로 탑 이미지가 생성되는 것을 확인했다. 그리고 Style GAN 알고리즘에서도 역시 학습이 진행 되었으며, 탑 이미지가 생성되었다. 결론적으로 GAN 알고리즘을 사용하여 높은 해상도의 탑 이미지를 구할 수 있게 되었다.