• 제목/요약/키워드: 학습 데이터 모델

검색결과 3,106건 처리시간 0.035초

Swin Transformer와 Sentinel-1 영상을 이용한 우리나라 저수지의 수체 탐지 (Waterbody Detection for the Reservoirs in South Korea Using Swin Transformer and Sentinel-1 Images)

  • 최소연;윤유정;강종구;김서연;정예민;임윤교;서영민;김완엽;최민하;이양원
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.949-965
    • /
    • 2023
  • 본 연구에서는 Sentinel-1 synthetic aperture radar 영상을 활용하여 딥러닝 모델인 Swin Transformer로 국내 농업용 저수지의 수표면적을 모니터링 하는 방법을 제시한다. Google Earth Engine 플랫폼을 이용하여 70만톤 급, 90만톤급, 150만톤급 저수지 7개소에 대한 2017년부터 2021년 데이터셋을 구축하였다. 저수지 4개소에 대한 영상 1,283장에 대해서 셔플링(suffling) 및 5-폴드(fold) 교차검증 기법을 적용하여 모델을 학습하였다. 시험평가 결과 모델의 윈도우 크기를 12로 설정한 Swin Transformer Large 모델은 각 폴드에서 평균적으로 99.54%의 정확도와 95.15%의 mean intersection over union (mIoU)을 기록하여 우수한 의미론적 분할 성능을 보여주었다. 최고 성능을 보여준 모델을 나머지 3개소 저수지 데이터셋에 적용하여 성능을 검증한 결과, 모든 저수지에서 정확도 99% 및 mIoU 94% 이상을 달성함을 확인했다. 이러한 결과는 Swint Transformer 모델이 국내의 농업용 저수지의 수표면적 모니터링에 효과적으로 활용될 수 있음을 보여준다.

동사 어휘의미망 평가를 위한 단어클러스터링 시스템의 활용 방안 (The Method of Using the Automatic Word Clustering System for the Evaluation of Verbal Lexical-Semantic Network)

  • 김혜경;윤애선
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.175-190
    • /
    • 2006
  • 최근 수년간 한국어를 위한 어휘의미망에 대한 관심은 꾸준히 높아지고 있지만. 그 결과물을 어떻게 평가하고 활용할 것인가에 대한 방안은 이루어지지 않고 있다. 본 논문에서는 단어클러스터링 시스템 개발을 통하여, 어휘의미망에 의해 확장되기 전후의 클러스터링을 수행하여 데이터를 서로 비교하였다 단어클러스터링 시스템 개발을 위해 사용된 학습 데이터는 신문 말뭉치 기사로 총 68.455.856 어절 규모이며, 특성벡터와 벡터공간모델을 이용하여 시스템A를 완성하였다. 시스템B는 구축된 '(-하)동사류' 3,656개의 어휘의미를 포함하는 동사 어휘의미망을 활용하여 확장된 것으로 확장대상정보를 선택하여 특성벡터를 재구성한다. 대상이 되는 실험 데이터는 '다국어 어휘의미망-코어넷'으로 클러스터링 결과 나타난 어휘의 세 번째 층위까지의 노드 동일성 석부로 정확률을 검수하였다. 같은 환경에서 시스템A와 시스템B를 비교한 결과 단어클러스터링의 정확률이 45.3%에서 46.6%로의 향상을 보였다. 향후 연구는 어휘의미망을 활용하여 좀 더 다양한 시스템에 체계적이고 폭넓은 평가를 통해 전산시스템의 향상은 물론. 연구되고 있는 많은 어휘의미망에 의미 있는 평가 방안을 확대시켜 나가야 할 것이다.

의사결정트리 기법을 이용한 파프리카용 스마트팜 전문가 시스템 (Smart Farm Expert System for Paprika using Decision Tree Technique)

  • 정혜선;이인용;임중선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.373-376
    • /
    • 2018
  • 기존의 파프리카 스마트팜 시스템의 경우 여러 센서 값을 기준 값에 추종하도록 설정 되어 있기 때문에 다른 외란의 값이 들어오면 시스템이 최적의 판단을 하지 못하는 경우가 많아 파프리카 생장에 유해한 경우가 발생한다. 이를 의사결정 나무 기법을 활용하여 파프리카 스마트팜용 전문가 시스템을 설계하여 주변 환경에 따라 달라지는 요소들에 의해 생성되는 데이터를 사용하여 농민의 경험치와 유사한 의사결정 구조를 가진 제어 알고리즘을 구축한다. 현재의 스마트팜 제어시스템의 경우 농민이 설정해둔 기준 값에 센서 값들을 추종하도록 시스템화 되어 있기 때문에 주변 환경의 외란에 대한 사용자의 개입이 필수적이다. 파프리카 스마트팜 장비를 제어하기 전 여러 환경 요소 중 가장 영향력을 미치는 것을 선정한 후 농민들의 경험치와 표준 의사결정 기준이 반영된 복합 환경제어를 위한 전문가 시스템을 모델링하였다. 설계된 모델은 내외부 환경 데이터에 의해 학습된 의사결정트리 기반의 파프리카용 전문가시스템으로 서, 사용자의 간섭을 최소화한 제어기를 설계할 수 있도록 지원한다. 이번 연구를 통해 여러 데이터를 복합 시키면서 각 환경 요소들이 상호관계를 갖고 있으며, 나아가 여러 주변 환경 요소들이 생장에 영향을 미치고 있기에 전문가용 파프리카 스마트팜을 만들 때 표준이 될 수 있는 제어 알고리즘이 될 것으로 기대한다.

  • PDF

무엇이 AI 프로젝트를 성공적으로 이끄는가? (What factors drive AI project success?)

  • 김계숙;안현철
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.327-351
    • /
    • 2023
  • 본 논문은 인공지능(AI) 프로젝트를 성공적으로 이끄는 주요 요인을 도출하고 중요도의우선순위를 두는 것을 목적으로 한다. 이를 위해 우선 기존 유관 연구들을 검토하여 성공요인을 선정하고, 전문가 인터뷰를 통해 17개 요인을 최종 도출하였다. 이어 TOE 프레임워크를 활용하여 계층 모형을 개발하였다. 이후, AI 활용 기업 소속 전문가와 AI 자문 및 기술, 플랫폼, 어플리케이션을 지원하는 공급기업 소속 전문가를 대상으로 설문 조사를 실시하고, AHP 방법을 활용하여 분석하였다. 분석 결과, 환경적 요인보다 조직적 요인과 기술적 요인이 모두 중요한데, 이 중 조직적 요인이 조금 더 중요한 것으로 나타났다. 조직적 요인 중에서는 전략/명확한 비즈니스 니즈와 AI 구현/활용 역량, 그리고 부서 간 협업/커뮤니케이션이 가장 중요한 요인으로 나타났다. 기술적 요인 중에서는 AI 학습을 위한 충분한 데이터 양과 데이터 품질이 가장 중요한 요인으로 도출되었으며, 이어서 IT 인프라/호환성이 중요하게 응답되었다. 환경적 요인에서는 AI를 직접 사용할 고객의 준비와 지지가 중요한 요인으로 나타났다. 각 17개 개별요인의 중요도를 살펴보면 데이터의 가용성과 품질(0.2245)이 가장 중요하고, 이어 전략/명확한 비즈니스 니즈(0.1076), 고객준비/지지(0.0763) 순으로 중요한 것으로 분석되었다. 이러한 결과는 AI 도입을 검토 중이거나 실행중인 기업, AI 도입을 지원하는 서비스 공급기업, AI 산업을 육성하고자 하는 정부 정책 입안자들에게 성공적인 실행, 육성을 위한 가이드로 활용될 수 있다. 또한 AI 프로젝트의 성공 모델을 연구하고자 하는 연구자들에게도 기여할 것으로 기대된다.

LDA 기반 은닉 토픽 추론을 이용한 TV 프로그램 자동 추천 (Automatic TV Program Recommendation using LDA based Latent Topic Inference)

  • 김은희;표신지;김문철
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.270-283
    • /
    • 2012
  • 다채널 TV, IPTV 및 Smart TV 서비스의 등장으로 인해 수많은 방송 채널과 방대한 TV 프로그램 콘텐츠가 시청자 단말로 제공됨으로써 시청자들은 자신이 원하는 콘텐츠를 쉽게 찾고 소비하는 것이 어려운 TV 시청 환경을 맞게 되었다. 따라서 TV 사용자들에게 자신이 선호하는 콘텐츠를 자동 추천해 줌으로써 원하는 콘텐츠로의 접근성을 증대시키는 것은 미래의 지능형 TV 서비스에 있어서 주요한 이슈이다. 이에 본 논문에서는 사용자의 선호 취향과 대중의 선호취향을 모두 고려한 협업필터링 개념의 통계적 기계학습 기반 TV 프로그램 추천 모델을 제시한다. 이를 위해 시청한 TV 콘텐츠에 대한 선호 토픽을 사용자의 시청 선호도로 보고, 최근 널리 활용되고 있는 LDA(Latent Dirichlet Allocation)모델을 TV 프로그램 추천 모델에 적용하였다. LDA 기반 TV 프로그램 추천 성능을 개선하기 위해 본 논문에서는 TV시청 이용내역 데이터를 기반으로, TV 사용자들의 관심 토픽을 은닉 변수로 하고, TV 사용자들의 관심 토픽에 대한 다양성을 반영하기 위해 은닉 변수의 확률분포 특성을 비대칭 디리클레(Dirichlet) 분포로 모형화하여 실험에 적용하였다. 제안된 LDA 기반 TV 프로그램 자동 추천 방법의 성능을 검증하기 위해, 유사 시청 특성을 갖는 사용자 그룹에 대해 상위 5개의 TV 프로그램을 일주일 단위로 추천하였을 경우 평균 66.5%, 2개월 단위의 추천에 대해서는 평균 77.9%의 precision 추천 성능을 확인할 수 있었다.

온실의 환경요인을 이용한 인공신경망 기반 수경 재배 파프리카의 증산량 추정 (Transpiration Prediction of Sweet Peppers Hydroponically-grown in Soilless Culture via Artificial Neural Network Using Environmental Factors in Greenhouse)

  • 남두성;이준우;문태원;손정익
    • 생물환경조절학회지
    • /
    • 제26권4호
    • /
    • pp.411-417
    • /
    • 2017
  • 광도, 포차와 같은 환경요인과 엽면적 지수와 같은 생육요인은 증산 속도를 변화시키는 중요한 변수이다. 본 연구에서는 Penman-Monteith의 증산 모델과 인공신경망(ANN)에 학습에 의한 증산속도 추정값을 비교하는 것을 목표로 하였다. 파프리카(Capsicum annuum L. cv. Fiesta)의 증산속도 추정은 로드셀을 이용한 배지의 중량변화를 통해 계산하였다. 온도, 상대습도, 배지 중량 데이터는 1분 단위로 2개월간 수집하였다. 증산량은 일차식으로는 정확한 추정이 어렵기 때문에, 기존의 Penman-Monteith식에 보정 광도를 사용한 수정식 Shin 등(2014)을 사용하였다. 이와는 별개로 ANN을 사용하여 증산량을 추정 비교하였다. 이를 위하여 광도, 온도, 습도, 엽면적지수, 시간을 사용한 입력층과 5개의 은닉층으로 구성된 ANN을 구축하였다. 각 은닉층의 퍼셉트론 개수는 가장 정확성이 높은 512개로 하였다. 검증 결과, 보정된 Penman-Monteith 모델식의 $R^2=0.82$이었고, ANN의 $R^2=0.94$로 나타났다. 따라서 ANN은 일반적인 모델식에 비해 정확한 증산량 추정이 가능한 것으로 나타났고, 추후 수경재배의 효율적인 관수전략 수립에 있어 적용 가능할 것으로 판단되었다.

동형이의어 분별에 의한 한국어 의존관계 분석 (An Analysis of Korean Dependency Relation by Homograph Disambiguation)

  • 김홍순;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권6호
    • /
    • pp.219-230
    • /
    • 2014
  • 의존관계 분석은 문장의 어절 간에 의존소-지배소를 결정하는 작업이다. 용언은 문형 및 하위범주화 정보의 선택제약에 의해 다른 어절과의 의존관계를 형성한다. 본 논문은 형태소 분석 단계에서 동형이의어 분별된 용언의 문형을 이용하여 용언의 의존관계를 분석하는 방법을 제안한다. 특히, 형태소분석 단계에서 품사 및 동형이의어 태깅을 위해 사용하는 단계별 전이모델의 학습사전을 재활용하여 {명사+격조사, 용언} 간의 의존관계를 확정하는 방안을 제안하고 그의 정확률 및 영향을 분석한다. 동형이의어가 부착되고 의존관계로 변경된 21개의 세종구문분석말뭉치를 이용하여 실험한 결과, 동형이의어 분별된 의존관계 분석 정확률이 80.38%로, 동형이의어가 분별되지 않은 의존관계분석에 비해 0.42%의 정확률 향상이 있었으며, 유의수준 1%의 검정통계량 Z는 ${\mid}Z{\mid}=4.63{\geq}z_{0.01}=2.33$으로 동형이의어 분별이 의존관계 분석에 영향이 있음을 보였다. 또한, 단계별 전이모델이 의존관계 분석 정확률에 약 7.14% 영향을 미치는 것을 알 수 있었다.

CNN(Convolutional Neural Network) 알고리즘을 활용한 음성신호 중 비음성 구간 탐지 모델 연구 (A Study on a Non-Voice Section Detection Model among Speech Signals using CNN Algorithm)

  • 이후영
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.33-39
    • /
    • 2021
  • 음성인식 기술은 딥러닝과 결합되며 빠른 속도로 발전하고 있다. 특히 음성인식 서비스가 인공지능 스피커, 차량용 음성인식, 스마트폰 등의 각종 기기와 연결되며 음성인식 기술이 산업의 특정 분야가 아닌 다양한 곳에 활용되고 있다. 이러한 상황에서 해당 기술에 대한 높은 기대 수준을 맞추기 위한 연구 역시 활발히 진행되고 있다. 그중에서 자연어처리(NLP, Natural Language Processing)분야에서 음성인식 인식률에 많은 영향을 주는 주변의 소음이나 불필요한 음성신호를 제거하는 분야에 연구가 필요한 상황이다. 이미 많은 국내외 기업에서 이러한 연구를 위해 최신의 인공지능 기술을 활용하고 있다. 그중에서 합성곱신경망 알고리즘(CNN)을 활용한 연구가 활발하게 진행되고 있다. 본 연구의 목적은 합성곱 신경망을 통해서 사용자의 발화구간에서 비음성 구간을 판별하는 것으로 5명의 발화자의 음성파일(wav)을 수집하여 학습용 데이터를 생성하고 이를 합성곱신경망을 활용하여 음성 구간과 비음성 구간을 판별하는 분류 모델을 생성하였다. 이후 생성된 모델을 통해 비음성 구간을 탐지하는 실험을 진행한 결과 94%의 정확도를 얻었다.

합성곱 신경망을 이용한 '미황' 복숭아 과실의 성숙도 분류 (Grading of Harvested 'Mihwang' Peach Maturity with Convolutional Neural Network)

  • 신미희;장경은;이슬기;조정건;송상준;김진국
    • 생물환경조절학회지
    • /
    • 제31권4호
    • /
    • pp.270-278
    • /
    • 2022
  • 본 연구는 무대재배 복숭아 '미황'을 대상으로 성숙기간 중 RGB 영상을 취득한 후 다양한 품질 지표를 측정하고 이를 딥러닝 기술에 적용하여 복숭아 과실 숙도 분류의 가능성을 탐색하고자 실시하였다. 취득 영상 730개의 데이터를 training과 validation에 사용하였고, 170개는 최종테스트 이미지로 사용하였다. 본 연구에서는 딥러닝을 활용한 성숙도 자동 분류를 위하여 조사된 품질 지표 중 경도, Hue 값, a*값을 최종 선발하여 이미지를 수동으로 미성숙(immature), 성숙(mature), 과숙(over mature)으로 분류하였다. 이미지 자동 분류는 CNN(Convolutional Neural Networks, 컨볼루션 신경망) 모델 중에서 이미지 분류 및 탐지에서 우수한 성능을 보이고 있는 VGG16, GoogLeNet의 InceptionV3 두종류의 모델을 사용하여 복숭아 품질 지표 값의 분류 이미지별 성능을 측정하였다. 딥러닝을 통한 성숙도 이미지 분석 결과, VGG16과 InceptionV3 모델에서 Hue_left 특성이 각각 87.1%, 83.6%의 성능(F1 기준)을 나타냈고, 그에 비해 Firmness 특성이 각각 72.2%, 76.9%를 나타냈고, Loss율이 각각 54.3%, 62.1%로 Firmness를 기준으로 한 성숙도 분류는 적용성이 낮음을 확인하였다. 추후에 더 많은 종류의 이미지와 다양한 품질 지표를 가지고 학습이 진행된다면 이전 연구보다 향상된 정확도와 세밀한 성숙도 판별이 가능할 것으로 판단되었다.

투수 및 이완하중 파악을 위한 터널 라이닝의 인공신경망 역해석 (Tunnel-lining Back Analysis Based on Artificial Neural Network for Characterizing Seepage and Rock Mass Load)

  • 공정식;최준우;박현일;남석우;이인모
    • 한국지반공학회논문집
    • /
    • 제22권8호
    • /
    • pp.107-118
    • /
    • 2006
  • 터널과 관련된 여러 영향인자중 시간의 따른 투수상태와 지반의 장기거동은 터널의 이상 거동을 이해하는데 있어서 중요하다. 터널은 이러한 인자에 의해서 심각한 손상을 입을 수 있으나 시공 후 이러한 인자들에 의해 발생한 영향을 정량적으로 분석해 내는 것은 쉽지 않다. 입력과 출력간의 상관관계가 비교적 독립적이라면 터널거동에 미치는 인자들의 영향은 역해석 기법을 적용하여 예측할 수 있다. 모델을 구성하는 입출력 자료의 특성에 따라 인공신경망 기법이나 최소제곱법 등 다양한 역해석 방법이 개발 될 수 있으며 수치해석, 실험 또는 계측 결과가 역해석 모델의 구성 및 검증을 위해 쓰일 수 있다. 본 연구에서는 시공 후 터널의 내공 변위 변화로부터 투수 및 지반의 장기거동과 관련된 인자들 중 배수재의 투수계수, 지하수위, 장기 이완 하중 크기 및 암반 손상 패턴 등의 변화에 의한 영향을 정량적으로 분석할 수 있는 역해석 기법을 개발하였다. 역해석은 인공신경망 기법을 적용하였으며 학습데이터 확보를 위해 수치해석 모델이 개발 되고 다양한 하중 상태에 대한 거동 분석이 이루어졌다.