• 제목/요약/키워드: 기계학습 및 인공지능

검색결과 192건 처리시간 0.033초

SimKoR: 한국어 리뷰 데이터를 활용한 문장 유사도 데이터셋 제안 및 대조학습에서의 활용 방안 (SimKoR: A Sentence Similarity Dataset based on Korean Review Data and Its Application to Contrastive Learning for NLP )

  • 김재민;나요한;김강민;이상락;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.245-248
    • /
    • 2022
  • 최근 자연어 처리 분야에서 문맥적 의미를 반영하기 위한 대조학습 (contrastive learning) 에 대한 연구가 활발히 이뤄지고 있다. 이 때 대조학습을 위한 양질의 학습 (training) 데이터와 검증 (validation) 데이터를 이용하는 것이 중요하다. 그러나 한국어의 경우 대다수의 데이터셋이 영어로 된 데이터를 한국어로 기계 번역하여 검토 후 제공되는 데이터셋 밖에 존재하지 않는다. 이는 기계번역의 성능에 의존하는 단점을 갖고 있다. 본 논문에서는 한국어 리뷰 데이터로 임베딩의 의미 반영 정도를 측정할 수 있는 간단한 검증 데이터셋 구축 방법을 제안하고, 이를 활용한 데이터셋인 SimKoR (Similarity Korean Review dataset) 을 제안한다. 제안하는 검증 데이터셋을 이용해서 대조학습을 수행하고 효과성을 보인다.

  • PDF

오픈신경망 포맷을 이용한 기계학습 모델 변환 및 추론 (Model Transformation and Inference of Machine Learning using Open Neural Network Format)

  • 김선민;한병현;허준영
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.107-114
    • /
    • 2021
  • 최근 다양한 분야에 인공지능 기술이 도입되고, 학계 관심이 늘어남에 따라 다양한 기계학습 모델들이 여러 프레임워크에서 운용되고 있다. 하지만 이러한 프레임워크들은 서로 다른 데이터 포맷을 가지고 있어, 상호운용성이 부족하며 이를 극복하기 위해 오픈 신경망 교환 포맷인 ONNX가 제안되었다. 본 논문에서는 여러 기계학습 모델을 ONNX로 변환하는 방법을 설명하고, 통합된 ONNX 포맷에서 기계학습 기법을 판별할 수 있는 알고리즘 및 추론 시스템을 제안한다. 또한, ONNX 변환 전·후 모델의 추론 성능을 비교하여 ONNX 변환 간 학습 결과의 손실이나 성능 저하가 없음을 보인다.

해안 경계 지능화를 위한 AI학습 모델 구축 방안 (A Methodology of AI Learning Model Construction for Intelligent Coastal Surveillance)

  • 한창희;김종환;차진호;이종관;정윤영;박진선;김영택;김영찬;하지승;이강욱;김윤성;방성완
    • 인터넷정보학회논문지
    • /
    • 제23권1호
    • /
    • pp.77-86
    • /
    • 2022
  • 본 연구의 궁극적인 목표인 지능형 해안 경계 체계 구축을 위해, 본 논문에서는 먼저 해안경계 지능화를 위한 AI 학습 모델의 구축 방안을 제시하였다. 우리는 3면이 바다로 이루어져있고 남과 북이 대치하는 상황으로 인해 해안 경계가 중요한 국가적 과업인 나라이다. 국방개혁 2.0에 의해 해안경계를 담당하고 있는 R/D (Radar) 운용인력이 감소하고 복무 기간이 단축되고 있다. 특히, 레이더와 같이 고도의 장비를 다루는 데에는 휴먼 에러가 발생할 개연성은 늘 상존하는 것이다. 해안 경계와 인공지능의 접목은 정부의 인공지능 국가전략의 구현과 확대라는 목표에도 필요 충분한 시점에 와 있다. 지능형 해안 경계 체계 구축을 위한 AI학습 모델 개발의 기능별 방안을 제시하였다. R/D신호 분석 AI모델 개발, 책임해역 분석 AI모델 개발, 표적 관리 자동화 기능으로 구분하였다. 이를 실현하기 위한 3단계 추진 전략을 살펴보았다. 1단계는 AI 학습모델 구축의 통상적인 단계로써, 데이터 수집, 데이터 저장, 데이터 여과, 데이터 정제, 데이터 변환 등이 이루어진다. 2단계에서는 R/D 특성에 기초해 신호분석을 실시하고, 실상과 허상을 분류하는 AI 학습모델 개발을 진행하고, 책임해역을 분석하고, 취약지역/시간 분석을 실시한다. 최종 단계에서는 AI 학습모델의 검증, 가시화 및 시연 등이 이루어진다. 군 무기체계에 AI 기술이 접목돼 지능화된 무기체계로 바뀌는 최초의 성과가 달성된다.

인공지능 기법을 활용한 홍수예측모델 개발 및 평가 - 한강수계 댐을 중심으로 - (Development and Evaluation of Flood Prediction Models Using Artificial Intelligence Techniques)

  • 조혜미;솜야 오랑치맥;유제호;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.131-131
    • /
    • 2022
  • 기후변화의 영향으로 극치강우의 변동성이 커지고 있으며 계획빈도를 초과하는 폭우로 피해가 증가하고 있다. 기존의 물리기반의 홍수예측모델은 개념적 및 구조적 제약과 함께 다양한 유역조건 및 수문기상 조건에 기인한 강우-유출 관계의 불확실성을 고려하는 데 한계가 있다. 특히 한정된 홍수 사상을 통해 구축된 관측 자료로 인해 새로운 홍수 사상 예측 능력이 저조할 수밖에 없다. 따라서 기존 물리모형 기반의 홍수예측과 함께, 딥러닝(deep learning) 모형을 고려한 홍수예측 모델 개발과 개선이 필요하다. 본 연구에서는 다양한 분야에서 활용되는 인공지능(artificial intelligence, AI) 기술을 종합적으로 검토하고, 홍수 예측 측면에서의 활용 가능성 및 신뢰성을 고려하여 AI 기법을 채택하였다. 한강수계에 존재하는 댐 중 일부를 선정하여 대상 댐의 수문·기상학적 자료를 전처리한 후, 인공지능 기반의 홍수예측모형을 구축 및 최적화하였다. 다양한 예측인자와 모델 구성으로 홍수예측력에 대한 평가를 다각적으로 수행함으로써 홍수예측모델의 신뢰성을 제고하였다. 전반적으로 우수한 결과를 도출하였고, 유역면적이 작을수록 결과가 좋았다. 이는 넓은 유역일수록 복잡한 강우-유출 과정이 내재되어 있기 때문으로 판단되며, 넓은 유역에는 본 연구에서 활용한 자료에 추가적인 자료를 도입하여 모형 개선이 이루어져야 할 것으로 판단하였다. 수문 예측 연구에 통계모형이나 기계학습모형의 적용은 많이 있었지만, 딥러닝 기법 활용은 새로운 시도라는 점에서 의미가 있다.

  • PDF

한국어 발화 문장에 대한 비언어 표현 정보를 자동으로 생성하는 모델 (A Model to Automatically Generate Non-verbal Expression Information for Korean Utterance Sentence)

  • 김재윤;장진예;김산;정민영;강현욱;신사임
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.91-94
    • /
    • 2023
  • 자연스러운 상호작용이 가능한 인공지능 에이전트를 개발하기 위해서는 언어적 표현뿐 아니라, 비언어적 표현 또한 고려되어야 한다. 본 논문에서는 한국어 발화문으로부터 비언어적 표현인 모션을 생성하는 연구를 소개한다. 유튜브 영상으로부터 데이터셋을 구축하고, Text to Motion의 기존 모델인 T2M-GPT와 이종 모달리티 데이터를 연계 학습한 VL-KE-T5의 언어 인코더를 활용하여 구현한 모델로 실험을 진행하였다. 실험 결과, 한국어 발화 텍스트에 대해 생성된 모션 표현은 FID 스코어 0.11의 성능으로 나타났으며, 한국어 발화 정보 기반 비언어 표현 정보 생성의 가능성을 보여주었다.

  • PDF

2000년대의 DB응용기술 '데이터 마이닝'

  • 나민영
    • 디지털콘텐츠
    • /
    • 9호통권52호
    • /
    • pp.5-17
    • /
    • 1997
  • 데이터 마이닝에 관한 연구는 원래 인공지능의 기계 학습에서 시작되었으나 여기에서의 연구는 주로 그 대상이 실험실용 데이터 즉, 엄정하게 선정된 적은 데이터들에 대해서만 이루어져 왔다. 본 고에서는 2000년대 데이터베이스 응용기술로 발전하고 있는 데이터 마이닝에 관하여 그 개념, 지식 발견 기법 및 활용 등을 살펴보고 여러 마이닝 지식중에서 분류에 관한 기술 동향을 살펴본다.

  • PDF

실시간 현장관측과 기계학습을 이용한 토양수분 예측기술의 개발 및 적용 (Development and application of soil moisture prediction using real-time in-situ observation and machine learning)

  • 우현아;이예원;김민영;노성진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.286-286
    • /
    • 2023
  • 물의 전체 순환 구조에서 토양수분이 차지하는 정량적 비중은 상대적으로 작지만, 강우-유출 과정의 비선형에 영향을 미치는 지배적 요인 중 하나이고, 토양 침식과 산사태, 농업생산량, 기후 변화 대응 등 광범위한 주제와 연관되어 있어, 토양수분의 물리과정에 대한 이해 증진과 예측 기술의 지속적인 개선이 필요하다. 본 연구에서는 금오공과대학교 유역 내에서 토양수분과 기상 요소를 실시간 관측하고, 기계학습 기법을 이용하여 토양수분을 단기 예측하는 기술을 개발하고 평가한다. 구체적으로는, 토양 관측 장비인 TEROS를 사용하여 표층 지점의 10cm, 심층 지점의 40cm에서의 토양수분, 토양장력과 토양온도를, 기상 관측 장비인 ATMOS를 사용하여 태양복사, 강수량, 기온, 풍속, 대기압 등 다양한 기상 요소를, 실시간 클라우드 방식으로 1여 년간 수집한 데이터를 활용한다. 또한, 과거 및 실시간 데이터를 기반으로 LSTM(Long-Short Term Memory) 기법을 사용하여 토양수분 예측 모형을 구축하고, 선행 예측 시간에 따른 모의 정확도를 평가한다. 기상 요소의 누적 등 자료 분석 방법이 표층 및 심층 토양수분 예측에 미치는 영향, 그리고 예측 모형 개선 방향에 대해 토의한다. 실시간 현장 관측 자료 및 인공지능 기반 단기 토양수분 예측 모의 기술은 소규모 유역의 수문순환 분석 및 물리기반 모형의 개선 등 다양한 분야에서 활용할 수 있을 것으로 기대된다.

  • PDF

119 신고 데이터를 이용한 자연어처리 기반 재난안전 상황 분류 알고리즘 분석 (Analysis of Disaster Safety Situation Classification Algorithm Based on Natural Language Processing Using 119 Calls Data)

  • 권수정;강윤희;이용학;이민호;박성호;강명주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권10호
    • /
    • pp.317-322
    • /
    • 2020
  • 인공지능의 발달로 인하여 재난 분야에서는 재난대응 지원 시스템으로 이용되고 있다. 재난은 언제 어디서든지 발생할 수 있으며, 재난 발생 시 소방청 119 신고접수대에 접수되는 신고는 크게 화재, 구조, 구급, 기타 신고 등 4가지로 구분된다. 119 신고에 따른 재난 대응도 그 종류 및 상황에 따라 다르게 대응된다. 본 논문에서는 119 신고 데이터 1280개 문서를 학습 데이터 셋을 이용하여 SVM, NB, k-NN, DT, SGD, RF 상황 분류 기계학습 알고리즘을 3 클래스로 테스트한 분류 성능은 최고 92%, 최소 77%의 성능을 보였다. 인공지능의 발달로 인하여 재난 분야에서는 재난 대응 지원 시스템으로 이용되고 있다. 재난은 언제 어디서든지 발생할 수 있으며, 재난 발생 시 소방청 119 신고접수대에 접수되는 신고는 크게 화재, 구조, 구급, 기타 신고 등 4가지로 구분된다. 119 신고에 따른 재난대응도 그 종류 및 상황에 따라 다르게 대응된다. 본 논문에서는 119 신고 데이터 1280개 문서를 학습 데이터 셋을 이용하여 SVM, NB, k-NN, DT, SGD, RF 상황 분류 알고리즘을 3 클래스로 테스트한 분류 성능은 최고 92%, 최소 77%의 성능을 보였다. 앞으로 다양한 분야의 재난별 데이터 셋을 확보하여 효율적인 재난 대응 연구가 필요하다.

연합학습을 위한 패턴 및 그룹 기반 효율적인 분산 합의 최적화 (Efficient distributed consensus optimization based on patterns and groups for federated learning)

  • 강승주;천지영;노건태;정익래
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.73-85
    • /
    • 2022
  • 인공지능으로 자동화와 연결성이 극대화되는 4차 산업혁명 시대를 맞이하여 모델의 업데이트를 위한 데이터 수집과 활용의 중요성이 점차 높아지고 있다. 인공지능 기술을 사용하여 모델을 생성하기 위해서는 일반적으로 데이터를 한곳에 모아야 업데이트할 수 있으나, 이런 경우 사용자의 개인정보를 침해할 수 있다. 본 논문에서는 분산 저장된 데이터를 직접 공유하지 않으면서 서로 협력하여 모델을 업데이트할 수 있는 분산형 기계학습 방법인 연합학습을 소개하며, 기존의 서버 없이 참여자들 간의 분산 합의 최적화를 이루는 연구를 소개한다. 또한, Kirkman Triple System을 기반으로 한 패턴 및 그룹을 생성하는 알고리즘을 이용하며, 병렬적인 업데이트 및 통신을 하는 패턴 및 그룹 기반 분산 합의 최적화 알고리즘을 제안한다. 이러한 알고리즘은 기존의 분산 합의 최적화 알고리즘 이상의 프라이버시를 보장하며, 모델이 수렴할 때까지의 통신시간을 감소시킨다.

K-means 알고리즘과 GBR 알고리즘을 이용한 정수장 응집제 투입률 결정 기법 (Determination of coagulant input rate in water purification plant using K-means algorithm and GBR algorithm)

  • 김진영;강복선;정회경
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.792-798
    • /
    • 2021
  • 본 논문에서는 인공지능 기반의 빅데이터 분석과 예측을 통하여 정수장의 공정 중 약품투입곤정에서 응집제 투입률을 결정하는 알고리즘을 도출하였다. 또한, 빅데이터 기술 및 인공지능 알고리즘 적용 방법에 대한 분석 및 기존의 학문적, 기술적 자료를 검토하여 유사 분야 적용 사례를 분석 검토하였다. 이를 통한 최적 응집제 투입률 제시를 목표로 운영 근무자의 의사결정 패턴을 입력 변수와 출력변수의 관계 패턴으로 학습한 후 학습된 패턴을 실제 응집제 주입 공정에 적용하여 침전수 탁도가 목표치에 근사한 일정 수준을 유지할 수 있도록 운영이 가능하였다. 데이터 범위 산정과 전처리를 거친 변수를 선정하여 알고리즘 수행을 준비한 후 군집화와 분류 알고리즘을 적용하여 알고리즘 수행과 결과에 대한 피드백을 반복하여 학습을 진행하였다.