• 제목/요약/키워드: 컴퓨터 모델

검색결과 5,786건 처리시간 0.033초

BERT 언어 모델을 이용한 감정 분석 시스템 (Sentiment Analysis System by Using BERT Language Model)

  • 김택현;조단비;이현영;원혜진;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.975-977
    • /
    • 2020
  • 감정 분석은 문서의 주관적인 감정, 의견, 기분을 파악하기 위한 방법으로 소셜 미디어, 온라인 리뷰 등 다양한 분야에서 활용된다. 문서 내 텍스트가 나타내는 단어와 문맥을 기반으로 감정 수치를 계산하여 긍정 또는 부정 감정을 결정한다. 2015년에 구축된 네이버 영화평 데이터 20 만개에 12 만개를 추가 구축하여 감정 분석 연구를 진행하였으며 언어 모델로는 최근 자연어처리 분야에서 높은 성능을 보여주는 BERT 모델을 이용하였다. 감정 분석 기법으로는 LSTM(Long Short-Term Memory) 등 기존의 기계학습 기법과 구글의 다국어 BERT 모델, 그리고 KoBERT 모델을 이용하여 감정 분석의 성능을 비교하였으며, KoBERT 모델이 89.90%로 가장 높은 성능을 보여주었다.

BERT+CRF를 이용한 다중 감성 표현 영역 추출 (Extracting multiple sentiment expression areas using BERT+CRF)

  • 박지은;이주상;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.571-575
    • /
    • 2021
  • 감성분석이란 텍스트에 들어있는 의견이나 감성, 평가, 태도 등의 주관적인 정보를 컴퓨터를 통해 분석하는 과정이다. 본 논문은 다양한 감성분석 실험 중 감성이 드러나는 부분을 파악하여 서술어 중심의 구 혹은 절 단위로 감성 표현 영역을 추출하는 모델을 개발하고자 한다. 제안하는 모델은 BERT에 classification layer와 CRF layer를 결합한 것이고 baseline은 일반 BERT 모델이다. 실험 결과는 기존의 baseline 모델의 f1-score이 33.44%이고 제안한 BERT+CRF 모델의 f1-score이 40.99%이다. BERT+CRF 모델이 7.55% 더 좋은 성능을 보인다.

  • PDF

산업용 형상 품질 검사 비전을 위한 딥러닝 기반 형상 키포인트 검출 모델 구현 (Implementation of a Deep Learning-based Keypoint Detection Model for Industrial Shape Quality Inspection Vision)

  • 김석주;권중장
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.37-38
    • /
    • 2023
  • 본 논문에서는 딥러닝을 기반으로 하는 키포인트 인식 모델을 산업용 품질검사 머신비전에 응용하는 방법을 제안한다. 전이학습 방법을 이용하여 딥러닝 모델의 인식률을 높이는 방법을 제시하였고, 전이시킨 특성 추출 모델에 대해 추가로 데이터 세트에 대한 학습을 진행하는 것이 특성추출 모델의 초기 ImageNet 가중치를 동결시켜 학습하는 것보다 학습 속도나 정확도가 높다는 것을 보여준다. 실험을 통해 딥러닝을 응용하는 산업용 품질 검사 공정에는 특성추출 모델의 추가 학습이 중요하다는 점을 확인할 수 있었다.

  • PDF

Cross-lingual Post-Training (XPT)을 통한 한국어 언어모델 구축 및 비교 실험 (Korean language model construction and comparative analysis with Cross-lingual Post-Training (XPT))

  • 손수현;박찬준;이정섭;심미단;이승현;이진우;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.295-299
    • /
    • 2022
  • 자원이 부족한 언어 환경에서 사전학습 언어모델 학습을 위한 대용량의 코퍼스를 구축하는데는 한계가 존재한다. 본 논문은 이러한 한계를 극복할 수 있는 Cross-lingual Post-Training (XPT) 방법론을 적용하여 비교적 자원이 부족한 한국어에서 해당 방법론의 효율성을 분석한다. 적은 양의 한국어 코퍼스인 400K와 4M만을 사용하여 다양한 한국어 사전학습 모델 (KLUE-BERT, KLUE-RoBERTa, Albert-kor)과 mBERT와 전반적인 성능 비교 및 분석 연구를 진행한다. 한국어의 대표적인 벤치마크 데이터셋인 KLUE 벤치마크를 사용하여 한국어 하위태스크에 대한 성능평가를 진행하며, 총 7가지의 태스크 중에서 5가지의 태스크에서 XPT-4M 모델이 기존 한국어 언어모델과의 비교에서 가장 우수한 혹은 두번째로 우수한 성능을 보인다. 이를 통해 XPT가 훨씬 더 많은 데이터로 훈련된 한국어 언어모델과 유사한 성능을 보일 뿐 아니라 학습과정이 매우 효율적임을 보인다.

  • PDF

단어 수준 한국어-영어 기계번역 품질 예측 (Word-level Korean-English Quality Estimation)

  • 어수경;박찬준;서재형;문현석;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.9-15
    • /
    • 2021
  • 기계번역 품질 예측 (Quality Estimation, QE)은 정답 문장에 대한 참조없이 소스 문장과 기계번역 결과를 통해 기계번역 결과에 대한 품질을 수준별 주석으로 나타내주는 태스크이며, 다양한 활용도가 있다는 점에서 꾸준히 연구가 수행되고 있다. 그러나 QE 모델 학습을 위한 데이터 구성 시 기계번역 결과에 대해 번역 전문가가 교정한 문장이 필요한데, 이를 제작하는 과정에서 상당한 인건비와 시간 비용이 발생하는 한계가 있다. 본 논문에서는 번역 전문가 없이 병렬 또는 단일 말뭉치와 기계번역기만을 활용하여 자동화된 방식으로 한국어-영어 합성 QE 데이터를 구축하며, 최초로 단어 수준의 한국어-영어 기계번역 결과 품질 예측 모델을 제작하였다. QE 모델 제작 시에는 Cross-lingual language model (XLM), XLM-RoBERTa (XLM-R), multilingual BART (mBART)와 같은 다언어모델들을 활용하여 비교 실험을 수행했다. 또한 기계번역 결과에 대한 품질 예측의 객관성을 검증하고자 구글, 아마존, 마이크로소프트, 시스트란의 번역기를 활용하여 모델 평가를 진행했다. 실험 결과 XLM-R을 활용하여 미세조정학습한 QE 모델이 가장 좋은 성능을 보였으며, 품질 예측의 객관성을 확보함으로써 QE의 다양한 장점들을 한국어-영어 기계번역에서도 활용할 수 있도록 했다.

  • PDF

언어모델을 활용한 문서 내 발화자 예측 분류 모델 (Speaker classification and prediction with language model)

  • 김경민;한승규;서재형;이찬희;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.317-320
    • /
    • 2020
  • 연설문은 구어체와 문어체 두 가지 특성을 모두 갖고 있는 복합적인 데이터 형태이다. 발화자의 문장 표현, 배열, 그리고 결합에 따라 그 구조가 다르기 때문에, 화자 별 갖는 문체적 특성 또한 모두 다르다. 국정을 다루는 정치인들의 연설문은 국정 현황을 포함한 다양한 주요 문제점을 다룬다. 그러면 발화자의 문서 내 문체적 특성을 고려할 경우, 해당 문서가 어느 정치인의 연설문인지 파악 할 수 있는가? 본 연구에서는 대한민국 정책 브리핑 사이트로부터 한국어 기반 사전 학습된 언어 모델을 활용하여 연설문에 대한 미세조정을 진행함으로써 발화자 예측 분류 모델을 생성하고, 그 가능성을 입증하고자 한다. 본 연구는 5-cross validation으로 모델 성능을 평가하였고 KoBERT, KoGPT2 모델에서 각각 90.22%, 84.41% 정확도를 보였다.

  • PDF

악의의 위탁 컴퓨터로부터 씬 클라이언트 보호를 위한 Virtual private computing (Virtual private computing for thin client against malicious surrogate)

  • 박종열;이동익;김형천;장인숙;박중길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.455-457
    • /
    • 2003
  • Pervasive 컴퓨팅은 다양한 분야에서 다양한 방향으로 연구가 진행 중에 있다. 제안된 모델 중에 CMU에서 제안한 위탁형 컴퓨팅 모델은 앞으로의 연구에 대한 한 방향을 제시하고 있다. 이 모델은 사용자가 요청하는 작업을 휴대하는 컴퓨터에서 처리하는 것이 아니라 주위에 뛰어난 성능을 가진 컴퓨터에게 작업을 위탁하는 방법이다. 이 방법은 기존 단말에서 작업을 처리하는 것에 비해 뛰어난 성능을 보이지만 위탁 컴퓨터에 의한 공격에 취약한 단점을 가지고 있다. 본 논문에서는 이러한 단점을 보완하기 위해서 Virtual Private Computing이라고 하는 개념을 제안 한다.

  • PDF

이동 세일즈 응용을 위한 이동 트랜잭션 모델 (Mobile Transact ion Model for Mobile Sales Application)

  • 최미선;김영국
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.232-234
    • /
    • 2002
  • 무선 통신 및 컴퓨터 기술의 발달은 사용자로 하여금 이동 중에도 휴대용 컴퓨터를 소지하고 무선 통신을 통해 다양한 비즈니스 트랜잭션을 수행할 수 있는 모바일 오피스(mobile of Hee)환경을 제공하고 있다. 그러나 무선 통신과 휴대용 컴퓨터의 고유한 특성으로 인해 이동 비즈니스 트랜잭션 처리에 유선망에서 사용되는 트랜잭션 처리 모델을 그대로 적용할 경우 트랜잭션 응답시간이 길어지고 데이터 관리가 복잡해지며, 통신 요금이 증가하는 등의 문제점이 발생한다. 본 연구에서는 고가의 무선통신 비용 및 이동 컴퓨터의 배터리 소모를 절감하기 위해 접속단절을 효과적으로 이용하여 회사와 이동 세일즈 사원들 간의 효율적인 비즈니스 트랜잭션 처리 시스템 구축을 위한 트랜잭션 처리 모델을 제안한다.

  • PDF

SPIN 과 SMV가 생성하는 반례의 특성 비교 (Comparison of Counter-Examples Generated by Model Checkers SPIN and SMV)

  • 채여경;강혜수;권령구;권기현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1578-1580
    • /
    • 2012
  • 모델 검증은 시스템이 만족해야 하는 속성을 자동으로 검사하는 정형 검증 기법으로써, 많은 도메인에서 활용되고 있다. 특히 모델 검증 도구들에 따라 상태 공간 탐색 방식이 다르고, 상태 공간 탐색 방식에 따라서 생성되는 반례도 달라진다. 본 논문에서는 모델 검증의 대표적인 도구인 SPIN과 SMV에서 생성하는 반례를 상호 비교한다.

과학 모델의 알고리즘의 학습이 학생들의 과학 개념 이해에 미치는 영향: 산-염기 개념을 중심으로 (Effect of Learning Scientific Model's Algorithm on Student's Understanding of Scientific concept : Focus on the Acid-Base Concept)

  • 백성혜;박철용;최희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제56차 하계학술대회논문집 25권2호
    • /
    • pp.384-385
    • /
    • 2017
  • 과학 모델은 복잡한 자연현상을 단순화하고 패턴화한 것이다. 따라서 과학 모델은 특정한 알고리즘을 가지며, 과학 모델에 대한 이해는 모델이 갖는 특정한 알고리즘에 대한 이해와 직접적으로 관련되어있다. 본 연구에서는 많은 학생들이 대안 개념을 가지고 있는 산-염기를 주제로 하여, 이 모델이 가지는 알고리즘을 학습하기 위한 프로그램을 설계하고, 알고리즘을 학습 하였을 때 과학 학습에 미치는 효과를 확인하였다. 고등학생 3학년을 대상으로 4차시로 수업을 진행하였으며, 수업의 사전과 사후 검사를 실시하여, 학생들의 모델에 대한 이해를 분석하였다. 수업 결과, 학생들은 모델의 정의와 화학반응 및 화학평형의 정성적인 부분에서는 이해의 향상을 보였으나, 정량적인 부분에는 효과를 보이지 못하였다. 이는 화학이 많은 수의 입자를 고려해야 하는 독특한 과목의 특성에 기인하며, 이를 보완하기 위하여 추후 컴퓨터프로그램을 교육 도구로 사용하는 수업을 통해 후속연구를 진행하고자 한다.

  • PDF