Utilizing Large Language Models for Non-trained Binary Sentiment Classification

Hyungjin Ahn;Taewook Hwang;Sangkeun Jung;

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
/
Pages.66-71
/
2023
/
2005-3053(pISSN)

한국정보과학회 언어공학연구회 (Human and Language Technology)

거대 언어 모델(LLM)을 이용한 비훈련 이진 감정 분류

Utilizing Large Language Models for Non-trained Binary Sentiment Classification

안형진 (충남대학교 컴퓨터융합학부) ;
황태욱 (충남대학교 컴퓨터융합학부) ;
정상근 (충남대학교 컴퓨터융합학부)

Hyungjin Ahn (The Division of Computer Convergence, Chungnam National University) ;
Taewook Hwang (The Division of Computer Convergence, Chungnam National University) ;
Sangkeun Jung (The Division of Computer Convergence, Chungnam National University)

발행 : 2023.10.12

PDF

PDF 다운로드

⟨ 이전 논문 다음 논문 ⟩

초록

ChatGPT가 등장한 이후 다양한 거대 언어 모델(Large Language Model, LLM)이 등장하였고, 이러한 LLM을 목적에 맞게 파인튜닝하여 사용할 수 있게 되었다. 하지만 LLM을 새로 학습하는 것은 물론이고, 단순 튜닝만 하더라도 일반인은 시도하기 어려울 정도의 많은 컴퓨팅 자원이 필요하다. 본 연구에서는 공개된 LLM을 별도의 학습 없이 사용하여 zero-shot 프롬프팅으로 이진 분류 태스크에 대한 성능을 확인하고자 했다. 학습이나 추가적인 튜닝 없이도 기존 선학습 언어 모델들에 준하는 이진 분류 성능을 확인할 수 있었고, 성능이 좋은 LLM의 경우 분류 실패율이 낮고 일관적인 성능을 보여 상당히 높은 활용성을 확인하였다.

키워드

과제정보

이 논문은 2022년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(2022R1F1A1071047)

한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)

거대 언어 모델(LLM)을 이용한 비훈련 이진 감정 분류

Utilizing Large Language Models for Non-trained Binary Sentiment Classification

초록

키워드

과제정보

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)