• 제목/요약/키워드: 대규모 언어모델 구조화

검색결과 4건 처리시간 0.022초

사실관계 확인을 위한 다중 대규모 언어모델의 입출력 제어 구조화 방법 (Structuring Input and Output Control of Multiple Large Language Models for Fact-Checking)

  • 정지수;이치현;강현석;정상근;노윤형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-161
    • /
    • 2023
  • 최근 대규모 언어 모델의 활용 방법에 대한 많은 관심이 지속되고 있다. LLM이 생성한 정보의 가장 중요한 도전 과제는 출력 문장이 사실인지 판단하기 어렵다는 점이다. 본 논문은 하나 또는 복수의 LLM를 구조화하여, 생산되는 다양한 결과를 활용하는 방안을 탐구한다. LLM이 생성한 출력 정보를 고려하여 사실 관계 확인 과제를 수행함에 있어서, 성능 향상 가능성을 평가하기 위한 실험을 진행했다. 대규모 언어모델의 구조화를 통해 입력 정보의 제어를 할 경우, 기존 최고 성능보다 4.75의 정확도 향상을 관찰할 수 있었다.

  • PDF

효과적인 RAG Document Data 구조화 전략 (Effective RAG Document Data Structuring Strategy)

  • 손영진;임유경;박민정;채상미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.807-809
    • /
    • 2024
  • 대규모 언어 모델의 발전은 텍스트 생성 및 정보 제공 분야에서 큰 진전을 이루었으며 사용자와의 원활한 소통을 가능하게 했다. 그러나 언어 모델은 특화된 정보 제공에 한계를 가지며 때때로 부정확한 정보를 생성할 수 있다. RAG(Retrieval-Augmented Generation) 기법은 이러한 한계를 극복하기 위해 제안되었다. 본 연구에서는 RAG 의 답변품질과 효율성을 높이기 위해 외부 문서 정보와 단어 단위로 카테고리화된 인덱싱 데이터 세트를 함께 제공하여 보다 정확하고 신뢰성 있는 문서 생성을 가능하게 하는 접근법을 제시한다.

한국어 사전학습 모델을 활용한 자연어 처리 모델 자동 산출 시스템 설계 (An Automated Production System Design for Natural Language Processing Models Using Korean Pre-trained Model)

  • 장지형;최호윤;이건우;최명석;홍참길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.613-618
    • /
    • 2022
  • 효과적인 자연어 처리를 위해 제안된 Transformer 구조의 등장 이후, 이를 활용한 대규모 언어 모델이자 사전학습 모델인 BERT, GPT, OPT 등이 공개되었고, 이들을 한국어에 보다 특화한 KoBERT, KoGPT 등의 사전학습 모델이 공개되었다. 자연어 처리 모델의 확보를 위한 학습 자원이 늘어나고 있지만, 사전학습 모델을 각종 응용작업에 적용하기 위해서는 데이터 준비, 코드 작성, 파인 튜닝 및 저장과 같은 복잡한 절차를 수행해야 하며, 이는 다수의 응용 사용자에게 여전히 도전적인 과정으로, 올바른 결과를 도출하는 것은 쉽지 않다. 이러한 어려움을 완화시키고, 다양한 기계 학습 모델을 사용자 데이터에 보다 쉽게 적용할 수 있도록 AutoML으로 통칭되는 자동 하이퍼파라미터 탐색, 모델 구조 탐색 등의 기법이 고안되고 있다. 본 연구에서는 한국어 사전학습 모델과 한국어 텍스트 데이터를 사용한 자연어 처리 모델 산출 과정을 정형화 및 절차화하여, 궁극적으로 목표로 하는 예측 모델을 자동으로 산출하는 시스템의 설계를 소개한다.

  • PDF

인공지능을 이용한 웹기반 건축현장 안전관리 플랫폼 개발 (Development of Web-based Construction-Site-Safety-Management Platform Using Artificial Intelligence)

  • 김시욱;김은석;김치경
    • 한국전산구조공학회논문집
    • /
    • 제37권2호
    • /
    • pp.77-84
    • /
    • 2024
  • 4차 산업혁명 시대에 건설산업은 전통적인 업무 방식에서 디지털 프로세스로 전환하고 있다. 특히, 건설산업의 특성으로 인해 업무 절차의 변경에는 어려움이 따르며, 점진적인 디지털 전환 및 시행착오가 발생하고 있다. 건설현장의 안전관리 분야도 역시 이 흐름을 따라 모든 데이터의 디지털화와 자동화를 목표로 연구 및 시도가 활발히 진행되고 있다. 그러나 최근의 통계에 따르면, 건설업 안전사고는 계속해서 발생하고 있으며, 안전사고 사망자 수도 줄지 않고 있다. 본 연구는 이러한 문제를 해결하기 위해 건설공사 안전관리 종합정보망의 빅데이터를 대규모 언어모델 인공지능을 통해 분석하였다. 분석된 결과는 실시간으로 업데이트가 가능한 상세설계모델로부터 위치정보와 공간적 특성을 반영하여 안전관리가 필요한 현장모델링에 정보를 맵핑하였다. 해당 연구를 통해 건설현장 안전관리 데이터의 디지털화를 통한 시설물 및 근로자의 안전을 강화하고, 건설사고 예방 및 효과적인 교육 지시를 위한 빅데이터 기반 안전관리 플랫폼 개발을 목표로 한다.