• 제목/요약/키워드: 모델향상

검색결과 7,233건 처리시간 0.03초

초거대 언어 모델로부터의 추론 데이터셋을 활용한 감정 분류 성능 향상 (Empowering Emotion Classification Performance Through Reasoning Dataset From Large-scale Language Model)

  • 박눈솔;이민호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.59-61
    • /
    • 2023
  • 본 논문에서는 감정 분류 성능 향상을 위한 초거대 언어모델로부터의 추론 데이터셋 활용 방안을 제안한다. 이 방안은 Google Research의 'Chain of Thought'에서 영감을 받아 이를 적용하였으며, 추론 데이터는 ChatGPT와 같은 초거대 언어 모델로 생성하였다. 본 논문의 목표는 머신러닝 모델이 추론 데이터를 이해하고 적용하는 능력을 활용하여, 감정 분류 작업의 성능을 향상시키는 것이다. 초거대 언어 모델(ChatGPT)로부터 추출한 추론 데이터셋을 활용하여 감정 분류 모델을 훈련하였으며, 이 모델은 감정 분류 작업에서 향상된 성능을 보였다. 이를 통해 추론 데이터셋이 감정 분류에 있어서 큰 가치를 가질 수 있음을 증명하였다. 또한, 이 연구는 기존에 감정 분류 작업에 사용되던 데이터셋만을 활용한 모델과 비교하였을 때, 추론 데이터를 활용한 모델이 더 높은 성능을 보였음을 증명한다. 이 연구를 통해, 적은 비용으로 초거대 언어모델로부터 생성된 추론 데이터셋의 활용 가능성을 보여주고, 감정 분류 작업 성능을 향상시키는 새로운 방법을 제시한다. 제시한 방안은 감정 분류뿐만 아니라 다른 자연어처리 분야에서도 활용될 수 있으며, 더욱 정교한 자연어 이해와 처리가 가능함을 시사한다.

  • PDF

지시문 및 번역 데이터셋을 활용한 Llama2 Cross-lingual 한국어 확장 (Llama2 Cross-lingual Korean with instruction and translation datasets)

  • 장규식;이현민;나승훈;임준호;김태형;류휘정;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.627-632
    • /
    • 2023
  • 대규모 언어 모델은 높은 연산 능력과 방대한 양의 데이터를 기반으로 탁월한 성능을 보이며 자연어처리 분야의 주목을 받고있다. 이러한 모델들은 다양한 언어와 도메인의 텍스트를 처리하는 능력을 갖추게 되었지만, 전체 학습 데이터 중에서 한국어 데이터의 비중은 여전히 미미하다. 결과적으로 이는 대규모 언어 모델이 영어와 같은 주요 언어들에 비해 한국어에 대한 이해와 처리 능력이 상대적으로 부족함을 의미한다. 본 논문은 이러한 문제점을 중심으로, 대규모 언어 모델의 한국어 처리 능력을 향상시키는 방법을 제안한다. 특히, Cross-lingual transfer learning 기법을 활용하여 모델이 다양한 언어에 대한 지식을 한국어로 전이시켜 성능을 향상시키는 방안을 탐구하였다. 이를 통해 모델은 기존의 다양한 언어에 대한 손실을 최소화 하면서도 한국어에 대한 처리 능력을 상당히 향상시켰다. 실험 결과, 해당 기법을 적용한 모델은 기존 모델 대비 nsmc데이터에서 2배 이상의 성능 향상을 보이며, 특히 복잡한 한국어 구조와 문맥 이해에서 큰 발전을 보였다. 이러한 연구는 대규모 언어 모델을 활용한 한국어 적용 향상에 기여할 것으로 기대 된다.

  • PDF

도심지의 열환경 평가를 위한 열수지 모델의 검증 (Examination of Heat Budget Model for Urban Thermal Environment Evaluation)

  • 김상백;염향희;권병혁;김연희;오성남
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2003년도 추계학술대회 논문집
    • /
    • pp.504-505
    • /
    • 2003
  • 국지규모의 기상해석을 위한 기존의 방법은 중규모 모델로부터 down-nesting에 의한 방법으로 모델의 해상도를 향상시켜 기상장을 해석하는 것이 일반적이다(Clark and Farley, 1984). 그러나, 이 방법은 단지 물리적인 격자구조만을 향상시킨 것으로 근본적인 모델 내부 구조의 향상을 가져온 것은 아니다. 따라서, 다양한 토지 피복이 혼재해 있는 도심지를 대상으로 하는 고해상도의 국지기상 모델에 대하여 계산시간과 정확성을 고려한 효율적인 지표면 열수지 모델의 구축이 요구되고 있다. (중략)

  • PDF

3D City모델과 CFD 모델을 통합한 대기환경 시각화 연구 (A Study on Atmospheric Environment Visualization by Integrating 3D City Model and CFD Model)

  • 안승만;이호영;성효현;최영진;우정헌
    • 대한공간정보학회지
    • /
    • 제19권4호
    • /
    • pp.13-21
    • /
    • 2011
  • 3D City 모델로부터 CFD 모델 입력자료를 생성하여 모델링 품질을 향상시키고 CFD 모델링 결과를 3D 모델과 통합하여 사실적이고 쉽게 인지할 수 있는 시각화 방법에 대하여 연구하였다. 국토지리정보원에서 구축한 3D City 모델을 이용해 세밀도와 정확도가 향상된 CFD 모델 입력자료를 생산하여 적용함으로써 상세한 도시공간구조를 반영하는 향상된 CFD 모델을 생산하였다. CFD_NIMR_SNU 모델로부터 바람의 흐름과 오염물질 확산을 시뮬레이션 하였으며 3D City Model과 CFD 모델을 통합하여 동적으로 시각화 하였다. 본 대기환경 시각화 도구는 도시기후 계획 및 관리에 있어 의사결정을 위한 시각적 소통능력을 향상시켜 비용과 시간을 최소화할 것이다.

이동에이전트를 위한 트랜잭션 모델 (Transaction Model for Mobile Agents)

  • 유정준;이동익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.239-241
    • /
    • 2000
  • 이동에이전트 시스템의 상용화 시작과 더불어 이동에이전트 시스템에 대한 신뢰성 향상의 노력이 시작되었다. 이러한 노력에 부응하여 이동에이전트 시스템 XMAS에서는 신뢰성 향상을 위한 방법으로 트랜잭션 개념을 도입하고 있다. 트랜잭션 개념의 도입으로 이동에이전트 수행결과의 일관성 유지가 가능하여 데이터에 대한 신뢰성 향상을 기대할 수 있다. 이동에이전트는 기존 트랜잭션 모델과는 다른 다양한 특성을 갖는다. 따라서 이동에이전트가 하나의 트랜잭션으로 처리되기 위해서는 기존 트랜잭션 모델과는 다른 트랜잭션 처리방법이 고려되어야 한다. 본 논문에서는 기존 트랜잭션 모델에서 발견되지 않는 이동에이전트의 특성을 알아보고 이러한 특성들이 트랜잭션 모델과 트랜잭션 처리방법에 미치는 영향을 살펴본다.

  • PDF

AIM을 이용한 염색공장의 생산성 향상을 위한 시뮬레이션 (Simulation Application in Textile Industry)

  • 최성훈
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1994년도 추계학술발표회 및 정기총회
    • /
    • pp.6-6
    • /
    • 1994
  • 본 사례는 염색 공장의 생산성 향상을 위해 시뮬레이션 기법을 사용한 것이다. 두 가지 시뮬레이션 분석이 실시되었다. 첫 번째는 봉제라인 모델을 개발하여 버퍼 크기와 작없시간 편차가 생산성에 미치는 영향을 분석한 것이다. 두 번째 모델은 건조기, 표백기 등과 같은 염색 설비의 투자 효과 분석에 대한 것이다. 본 사례에서 작업시간의 확률분포를 추정하는 새로운 방법을 제시하였다. 모델 개발과 분석을 위해 AIM (Analyzer for Improving Nanufacturing)이 사용되었다. AIM은 Pritsker 사가 개발한 제조 시스템 전용 시뮬레이션 소프트웨어이다. AIM은 대화방식의 모델 개발 및 시뮬레이션이 가능하고 자동적인 애니메이션 작성과 강력한 그래프 기능을 제공하므로 AIM을 이용하면 모델 개발기간이 대폭적인 단축과 시뮬레이션의 커뮤니케이션 기능을 향상시킬수 있다.

  • PDF

좌-우향 은닉 마코프 모델에서 상태결정을 이용한 음질향상 (Efficient Speech Enhancement based on left-right HMM with State Sequence Decision Using LRT)

  • 이기용
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.47-53
    • /
    • 2004
  • 본 논문에서는 좌-우향은닉 마코프 모델 (Left-Right Hidden Markov Model)에서 상태결정을 갖는 음성향상방법을 제안하였다. 은닉 마코프 모델에 기초를 둔 음질향상 방법은 성능은 우수하나, 모든 상태에 대해서 음질향상 알고리즘을 계산하므로, 계산량이 많고, 메모리가 많이 필요하여 실시간 처리에 부적절하다. 좌-우향 은닉 마코프 모델은 마코프 모델을 좌측에서 우측으로의 전이만 허용하는 모델로 단순화시켜 현재 상태에서 현재 상태나 다음 상태로 전이될 수 있는 특성을 가지고 있다. 본 논문에서는, 좌-우향 은닉 마코프 모델에서 유사도비 테스트 (Log-Likelihood Ratio Test)를 이용하여 현재 음성의 상태를 결정하는 알고리즘을 제안하였다. 현재 음성의 상태를 알고 있다면, 현재 상태에 대해서만 음질향상 알고리즘을 계산하므로, 계산량이 줄어든다. 제안된 방법의 성능 평가를 위하여 음질 향상 시간과 신호 대 잡음비를 비교하였다. 제안된 방법은 기존의 방법에 비해 음질향상의 결과는 약 0.2∼0.4 dB 정도 떨어졌지만, 계산량을 많이 줄일 수 있었다.

데이터 마이닝의 지도학습 기법 성능향상을 위한 불일치 패턴 모델 (Inconsistent Pattern Model for Improving the Performance of Supervised Learning in Data Mining)

  • 허준;김종우
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2007년도 추계학술대회 및 정기총회
    • /
    • pp.288-305
    • /
    • 2007
  • 본 논문은 데이터 마이닝의 기법 중 가장 잘 알려진 지도학습 기법의 성능 향상을 위한 새로운 Hybrid 및 Combined 기법인 불일치 패턴 모델(오차 패턴 모델)에 대한 연구 논문이다. 불일치 패턴 모델이란 2개 이상의 기법 중 향후 더 레코드별로 더 잘 맞출 수 있는 기법을 메타 분류하는 불일치 패턴 모델을 개발하여, 최종적으로는 기존의 기법보다 더 좋은 분류 정확도 및 예측 향상율을 기대하기 위한 기법을 의미한다. 본 논문에서는 의사 결정나무 추론 기법인 C5.0과 C&RT 그리고 신경망 분석, 그리고 로지스틱 회귀분석과 같은 대표적인 데이터 마이닝의 지도학습 기법을 이용하여 불일치 패턴 모델을 생성하여 보고, 이들이 기존 단일 기법과 기존의 Combined 모델인 Bagging, Boosting 그리고 Stacking 기법보다 성능이 우수함을 23개의 실제 데이터 및 공신력 있는 공개 데이터를 이용하여 증명하여 보였다. 또한 데이터의 특성에 따라서 불일치 패턴 모델의 성능의 변화 및 더 우수해 지는지를 알아보기 위한 연구포 같이 수행을 하여 본 모델의 활용성을 높이고자 하였다.

  • PDF

다양한 운영체제에서의 다중 프로세스와 스레드 모델의 웹 서버 성능 비교 (Performance Comparisons of Multi-Process and Multi-Thread based Web Servers on Multiple Operating System Platforms)

  • 도인환;김경중;정규헌;전기훈;노삼혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.94-96
    • /
    • 2003
  • 맡은 사용자 영역의 프로그램들이 확장성과 성능 향상을 목적으로 다중 프로세스 모델에서 다중 스레드 모델로 바뀌고 있다. 웹 서버도 폭발적으로 증가하는 사용자 요청을 수용할 수 있도록 확장성과 성능 향상을 위해서 다중 스레드 모델을 적용하였다. 본 논문에서는 다중 프로세스 모델을 적용한 웹 서버와 다중 프로세스/다중 스레드 모델을 적용한 웹 서버에 대한 성능을 여러 운영체제 환경에서 평가하였다. 실험 결과 전체적으로 다중 프로세스 모델이 다중 스레드 모델보다 더 좋은 성능과 안정성을 보였다.

  • PDF

온톨로지 기반의 에러검출 방법에 관한 연구 (A Study on the Error Detection based on Ontology)

  • 서진원;임재현;김치수
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2008년도 춘계학술발표논문집
    • /
    • pp.220-223
    • /
    • 2008
  • 본 논문은 소프트웨어 설계 시 향상된 오류 검출방법을 통해서 소프트웨어 설계의 질을 향상시켜 그에 따른 소프트웨어 제품의 질을 향상시키데 목적을 두고 있다. 또한 소프트웨어 설계 방법론인 MOA(Methodology for Object to Agents)를 기초로 하고 있으며, MOA는 보편적인 정보 모델로써 온톨로지 기반 모델인 OSSD( Ontology for Sortware Specification and Desigh)모델을 이용한다. 본 논문은 OSSD 모델, 뷰-간 비일관성 검사기법, 일관성 프레임워크의 온톨로지적 특성과 연관된 규칙의 조합을 이용하여 UML모델에서 OSSD 모델로의 변환과정에서 수행되는 새로운 형식의 오류 검출방법을 정의한다. OSSD 모델로의 변환과정은 OSSD 모델의 인스턴스를 생성하기 위한 알고리즘에서 복수의 사상테이블을 이용하는 소프트웨어 설계의 어휘분석과 의미분석을 포함한다.

  • PDF