• 제목/요약/키워드: 모델평가

검색결과 12,466건 처리시간 0.044초

학습발달과정에 근거한 과정중심 STEAM 역량 평가 모델에 대한 이론적 탐색 (Theoretical Exploration of a Process-centered Assessment Model for STEAM Competency Based on Learning Progressions)

  • 유선아;곽영순;양성호
    • 과학교육연구지
    • /
    • 제42권2호
    • /
    • pp.132-147
    • /
    • 2018
  • 본 연구에서는 과정중심 평가에 대한 이론적 모델을 STEAM 교육 맥락에서 핵심역량의 학습발달과정에 근거하여 개발, 제안하였다. 본 연구에서 제안하는 '과정-결과를 결합한 모듈 타입(Process-Products Combined Module-type)의 STEAM 평가모델(P2CM STEAM 평가모델)'은 문헌분석을 통해 도출된 것으로, STEAM 수업 맥락에서 핵심역량 학습발달과정에 초점을 둔 모델이다. 의 특징은 STEAM 수업과 평가를 연계하고, 과정평가와 결과평가가 동시에 가능하며, 다양한 STEAM 주제와 수업유형에 실제로 적용 가능한 점이다. 은 3개의 축으로 구성되는데, 첫 번째 축(X축)은 STEAM에서 중점을 두어야 할 4C 역량을, 두 번째 축(Y축)은 STEAM 수업유형의 종류와 위계를 나타내며, 세 번째 축은 학습발달 수준인 평가기준을 나타낸다. 에 기반으로 하여 창조기반의 창의역량에 초점을 둔 평가모듈(창의역량${\times}$창조기반)에서, 학생들의 학습발달과정을 평가할 수 있는 평가기준을 예시하였다. 연구결과를 토대로 한국형 LP에 대한 연구성과를 토대로 평가모델 개발하기, 현장밀착형 심층연구를 통한 증거기반 평가모델 개발 제공, 교사공동체 및 현장교사들의 참여를 통한 형성 평가 모델 수정보완, 학습발달수준 추적을 위한 평가모델에 대한 지속적인 연구의 필요성 등을 제안하였다.

학습 데이터 용량 및 반복 학습 횟수에 따른 이미지 기반 GPT 문장생성 및 성능 분석 (Analyze GPT sentence generation performance based on Image by training data capacity and number of iterations)

  • 이동희;최봉준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.363-364
    • /
    • 2023
  • 현재 많은 사람이 GPT를 통해 다양한 활동 및 연구를 진행하고 있다. 사람들은 GPT를 통해 문장생성 시 문장에 대한 정확도를 중요하게 생각한다. 하지만 용도에 따라 GPT를 통해 생성하는 문장의 문체와 같은 표현방식이 다르다. 그래서 생성된 문장이 유의미한 문장이라는 것에 판단이 매우 주관적이기 때문에 수치적 평가가 어렵다. 본 논문에서는 자연어처리 모델이 생성한 문장의 유의미함을 판단하기 위해 각 모델을 학습하는 데이터 용량과 반복 학습의 횟수에 따른 결과물을 비교하였다. 본 연구에서는 Fine-Tuning을 통해 총 4개의 GPT 모델을 구축하였다. 각 모델로 생성 문장을 BLEU 평가지표를 통해 평가한 결과 본 연구에 BLEU 모델은 부적합하다는 결과를 도출하였다. 이를 해결하기 위해 본 연구에서는 생성된 모델을 평가하고자 설문지를 만들어 평가를 진행하였다. 그 결과 사람에게 긍정적인 평가를 받는 결과를 얻을 수 있었다.

  • PDF

한국어 언어 모델의 정치 편향성 검증 및 정량적 지표 제안 (Measurement of Political Polarization in Korean Language Model by Quantitative Indicator)

  • 김정욱;김경민;;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.16-21
    • /
    • 2022
  • 사전학습 말뭉치는 위키백과 문서 뿐만 아니라 인터넷 커뮤니티의 텍스트 데이터를 포함한다. 이는 언어적 관념 및 사회적 편향된 정보를 포함하므로 사전학습된 언어 모델과 파인튜닝한 언어 모델은 편향성을 내포한다. 이에 따라 언어 모델의 중립성을 평가할 수 있는 지표의 필요성이 대두되었으나, 아직까지 언어 인공지능 모델의 정치적 중립성에 대해 정량적으로 평가할 수 있는 척도는 존재하지 않는다. 본 연구에서는 언어 모델의 정치적 편향도를 정량적으로 평가할 수 있는 지표를 제시하고 한국어 언어 모델에 대해 평가를 수행한다. 실험 결과, 위키피디아로 학습된 언어 모델이 가장 정치 중립적인 경향성을 나타내었고, 뉴스 댓글과 소셜 리뷰 데이터로 학습된 언어 모델의 경우 정치 보수적, 그리고 뉴스 기사를 기반으로 학습된 언어 모델에서 정치 진보적인 경향성을 나타냈다. 또한, 본 논문에서 제안하는 평가 방법의 안정성 검증은 각 언어 모델의 정치적 편향 평가 결과가 일관됨을 입증한다.

  • PDF

대인(Personal) 감성 이미지 평가 기법의 개발과 적용 (Development of Evaluatin Techniques of Personal Image and its Application)

  • 황상민
    • 감성과학
    • /
    • 제2권2호
    • /
    • pp.105-113
    • /
    • 1999
  • 특정 사람에 대해 느끼는 이미지 또는 특정 사람이 가지는 이미지를 어떻게 평가하고 나타낼 수 있을까\ulcorner 본 연구에서는 사람에 대해 가지는 이미지를 표준적인 감성 어휘 척도를 활용하여 모델이 가지는 감성이미지가 무엇인지를 비교평가 할 수 있는 방법을 제시한다. 연구 대상으로는 국내 화장품 회사의 모델을 활용하였다. 4명의 모델을 전체와 부분 모습의 두 가지 형태로 제시하면서 각 인물이 가진 이미지를 평가하게 하였다. Personal 감성이미지를 평가하기 위해서 사람의 특성이나 이미지를 묘사하는 형용사 쌍 103개를 이용하였다. 모델 이미지에 대한 평가 반응은 요인분석을 통해 7개의 감성어휘 요인으로 나타났다. 우아한-천박한, 신선감-답답함, 편안함-불편함, 순수함-가식적인, 세련미-촌스러운, 진취성-보수성, 여성성-남성성, 4명의 모델들은 이 7가지 감성 이미지 요인에 따라 상호 차별적으로 나타났다. 인물 감성이미지는 감성적 어휘로 표현됨과 동시에 각 인물이 가진 고유하고 대표적인 personal image로 나타낼 수 있는가를 보여줄 수 있엇다. 본 연구에서는 개발된 감성이미지척도는 사람의 이미지를 평가하는 대표적인 감성척도로 이용될 수 있을 뿐 아니라, 특정 제품을 나타내는 모델이 일반인들에 어떤 이미지를 전달하는지 그리고 모델의 이미지와 제품이 지향하는 이미지와 얼마나 일치하는지를 평가할 수 있었다.

  • PDF

대인(Personal) 감성 이미지 평가 기법의 개발과 적용 (Development of Evaluation Techniques of Personal Image and its Application)

  • 황상민
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 추계학술대회 논문집
    • /
    • pp.310-317
    • /
    • 1999
  • 특정 사람에 대해 느끼는 이미지 또는 특정 사람이 가지는 이미지를 어떻게 평가하고 나타낼 수 있을까\ulcorner 본 연구에서는 사람에 대해 가지는 이미지를 표준적인 감성 어휘 척도를 활용하여 모델이 가지는 감성이미지가 무엇인지를 비교평가 할 수 있는 방법을 제시한다. 연구 대상으로는 국내 화장품 회사의 모델을 활용하였다. 4명의 모델을 전체와 부분 모습의 두가지 형태로 제시하면서 각 인물이 가진 이미지를 평가하게 하였다. Personal 감성이미지를 평가하기 위해서 사람의 특성이나 이미지를 묘사하는 형용사 쌍 103개를 이용하였다. 모델 이미지에 대한 평가 반응은 요인분석을 통해 7개의 감성 어휘 요인으로 나누어졌다. 4명의 모델들은 이 7가지 감성 이미지 요인에 따라 상호 차별적으로 나타났다. 인물 감성이미지는 감성적 어휘로 표현됨과 동시에 각 인물이 가진 고유하고 대표적인 personal image로 나타낼 수 있는가를 보여줄 수 있었다. 본 연구에서는 개발된 감성이미지 척도는 사람의 이미지를 평가하는 대표적인 감성척도로 이용될 수 있을 뿐 아니라, 특정 제품을 나타내는 모델이 일반인들에 어떤 이미지를 전달하는지 그리고 모델의 이미지와 제품이 지향하는 이미지와 얼마나 일치하는지를 평가할 수 있었다.

  • PDF

AIS data 분석을 통한 해상교통환경평가에 관한 연구

  • 황수진;김은경;임남균
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2016년도 춘계학술대회
    • /
    • pp.67-68
    • /
    • 2016
  • 해상교통환경평가는 선박 간 항행상황의 위험도를 정량화하여 나타냄으로써 선박의 안전운항을 효과적으로 지원하는 역할을 한다. 대표적인 해상교통환경평가모델로는 ES(Environmental Stress model)와 CR(Collision Risk)모델이 있다. 이러한 모델을 살펴보면, 각각의 평가지수를 이용하여 항행상황의 위험도를 정량화하며, 선박 간 조우관계를 기반으로 평가요소를 구성함을 알 수 있다. 이번 연구에서는 선박 간 조우관계를 포함한 항행상황의 위험도에 영향을 줄 것으로 기대되는 다양한 요소를 고려한 평가지수의 타당성을 살펴보고자 한다. 이를 위하여, AIS data를 이용하여 해상교통환경을 재현하고 분석하였으며, 동일한 항행상황을 ES, CR과 제안한 모델을 이용하여 위험도 평가를 실시하였다. 그 결과를 비교하여 제시함으로써 본 모델이 해상교통환경모델로서 항만 내 통항 안전성 평가에 적용 가능성을 평가하였다.

  • PDF

ETCCDI를 활용한 전구기후모델 평가방법 제안 (Proposal of GCM Evaluation Method Using ETCCDI)

  • 정임국;조재필;박지훈;이은정
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2018
  • 전구기후모델은 전 지구 규모에서 일관성 있는 전망 결과를 제공한다. 이를 수자원분야의 활용과 같은 지역 단위의 응용분야에 실질적으로 활용하기 위해서는 상세화 절차가 반드시 필요하며, 상세화 전후의 결과에 대한 평가가 필요하다. 본 연구에서는 전구기후모델을 이용한 상세화 전후의 체계적인 평가를 위한 방법을 제안하고자 한다. 평가방법으로는 과거 재현성 평가와 미래 불확실성 평가를 통해 실시하였다. 과거 재현성 평가는 상세화 이전 전구기후모델의 과거 공간재현성평가와 상세화 된 자료와 ETCCDI를 이용한 Technique for Order of Preference b Similarity to Ideal Solution (TOPSIS)기법으로 평가하였다. 미래 기간의 불확실성 평가는 Katsavounidis approach (KKZ)방법을 통한 미래 불확실성의 설명력을 고려하여 실시하였다. 전구기후모델은 CMIP5에서 제공되는 모형들 중 26를 이용하였고, Representative Concentration Pathways (RCP) 시나리오는 4.5와 8.5를 이용하였고, 기상변수는 강수량, 최대기온, 최저기온을 구축하였다. 상세화는 통계적 상세화방법 중 하나인 Spatial Disaggregation Quantile Delta Mapping (SDQDM)방법을 이용하였다. 과거 재현성평가를 위한 과거기간은 1976년부터 2005년까지의 30년 기간을 사용하였다. 미래 불확실성 평가를 위한 기간은 3개 구간 (2011-2040, 2041-2070, 2071-2099)을 사용하였다. 과거 재현성 평가를 통해 26개 전구기후모델 중 모사력이 부족하다고 판단되는 모델을 제외한 19개 전구기후모델을 선정하였고, 이를 이용하여 미래 불확실성 평가를 실시하였다. 그 결과 각각의 미래기간과 RCP시나리오에서의 미래변동성을 설명하기 위한 전구기후모델의 최소 필요수를 알 수 있었다. 본 연구의 결과를 효율적인 수자원분야의 전구기후모델의 활용이 가능할 것으로 기대된다.

  • PDF

해수유동모델 검증을 위한 오차평가방법 비교 연구 (Skill Assessments for Evaluating the Performance of the Hydrodynamic Model)

  • 김태윤;윤한삼
    • 한국해양환경ㆍ에너지학회지
    • /
    • 제14권2호
    • /
    • pp.107-113
    • /
    • 2011
  • 해수유동모델의 검증 및 평가를 위해 적용되는 또는 적용가능한 10종류의 모델 오차평가방법 - 네가지의 정량적 평가방법(절대평균오차, 평균제곱근 오차, 상대적 절대평균오차, 백분율모델오차)과 여섯가지의 정성적 평가방법(상관계수, 신뢰지수, 일치지수, 모델효율성, 비용함수, 잔여량계수) - 을 소개하고, 실제 조위, 유속, 염분관측치와 3차원 곡선형 모델(CH3D)에서 구해진 플로리다 하구에서의 수치해에 이들 모델 오차평가방법들을 적용하였다. 조위 및 유속평가시 절대평균오차, 평균제곱근 오차, 상대적 절대평균오차, 상관계수, 일치지수, 모델효율성, 비용함수, 잔여량계수 등이 적합하였다. 그리고 염분평가시 절대평균오차, 평균제곱근 오차, 상대적 절대평균오차, 백분율모델오차, 상관계수, 신뢰지수, 비용함수, 잔여량계수 등의 사용이 타당하였다. 정량/정성적 평가방법들이 서로 유사한 평가경향을 보여 줌으로써, 상호간의 신뢰성도 보여 주었다. 다양한 모델 오차평가방법을 통하여 계산된 평가값을 토대로, 본 연구에서는 조위, 유속, 염분이 잘 재현된 해수유동모델의 평가범위를 제시하였다. 조위의 경우 상대적 절대평균 오차는 10%이내, 상관계수는 0.95이상, 일치지수는 0.98이상, 모델효율성은 0.93이상, 비용함수는 0.21이내이며, 유속의 경우 상대적 절대평균오차는 20%이내, 상관계수는 0.7이상, 일치지수는 0.8이상, 모델효율성은 0.5이상, 비용 함수는 0.5이내이며, 염분의 경우 상대적 절대평균오차와 백분율모델오차는 10%이내, 상관계수는 0.9이상, 신뢰지수는 1.15이내, 비용함수는 0.1이내 이다.

언어 모델의 뉴스 도메인 요약 성능 비교 분석 (Comparative Analysis of Language Model Performance in News Domain Summarization)

  • 류상원;김윤수;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.131-136
    • /
    • 2023
  • 본 논문에서는 기존의 요약 태스크에서 주로 사용하는 인코더-디코더 모델과 디코더 기반의 언어 모델의 성능을 비교한다. 요약 태스크를 평가하는 주요한 평가 지표인 ROUGE 점수의 경우, 정답 요약문과 모델이 생성한 요약문 간의 겹치는 단어를 기준으로 평가한다. 따라서, 추상적인 요약문을 생성하는 언어 모델의 경우 인코더-디코더 모델에 비해 낮은 ROUGE 점수가 측정되는 경향이 있다. 또한, 최근 연구에서 정답 요약문 자체의 낮은 품질에 대한 문제가 되었고, 이는 곧 ROUGE 점수로 모델이 생성하는 요약문을 평가하는 것에 대한 신뢰도 저하로 이어진다. 따라서, 본 논문에서는 언어 모델의 요약 성능을 보다 다양한 관점에서 평가하여 언어 모델이 기존의 인코더-디코더 모델보다 좋은 요약문을 생성한다는 것을 보인다.

  • PDF

가상현실 게임의 평가 모델 연구 (A Study of Evaluation Model of VR(Virtual Reality) Game)

  • 박찬일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.345-346
    • /
    • 2019
  • 본 논문에서는 가상현실 게임의 평가 모델을 제안한다. 게임의 평가 모델은 장르별, 재미요소 특성에 맞게 연구 되어 왔다. 가상현실 게임에 대한 평가 모델은 아직까지 연구 제안된 모델이 없었다. 4차 산업과 연관하여 가상현실은 최근 가장 각광 받고 있는 분야 중 하나이며 기술의 발달은 게임 분야와 관련하여 많은 발전을 지속하고 있다. 가상현실 게임의 평가 모델 항목은 5가지로 구분하였다. 이를 기반으로 가상현실 슈팅 게임을 활용하여 이를 평가 할 수 있는지 검증하였다. 본 논문에서 제안한 평가영역을 바탕으로 가상현실 게임을 평가할 수 있으며 이는 게임 개발의 성공을 위한 하나의 가치 척도로 활용될 수 있다.

  • PDF