• Title/Summary/Keyword: 결과평가

Search Result 56,308, Processing Time 0.063 seconds

KoRIBES : A Study on the Problems of RIBES in Automatic Evaluation English-Korean Patent Machine Translation (특허 기계 번역에 대한 RIBES 한국어 자동평가 문제에 대한 고찰)

  • Jang, Hyeon-Jin;Jang, Moon-Seok;Noh, Han-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.543-547
    • /
    • 2020
  • 자연어 처리에서 기계번역은 가장 많이 사용되고 빠르게 발전하고 있다. 기계번역에 있어서 사람의 평가가 가장 정확하고 중요하지만 많은 시간과 비용이 발생된다. 이에 기계번역을 자동 평가하는 방법들이 많이 제안되어 사용되고 있지만, 한국어 특성을 잘 반영한 자동평가 방법은 연구되지 않고 있다. BLEU와 같은 자동평가 방법을 많이 사용하고 있지만 언어의 특성 차이로 인해 원하는 평가결과를 얻지 못하는 경우가 발생하며, 특히 특허나 논문과 같은 기술문서의 번역에서는 더 많이 발생한다. 이에 본 논문에서는 단어의 정밀도와 어순이 평가에 영향이 있는 RIBES를 가지고 특허 기계 번역에서 영어→한국어로 기계 번역된 결과물의 자동평가에 대해 사람의 평가와 유사한 결과를 얻기 위해 tokenization 과정에서 복합 형태소 분리를 통한 평가방법을 제안하고자 한다.

  • PDF

Evaluation Method of Machine Translation System (기계번역 성능평가를 위한 핵심어 전달율 측정방안)

  • Yu, Cho-Rong;Lee, Young-Jik;Park, Jun
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.241-245
    • /
    • 2003
  • 본 논문은 기계번역 시스템의 성능평가를 위한 '핵심어 전달율 측정' 방안에 대해서 기술한다. 기계번역 시스템의 성능평가는 두 가지 측면으로 고려될 수 있다. 첫 번째는 객관적인 평가로 IBM에서 주창한 BLEU score 측정이나 NIST의 NIST score 측정이 그 예이다. 객관적인 평가는 평가자의 주관적인 판단이나 언어적인 특성을 배제한 방법으로 프로그램을 통해 자동으로 fluency와 adequacy를 측정하여 성능을 평가한다. 다음은 주관적인 평가이다. 주관적인 평가는 평가자의 평가를 통해 번역의 품질을 평가하는 방법이다. 주관적 평가 방법의 대표적인 것으로는 NESPOLE이나 LDC가 있다. 주관적인 평가는 평가자의 정확한 판단으로 신뢰할만한 성능평가 결과를 도출하지만, 시간과 비용이 많이 들고, 재사용할 수 없다는 단점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해, 번역대상 문장에서 핵심어를 추출하고, 그 핵심어가 기계번역 시스템의 수행결과에 전달된 정도를 자동으로 측정하는 새로운 평가방법인 '핵심어 전달율 측정' 방안을 제안한다. 이는 성능평가의 비용과 시간을 절약하고, 주관적 평가와 유사한 신뢰성 있는 평가결과를 얻을 수 있는 좋은 지표가 될 수 있을 것으로 기대한다.

  • PDF

Exploration on the Feasibility of Utilization and Teacher Perceptions of Using ChatGPT for Student Assessment in Science (과학 교과의 학생 평가에서 ChatGPT의 활용 가능성 및 교사 인식 탐색)

  • Dongwon Lee;Hyeon-Pyo Shim;Jongho Baek
    • Journal of The Korean Association For Science Education
    • /
    • v.44 no.1
    • /
    • pp.119-130
    • /
    • 2024
  • This study explores the possibility of using a generative artificial intelligence, ChatGPT, for student assessment in science subjects. In order to achieve our goal, we developed assessment items, collected students' responses, and input them into ChatGPT to implement the assessment procedures. Subsequently, we shared the assessment results from ChatGPT with science teachers and compared them to the teachers' assessment process to investigate the use of ChatGPT in student assessment. Regarding the results, in terms of setting the scoring rubric, we found the rubric generated by ChatGPT to be generally appropriate. However, the consistency between the scoring results obtained from ChatGPT and those determined by the teachers was relatively low. This inconsistency was more pronounced in items with additional assessment components and a more intricate rubric. In regard to feedback on student responses, there were some instances where the feedback generated was scientifically incorrect or beyond the scope of the curriculum, but there were also some positives, such as the provision of exemplary answers to questions and additional examples that helped students learn further. From these results, the teachers perceived limitations in using ChatGPT to conduct assessment in terms of reliability, which is considered crucial in student assessment, but suggested that it could be used to support assessment. Finally, synthesizing these findings, implications for utilizing ChatGPT in student assessment were suggested.

An Effect Analysis on the Management and Service Evaluation System for Bus Company (시내버스업체의 경영 및 서비스 평가제도 도입 효과분석)

  • Kim, Jeom-San;Jo, Hye-Jeong;Park, Jun-Sik
    • Journal of Korean Society of Transportation
    • /
    • v.25 no.5
    • /
    • pp.43-55
    • /
    • 2007
  • Gyeonggi-do has conducted bus management and service evaluation of bus operating company since 2005 under the law for promoting public transportation. The evaluation results are used for improving bus service, making policy, and estimating incentives to bus companies. A lot of cost and man-month are needed to evaluate bus management and service for bus operating company, and many companies are against the evaluation. Therefore, the effect analysis on evaluation system should be followed to maintain it. This research results in the evaluation system has positive effects through quantitative and qualitative analysis. The data of bus company's operation condition in 2005 and 2006 are used for a comparative analysis. From the survey result for the company, bus drivers, and administrators, it results that positive effects are predominant. The results of this research could be used for a shield against some criticism about appropriateness of the evaluation criteria and effectiveness of the evaluation system. For improving bus service, evaluation items and criteria could be added or adjusted based on this research.

Development of User's Evaluation Criteria for VJ Broadcasting Program (VJ 방송프로그램의 수용자 평가척도 개발)

  • Lee, Jong-Tak
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.5
    • /
    • pp.135-143
    • /
    • 2010
  • As the broadcasting programs produced by VJ are increasing, every broadcasting company has doubts as to how their program evaluations derive the objective evaluation results and proposes their own tailored program evaluation methods considering the change of the production system. The proposed quality evaluation items represent a new model in terms of the perfectness of VJ broadcasting program production and are used as a way to revise the current evaluation methods of the broadcasting companies. To derive the items which help to find the problems of VJ broadcasting programs, 30 specialists, such as PDs, VJs, and professors, are chosen as a specialist group, and the first experiment is performed to select the evaluation items of VJ broadcasting programs. Based on the result of the degree of importance of the evaluation items, 9 VJ program evaluation items are made. Also, the second experiment is performed in order to verify the proposed evaluation criteria. As a result of the experiment, the reliability of the proposed evaluation method is .939, which is proved to be significant. The selection of the quality evaluation items considering only the VJ broadcasting programs turns out to be significant as a new quality evaluation criterion.

Using GOMS for User Interface Evaluation (GOMS를 이용한 사용자 인터페이스 평가)

  • Jeon, Young-Joo;Back, Ji-Seung;Myung, Ro-Hae
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.1045-1052
    • /
    • 2009
  • 컴퓨터의 빠른 발달과 보급 속도로 인해 사용자와 컴퓨터 간의 상호작용(Human-Computer Interaction; HCI)이 중요해 지면서, 인터페이스 개발과 평가가 강조되고 있다. 본 논문에서는 컴퓨터 시스템의 정량적 사용성 평가에 널리 이용되는 GOMS에 대한 이해와 함께 인터페이스 평가에서의 GOMS의 한계와 개선 방향에 대하여 알아보고자 한다. 먼저 연구 대상이 되는 컴퓨터 작업 환경을 선정하고, 특정 작업에 대한 작업 분석을 실시하였다. 그리고 작업 분석 결과를 바탕으로 NGOMSL을 이용하여 모델링 하였다. 모델링 결과 작업 Operators의 구성을 알 수 있었고, 총 수행시간과 학습시간을 예측할 수 있었다. GOMS 모델링 결과가 실제 사람의 수행 결과와 얼마나 일치하는지를 비교하기 위하여 Empirical Test를 실시하였고, 그 결과 GOMS 모델링을 통해 예측된 수행시간과 실험을 통해 얻은 총 수행시간 사이에는 큰 차이가 있음을 알 수 있었다. 이러한 차이를 줄이고 실제 사용자의 수행과정과 유사하게 모델링을 하기 위하여 두 가지 가정을 바탕으로 GOMS 모델을 개선하였다. 본 연구를 통하여 GOMS 모델링은 컴퓨터 시스템의 효과적인 상대적 사용성 평가 도구로 활용될 수 있음을 확인할 수 있었다.

  • PDF

액체금속로 고온 구조물의 크립-피로 손상평가 방법 비교 분석

  • Kim, Jong-Beom;Lee, Hyeong-Yeon;Yoo, Bong;Yoon, Sam-Son
    • Proceedings of the Korean Nuclear Society Conference
    • /
    • 1998.05b
    • /
    • pp.823-830
    • /
    • 1998
  • 본 연구에서는 미국, 프랑스, 일본의 고온구조 설계지침서의 크립-피로 손상평가 방법을 살펴보고 고온하중을 받는 불연속 구조물에 대하여 범용 유한요소 해석코드인 ANSYS와 ABAQUS를 이용한 열전달 및 응력해석을 수행하여 각국의 코드 절차에 따른 크립-피로 손상 평가를 하였다. 이들 결과를 점소성 비탄성 구성식을 적용한 비탄성해석 결과와 비교평가하였다. 본 연구에서 분석한 불연속 구조물의 경우에 대한 평가 결과 미국의 ASME Subsection NH에 의한 방법이 비탄성 해석결과에 가장 가까운 결과를 주며, 일본의 BDS에 따른 평가방법은 적용성이 가장 편리함을 알 수 있었다.

  • PDF

A Study of the effect of Analysis & Evaluation in acquisition phase on user satisfaction and usage (획득단계 분석평가 결과가 사용자 만족 및 활용에 미치는 요인에 관한 연구)

  • Jeon, Nam-Hee;Chung, Jung-Ku;Gim, Gwang-Yong
    • Journal of the military operations research society of Korea
    • /
    • v.35 no.3
    • /
    • pp.101-117
    • /
    • 2009
  • The objective of this study is to find relations between success factors of project management and user satisfaction and usage for analysis report. According to emprical study, the main factors that affect user satisfaction are requirement and proper planning. And the main factors that affect usage are expert of analysis, proper planning and user satisfaction.

Development and Application of Adaptability Assessment Methods for Traffic Assignment Techniques (통행배정지법 적용성 평가방법의 개발 및 적용)

  • 최재훈;박병호
    • Journal of Korean Society of Transportation
    • /
    • v.16 no.2
    • /
    • pp.23-35
    • /
    • 1998
  • 이 연구는 두가지의 목적을 갖는다. 첫 번째는 통행배정결과를 평가하는데 혼동되어 이용되고 있는 방법들을 체계화하여 통합된 철차를 개발하는 것이고, 두 번째는 충북도내 3개 도시(청주, 충주 및 제천시)의 배정결과에 이를 적용시켜 해당 도시별로 신뢰도가 높은 통행배정법을 제안하는 것이다. 분석된 주요 연구결과는 다음과 같다. 첫째, 관련문헌들을 검토하여 평가방법들을 통계학적 관점에서 크게 기술통계법과 추리통계법으로 체계화시키고, 이러한 평가방법들의 결과를 순위자료화하여 종합적인 판단을 내릴 수 있는 방법을 정립함으로써 통합된 일련의 평가절차를 개발하였다. 둘째, 개발된 절차를 이용한 사례연구 결과, 청주시와 충주시에 대해서는 확률배정법, 제천시에 대해서는 분할배정법의 적용성이 우수한 것으로 나타났다. 본 연구를 통해 개발된 평가절차는 해당도시에 적합한 통행배정기법을 선정하는데 이용될 수 있을 뿐만 아니라, 향후 개발되는 통행배정 알고리즘들의 효과를 기존 배정기법들과 비교하여 설명할 수 있는 분석의 틀을 제공할 수 있다.

  • PDF

원자력발전소의 인간 공학 주기적 안정성 평가 방법론 및 적용

  • 정연섭;지문구;김주택
    • Nuclear industry
    • /
    • v.23 no.6 s.244
    • /
    • pp.39-47
    • /
    • 2003
  • 법령에 의하여 요구되는 주기적 안전성 평가를 위하여 인적 요소 평가 방법론을 개발하였다. 특히 평가 하위 업무간의 중복을 제거하여 업무의 효율을 향상시키고 반복적으로 수행되는 동일발전소, 혹은 타발전소의 결과를 충분히 활용할 수 있도록 하였다. 이 방법론은 인간 기계 연계 체제의 현상태 평가, 운전 이력 중심 평가, 시뮬레이션 활용 평가라는 3가지로 특정지어진다. 이 평가 방법을 적용하여 고리 3$\cdot$4호기에 대해서 부분 평가를 수행하였고 그 결과를 제시하였다.

  • PDF