• Title/Summary/Keyword: Item difficulty

Search Result 285, Processing Time 0.029 seconds

웹 기반 학습평가를 위한 학습자 중심 문제추천 시스템 (A Learner Tailoring Question Recommendation System for Web based Learning Evaluation System)

  • 정화영;김은원;홍봉화
    • 전자공학회논문지 IE
    • /
    • 제45권4호
    • /
    • pp.68-73
    • /
    • 2008
  • 본 연구는 웹 기반 학습평가를 위한 학습자 중심의 문제추천 시스템을 제안하였다. 문제추천 과정을 위하여 문항난이도가 이용되었으며, 각 문제들은 문제은행에 저장 및 관리되었다. 문항난이도는 학습과정 중 재 산출되며 다음 학습에서 피드백되었다. 학습자 중심 문제추천을 위해, 학습자는 학습 전 학습단원을 선택할 수 있으며 학습난이도를 설정할 수 있도록 하였다. 제안방법의 적용결과 대부분의 학습자들이 학습난이도 조절로 인하여 성적이 향상됨을 알 수 있었다.

문제은행 시스템의 문항 차분 난이도 및 변별도를 기반으로 한 문항 적합성 검증 (Item Difference Difficulty & Item Discrimination based Item Suitability Verification for Test Bank System)

  • 전병호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.403-406
    • /
    • 2001
  • 문제은행 시스템은 피험자의 조건에 따라 데이터베이스에서 문항을 추출하여 가상공간에서 평가를 수행한다. 가상 공간에서의 평가는 피험자에게 적용하는 경우 출제 빈도에 따라 운항의 난이도 및 변별력에 영향을 주게 된다 출제 빈도에 따라 난이도나 변별력이 낮아지는 문항은 출제를 제한하는 기준이 필요하다. 본 논문에서는 문항 사후 난이도와 문항 변별도를 기반으로 하여, 문항 차분 난이도를 주기적으로 측정하고 난이도 차이가 일정 수준 이상이 되는 문항에 대해 출제를 제한하는 방안과 전체 피험자에 대한 운항의 변별력을 측정하러 변별력이 떨어지는 문항을 출제자에게 문항을 수정하게 하거나 삭제하도록 하는 방안들 제안한다.

  • PDF

Rasch 모형을 적용한 지체장애 엘리트선수의 스포츠수행전략(TOPS) 척도 타당화 (A Psychometric Item Goodness-of-Fit of the Test of Performance Strategies for Athletes with Physical Disabilities Applying Rasch Model)

  • 서은철;백재근
    • 재활복지
    • /
    • 제21권2호
    • /
    • pp.169-190
    • /
    • 2017
  • 이 연구의 목적은 스포츠수행전략(TOPS) 척도를 지체장애 엘리트선수에게 적용이 가능토록, Rasch 평정척도모형을 적용하여 문항의 적합성을 검증하는 데에 있다. 이를 위해 지체장애 엘리트선수 215명을 대상으로 5요인 24문항으로 구성되어있는 TOPS 척도에 응답토록 하였고, 일차원성 가정은 PCAR 검증을 통해서, 문항의 적합성은 WINSTEPS 3.65 프로그램을 통하여 검증하였다. 그 결과, 첫째, 문항의 응답범주는 문제가 있는 것으로 나타나, 기존 5점 범주 대신 3점 범주로 수정이 필요하다. 둘째, 문항적합성을 분석한 결과 21문항은 적합한 것으로 나타났지만, 3문항은 부적합한 것으로 나타났다. 셋째, TOPS 척도의 문항 신뢰도는 수용이 가능했지만, 응답자 신뢰도는 낮게 나타나, 문항 곤란도를 고려한 문항 순서의 조정이 필요하였다. 넷째, 개인 속성점수와 곤란도를 Item-Person Map을 통해 비교한 결과, 혼잣말 요인을 제외한 나머지 요인들에서 개인 속성점수 분포에 비해 문항 곤란도 분포가 편향되어 있는 것으로 나타내었다. 따라서 후속 연구에서 지체장애 엘리트선수의 TOPS를 적용하기 위해서는 문항의 배열을 곤란도가 낮은 문항에서 높은 문항 순으로 조정하고, 응답범주는 3점 범주로 설정, 아울러 곤란도를 고려한 추가문항을 개발하는 것이 타당한 결과를 산출할 수 있을 것이다.

라쉬분석을 이용한 세 가지 요통 장애 설문지의 비교 (A Comparison of Three Low Back Disability Questionnaires With Rasch Analysis)

  • 김경모;박소연;이충휘
    • 한국전문물리치료학회지
    • /
    • 제18권3호
    • /
    • pp.94-102
    • /
    • 2011
  • The purpose of this study was to review existing assessment tools for patients with low back pain and improve them through combination. A total of 314 patients with low back pain participated. Their condition was assessed using the Oswestry Disability Questionnaire (ODQ), the Quebec Back Pain Disability Scale (QBPD), and the Back Pain Functional Scale (BPFS). Rasch analysis was applied to identify inappropriate items, item difficulties, and the separation index. In this study, the 'sex life' item of the ODQ (10 items) and the 'sleeping' item of the BPFS (12 items) showed misfit statistics, whereas all items of the QBPD (20 items) were appropriate. After combining the ODQ, QBPD and BPFS, Rasch analysis was applied. The 'pain intensity', and the 'sex life' item of the ODQ and the 'throw a ball' item of QBPD showed misfit statistics. These 3 items were retained for further analysis. The remaining 42 combined ODQ-QBPD-BPFS items were arranged according to difficulty. For all subjects, the most difficult item was 'pain intensity', whereas the easiest was 'take food out of the refrigerator'. As the separation index of 42 combined ODQ-QBPD-BPFS was higher than that of the three questionnaires separately, difficulty of items varied with some need for rearrangement. The results of this study confirmed the possibility and need for a new back pain disability assessment tool, and produced one. Further study is needed to refine the questionnaire in consideration of psychosocial and occupational factors.

2011-2016년 의학교육평가컨소시엄 임상종합평가의 효과성 (Effectiveness of Medical Education Assessment Consortium Clinical Knowledge Mock Examination (2011-2016))

  • 이상엽;이예리;김미경
    • 의학교육논단
    • /
    • 제20권1호
    • /
    • pp.20-31
    • /
    • 2018
  • Good assessment is crucial for feedback on curriculum and to motivate students to learn. This study was conducted to perform item analysis on the Medical Education Assessment Consortium clinical knowledge mock examination (MEAC CKME) (2011-2016) and to evaluate several effects to improve item quality using both classical test theory and item response theory. The estimated difficulty index (P) and discrimination index (D) were calculated according to each course, item type, A (single best answer)/R (extended matching) type, and grading of item quality. The cut-off values used to evaluate P were: >0.8 (easy); 0.6-0.8 (moderate); and <0.6 (difficult). The cut-off value for D was 0.3. The proportion of appropriate items was defined as those with P between 0.25-0.75 and D ${\geq}0.25$. Cronbach ${\alpha}$ was used to assess the reliability and was compared with those of the Korean Medical Licensing Examination (KMLE). The results showed the recent mean difficulty and decimation index was 0.62 and 0.20 for the first MEAC CKME and 0.71 and 0.19 for the second MEAC CKME, respectively. Higher grade items evaluated by a self-checklist system had better D values than lower grade items and higher grade items gradually increased. The preview and editing process by experts revealed maintained P, decreased recall items, increased appropriate items with better D values, and higher reliability. In conclusion, the MEAC CKME (2011-2016) is deemed appropriate as an assessment to evaluate students' competence and prepare year four medical students for the KMLE. In addition, the self-checklist system for writing good items was useful in improving item quality.

문항반응이론을 적용한 한국판 보스톤 이름대기 검사 단축형(K-BNT-15) 개발 (Development of Short Form of the Korean Version- the Boston Naming Test (K-BNT-15) Based on Item Response Theory)

  • 김향희;김수련
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.321-327
    • /
    • 2013
  • 이름대기 능력의 손상은 신경학적 질환을 지닌 환자뿐만 아니라, 정상적인 노화과정에 있는 노인에게서도 빈번하게 관찰된다. 이름대기 능력을 평가하기 위해 가장 널리 사용되고 있는 한국판 보스톤 이름대기 검사(Korean version-the Boston Naming Test, K-BNT)는 60문항으로 구성되어 있다. 일반노인들은 노화에 따른 주의력 감소로 인하여 검사 소요시간이 길면 검사에 대한 집중이 어려워지므로, 검사 결과에 대한 타당도 및 신뢰도를 확보하기 위해서는 문항축소가 바람직하다. 본 연구의 목적은 '문항반응이론(Item Response Theory)'을 적용하여, 60개 문항의 K-BNT를 일반노년층의 이름대기 능력을 가장 잘 평가할 수 있는 15개 문항의 검사(즉, K-BNT-15)를 개발하는 것이었다. 이를 위하여, 일반노인 175명을 대상으로 라쉬분석을 실시하여, 문항적합도, 성별 차이, 문항난이도 등을 평가하였다. K-BNT-15의 실시 결과, 일반 노년층은 10년 단위로 수행력이 감소하였고, 경도인지장애(mild cognitive impairment, MCI) 환자는 일반 노년층에 비해 유의하게 낮은 수행력을 보였다. 본 연구에서는 언어 평가도구의 단축형 개발 시, 특정 집단의 언어적 능력과 문항의 응답 결과의 관계를 규명하여 그 집단에게 적합한 문항을 선별할 수 있다는 점에서 문항반응이론이 유용함을 보여주었다. 또한, K-BNT-15가 노화에 따른 대면이름대기 감소 및 환자군과의 차이를 잘 보여주는 검사임을 검증하였다.

한국어판 야식증후군 측정도구의 신뢰도, 타당도 및 문항반응이론에 의한 문항분석 (Psychometric Properties and Item Evaluation of Korean Version of Night Eating Questionnaire (KNEQ))

  • 김범종;김인자;최희정
    • 대한간호학회지
    • /
    • 제46권1호
    • /
    • pp.109-117
    • /
    • 2016
  • Purpose: The aim of this study was to develop a Korean version of Night Eating Questionnaire (KNEQ) and test its psychometric properties and evaluate items according to item response theory. Methods: The 14-item NEQ as a measure of severity of the night eating syndrome was translated into Korean, and then this KNEQ was evaluated. A total of 1171 participants aged 20 to 50 completed the KNEQ on the Internet. To test reliability and validity, Cronbach's alpha, correlation, simple regression, and factor analysis were used. Each item was analyzed according to Rasch-Andrich rating scale model and item difficulty, discrimination, infit/outfit, and point measure correlation were evaluated. Results: Construct validity was evident. Cronbach's alpha was .78. The items of evening hyperphagia and nocturnal ingestion showed high ability in discriminating people with night eating syndrome, while items of morning anorexia and mood/sleep provided relatively little information. The results of item analysis showed that item2 and item7 needed to be revised to improve the reliability of KNEQ. Conclusion: KNEQ is an appropriate instrument to measure severity of night eating syndrome with good validity and reliability. However, further studies are needed to find cut-off scores to screen persons with night eating syndrome.

실재감요인과 만족감요인이 몰입에 미치는 영향에 관한 연구 - 온라인게임을 중심으로 - (A Study on the Influence of the Flow by the Presence and Satisfaction Factors - Focused on Online Game -)

  • 조진완;이종호
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2008년도 연합학회학술대회
    • /
    • pp.87-106
    • /
    • 2008
  • 본 연구는 온라인게임의 속성에는 어떠한 것이 있는지 규명하고, 온라인게임의 속성이 몰입에 미치는 영향에 대해서 연구했다. 또한 온라인게임의 속성이 몰입에 미치는 영향에 관한 선행연구를 분석한 결과로 그래픽, 사운드, 시나리오, 게임속도, 조작성, 난이도가 온라인게임의 속성으로써 몰입에 영향을 미치는 요인으로 파악되어 연구의 변수로 사용하였다. 연구결과, 온라인게임의 속성 중 몰입에 유의한 영향을 미치는 요인으로 시나리오, 게임속도, 난이도에 관한 가설이 채택되었다. 한편 몰입에 유의한 영향을 미칠 것으로 예상되었던 그래픽, 사운드, 조작성에 관한 가설은 기각되었다.

  • PDF

Differential Item Functioning of the Oswestry Low Back Pain Questionnaire Between Participants With and Without Low Back Pain

  • Choi, Bong-Sam
    • 한국전문물리치료학회지
    • /
    • 제21권4호
    • /
    • pp.40-48
    • /
    • 2014
  • Differential item functioning (DIF) based on Rasch model can be used to examine whether the items function similarly across different groups and identify items that appear to be too easy or difficult after controlling for the ability levels of the compared groups. The Oswestry low back pain disability (Oswestry) has traditionally been proved as an effective instrument measuring disability resulting from low back pain (LBP). In this study, DIF method was used to explore whether items on the Oswestry perform similarly across two different groups (participants with LBP and no LBP). A series of Rasch analyses on the 10 items of the Oswestry were performed using Winsteps$^{(R)}$ software. Forty-two participants with back pain were recruited from 3 rehabilitation hospitals in Gainesville, Florida. Another 42 participants with no LBP were recruited from several public places in the rehabilitation hospitals. Based on the DIF analysis across the two groups, several items were found to have an uniform DIF. Participants with no LBP had more difficulty on lifting and personal care items and participants with LBP had more difficulty on sleeping and social life items. For non-LBP group, a high ceiling effects (83% of participants with non-LBP) was detected, which was not be able to be effectively measured with the Oswestry items. Although 4 items of the Oswestry function differently across the two groups, all items of the Oswestry were well targeted the LBP group.

How to develop tiered tests: A developmental framework using statistical indexes and four tier types in secondary physics

  • Kim, Min-Kee;Jung, Jin-Sun;Pak, Sung-Jae
    • 한국과학교육학회지
    • /
    • 제29권3호
    • /
    • pp.277-290
    • /
    • 2009
  • In the era of the outcome-based education, multiple-choice test has been widely employed owing to its efficiency that enables educators to evaluate a quantity of students with much objectiveness. However, the prevalent test has not been reconsidered enough to overcome its apparent shortcomings: examiners' effort for developing plausible and faultless distracters defending from every falsification, and students' random guessing on key choices. For alleviating such defects, tiered test as an experimental format of multiple-choice tests has been suggested in science education. Since there has not accumulated much study on the implementation of tiered tests, our research aim is set to construct a framework suggesting statistical indexes for rationally discerning tiered units that develop an effective tiered test. Graded both by our tiered-scoring and by the conventional partial-scoring, the preliminary tiered test in secondary physics attests the improvement in its discrimination and difficulty distribution. The findings reveal that the two indexes discern effective tiered items: discrimination increase (Ct-p) and difficulty decrease (Dp-t). Based on the index information, 4 heterogeneous tier types are recommended in the content of secondary physics: directional manipulation, repeated calculation, diverse explanation, and plural variables.