سنجش

سنجش و اندازه گیری در علوم رفتاری

سنجش

سنجش و اندازه گیری در علوم رفتاری

مدل های سوال-پاسخ چند ارزشی (polytomous IRT)

 

مدل های سوال-پاسخ دو ارزشی، این محدودیت را دارند که در بسیاری از چارچوب پاسخ هایی را که روان شناسان به کار می برند نمی توان به صورت درست و غلط نمره گذاری کرد. شمار زیادی از ابزارهای اندازه گیری، به ویژه در حوزه سنجش نگرش و شخصیت با سوال های چند گزینه ای به صورت طبقه های چندگانه مرتب شده وجود دارند. برای این نوع داده ها، مدل های سوال-پاسخ چند درجه ای مورد نیاز است تا بین سطح صفت آزمودنی و احتمال پاسخ دادن به یکی از طبقه ها یک رابطه غیر خطی ارائه شود. بسیاری از این مدل های سوال پاسخ چند ارزشی وجود دارند و همه سال مدل های جدیدی نیز پیشنهاد می شود (شریفی و همکاران، 1388).

شش مدل مرسوم آن عبارتند از :

 

1. the Graded Response Model (GRM; Samejima, 1969);

 2. the Modified Graded Response Model (MGRM; Muraki, 1990);

 3. the Partial Credit Model (PCM; Masters, 1982);

4. the Generalized Partial Credit Model (GPCM; Muraki, 1992);

 5. the Rating Scale Model (RSM; Andrich, 1978);

6. the Nominal Response Model (NRM; Bock, 1972).

 

انواع مدل های سوال-پاسخ چند ارزشی (polytomous IRT)

بسته R

تعداد پارامترها

ارائه کننده

مدل

ردیف

ltm

2 پارامتری:

شیب سوال

آستانه بین طبقه ای

سیم جیما، 1969

مدل پاسخ مدرج

Graded response model (GRM)

1

mirt

2 پارامتری:

شیب سوال

آستانه بین طبقه

موراکی، 1990

پاسخ مدرج تعدیل شده

Modified Graded response model (M-GRM)

2

eRm

1 پارامتری:

تقاطع (دشواری نسبی مراحل)

ماسترز، 1982

مدل امتیاز پاره ای

Partial credit model (PCM)

3

ltm

2 پارامتری:

تقاطع (دشواری نسبی مراحل)

شیب

موراکی، 1992

مدل امتیاز پاره ای تعمیم یافته

Generalized partial credit model (G-PCM)

4

eRm

1 پارامتری:

نقاط تقاطع (سطح دشواری مراحل)

آندریچ، 1978

مدل مقیاس درجه بندی

Rating scale model (RSM)

5

mirt

2 پارامتری:

شیب خط اثر برای طبقه

عرض از مبدا برای طبقه

باک، 1972

مدل پاسخ اسمی

Nominal response model (NRM)

6

 

پکیج های مربوط به نظریه سوال-پاسخ در نرم افزار R

در لینک زیر می توانید پکیج های مربوط به نظریه سوال-پاسخ در نرم افزار را مشاهده کنید:

http://cran.r-project.org/web/views/Psychometrics.html

 

 

 

 

 

extended Rasch models, i.e.

the ordinary Rasch model for dichotomous data (RM),

the linear logistic test model (LLTM),

the rating scale model (RSM) and its linear extension (LRSM),

the partial credit model (PCM) and its linear extension (LPCM) using conditional ML estimation

eRm

1

Item Response Theory (IRT):

simple RM

functions for estimating Birnbaum's 2- and 3-parameter models based on a marginal ML approach

graded response model for polytomous data

linear multidimensional logistic model

ltm

2

unidimensional and multidimensional item response models

multifaceted models

latent regression models

drawing plausible values.

TAM

3

analysis of dichotomous and polytomous response data using unidimensional and multidimensional latent trait models under the IRT paradigm Exploratory and confirmatory models with quadrature (EM) or stochastic (MHRM) methods Confirmatory bi-factor and two-tier analyses for modeling item testlets

 Multiple group analysis and mixed effects designs for detecting differential item functioning and modelling item and person covariates.

mirt

4

functions for Nominal Response Model and the Nested Logit Model for multiple-choice items and other polytomous response formats.

uni- and multidimensional item response models (especially for locally dependent item responses) and some exploratory methods (DETECT, LSDM, model-based reliability) in sirt

mcIRT

5

multidimensional polytomous Rasch model

Mueller's continuous rating scale model

pcIRT

6

IRT models under (1) multidimensionality assumption, (2) discreteness of latent traits, (3) binary and ordinal polytomous items

MultiLCIRT

7

Conditional maximum likelihood estimation via the EM algorithm and information-criterion-based model selection in binary mixed Rasch models

mixture Rasch models, including the dichotomous Rasch model, the rating scale model, and the partial credit model

mRm

 

psychomix

 

 mixRasch

8

Calibration of item and ability parameters

unidimensional and multidimensional methods such as Mean/Mean, Mean/Sigma, Haebara, and Stocking-Lord methods for dichotomous (1PL, 2PL and 3PL) and/or polytomous (graded response, partial credit/generalized partial credit, nominal, and multiple-choice model) items.

The multidimensional methods include the Reckase-Martineau method and extensions of the Haebara and Stocking-Lord method.

plink

9

direct, chain and average (bisector) equating coefficients with standard errors using Item Response Theory (IRT) methods for dichotomous items

equateIRT

 

  calibrates the parameters for Samejima's Continuous IRT Model via EM algorithm and Maximum Likelihood

compute item fit residual statistics, to draw empirical 3D item category response curves, to draw theoretical 3D item category response curves, and to generate data under the CRM for simulation studies

EstCRM

 

DIF in dichotomously scored items

uniform and non-uniform DIF effects can be detected

difR

 

 

 logistic regression framework for detecting various types of DIF

lordif

 

 penalty approach to DIF in Rasch models with multiple (metric) covariates

DIFlasso

10

functions to perform Raju, van der Linden and Fleer's (1995) Differential Item and Item Functioning analyses

functions to use the Monte Carlo Item Parameter Replication (IPR) approach for obtaining the associated statistical significance tests cut-off points

DFIT

12

computarized adaptive testing using IRT methods.

catR

13

 

maximum likelihood estimates and pseudo-likelihood estimates of parameters of Rasch models for polytomous (or dichotomous) items and multiple (or single) latent traits

Robust standard errors for the pseudo-likelihood estimates

plRasch

 

14

 

multilevel Rasch model

Functions for mixed-effects models with crossed or partially crossed random effects

 Polytomous models

Tree-structured item response models of the GLMM family

lme4,

nlme, MCMCglmm ordinal

lme4

 irtrees 

15

 

Nonparametric IRT analysis

automated item selection algorithm, and various checks of model assumptions

Forward Search for Mokken scale analysis. It detects outliers, it produces several types of diagnostic plots.

mokken

 

fwdmsa

16

 

nonparametric item and option characteristic curves using kernel smoothing.

smoothing bandwidth using cross-validation and a variety of exploratory plotting tools.

KernSmoothIRT

17

 

construction of exact Rasch model tests by generating random zero-one matrices with given marginals.

RaschSampler

18

 

Simple Rasch computations such a simulating data and joint maximum likelihood

MiscPsycho

19

 

 estimate multidimensional subject parameters (MLE and MAP) such as personnal pseudo-guessing, personal fluctuation, personal inattention

assess person fit

identify misfit type

 generate misfitting response patterns

make correction while estimating the proficiency level considering potential misfit at the same time

irtProb

20

 

classification accuracy and consistency under Item Response Theory

only works for 3PL IRT models (or 2PL or 1PL) and only for independent cut scores

cacIRT

21

 

simple common interface to the estimation of item parameters in IRT models for binary responses with three different programs (ICL, BILOG-MG, and ltm, and a variety of functions useful with IRT models.

irtoys

22

 

cognitive diagnosis models (DINA, DINO, GDINA, RRUM, LCDM, pGDINA, mcDINA)

general diagnostic model (GDM)

structured latent class analysis (SLCA)

CDM

23

 

Gaussian ordination, related to logistic IRT Maximum likelihood estimation through canonical correspondence analysis

VGAM

24

 

multilevel IRT models

  joint hierarchically built up likelihood for estimating a two-parameter normal ogive model for responses and a log-normal model for response times

mlirt

cirt

 

25

 

Bayesian approaches for estimating item and person parameters by means of Gibbs-Sampling

Bayesian IRT and roll call analysis

MCMCpack

pscl

 

26

 

commands to drive the dot program from graphviz to produce a graph useful in deciding whether a set of binary items might have a latent scale with non-crossing ICCs.

latdiag

27

 

to factor out logic and math common to IRT fitting, diagnostics, and analysis

 

rpf

 

28

 

examine classification accuracy and consistency under IRT models

classify

29

 

graphical tools for plotting item-person maps

WrightMap

30

 

 

 

منابع فارسی درمورد نظریه پرسش - پاسخ

کریستین دی مارس. (1393). کاربرد نظریه سوال پاسخ در سنجش آموزش. ترجمه دکتر عباس بازرگان و دکتر مجید یوسفی افراشته. تهران: انتشارات سازمان سنجش کشور.

 

گرامی پور، مسعود و فلسفی نژاد، محمدرضا(1392) روشهای آماری بررسی کنش افتراقی سؤال در آزمون های سرنوشت ساز.تهران: انتشارات جهاد دانشگاهی واحد تربیت معلم.

 

فردریک ام. لرد (۱۹۸۰).کاربردهای نظریه سوال- پاسخ ترجمه دکتر علی دلاور و جلیل یونسی٬ انتشارات رشد٬ ۱۳۹۱.

 

اوستینی و نرینگ. (1391). «مدل‌های چند ارزشی نظریه سوال-پاسخ» مترجمان: مجتبی حبیبی، علی مقدم زاده و ابراهیم خدایی، تهران: انتشارات سازمان سنجش آموزش کشور.

 

رونالد ک. همبلتون٬ اچ. سوامیناتان٬ اچ جین راجرز (۱۹۹۱). مبانی نظریه پرسش-پاسخ ترجمه دکتر محمدرضا فلسفی نژاد٬ انتشارات دانشگاه علامه طباطبایی٬  ۱۳۸۹.

 

سوزان ای. امبرتسون و استیون پی رایس (۲۰۰۱). نظریه های جدید روان سنجی برای روان شناسان به انضمام نرم افزارهای تحلیل داده ها ترجمه دکتر حسن.پاشا شریفی٬ دکتر ولی الله فرزاد، مجتبی حبیبی عسگرآباد و بلال ایزانلو٬ انتشارات رشد، ۱۳۸۸.


 

داتو گراجتر  لئوواندرکمپ (2000). مبانی نظری آماری آزمون در روانشناسی تعلیم و تربیت ترجمه : شیده کامکار - دکتر فرزاد اسکندری، نشر : بهینه فراگیر، ١٣٨٧.


جری متسن آمورنن (1385). مبانی نظری آزمون و آزمون سازی ترجمه خانم شیده کامکار و دکتر اسدالله اسرایی، تهران: انتشارات بهینه.


کلاس سیجت سما و ایو دبلیو مولن آیر (۲۰۰۱). مقدمه ای بر تئوری ناپارامتریک سوال پاسخ به همراه نرم افزار ترجمه سلیمان (سالار) ذوالفقارنسب٬ انتشارات کتابخانه رایانه ای مشهد، ۱۳۸۵.


 فرانک بی. بیکر (۲۰۰۲). پایه های نظریه سوال  پاسخ: نظریه جدید روان سنجی به همراه نرم افزار ترجمه دکتر حیدر علی هومن و دکتر علی عسگری٬ نشر پارساروان ۱۳۸۱.