مدل های سوال-پاسخ دو ارزشی، این محدودیت را دارند که در بسیاری از چارچوب پاسخ هایی را که روان شناسان به کار می برند نمی توان به صورت درست و غلط نمره گذاری کرد. شمار زیادی از ابزارهای اندازه گیری، به ویژه در حوزه سنجش نگرش و شخصیت با سوال های چند گزینه ای به صورت طبقه های چندگانه مرتب شده وجود دارند. برای این نوع داده ها، مدل های سوال-پاسخ چند درجه ای مورد نیاز است تا بین سطح صفت آزمودنی و احتمال پاسخ دادن به یکی از طبقه ها یک رابطه غیر خطی ارائه شود. بسیاری از این مدل های سوال پاسخ چند ارزشی وجود دارند و همه سال مدل های جدیدی نیز پیشنهاد می شود (شریفی و همکاران، 1388).
شش مدل مرسوم آن عبارتند از :
1. the Graded Response Model (GRM; Samejima, 1969);
2. the Modified Graded Response Model (MGRM; Muraki, 1990);
3. the Partial Credit Model (PCM; Masters, 1982);
4. the Generalized Partial Credit Model (GPCM; Muraki, 1992);
5. the Rating Scale Model (RSM; Andrich, 1978);
6. the Nominal Response Model (NRM; Bock, 1972).
انواع مدل های سوال-پاسخ چند ارزشی (polytomous IRT)
بسته R |
تعداد پارامترها |
ارائه کننده |
مدل |
ردیف |
ltm |
2 پارامتری: شیب سوال آستانه بین طبقه ای |
سیم جیما، 1969 |
مدل پاسخ مدرج Graded response model (GRM) |
1 |
mirt |
2 پارامتری: شیب سوال آستانه بین طبقه |
موراکی، 1990 |
پاسخ مدرج تعدیل شده Modified Graded response model (M-GRM) |
2 |
eRm |
1 پارامتری: تقاطع (دشواری نسبی مراحل) |
ماسترز، 1982 |
مدل امتیاز پاره ای Partial credit model (PCM) |
3 |
ltm |
2 پارامتری: تقاطع (دشواری نسبی مراحل) شیب |
موراکی، 1992 |
مدل امتیاز پاره ای تعمیم یافته Generalized partial credit model (G-PCM) |
4 |
eRm |
1 پارامتری: نقاط تقاطع (سطح دشواری مراحل) |
آندریچ، 1978 |
مدل مقیاس درجه بندی Rating scale model (RSM) |
5 |
mirt |
2 پارامتری: شیب خط اثر برای طبقه عرض از مبدا برای طبقه |
باک، 1972 |
مدل پاسخ اسمی Nominal response model (NRM) |
6 |
در لینک زیر می توانید پکیج های مربوط به نظریه سوال-پاسخ در نرم افزار را مشاهده کنید:
http://cran.r-project.org/web/views/Psychometrics.html
|
|
|
|
extended Rasch models, i.e. the ordinary Rasch model for dichotomous data (RM), the linear logistic test model (LLTM), the rating scale model (RSM) and its linear extension (LRSM), the partial credit model (PCM) and its linear extension (LPCM) using conditional ML estimation |
1 |
Item Response Theory (IRT): |
|
simple RM functions for estimating Birnbaum's 2- and 3-parameter models based on a marginal ML approach graded response model for polytomous data linear multidimensional logistic model |
2 |
||
unidimensional and multidimensional item response models multifaceted models latent regression models drawing plausible values. |
3 |
||
analysis of dichotomous and polytomous response data using unidimensional and multidimensional latent trait models under the IRT paradigm Exploratory and confirmatory models with quadrature (EM) or stochastic (MHRM) methods Confirmatory bi-factor and two-tier analyses for modeling item testlets Multiple group analysis and mixed effects designs for detecting differential item functioning and modelling item and person covariates. |
4 |
||
functions for Nominal Response Model and the Nested Logit Model for multiple-choice items and other polytomous response formats. uni- and multidimensional item response models (especially for locally dependent item responses) and some exploratory methods (DETECT, LSDM, model-based reliability) in sirt |
5 |
||
multidimensional polytomous Rasch model Mueller's continuous rating scale model |
6 |
||
IRT models under (1) multidimensionality assumption, (2) discreteness of latent traits, (3) binary and ordinal polytomous items |
7 |
||
Conditional maximum likelihood estimation via the EM algorithm and information-criterion-based model selection in binary mixed Rasch models mixture Rasch models, including the dichotomous Rasch model, the rating scale model, and the partial credit model |
|
8 |
|
Calibration of item and ability parameters unidimensional and multidimensional methods such as Mean/Mean, Mean/Sigma, Haebara, and Stocking-Lord methods for dichotomous (1PL, 2PL and 3PL) and/or polytomous (graded response, partial credit/generalized partial credit, nominal, and multiple-choice model) items. The multidimensional methods include the Reckase-Martineau method and extensions of the Haebara and Stocking-Lord method. |
9 |
||
direct, chain and average (bisector) equating coefficients with standard errors using Item Response Theory (IRT) methods for dichotomous items |
|
||
calibrates the parameters for Samejima's Continuous IRT Model via EM algorithm and Maximum Likelihood compute item fit residual statistics, to draw empirical 3D item category response curves, to draw theoretical 3D item category response curves, and to generate data under the CRM for simulation studies |
|
||
DIF in dichotomously scored items uniform and non-uniform DIF effects can be detected |
|
|
|
logistic regression framework for detecting various types of DIF |
|
||
penalty approach to DIF in Rasch models with multiple (metric) covariates |
10 |
||
functions to perform Raju, van der Linden and Fleer's (1995) Differential Item and Item Functioning analyses functions to use the Monte Carlo Item Parameter Replication (IPR) approach for obtaining the associated statistical significance tests cut-off points |
12 |
||
computarized adaptive testing using IRT methods. |
13 |
|
|
maximum likelihood estimates and pseudo-likelihood estimates of parameters of Rasch models for polytomous (or dichotomous) items and multiple (or single) latent traits Robust standard errors for the pseudo-likelihood estimates |
|
14 |
|
multilevel Rasch model Functions for mixed-effects models with crossed or partially crossed random effects Polytomous models Tree-structured item response models of the GLMM family |
lme4, |
15 |
|
Nonparametric IRT analysis automated item selection algorithm, and various checks of model assumptions Forward Search for Mokken scale analysis. It detects outliers, it produces several types of diagnostic plots. |
|
16 |
|
nonparametric item and option characteristic curves using kernel smoothing. smoothing bandwidth using cross-validation and a variety of exploratory plotting tools. |
17 |
|
|
construction of exact Rasch model tests by generating random zero-one matrices with given marginals. |
18 |
|
|
Simple Rasch computations such a simulating data and joint maximum likelihood |
19 |
|
|
estimate multidimensional subject parameters (MLE and MAP) such as personnal pseudo-guessing, personal fluctuation, personal inattention assess person fit identify misfit type generate misfitting response patterns make correction while estimating the proficiency level considering potential misfit at the same time |
20 |
|
|
classification accuracy and consistency under Item Response Theory only works for 3PL IRT models (or 2PL or 1PL) and only for independent cut scores |
21 |
|
|
simple common interface to the estimation of item parameters in IRT models for binary responses with three different programs (ICL, BILOG-MG, and ltm, and a variety of functions useful with IRT models. |
22 |
|
|
cognitive diagnosis models (DINA, DINO, GDINA, RRUM, LCDM, pGDINA, mcDINA) general diagnostic model (GDM) structured latent class analysis (SLCA) |
23 |
|
|
Gaussian ordination, related to logistic IRT Maximum likelihood estimation through canonical correspondence analysis |
24 |
|
|
multilevel IRT models joint hierarchically built up likelihood for estimating a two-parameter normal ogive model for responses and a log-normal model for response times |
cirt
|
25 |
|
Bayesian approaches for estimating item and person parameters by means of Gibbs-Sampling Bayesian IRT and roll call analysis |
|
26 |
|
commands to drive the dot program from graphviz to produce a graph useful in deciding whether a set of binary items might have a latent scale with non-crossing ICCs. |
27 |
|
|
to factor out logic and math common to IRT fitting, diagnostics, and analysis
|
|
28 |
|
examine classification accuracy and consistency under IRT models |
29 |
|
|
graphical tools for plotting item-person maps |
30 |
|
کریستین دی مارس. (1393). کاربرد نظریه سوال پاسخ در سنجش آموزش. ترجمه دکتر عباس بازرگان و دکتر مجید یوسفی افراشته. تهران: انتشارات سازمان سنجش کشور.
گرامی پور، مسعود و فلسفی نژاد، محمدرضا(1392) روشهای آماری بررسی کنش افتراقی سؤال در آزمون های سرنوشت ساز.تهران: انتشارات جهاد دانشگاهی واحد تربیت معلم.
فردریک ام. لرد (۱۹۸۰).کاربردهای نظریه سوال- پاسخ ترجمه دکتر علی دلاور و جلیل یونسی٬ انتشارات رشد٬ ۱۳۹۱.
اوستینی و نرینگ. (1391). «مدلهای چند ارزشی نظریه سوال-پاسخ» مترجمان: مجتبی حبیبی، علی مقدم زاده و ابراهیم خدایی، تهران: انتشارات سازمان سنجش آموزش کشور.
رونالد ک. همبلتون٬ اچ. سوامیناتان٬ اچ جین راجرز (۱۹۹۱). مبانی نظریه پرسش-پاسخ ترجمه دکتر محمدرضا فلسفی نژاد٬ انتشارات دانشگاه علامه طباطبایی٬ ۱۳۸۹.
سوزان ای. امبرتسون و استیون پی رایس (۲۰۰۱). نظریه های جدید روان سنجی برای روان شناسان به انضمام نرم افزارهای تحلیل داده ها ترجمه دکتر حسن.پاشا شریفی٬ دکتر ولی الله فرزاد، مجتبی حبیبی عسگرآباد و بلال ایزانلو٬ انتشارات رشد، ۱۳۸۸.
داتو گراجتر – لئوواندرکمپ (2000). مبانی نظری آماری آزمون در روانشناسی تعلیم و تربیت ترجمه : شیده کامکار - دکتر فرزاد اسکندری، نشر : بهینه فراگیر، ١٣٨٧.
جری متسن آمورنن (1385). مبانی نظری آزمون و آزمون سازی ترجمه خانم شیده کامکار و دکتر اسدالله اسرایی، تهران: انتشارات بهینه.
کلاس سیجت سما و ایو دبلیو مولن آیر (۲۰۰۱). مقدمه ای بر تئوری ناپارامتریک سوال پاسخ به همراه نرم افزار ترجمه سلیمان (سالار) ذوالفقارنسب٬ انتشارات کتابخانه رایانه ای مشهد، ۱۳۸۵.
فرانک بی. بیکر (۲۰۰۲). پایه های نظریه سوال – پاسخ: نظریه جدید روان سنجی به همراه نرم افزار ترجمه دکتر حیدر علی هومن و دکتر علی عسگری٬ نشر پارساروان ۱۳۸۱.