گرامی پور، مسعود. (1390). مقایسه قدرت آزمون نسبت درستنمایی مبتنی بر مدل سوال-پاسخ با روش های تحلیل عاملی تاییدی و رگرسیون لوجستیک در شناسایی کنش افتراقی سوال به منظور اطمینان از عادلانه بودن سنجش آزمون های سرنوشت ساز. دکترا سنجش و اندازه گیری-استاد راهنما: محمدرضا فلسفی نژاد. استاد مشاور: علی دلاور، نورعلی فرخی. دانشگاه علامه طباطبایی.
مینایی، اصغر. (1391). مدل پردازی تشخیصی-شناختی سوالهای ریاضیات تیمز 2007 در دانش آموزان پایه هشتم ایران با استفاده از مدل RUM و مقایسه مهارتهای ریاضی دانش آموزان دختر و پسر. دکترا سنجش و اندازه گیری-استاد راهنما: محمدرضا فلسفی نژاد. استاد مشاور: علی دلاور، نورعلی فرخی. دانشگاه علامه طباطبایی.
یونسی، جلیل. (1391). تحلیل داده های تیمز پیشرفته 2008: توانمندی رویکرد بیزی مدل نظریه سوال-پاسخ. استاد راهنما: علی دلاور، فرزاد اسکندری. استاد مشاور، محمدرضا فلسفی نژاد، نورعلی فرخی.دکترا سنجش و اندازه گیریدانشگاه علامه طباطبایی.
همتی، آزاد (1392). مطالعه انطباق ساختار پنج عاملی شخصیت مرضی با صفات پیشنهادی محور دوم DSM-5. دکترا سنجش و اندازه گیری-استاد راهنما: علی دلاور، محمود دژکام. استاد مشاور: احمد برجعلی، محمد کاظم عاطف وحید. دانشگاه علامه طباطبایی.
کبیری، مسعود. (1392). کاربرد سنجش تشخیصی به منظور تعیین مهارت های کسب شده علوم تجربی در دانش آموزان سال سوم راهنمایی ایران بر اساس داده های تیمز 2011. دکترا سنجش آموزش دانشگاه تهران. استاد راهنما: عباس بازرگان و شکوهی یکتا. دانشگاه تهران.
مقدم زاده، علی. (1392). روش بهینه همترازسازی با توجه به ویژگیهای بومی آزمونهای ملی ایران: مورد مطالعه آزمون تولیمو و آزمون جامع کنکورهای آزمایشی سازمان سنجش آموزش کشور. دکترا سنجش و اندازه گیری-استاد راهنما: علی دلاور. استاد مشاور: ابراهیم خدایی. دانشگاه علامه طباطبایی.
عباسی، هادی. (1392). ارزیابی جامع و تعیین استانداردهای علمی چیرگی در آزمون تخصصی ورود به دوره های انترنی رشته پزشکی با استفاده از مدل کلاسیک و خصیصه مکنون. دکترا سنجش و اندازه گیری-استاد راهنما: محمدرضا فلسفی نژاد، علی دلاور. استاد مشاور: نورعلی فرخی، محمد علی محققی. دانشگاه علامه طباطبایی.
مینایی اصغر (1392).سنجش مقایسه پذیری سازه و تحلیل کارکرد افتراقی سوال ها(DIF) و بلوک های(DTF) آزمون علوم پایه هشتم تیمز 2007در بین دانش آموزان ایران و آمریکا، اندازه گیری تربیتی، 4(11)، 109-146.
ذوالفقارنسب، س. (1391). طراحی و پیاده سازی بانک سوال مدرج شده در آزمون های سراسری. فصلنامه انجمن آموزش عالی ایران. 4(4)، 99-79.
محمودیان، ح. و محبی نیا، ج. (91). بازشناسی جایگاه فراموش شده بانک سوال در نظام آموزشی کشور. فصلنامه مطالعات آموزشی و آموزشگاهی، 1 (3)، 147-141.
حاتمی کیا. ا.، هومن، ح.، عسگری، ع.، رحمانی، م.، امیربگلوی داریانی، م. مقایسه هوش سیال دانش آموزان دختر و پسر بر پایه دو نظریه کلاسیک و سوال- پاسخ. روانشناسی معاصر، 8 (1)، 20-11.
یونسی، ج.، دلاور، ع. (1391). توانمندی رویکرد بیزی مدل IRTچندسطحی: تحلیل داده های آزمون ریاضیات تیمز پیشرفته 2008. اندازه گیری تربیتی.
پرواز، ر، ﺣﺴﻴﻨﻲ ح، ﺣﻴﺪری ف، ﺻﻴﺎدی ی ( 1391 ) ﺗﺎﺛﻴﺮ ﻛﺎرﺑﺮد ﻣﺪﻟﻬﺎی ﺳﻨﺠﺶ اﻧﻄﺒﺎﻗﻲ ﻛﺎﻣﭙﻴﻮﺗﺮی ﺑﺮ ﻧﮕﺮش داﻧﺶآﻣﻮزان ﺳﻮم دﺑﻴﺮﺳﺘﺎن ﻛﺮﻣﺎﻧﺸﺎه. ﭼﻬﺎرﻣﻴﻦ ﻫﻤﺎﻳﺶ ﻣﻠﻲ آﻣﻮزش، داﻧﺸﮕﺎه ﺗﺮﺑﻴﺖ دﺑﻴﺮ ﺷﻬﻴﺪ رﺟﺎﻳﻲ، ﺗﻬﺮان.
ضرغامی، م، قایمی، ف. و قایمی. ف. (1391). ﺑﺮآورد اﺳﺘﻌﺪاد اﻓﺮاد در ﻓﻌﺎل ﺳﺎزی ژن ها. ژﻧﺘﯿﮏ در ﻫـﺰاره ﺳـﻮم. ﺳـﺎل ﯾﺎزدﻫﻢ / ﺷﻤـﺎره ۱، 2979-2970.
مام شریفی، ا. (1391). ارزشیابی آزمون نظری آزمون گواهینامه رانندگی بر اساس نظریه سوال ـ پاسخ و مقایسه آن با نظریه کلاسیک آزمون. اندازه گیری تربیتی دوره 3- مسلسل 7.
گرامی پور، م فلسفی نژاد، م؛ دلاور، علی و فرخی، ن.(1391). مقایسه قدرت آزمون نسبت درستنمایی مبتنی بر مدل پرسش-پاسخ با روش تحلیل عاملی تأییدی در شناسایی کنش افتراقی سؤالات به منظور اطمینان از عادلانه بودن سنجش در آزمون های سرنوشت ساز، فصلنامه اندازه گیری تربیتی، دانشگاه علامه طباطبایی .شماره 9، دوره سوم، پاییز، ص ص 122-105.
حبیبی، م.، خدایی، ا.، و ایزانلو، ب. (1391). نظریه های قدیم و جدید اندازه گیری در علوم رفتاری و پزشکی: مروری بر روش شناسی، مزایا و تنگناها. فصلنامه تحقیقات علوم رفتاری، 10(4): 315-302.
ایزانلو، ب.، حبیبی، م.، و کاوه ای، ب. (1391). ملاکهای روانسنجی ارزیابی سوالات و آزمونهای چندگزینه ای در اندازه گیری های روانی-تربیتی. فصلنامه تخصصی روان سنجی، 1(1): 104-77.
ایزانلو، ب.، و حبیبی، م. (1391). مقایسه تابع آگاهی سوال و آزمون در مدلهای یک، دو و سه پارامتریک نظریه سوال-پاسخ، فصلنامه تخصصی روان سنجی، 1(1): 75-59.
ذوالفقارنسب، س. (1391). طراحی و پیاده سازی بانک سوال مدرج شده در آزمون های سراسری. فصلنامه انجمن آموزش عالی ایران. 4(4)، 99-79.
حبیبی، م.، مرادی، ف.، و ایزانلو، ب. (1390). تغییرناپذیری پارامترها در نظریه سوال پاسخ و تحلیل عاملی تاییدی: توصیف و مقایسه دو رویکرد بر اساس داده های تجربی. فصلنامه اندازه گیری تربیتی، 2(2): 70-47.
مینایی، ا. و فلسفی نژاد، م. (1389). روشهای سنجش تک بعدی بودن سوالها در مدلهای دو ارزشی.اندازه گیری تربیتی دوره 1- شماره 3
ایزانلو، ب.، و حبیبی، م.(1389). شناسایی کارکرد متفاوت سؤال بر اساس نظریۀ سؤال-پاسخ: کاربرد الگوی تک پارامتری با استفاده از نرم افزار بای لوگ-ام جی. فصلنامه روان شناسی کاربردی، 4 (2): 31- 20.
صابری، ن و ﻣﻨﺘﻈﺮ، غ (1389) ﭘﺎﻳﺶ، ارزﻳﺎﺑﻲ و ﮔﺮوه ﺑﻨﺪی ﻳﺎدﮔﻴﺮﻧﺪﮔﺎن در ﻣﺤﻴﻂ ﻳﺎدﮔﻴﺮی اﻟﻜﺘﺮوﻧﻴﻜﻲ ﻣﺒﺘﻨﻲ ﺑﺮ ﻧﻈﺮﻳﺎت ﻳﺎدﮔﻴﺮی و ﻧﻈﺮﻳﻪ ﭘﺮﺳﺶ و ﭘﺎسخ، اوﻟﻴﻦ ﻛﻨﻔﺮاﻧﺲ ﻣﺪرﺳﻪ ﻫﻮﺷﻤﻨﺪ، اﺳﻔﻨﺪ 1389.
ﺻﺎﺑﺮی،ن و ﻣﻨﺘﻈﺮ، غ (1389) ﻃﺮاﺣﻲ و ﭘﻴﺎده ﺳﺎزی ﺳﺎﻣﺎﻧﺔ ﭼﻨﺪ ﻛﺎرﮔﺰاره آﻣﻮزﺷﻴﺎر ﻫﻮﺷﻤﻨﺪ ﻣﺒﺘﻨﻲ ﺑﺮ ﺷﺒﻜﺔ ﺑﻴﺰ در ﻣﺤﻴﻂ آﻣﻮزش اﻟﻜﺘﺮوﻧﻴﻜﻲ، ﻣﺠﻠﺔ ﻓﻨﺎوری آﻣﻮزش، دوره 5، ﺷﻤﺎره 1.
ﺻﺎﺑﺮی،ن و ﻣﻨﺘﻈﺮ، غ (1389) ﺑﻬﻴﻨﻪ ﺳﺎزی ﻧﻈﺮﻳﺔ ﭘﺮﺳﺶ و ﭘﺎﺳﺦ ﻣﺒﺘﻨﻲ ﺑﺮ ﻣﻨﻄﻖ ﻓﺎزی ﺑﺮای ﺷﺨﺼﻲ ﺳﺎزی ﺳﺎﻣﺎﻧﺔ آﻣﻮزﺷﻴﺎر ﻫﻮﺷﻤﻨﺪ، دﻫﻤﻴﻦ ﻛﻨﻔﺮاﻧﺲ ﺳﻴﺴﺘﻢ ﻫﺎی ﻓﺎزی اﻳﺮان، داﻧﺸﮕﺎه ﺷﻬﻴﺪ ﺑﻬﺸﺘﻲ.
صابری، ن. و منتظر، غ. (1389). ﺷﺨﺼﻲ ﺳﺎزی ﻣﺤﻴﻂ ﻳﺎدﮔﻴﺮی اﻟﻜﺘﺮوﻧﻴﻜﻲ ﺑﻪ ﻛﻤﻚ ﺗﻮﺻﻴﻪ ﮔﺮ ﻓﺎزی ﻣﺒﺘﻨﻲ ﺑﺮﺗﻠﻔﻴﻖ ﺳﺒﻚ ﻳﺎدﮔﻴﺮی و ﺳﺒﻚ ﺷﻨﺎﺧﺘﻲ. فصلنامه فناوری اطلاعات و ارتباطات ایران. 2 (3 و 4)، 109-91.
یونسی، ج. و دلاور، ع.، فلسفی نژاد، م. (1389). بررسی ویژگی های روان سنجی سؤالا ت تخصصی آزمون فراگیر رشته روان شناسی دانشگاه پیام نور در سال 85. فصلنامه اندازه گیری تربیتی.
عسگری، م. (1389). سنجش انطباقی با رایانه. نامه آموزش عالی. 11، 86-63.
کاردان، ا. و کاردان، ص. (1388). ارزشیابی تطبیق پذیر و تخمین سطح دانش با استفاده از مدل دانش و به کمک شبکه بیزی.نشریه علمی پژوهشی فناوری آموزش، 3 (4)، 280-267.
ایزانلو، ب. و حبیبی، م. (1387). مقدمه ای بر مبانی رویکردهای جدید اندازه گیری در حوزه روان شناسی و علوم تربیتی. فصلنامه روانشناسی و علوم تربیتی.
گل محمد نژاد، غ. (1387).معرفی
و مقایسه تحلیلی نظریه آزمون کلاسیک و نظریه سوال-پاسخ در روانسنجی.
فصلنامه علوم
مدیریت دوره 2- مسلسل 7.
عقیق، ک. (1387). آزمون برازش توزیع لجستیک در تعیین توانایی و رتبه بندی در امتحانها. مجله فناوری آموزش، 3 (3)، 214-205.
عسکری، ع. (1386). روی آوردهای نوین در روانسنجی. قسمت سوم، مدلهای نظریه سوال - پاسخ ، مدلهای راش فصلنامه روانشناسی تحولی: روانشناسان ایرانی ، سال چهارم، شماره 13.
عسکری، ع. (1386). رویآوردهای نوین در روانسنجی - قسمت چهارم : مدلهای نظریه سوال - پاسخ، مدلهای دو ارزشی. روانشناسی تحولی: روان شناسان ایرانی دوره 4- مسلسل 14.
دلاور، ع.، مقدم زاده، ع، مطیعی لنگرودی، س. (1385). مقایسه مدل اندازه گیری کلاسیک و مدل غیر پارامتریک سوال-پاسخ از نظر ویژگی های سوال. فصلنامه نوآوری های آموزشی، 18 (5).
مطیعی لنگرودی، س.، پیروی، ر.، تاج الدین، ض. و مقدم زاده، ع. (1385). مقایسه دو روش اندازه گیری کلاسیک و سوال-پاسخ از نظر خصوصیات آزمودنی ها و ویژگی های سوال و بالعکس. فصلنامه روانشناسی و تعلیم و تربیت، 4، 208-177.
سپاسی، ح. (1382). مقایسه مفاهیم و مقروضه های نظریه کلاسیک و نظریه جدید سوال- پاسخ در ساخت آزمونهای روانی و تربیتی. مطالعات روانشناسی تربیتی دوره 3- شماره 3 دوره 3- شماره 4.
فراهانی، م. (1380). مدل های اندازه گیری (کلاسیک و سؤال پاسخ) از لحاظ برآورد پارامترهای سؤال و توانایی. نشریه:تعلیم و تربیت، 67 (17)، 83 - 98.
کریستین دی مارس. (1393). کاربرد نظریه سوال پاسخ در سنجش آموزش. ترجمه دکتر عباس بازرگان و دکتر مجید یوسفی افراشته. تهران: انتشارات سازمان سنجش کشور.
گرامی پور، مسعود و فلسفی نژاد، محمدرضا(1392) روشهای آماری بررسی کنش افتراقی سؤال در آزمون های سرنوشت ساز.تهران: انتشارات جهاد دانشگاهی واحد تربیت معلم.
فردریک ام. لرد (۱۹۸۰).کاربردهای نظریه سوال- پاسخ ترجمه دکتر علی دلاور و جلیل یونسی٬ انتشارات رشد٬ ۱۳۹۱.
اوستینی و نرینگ. (1391). «مدلهای چند ارزشی نظریه سوال-پاسخ» مترجمان: مجتبی حبیبی، علی مقدم زاده و ابراهیم خدایی، تهران: انتشارات سازمان سنجش آموزش کشور.
رونالد ک. همبلتون٬ اچ. سوامیناتان٬ اچ جین راجرز (۱۹۹۱). مبانی نظریه پرسش-پاسخ ترجمه دکتر محمدرضا فلسفی نژاد٬ انتشارات دانشگاه علامه طباطبایی٬ ۱۳۸۹.
سوزان ای. امبرتسون و استیون پی رایس (۲۰۰۱). نظریه های جدید روان سنجی برای روان شناسان به انضمام نرم افزارهای تحلیل داده ها ترجمه دکتر حسن.پاشا شریفی٬ دکتر ولی الله فرزاد، مجتبی حبیبی عسگرآباد و بلال ایزانلو٬ انتشارات رشد، ۱۳۸۸.
داتو گراجتر – لئوواندرکمپ (2000). مبانی نظری آماری آزمون در روانشناسی تعلیم و تربیت ترجمه : شیده کامکار - دکتر فرزاد اسکندری، نشر : بهینه فراگیر، ١٣٨٧.
جری متسن آمورنن (1385). مبانی نظری آزمون و آزمون سازی ترجمه خانم شیده کامکار و دکتر اسدالله اسرایی، تهران: انتشارات بهینه.
کلاس سیجت سما و ایو دبلیو مولن آیر (۲۰۰۱). مقدمه ای بر تئوری ناپارامتریک سوال پاسخ به همراه نرم افزار ترجمه سلیمان (سالار) ذوالفقارنسب٬ انتشارات کتابخانه رایانه ای مشهد، ۱۳۸۵.
فرانک بی. بیکر (۲۰۰۲). پایه های نظریه سوال – پاسخ: نظریه جدید روان سنجی به همراه نرم افزار ترجمه دکتر حیدر علی هومن و دکتر علی عسگری٬ نشر پارساروان ۱۳۸۱.
Notes |
Bilog |
Winsteps |
|
It is said that Rasch modeling is not the same as 1P modeling in Bilog. Rasch is a philosophy of psychometrics, in which data fits the model, not the model fits the data |
One-, two-, and three parameter models |
Rasch model |
Modeling |
You can enter scaling options in Winsteps and Bilog. |
Default: Probits This is a escaling by 1.7 |
Default: Logits |
Scale unit |
Winsteps makes no assumptions about parameter distributions. Bilog assumes normal sample distribution. This may squeeze or spread results particularly at the tails. |
Normal sample distribution |
No assumption |
Assumptions |
MMLE assumes the conditional independence of responses to different items by persons of the same ability. UCON is more biased than conditional methods, but this bias is negligibly small and always less than the standard errors of the estimated measures. This usually has only decimal place effects. |
Marginal Maximum Likelihood Estimate as the default. MMAP and Bayes are also available |
Joint Maximum Likelihood Estimate, also known as Unconditional Maximum Likelihood estimate (UCON). |
Estimation |
|
Person mean=0 Person variance=1 |
Item mean=0 |
Setting of origin |
|
Multiple-form equating by using common or linking items |
Across-sample test equating by using anchored items |
Test equating |
The numbers in the step function output are difficulty indices in terms of logit, the natural log of the odds ratio. Going from one point to two points, and from two points to three points, will certainly increase the logit difficulty. Distances in logit are comparable. To be specific, if step3 - step2 = 0.1 and step2 - step1 = 0.1. The two "0.1" are considered the same quantities. |
Can handle binary responses only |
Can handle both dichotomous and partial credit items, use step functions |
Partial credit |
|
Fit statistic is expressed as Chi-square/degree of freedom, where Chi-square results are testing the fit between the expected and the observed. |
Winsteps has two types of fitness indexes: INMSQ (Infit mean square) and OUTSQ (Outfit mean square). The INMSQ is usually more informative than the OUTSQ. |
Fitness |
منبع:
Yu, Chong Ho & Sharon E. Osborn Popp (2005). Test Equating by Common Items and Common Subjects: Concepts and Applications. Practical Assessment Research & Evaluation, 10(4). Available online: http://pareonline.net/getvn.asp?v=10&n=4