سنجش

سنجش و اندازه گیری در علوم رفتاری

سنجش

سنجش و اندازه گیری در علوم رفتاری

بعد (dimension)

 در فیزیک و ریاضیات، بعد یک فضا یا شی عبارت است از حداقل محور مختصاتی که برای مشخص کردن هر نقطه در آن محور مورد نیاز است. بنابراین یک خط  دارای یک بعد است زیرا فقط  یک مختصات برای تعیین یک نقطه بر روی آن مورد نیاز است (مثلاً عدد 5 بر روی محور اعداد). یک سطح دارای دو بعد است زیرا برای مشخص کردن یک نقطه بر روی آن به دو مختصات نیاز است (مثلاً برای تعیین نقطه بر روی سطح کره (گوی) به دو مختصات یعنی طول و عرض نیاز است. داخل یک مکعب، یک استوانه یا یک کره، سه بعدی است زیرا برای نشان دادن یک نقطه در این فضاها به سه مختصات نیاز است. پس انواع ابعاد عبارتند از یک نقطه: صفربُعدی، یک پاره‌خط: یک‌بعدی، یک مربع: دوبعدی، مکعب: سه‌بعدی و یک تِسِرَکت: چهاربعدی. علاوه بر بعدهای سه‌گانه در فیزیک، زمان به عنوان بعد چهارم شناخته می‌شود.

در فیزیک و سایر علوم، تحلیل بعد عبارت است از رابطه بین کمیت های فیزیکی مختلف به وسیله شناسایی ابعاد آن ها. بعد هر کمیت فیزیکی، ترکیبی از ابعاد فیزیکی اصلی است که آن را تشکیل می دهد. بعضی از بعد های فیزیکی اصلی عبارتند از طول، حجم، زمان و بار الکتریکی. کمیت های فیزیکی دیگر را می توان با استفاده این بعدهای اصلی بیان کرد. مثلاً سرعت عبارت است از بعد طول (یا فاصله) بر حسب هر واحد زمان و می توان بر حسب متر بر ثانیه، مایل بر ساعت یا واحدهای دیگر اندازه گیری شود.

اصلی ترین قانون تحلیل بعد، همگنی بعدی است که اولین بار توسط نیوتن فرمول بندی شد و نیوتن آن را اصل مهم شباهت (great principle of similitude) نامید.

 

نظریه رویه و ترسیم جملات

نظریه رویه روشی برای رسمی کردن فرایند تحقیق است و رویکرد ساختارمندی برای تدوین سوالات تحقیق از طریق ترسیم جملات ارایه می دهد. ترسیم جملات روشی برای تبدیل مشاهدات به سوالات و طرح تحقیق است. تحلیل کوچک ترین فضا نیز تکنیکی برای نمایش تصویری داده های داده های مشتق شده از نظریه رویه است. ترسیم جملات محقق را قادر می سازد تا آزمایش یا تحقیقی را با مفهوم بیان کند. ترسیم جملات، مفهوم کلیدی در این مرحله از تحقیق است اگر چه فقط یک عنصر در این سیستم یا بسته برای تدوین سیستماتیک عناصر ساخته می شود. در کار گاتمن و گرینباوم (1998) ترسیم جملات عبارت بود از ارایه مشاهدات به شکلی که ساخت نظریه را به طور صریح و سیستماتیک، تسهیل می کرد. ترسیم جملات عبارت است از روش رسمی پرسیدن سوالی که مشاهدات مربوط به تحقیق را ترسیم می کند. واژه ترسیم در این جا دارای همون مفهومی است که در جغرافیا استفاده می شود. تغییرات سطح زمین، جاده ها و شهرها، ویژگی هایی را که به وسیله نقشه ارایه شده است را ارایه می دهد و ترسیم جملات نیز موقعیتی مشابه را ارایه می دهد که در آن ویژگی های مشاهده شده یک پدیده اجتماعی در آن جمله ارایه شده است.

تصویر

خانم صورتی

گرانی اسمیت

برابرن

خوشمزه قرمز

 

ترسیم جملات ترکیبی از مجموعه مرکز و مجموعه معنی است که به آن­ها حیطه گویند. مجموعه تصاویر، سوالات، تجارب و غیره که حیطه به آن اشاره دارد را دامنه گویند. مرکز، معنی و دامنه عبارتند از جهان مشاهدات. برای توضیح بیشتر به مثال زیر توجه کنید. فرض کنید فردی به نام روبرت وجود دارد و ما جمله ای در مورد او می سازیم: روبرت سیب می خورد. در این جا مرکز، روبرت است. او عبارت است از عنصری در مجموعه همه مردانی که در مثلاً یک شرکت کار می کنند. فرض کنید این مجموعه شامل عناصر روبرت، رگینالد، رودریک و رودی است. مجموعه معنی در جمله روبرت سیب می خورد، واژه خوردن است. خوردن عضوی از مجموعه عواملی است که شامل خوردن، پوست کندن، پرت کردن، چیدن و روشن کردن است. مجموعه تصویر در روبرت سیب را می خورد سیب است. می توان گفت که ممکن است میوه های مختلفی وجود داشته باشد مثل هلو و موز اما در این مورد دقیق تر خواهیم بود و می گوییم نوع خاصی از سیب مد نظر است. مجموعه تصویر در این جا، دامنه است و دامنه سیب ها ممکن است شامل خانم صورتی، اسمیت گرانی، برابرن و خوشمزه قرمز باشد. اگر این مولفه ها را کنار هم قرار دهیم چیزی شبیه زیر خواهیم داشت:

مرکز

مفهوم

روبرت

می خورد

رگینالد

پوست می کند

رودریک

دور می اندازد

رودی

می چیند

 

برق می اندازد


این چارچوب ترسیمی که در آن مجموعه تمرکز و مجموعه معنی، حیطه را می سازد و مجموعه تصویر، دامنه را می سازد، شکل کلی ترسیم جملات است. در این جا فلش از حیطه به دامنه بدین معناست که مجموعه هایی که حیطه را شکل می دهند به مجموعه ها در این دامنه تخصیص می یابند. ولی مثل وقتی که گفته می شود "نقشه، سرزمین نیست"، ترسیم جملات آن چه که ممکن است تخصیص واقعی باشد تعیین نمی کند.

بر اساس این چارچوب می توانیم سوالاتی را بر مبتنی بر ساختار داشته باشیم. مثلاً می توانیم بپرسیم که: روبرت چه میوه ای را دور می اندازد؟ رودی چه نوع سیبی می خورد؟ چه نوع سیبی توسط رگینالد پوست گرفته می شود؟ در این مثال 20 سوال وجود خواهد داشت (4 مرد و 5 عمل). مجموعه مرکز و مجموعه مفهوم  یک مجموعه دکارتی را تشکیل می دهد که می توان آن را به 20 روش ترکیب کرد: روبرت می خورد، روبرت پوست می کند، روبرت دور می ریزد، ... رودی برق می اندازد. اشیا این اعمال و انواع سیب در این دامنه هستند، بنابراین ممکن است این جمله را داشته باشیم که روبرت سیب بریرن می خورد.

چند سرواژه در سنجش و اندازه گیری

APA: American Psychology Association

ACER: Australian Council for Educational Research

ACT: American College Testing

ERIC: Education Resources Information Center

GRE: Graduate Record Examination

IEA: International Association for the Evaluation of Educational Achievement

TIMSS: Trends of International in Mathematics and Science Study

NCME: National Council on Measurement in Education

OECD: Organisation for Economic Co-operation and Development

PIRLS: Progress in International Reading Literacy Study

PISA: Programme for International Student Assessment

SAT: Scholastic Aptitude Test or Scholastic Assessment Test

سنجش کلاس درس و استانداردهای آن (classroom assessment)

فنون سنجش کلاس درس عبارتند از روش­ های ارزشیابی تکوینی که دارای دو هدف است. آن­ها می توانند میزان درک فراگیران از محتوای دروس ارایه شده در دوره را مورد سنجش قرار داده و اطلاعاتی راجع به اثربخشی روش­ تدریس مدرس در اختیار مدرس قرار دهد. اغلب آن ها سریع و ساده قابل استفاده هستند و انواع مختلفی از اطلاعات را در اختیار محقق قرار می دهند.

سنجش کلاس درس بخش جدایی ناپذیر تدریس و یادگیری است. بدون سنجش مناسب قادر نخواهیم بود به این مطلب که آیا فراگیران بر اساس آن چه برنامه ریزی شده است در حال پیشرفت هستند یا نه پی برد. علاوه بر این قادر نخواهیم بود برای فرصت های یادگیری آتی فراگیران به طور اثربخشی برنامه ریزی کنیم. استانداردهای سنجش کلاسی و رهنمون های مربوط به آن مباحثی را که هنگام قضاوت حرفه ای برای سنجش کلاسی تکوینی، تراکمی و معیارهای عادلانه و منصفانه برای همه فراگیران مورد نیاز است را شناسایی می کند. مدرسان، فراگیران و والدین می توانند به منظور افزایش یادگیری فراگیران از نتایج حاصل از سنجش کلاسی مربوط به این استانداردها و رهنمون ها با اطمینان استفاده کنند.

قبل از استفاده از هر روش سنجشی لازم است که درک درستی از موارد زیر داشته باشیم: 1)هدف سنجش، 2)آن چه باید مورد سنجش قرار گیرد، 3)بهترین روش سنجش، 4) چگونگی به اشتراک گذاشتن نتایج و با چه کسی به اشتراک گذاشتن و 5)چگونه درگیر کردن فراگیران در فرایند سنجش. این 5 مورد مهم باید ما را از شروع طرحریزی سنجش و آموزش هدایت کند زیرا آن­ها تاثیر مثبتی بر یادگیری مستمر فراگیران دارد.

استانداردهای سنجش کلاسی شامل سه حیطه است: شالوده (هدف سنجش، انتظارات یادگیری، طراحی سنجش، درگیری فراگیران در سنجش، آمادگی سنجش، ارایه نتایج به والدین و اولیا)، کاربرد (تحلیل عملکرد فراگیران، بازخورد اثربخش، پیگیری آموزشی، نمرات و نظرات نهایی، گزارش دهی) و کیفیت (تنوع فرهنگی و زبانی، آموزش و پرورش کودکان استثنایی و خاص)، سوگیری نداشتن، روایی، پایایی و بازتاب.

سنجش شناختی-تشخیصی (cognitive diagnostics assessment-CDMs)

سنجش شناختی-تشخیصی به منظور اندازه­گیری ساختارهای دانش ویژه و مهارت­های پردازش در فراگیران تدوین شده است تا اطلاعاتی در مورد نقاط قوت و ضعف شناختی فراهم آورد. سنجش شناختی-تشخیصی هنوز در ابتدای راه است، اما پایه آن به خوبی تدوین شده است. در سال 1980 دو فصل از کتاب اندازه­گیری روبرت لین شروعی برای تمایل و نیاز زیاد به سنجش شناختی-تشخیصی بود. فصل روایی سامویل مسیک و فصل آخر اسنو و دیوید لوهمانز، دلالت­های روانشناسی شناختی برای اندازه­گیری آموزشی، به یکپارچه کردن همراهی روانشناسی شناختی در اندازه­گیری آموزشی کمک کرد.

مدل­های شناختی-تشخیصی به منظور ارایه اطلاعات مورد نظر به صورت نیمرخ­های نمره که محدودیت مدل­های نظریه سوال-پاسخ را رفع می­کند، تدوین شده اند. انواع مختلف مدل­های شناختی-تشخیصی در ادبیات اندازه­گیری ارایه شده است. به طور کلی این مدل­ها، وضعیت­های مختلف مورد نظر محققان (مثل انواع سازه، پاسخ، و بعدیت) در روانسنجی و علوم شناختی و یادگیری را پوشش می­دهند. به دلیل محبوبیت این مدل­ها، مطالعاتی در میان محققان به منظور درک و یکپارچه کردن این مدل­ها انجام شده است. انواع مختلفی از مدل­های تشخیصی-شناختی در ادبیات وجود دارد و در عمل نیز استفاده شده است. برای مقایسه این مدل­ها، سه متغیر را می­توان مد نظر قرار داد: متغیر پاسخ­های دو ارزشی و چندارزشی، متغیر مکنون دو ارزشی و چندارزشی و متغیر گروه­بندی جبرانی یا غیر جبرانی صفت مکنون.

الگوهای خاص صفت، مهارت و عدم مهارت طبقه­ها یا گروه­های مکنون را که بر اساس آن مدل­های شناختی-تشخیصی، آزمودنی­ها را طبقه بندی می­کند را تعریف می­کند. به دلیل این­که صفت­ها و بنابراین طبقه­ها قبل از تحلیل تعریف می­شوند، این مدل­ها، مدل­های طبقه مکنون تاییدی هستند که طبقه بندی آزمودنی­ها بر اساس پاسخ به سوالات تعیین می­شود. به دلیل ماهیت تاییدی این مدل­ها، تدوین یک آزمون تشخیصی ابتدا مستلزم صفاتی است که به وسیله تحقیقات شناختی برای حیطه مورد نظر مهم تشخیص داده شده است، می باشد. سپس، هر سوال آزمون برای اندازه­گیری یک یا چند صفت طراحی می­شود. به دلیل این­که یک سوال می­تواند بیش از یک صفت را اندازه گیری کند، چند بعدی بودن درون و بین سوالات وجود دارد. همخوانی سوال-صفت در ماتریس کیو ارایه می شود. ماتریسی که در آن 1 نشان می­دهد که یک سوال یک صفت را اندازه­گیری می­کند و درایه صفر بدین معناست که آن سوال آن صفت را اندازه­گیری نمی­کند. دقت طبقه­بندی مدل­های شناختی-تشخیصی به همخوانی درست سوالات با صفات بر می­گردد، به گونه­ای که تعیین نادرست ماتریس کیو منجر به طبقه­بندی غلط می­شود.

هدف اندازه­گیری تشخیصی شبیه تشخیص­های معمول است با این تفاوت که بافتی که در آن اندازه گیری می­شود، رسمی­تر است. مثلاً فردی که باید مورد تشخیص قرار گیرد می­تواند بیماری باشد که در بیمارستان از نظر روانی مورد ارزیابی قرار می­گیرد، فراگیری که در مدرسه به عنوان دانش­آموزی مستعد جایابی می­شود، یا بازیکنی که کالایی را در دنیای مجازی خریداری می­کند. در این­گونه موارد هدف اندازه­گیری شناختی عبارت است از: تشخیص اختلال احتمالی و تعیین اثربخش­ترین برنامه درمانی برای بیمار، شناسایی نقاط قوت و ضعف در حیطه محتوایی خاص و تعیین بهترین راهبرد تمرین برای آن فراگیر، یا تشخیص ویژگی­های رفتار خرید و ارایه راهبردهای بازاریابی برای آن بازیکن. به منظور ارایه نیمرخ دقیق افراد با توجه به ویژگی­های مورد نظر در این موقعیت، سوالاتی به طور خاص طراحی می­شود، یا تکالیفی به این افراد ارایه می­شود و پاسخ­های فرد و رفتارهای مرتبط به آن ثبت می­شود. رفتارها می­تواند شامل پاسخ­های کلامی به سوالات باز پاسخ توسط بیمارباشد، پاسخ­های کتبی به سوالات چند گزینه­ای توسط فراگیر باشد، یا پیگیری فعالیت­ها در محیط­های اجباری توسط بازیکن باشد.

مدل­های طبقه­بندی شناختی، زیر مجموعه­ای از مدل­های روانسنجی هستند که افراد را بر اساس متغیرهای مکنون طبقه­ای چندگانه طبقه­بندی می­کنند. پایه­ طبقه­بندی در این مدل­ها بر اساس داده­های پاسخ مشاهده شده که از طریق سنجش تشخیصی جمع آوری شده­اند، است. این مدل­ها مکانیسمی برای بررسی داده­های جمع­آوری شده، ارایه می­دهند. اگر طبقه­بندی­ها، درک مهمی از ویژگی­های مکنون افراد را تایید کند پس استفاده از این مدل­ها می­تواند تحلیل­های عملی مفیدی را فراهم کند. این مدل­ها ابزاری تدوین می­کنند که تحلیل­هایی که در آن انواع رفتار افراد وابسته به الگوی داده­ها با وزن­های مختلف است را ممکن می­سازد. اما انتخاب این که چگونه الگوهای رفتاری تدوین شده اند (تصمیم­گیری در مورد این که چه صفاتی باید ارایه شوند، چه اطلاعاتی باید استخراج شود، چگونه باید اطلاعات استخراج شده را به صورت خروجی برای یک مدل آماری کدگذاری کرد) تنها ملاحظه­ای است که تدوین کننده سنجش شناختی باید مد نظر قرار دهد. صفت­ در این مدل­ها نشان دهنده سازه­ای مثل دانش یا بیماری روانی است و طبقه بندی افراد بر اساس صفات است. صفات از متغیرهای پنهان طبقه ای مشتق می­شوند، بنابراین لازم است که طبقه بندی از نظر آماری از داده­های قابل مشاهده پاسخ دهندگان استنباط شود. این مدل­ها، همبستگی آماری را ارایه می­دهند.

راپ و تمپلین (2008) نه ویژگی اصلی که می­تواند برای مقایسه مدل­های شناختی-تشخیصی با دیگر مدل­های متغیر مکنون مورد استفاده قرار گیرد را فهرست کردند. برخی از آن­ها عبارت است از: 1)ماهیت چندبعدی­شان، 2)ماهیت تاییدی بودنشان، 3)پیچیدگی ساختار عاملی­شان و 4) ماهیت تشخیصی بودن تفسیرهای­شان. مدل­های تحلیل عاملی و نظریه سوال-پاسخ وقتی مورد استفاده قرار می­گیرد که ساختارهای بارگذاری ساده­تر است (مثلاً هر سوال فقط بر روی یک بعد بار دارد.)، اما مدل­های شناختی-تشخیصی دارای ساختارهای پیچیده بارگذاری هستند که معمولاً مستلزم چندین توانایی به هم مرتبط هستند.

در این مدل­ها، پیوستار مفروض به دو دسته مجرا مثل ماهر یا غیرماهر در زمینه­های آموزشی و اختلال داشتن یا اختلال نداشتن در زمینه روانشناسی بالینی تقسیم می­شود . ویژگی­­هایی که احتمال­شان بیش­تر از 5/. است را به عنوان تشخیص مثبت (یعنی ماهر)، و ویژگی­های که کم­تر از 5/. هستند به عنوان تشخیص منفی (غیرماهر) در نظر گرفته می­شوند. احتمال­های نزدیک به 5/. نشان دهنده آن هستند که متغیرهای مشاهده شده، اطلاعات کافی ارایه نمی­دهد تا بتوان بر اساس آن تشخیص روشنی ارایه داد و طبقه­بندی را به شدت مبهم می­کند. هدف اصلی این مدل­ها، تشخیص است و این ویژگی استفاده از این مدل­ها برای داده­های حاصل از سنجش تشخیصی را از استفاده از مدل­های تحلیل عاملی تاییدی و نظریه سوال-پاسخ برای داده­های حاصل از ارزشیابی جایابی، پذیرش و گواهینامه متفاوت می­کند. سنجش شناختی-تشخیصی برای معلمان، والدین و مسوولین آموزشی که متمایلند میزان اطلاعاتی را که دانش آموزان در آن مهارت کسب کرده اند را بدانند، مفید هستند.

با وجود اهمیت مدل­های شناختی-تشخیصی، مباحث مهم و محدودیت­هایی در استفاده از این مدل­ها وجود دارد که نیاز به بحث دارد. مهم­ترین مبحث، بحث روایی است. روایی نتایج در این مدل­ها به نظریه زیربنایی آن­ها بستگی داد. بخصوص اگر تعریف معیارها دقیقاً مشخص نشده باشد یا اگر این معیارها به تشخیص مربوط نباشد، نتایج حاوی اطلاعات تشخیصی با روایی کم خواهد بود. البته این دغدغه به طور کلی در مورد مدل­های متغیر پنهان وجود دارد. در استفاده از اطلاعات تشخیصی حاصل از مدل­های شناختی-تشخیصی باید مد نظر قرار گیرد که دانشی که بر اساس نتایج به دست می آید به این بستگی دارد که تا چه حد نظریه زیربنایی مبتنی بر واقعیت است. علاوه بر روایی، تدوین ماتریس کیو که تعریف معیارهای مورد اندازه­گیری را ارایه می­دهد نیز یکی دیگر از دغدغه­های این مدل­هاست. کیفیت برازش مدل شناختی-تشخصی به کیفیت ماتریس کیو استفاده شده در تحلیل بستگی دارد. تعریف این ماتریس باید زیربنای نظری حیطه ابزار را با نتایج تجربی تحلیل ترکیب کند. شاید مهم­ترین نکته در نتایج این مدل­ها، تصدیق بیرونی براوردهای تشخیصی است. ساخت ابزار برای اهداف تشخیصی باید به کمک اندازه­های روایابی بیرونی انجام شود. به زعم تاتسوکا (2005) "در حالت واقعی، سه واژه مهم عبارت است از موقعیت، موقعیت و موقعیت. در مدل­یابی تشخیصی، سه واژه مهم عبارت است از روایابی، روایابی و روایابی." روایابی بیرونی، تفسیر برآوردهای تشخیصی نتایج مدل شناختی-تشخیصی را را مطمین می­سازد. این مدل­ها را می­توان با ابزار­های موجود به کار برد ولی باید توجه کرد در بسیاری از موارد پرسشنامه­ها، گویه­های طرح شد به منظور استفاده از مدل تحلیل عاملی تاییدی (با یک ساختار ساده) به منظور اندازه­گیری ملاک­های مکنون در یک پیوستار و نه در یک طبقه­بندی تدوین شده اند. مشکلاتی مشابه نیز در استفاد از این مدل­ها در اندازه­گیری آموزشی وجود دارد زیرا این آزمون­ها برای تحلیل در مقیاسی تک بعدی طراحی شده اند. معمولاً این آزمون­ها با انتخاب سوال­هایی حداکثر اطلاعات را با توجه به پیوستار مکنون ارایه می­دهد. طبقه بندی بر اساس یک پیوستار مکنون می­تواند منجر به برآوردهایی شود که در آن افراد زیادی یا همه صفات را دارند و یا هیچ کدام را ندارند. در این­گونه موارد، همه همبستگی­های بین صفات (بر اساس مدل ساختاری) واحد (تمایل به این­که یک پیوستار زیربنای داده­هاست) می­شوند.

در مقایسه با مدل­های نظریه پاسخ-سوال چند بعدی (MIRT)، این مدل­ها در هر بعد به سوال­های بسیار کم­تری برای کسب برآوردهای پایا نیاز دارد (تمپلین و برادشاو، 2013). مدل­های نظریه پاسخ-سوال چند بعدی مستلزم سوال­های بیشتری هستند و شاید یکی از دلایل غالب ماندن مدل­های تک بعدی در آموزش علی رغم نیاز دولت­ها و نیاز معلمان  به مدل­های نظریه سوال-پاسخ چند بعدی برای گرفتن بازخوردهای دقیق و ظریف، همین مطلب باشد.

اهمیت مدل­های شناختی-تشخیصی در مقایسه با نظریه کلاسیک آزمون و نظریه سوال-پاسخ از آن­جا ناشی می­شود که در این مدل­ها نیمرخ دانش آموزان ارایه می­شود که در آن مجموعه­ای از مهارت­های یا صفت­های دو ارزشی که فرد در آن به مهارت رسیده یا نرسیده است نمایش داده می­شود. نیمرخ­های صفات گسسته، اطلاعاتی در مورد نیازهای گروهی از دانش آموزان در اختیار معلم قرار می­دهد (برخلاف مدل­های نظریه سوال-پاسخ چند بعدی که پروفایلی از نمرات ارایه می­دهد).