سنجش

سنجش و اندازه گیری در علوم رفتاری

سنجش

سنجش و اندازه گیری در علوم رفتاری

هم خطی

زمانی که با وجود معناداری معادله نهایی معادله نهائی، ضرایب رگرسیون معنی­دار نیستند باید به نقش هم­خطی در رابطه شک کرد. هم خطی عدم اطمینان در مورد پارامترهای برآورد شده را افزایش می دهد و در نتیجه خطاهای معیار افزایش می یابند. آن چه که ممکن است در این حالت اتفاق بیفتد این است که معادله رگرسیون مشخص می کند که نسبت بالایی از واریانس توسط متغیرهای مستقل قابل تبیین است، اما مشخص نمی کند که چه میزان از پارامترهای برآورد شده به هریک از متغیرهای مستقل اختصاص دارد. روش های مختلفی برای ارزیابی هم خطی بودن وجود دارد.

اولین روش ارزیابی هم خطی، بررسی بصری ساده ماتریس همبستگی بین متغیرهای پیش بین یعنی تحلیل رگرسیون جداگانه برای هر یک از متغیرهای مستقل است. وقتی یک متغیر دارای همبستگی بالائی (بیش از 8/.) با متغیرهای دیگر باشد یعنی سرنخی برای هم خطی بودن وجود دارد. البته همبستگی های پایین به این معنا نیست که مشکلی وجود ندارد زیرا همبستگی های چندگانه مهم هستند و نه همبستگی های دو متغیری. همبستگی بیان می کند که دو متغیر چه میزان واریانس مشترک دارند اما این مقدار تعیین نمی کند که هم خطی وجود دارد یا نه. آن چه نیاز است دانستن نسبت واریانس مشترک هر متغیر مستقل با تمام متغیرهای مستقل دیگر است. روش پی بردن به سهم مشترک یک متغیر با تمام متغیرهای دیگر انجام تحلیل رگرسیون چندگانه است، به صورتی که هر بار یکی از متغیرهای مستقل به عنوان متغیر وابسته و دیگر متغیرهای مستقل را به عنوان متغیر مستقل در نظر می گیریم.

روش دوم برای بررسی هم خطی، تولرنس (تحمل) است. تولرانس تا حدودی شکل گسترده ضریب همبستگی چندگانه است. تولرانس یک متغیر میزانی است که آن متغیر را از سایر متغیرهای مستقل دیگر نمی توان پیش بینی نمود. تولرانس یک متغیر به صورت یک منهای مجذور آر محاسبه می شود و به این صورت که در تحلیل رگرسیون از متغیر مورد نظر به عنوان متغیر وابسته و ار بقیه متغیرها به عنوان متغیرهای مستقل استفاده می شود. اگر در تحلیل رگرسیون تنها دو متغیر مستقل وجود داشته باشد، ارزش مجذور آر (همبستگی چندگانه) مساوی ارزش r ( همبستگی دو متغیری) و تولرنس از طریق ماتریس همبستگی دو متغیری محاسبه می شود. تولرنس بین صفر و یک در نوسان است. تولرنس معادل صفر برای یک متغیر بدین معنی است که این متغیر از طریق متغیرهای مستقل دیگر به طور کامل قابل پیش بینی است و بنابراین هم خطی کامل وجود دارد. اگر مقدار تولرنس متغیری مساوی یک باشد، مشخص می شود که متغیر مورد نظر با سایر متغیرهای مستقل کاملاً ناهمبسته است.

روش سوم برای بررسی هم خطی، عامل تورم واریانس (VIF) است که تا حد ریادی با تولرنس ارتباط دارد. هنگامی که بیش از دو متغیر مستقل وجود دارد برابر است با معکوس تولرنس. هر چند این محاسبه غیرضروری به نظر می رسد ولی مقدار عامل تورم واریانس مفید است زیرا با مقدار خطای معیار متغیر که به علت هم خطی افزایش یافته ارتباط دارد. مقدار افزایش در خطای معیار با ریشه دوم عامل تورم واریانس برابر است. زمانی که VIF مساوی 4 است خطای معیار دو برابر می شود. بنابراین اغلب از عدد 4 به عنوان نقطه برش اختیاری برای تعیین هم خطی استفاده می شود.

منبع: رگرسیون و همبستگی کاربردی از مایلز و شولین ترجمه دکتر کیامنش و دکتر کبیری

 

پیش فرض های تحلیل رگرسیون خطی

.

1-متغیر ملاک باید در مقیاس پیوسته اندازه گیری شود. متغیر(های) پیش بین باید در مقیاس پیوسته اندازه گیری شوند یا اگر در مقیاس های طبقه ای اندازه گیری می شوند لازم است مجدداً کدگذاری شوند.

2- نرمال بودن شکل توزیع نمرات متغیر ملاک (بررسی توزیع تک متغیره و چند متغیره)

3- بررسی باقیمانده ها از نظر همپراشی، نرمال بودن و همبسته نبودن با یکدیگر و همبسته نبودن با متغیرهای پیش بین

4- شناسائی داده های پرت تک متغیره و چند متغیره با استفاده از فاصله ماهالانوبیس و آماره های تشخیص (فاصله، اهرم و نفوذ)

5- بررسی وجود هم خطی از طریق ضریب تحمل و عامل تورم واریانس

6- بررسی استقلال خطاها با استفاده از آزمون دوربین-واتسون

 

علاوه بر این پیش فرض ها، موارد زیر نیز باید مد نظر قرار گیرد:

1- پالایش داده ها

2- نحوه برخورد با داده های گمشده

3-حجم نمونه و مناسب بودن آن با توجه به تعداد متغیرهای پیش بین

4- شناسایی متغیر بازدارنده

 

 

 

.

    v