تجزیه و تحلیل آماری

تحلیل آماری داده ها در روان شناسی، مدیریت (منابع انسانی، آموزشی و مالی)، اقتصاد و حسابداری

تجزیه و تحلیل آماری

تحلیل آماری داده ها در روان شناسی، مدیریت (منابع انسانی، آموزشی و مالی)، اقتصاد و حسابداری

رگرسیون لجستیک

دوشنبه, ۳ آذر ۱۳۹۳، ۰۸:۴۶ ب.ظ

در رگرسیون لوجستیک متغیر پاسخ یک متغیر کیفی چند مقداری استبرخلاف رگرسیون خطی ساده که در آن متغیر پاسخ یک متغیرکمی پیوسته و دارای توزیع نرمال بود. در رگرسیون لوجستیک متغیر پاسخ یک متغیر کیفی دو مقداری و یا چند مقداری است که اگر متغیر پاسخ دو مقداری باشد آن را رگرسیون لجستیک دودویی گفته و در غیر این صورت آن را رگرسیون لجستیک چند مقداری می گوئیم. در رگرسیون معمولی هدف از برازش مدل رگرسیون پیش بینی مقدار متغیر وابسته با معلوم بودن مقادیر متغیرهای مستقل است، اما در رگرسیون لجستیک هدف پیش بینی احتمال عضویت یک نمونه در یکی از دو گروه ویا چند گروه مورد نظر است.

روش انجام تحلیل رگرسیون لجستیک با رگرسیون معمولی متفاوت است، در رگرسیون معمولی برای برآورد پارامترها از روش حداقل کردن مجذور خطاها )روش OLS ( استفاده می شود. حال آنکه در رگرسیون لجستیک برای برآورد پارمترها از روش حداکثر درستنمایی ML ) استفاده می شود. در رگرسیون لجستیک برای بررسی معنی دار بودن مدل رگرسیون از آزمون کی دو )کای اسکورو برای بررسی معنی دار بودن وجود هر کدام از ضرائب از آزمون والد[1] استفاده می شود. در رگرسیون معمولی فرض بر این بود که متغیر پاسخ دارای توزیع نرمال با واریانس ثابت است اما در این رگرسیون فرض نرمال بودن متغیر پاسخ و نیز فرض ثابت بودن واریانس مطرح نیستاما فرض عدم وجود همخطی در بین متغیرهای پیشگو بایدبرقرار باشد.

در رگرسیون لجستیک برای معتبر بودن تفسیر نتایج حجم نمونه باید بزرگتر از حجم نمونه در رگرسیون خطی باشدمطابق قواعد تجربی برای این رگرسیون حجم نمونه حداقل باید 30 برابر پارامترهای برآورد شده (تعداد ضرایب متغیرهای پیشگو به همراه ضریب ثابت) باشدبنابرین در این پژوهش و در بررسی فرضیه های تحقیق حداقل حجم نمونه باید 60 باشد.

فرض کنید متغیر پاسخ که آن را با Y نشان می دهیم مقادیر یک و صفر را با احتمال های به ترتیب p و 1-p اختیار کرده و تنها یک متغیر پیشگو داشته باشیم که آن را با X نشان می دهیم، مانند بررسی فرضیه های پژوهش بدون در نظر گرفتن سایر متغیرهای مستقل، در این رگرسیون به دنبال مدل سازی احتمال موفقیت هستیم .مدلی که برای احتمال موفقیت در نظر می گیریم به صورت زیر است.

که در آن  و   پارامترهای ثابتی هستند. این تابع را تابع لجستیک می نامیمنمودار این تابع به شکل S و به صورت زیر است.

 

 

 

 

 

 

همین طور که ازاین شکل پیداست احتمال p ابتدا با افزایش x به کندی افزایش یافته سپس این افزایش شتاب می گیرد و سرانجام پایدار می شود ولی بیشتر از یک نمی شود. تابع لجستیک نسبت به پارامترهای آن  و    غیر خطی است. اما همانطوری که گفتیم به جای استفاده از احتمال وقوع یک پیشامد از لگاریتم بخت آن پیشامد استفاده می شودبدین ترتیب داریم.

 

 

تبدیل فوق را تبدیل لوجیت نیز می نامندبا انجام چنین تبدیلی و استفاده از لگاریتم بخت رابطه فوق نسبت به پارامترهای  و    خطی می شودبنابراین یک مدل رگرسیون لوجستیک با یک متغیر پیشگو، مدلی به صورت زیر است.

که در آن    لگاریتم بخت موفقیت بوده ومقدارآن در فاصله   تا   تغییر می کند.



[1]. wald

موافقین ۰ مخالفین ۰ ۹۳/۰۹/۰۳
mohammad shourvazi

نظرات  (۱)

خوب بود 

ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی