رگرسیون پروبیت که به مدل های پروبیت نیز معروف هستند زمانیکه خروجی یا متغیر وابسته مدل دو وجهی باشد کاربرد دارد. در مدل های پروبیت معکوس توزیع نرمال استاندارد به عنوان ترکیبی خطی از متغیر های پیش بین مدل سازی می شود. در این شرایط کاربرد روش های معمولی رگرسیون کاربرد ندارد زیرا در توزیع در دو سطح رخ داده است.
به عنوان مثال محققی می خواهد در مورد عضو شدن یا نشدن شهروندان یک شهر به سازمان غیر دولتی حفظ محیط زیست با توجه به ویژگی های فردی و اجتماعی اقدام کند. یا در قبول یا رد یک پیشنهاد تبلیغاتی چه متغیر های پیش بینی دخیل هستند. این تکنیک شباهت زیادی به توابع لجیت دارد و توزیع انها به شرح زیر است و به اعتقاد آمار دانان ترجیحات فردی می تواند در انتخاب کمک کند.
اعضای شبکه مشاوران در حوزه «تحقیقات بازار، بازاریابی و فروش»
هدف نوشتار حاضر ارائه کد ها و کتابخانه های ضروری برای اجرای این تحلیل در R است که نسخه مورد استفاده برای این تحلیل1-14-2 است. از طریق دستور Rcommander فایل داده مورد نظر را وارد نرم افزار کرده و با استفاده از دستورattach() فایل داده را در خط فرمان Rقرار می دهیم. با استفاده از دستورnames() متغیر های وارد شده مورد بازبینی قرار می گیرند. در این تحقیق می خواهیم از سه متغیر GPA، GRE و رتبه موسسه برای پیش بینی ورود یا عدم ورود، استفاده کنیم. روش هایی چون لجستیک دو جمله ای، تحلیل تشخیصی و Hotelling’s T2 به عنوان بدیل های این روش مطرح هستند. برای اجرای این تکنیک دستور زیر را وارد می کنیم. as.factor () را در مورد متغیر های پیش بین ترتیبی به کار می بریم.
logit<- glm(admit ~ gre + gpa + as.factor(rank), family=binomial(link=”probit”), data=mydata, na.action=na.pass)
مقدار Z value که معادل آماره والد است برای تمام متغیر های پیش بین معنی دار است. confint() سطح معنی داری را برای این متغیر ها آشکار می سازد.
برای فراخوانی شدت معنی داری سطوح متغیر های رتبه موسسات از دستور زیر استفاده می شود.
library(aod)
wald.test(b=coef(logit), Sigma=vcov(logit), Terms=4:6)
در صورتیکه این تست معنی دار باشد نشان می دهد سطوح متغیر رتبه موسسات معنی دار بوده است یا خیر. این روشآماری به حجم نمونه بالایی نیاز دارد زیرا که به روش حداکثر درستنمایی کار می کند. به طور کلی این روش برای تفسیر باید به صورت شانس رخداد هر یک از سطوح متغیر های پیش بین مورد توجه قرار گیرد. به طور کلی این روش زمانیکه متغیر وابسته گسسته است مورد استفاده قرار می گیرد و در شرایط پژوهشی به خصوص مطالعات اقتصادی کاربرد وسیعی دارد.