رگرسیون لجستیک دو جملهای (Binomial Logistic Regression) یک روش آماری است که برای پیشبینی احتمال وقوع یک رویداد دو حالته (دوجملهای) بر اساس یک یا چند متغیر مستقل استفاده میشود. این روش به ویژه در تحلیلهای پزشکی، اجتماعی و اقتصادی کاربرد دارد.
مجموعه داده ی زیر از ” مدلسازی داده های دودویی” اثر دی.کولت(1991) برداشته شده است که مربوط به تحقیقی درباره ی مقاومت فشاری اتصال دهنده ها در صنعت هواپیما سازی است. این بررسی در 10 فشار هوایی متفاوت از 2500psi تا 4300psi با پله ی 200psi آزمایش شده است. که در متغیر Load آنها را بصورت زیر تعریف می کنیم:
Load <- c(25,27,29,31,33,35,37,39,41,43)
تعداد اتصال دهنده هایی که در هر فشار مورد آزمایش قرار گرفتند را در متغیر n :
n<- c(50,70,100,60,40,85,90,50,80,65)
و تعداد اتصال دهنده هایی که در این آزمایش در هر فشار، دچار سانحه شده اند را در متغیر r تعریف می کنیم:
r <- c(10,17,30,21,18,43,54,33,60,51)
حتما بخوانید: پیاده سازی روش بوت استرپ
فرض می کنیم که ri دارای توزیع دوجمله ای با پارامترهای ni و pi است. ( i=1,…,10)
مدل glm را با تابع پیوند logit به عنوان مدل مورد نظر درنظر می گیریم.
حال مقدار p ها را محاسبه کرده و آنها را در مقابل فشارهای مختلف رسم می کنیم:
p <- r/n
plot(Load,p)
داده ها نشان داده شد. حال مدل مورد نظر را به آن برازش می دهیم:
mymodel <- glm(p~ Load,weights=n,family=binomial)
summary(mymodel)
plot(mymodel,ask=T)
این مدل AIC مناسب و برازش خوبی به داده ها دارد. برای نمایش بهتر این موضوع، مدل برازش داده شده را روی داده ها بصورت زیر رسم می و با خطوط عمودی بازه ی واقعی داده ها را مشخص می کنیم:
x <- 15:55 ;
alpha = mymodel.l$coefficients[1];
beta= mymodel.l$coefficients[2];
y <- alpha + beta*x; Y= 1/(1+ exp(-y));
plot(x, Y, type=”l”,xlab=”Load”,ylab=”Fitted Probability of failure”)
abline(v=25);
abline(v=43);
points(Load,p)
به همین ترتیب می توان سایر توابع پیوند دیگر را نیز مورد بررسی قرار داد.
با دریافت « مشاوره برنامهنویسی، وب و سئو » از کارشناسان جوان حرفهای و باتجربه ساکوراد؛ موفقیت کسب و کار، رونق فروش و افزایش درآمد خود را تضمین کنید!
و اما کلام آخر…
رگرسیون لجستیک دو جملهای ابزاری قدرتمند برای تحلیل دادههای دوجملهای است و با توجه به توانایی آن در مدلسازی روابط پیچیده بین متغیرها، به طور گستردهای در تحقیقات علمی و کاربردی استفاده میشود.