آموزش R | رگرسیون لجستیک برای توزیع دوجمله ای

مجموعه داده ی زیر از ” مدلسازی داده های دودویی” اثر دی.کولت(۱۹۹۱) برداشته شده است که مربوط به تحقیقی درباره ی مقاومت فشاری اتصال دهنده ها در صنعت هواپیما سازی است. این بررسی در ۱۰ فشار هوایی متفاوت از ۲۵۰۰psi تا ۴۳۰۰psi با پله ی ۲۰۰psi آزمایش شده است. که در متغیر Load آنها را بصورت زیر تعریف می کنیم:

Load <- c(25,27,29,31,33,35,37,39,41,43)

تعداد اتصال دهنده هایی که در هر فشار مورد آزمایش قرار گرفتند را در متغیر n :

n<- c(50,70,100,60,40,85,90,50,80,65)

و تعداد اتصال دهنده هایی که در این آزمایش در هر فشار، دچار سانحه شده اند را در متغیر r تعریف می کنیم:

r <- c(10,17,30,21,18,43,54,33,60,51)

فرض می کنیم که ri دارای توزیع دوجمله ای با پارامترهای ni و pi است. ( i=1,…,10)

مدل glm را با تابع پیوند logit به عنوان مدل مورد نظر درنظر می گیریم.
حال مقدار p ها را محاسبه کرده و آنها را در مقابل فشارهای مختلف رسم می کنیم:

p <- r/n
plot(Load,p)

داده ها نشان داده شد. حال مدل مورد نظر را به آن برازش می دهیم:

mymodel <- glm(p~ Load,weights=n,family=binomial)

summary(mymodel)

plot(mymodel,ask=T)

این مدل AIC مناسب و برازش خوبی به داده ها دارد.  برای نمایش بهتر این موضوع، مدل برازش داده شده را روی داده ها بصورت زیر رسم می و با خطوط عمودی بازه ی واقعی داده ها را مشخص می کنیم:

x <- 15:55 ;
alpha = mymodel.l$coefficients[1];
beta= mymodel.l$coefficients[2];
y <- alpha + beta*x; Y= 1/(1+ exp(-y));
plot(x, Y, type=”l”,xlab=”Load”,ylab=”Fitted Probability of failure”)
abline(v=25);
abline(v=43);
points(Load,p)

به همین ترتیب می توان سایر توابع پیوند دیگر را نیز مورد بررسی قرار داد.

ارسال دیدگاه