در روش های پارامتری کلاسیک بررسی وجود داده های پرت؛ همسانی تحلیلهای واریانس و بررسی توزیع نرمال، به عنوان پیش شرط های اساسی همواره مورد نظر محققان و داده پردازان بوده است. تست های چون ANOVA, ANCOVA , MANOVA به این تست ها حساسیت داشته و قبل از تحلیل نتایج این آزمون ها، بررسی تست های تشخیصی از اهمیت بالایی برخوردار هستند. بررسی این تست ها به منظور افزایش دقت آزمون ها توصیه شده است.
حتما بخوانید: تعیین خطای نوع دوم در آزمون t وابسته
به منظور بررسی داده های پرت یا دورافتاده (که تشخیص آنها علاوه بر روش های مرتبط با تحلیلهای واریانس در بسیاری از روش های چند متغیره نیز به عنوان مبنای انجام تحلیل است) باید از دستور aq.plot استفاده نمود. کتابخانه Mvoutlier برای این منظور توسط R پشتیبانی شده است. این تابع با استفاده از مجذور فواصل ماهالانوبیس نوع توزیع داده های تجربی موجود را بر اساس وجود داده های پرت مورد تحلیل قرار می دهد. به منظور انجام آن باید دستور زیر را وارد نمود.
library(mvoutlier)
outliers <- aq.plot(mtcars[c(“mpg”,”disp”,”hp”,”drat”,”wt”,”qsec)])
Read استفاده می شود. وجود داده های پرت را می توان در چهار دیاگرام خروجی مورد توجه قرار داد و نسبت به مدیریت و حذف آنها از تحلیل اقدام نمود.
مفروضه بعدی توزیع نرمال متغیر های تحقیق است. در آزمون هایی که توزیع نرمال باید مورد توجه باشد از پلات کیو استفاده می شود که به این منظور باید دستور زیر را در کنسول R وارد نمود.
نام فایل داده <- read.csv(آدرس فایل روی سیستم)
attach(نام فایل داده ای که از قبل وارد شده است)
qqnorm(نام یکی از متغیر ها در فایل)
qqline(نام یکی از متغیر ها در فایل)
این خروجی نشان می دهد که وضعیت پراکنش متغیر مورد مطالعه چگونه است و تا چه حد به خط نرمال نزدیک یا دور است. به منظور بررسی دقیق تر می توان از دستور shapiro.test(x) استفاده نمود. که X یک بردار عددی است.
به منظور مطالعه شرط نرمال بوده چند متغیره که در بسیاری از آزمون ها شرط اساسی به شمار می رود باید از تست هایی چون شاپیرو چند متغیره استفاده نمود که توسط Royston (1983). ابداع شده است. این روش نسبت به روش هایی که تک تک متغیر ها را به تفکیک مورد تحلیل قرار می دهند بسیار کاراتر و دقیق تر بوده و در بررسی همزمان متغیر ها شرط توزیع آنها در رابطه با سایر متغیر های مدل یا تابع بررسی می شود.
در نرم افزار R این دستور تعبیه شده است و برای محققان امکان محاسبه این تست فراهم شده است. (mshapiro.test (M این تست را انجام می دهد. که M ماتریس عددی است.
اگر p×1 بردار تصادفی نرمال چند متغیره داشته باشیم آنگاه فاصله مجذور ماهالانوبیس بین X و μ میل به توزیع کای اسکویر با P درجه آزادی دارد.
به منظور بررسی این خروجی بر اساس یک دیاگرام باید از دستور استفاده شود.
x <- as.matrix(mydata)
<- colMeans(x)
n <- nrow(x); p <- ncol(x); cov <- cov(x)
d <- mahalanobis(x,center,cov) # distances
qqplot(qchisq(ppoints(n),df=p),d main=”QQ Plot Assessing Multivariate Normality ylab=”Mahalanobis D2″)”,,
abline(a=0,b=1)
به منظور بررسی تست های همسانی تحلیلهلی ورایانس نیز باید از آزمون های بارتلت و فیگنر – کیلن استفاده می شود که دستورات زیر را باید وارد نمود.
bartlett.test(y~G, data=نام فایل داده)
fligner.test(y~G, data= نام فایل داده)
که در این دستور Y متغیر کمی و G متغیر گروه بندی است.
به منظور گرافیکی سازی آن این دستور کافی است دستور زیر را که بر مبنای Brown-Forsyth طراحی شده است وارد نمود.
library(HH)
hov(y~G, data= نام فایل داده)
plot.hov(y~G,data= نام فایل داده)
که در این دستور Y متغیر کمی و G متغیر گروهبندی است.
همسانی طبقات در سطوح متغیر های طبقه ای را با استفاده از این پلات می توان مشاهده نمود. در این مقاله هدف ارائه دستور ها و کتابخانه های اساسی R در محاسبات مربوط به متداول ترین محاسبات پیش نیاز تحلیلهای واریانس بود که در برخی از آزمون های دیگر چند متغیره نیز کاربرد دارد. به طور کلی این نرم افزار از قابلیت های مناسبی برای پوشش نیاز های محاسباتی محققان برخوردار است.
با دریافت « مشاوره برنامهنویسی، وب و سئو » از کارشناسان جوان حرفهای و باتجربه ساکوراد؛ موفقیت کسب و کار، رونق فروش و افزایش درآمد خود را تضمین کنید!
و اما کلام آخر…
تحلیلهای واریانس ابزاری قدرتمند برای ارزیابی تفاوتهای بین گروههای مختلف است. با توجه به پیشنیازها و نحوه اجرای آن، این روش میتواند اطلاعات ارزشمندی درباره تأثیر متغیرهای مستقل بر متغیر وابسته ارائه دهد.