تحلیل واریانس یکی از مباحث پر تکرار آماری است. در این مقاله قصد داریم ابتدا تحلیل وارینس را با مثالی ملموس و ساده توضیح دهیم و کاربرد آن را مطرح خواهیم کرد. در ادامه آزمون فیشر و تاثیر آن در آنالیز واریانس یکطرفه مطرح خواهد شد. در انتها هم علت استفاده از واریانس را در آزمون میانگین ها مطرح خواهیم کرد.
تحلیل واریانس چیست؟
فرض کنید میخواهیم در یک سازمان اداری بررسی کنیم آیا سطح تحصیلات بر میزان حقوق دریافتی تأثیر دارد. چون میزان حقوق، متغیری کمی و سطح تحصیلات متغیری کیفی است، برای این مسئله میتوانیم از تحلیل واریانس (آنوا یا ANOVA) استفاده کنیم. برای این کار ابتدا میانگین میزان حقوق دریافتی را در هر یک از سطوح تحصیلات در نظر میگیریم. سپس توسط تحلیل واریانس بررسی میکنیم آیا میانگینهای حقوق در سطوح تحصیلی مختلف با هم متفاوت هستند یا خیر.در صورت پذیرش فرضیه عدم برابر بودن میانگینهای حقوق در سطوح مختلف تحصیلی، میتوانیم نتیجه بگیریم سطح تحصیلات بر میزان حقوق دریافتی تأثیر دارد. در حقیقت با استفاده از تحلیل واریانس میتوان بررسی آیا میانگین متغیر پاسخ در سطوح عامل مورد نظر دارای تفاوت هستند یا خیر.اما تحلیل واریانس شامل انواع بسیار زیادی است. معروفترین انواع تحلیل واریانس، تحلیل واریانس یکطرفه و تحلیل واریانس دوطرفه است. تحلیل واریانس از آزمونهای فیشر (F) برای بررسی برابر بودن میانگینها استفاده میکند که متعلق به سه یا تعدادی بیشتر از گروهها هستند. در این مطلب، به تعدادی از سوالات مربوط به آزمونهای فیشر (Fisher test) پاسخ میدهیم که برای بسیاری از محققین مورد ابهام است. سوالاتی از قبیل:
- آزمون فیشر چگونه عمل میکند؟
- چرا از آنالیز واریانسها برای آزمون میانگینها استفاده میکنیم؟
در این مطلب از مفاهیم و نمودارهای مختلف برای پاسخ به سوالات فوق در قالب آنالیز واریانس یکطرفه استفاده میکنیم.
آزمون فیشر و آماره های فیشر چیست؟
عبارت آزمون فیشر بر اساس این حقیقت است که این آزمونها از آماره فیشر برای آزمون فرضیات استفاده میکنند. آماره فیشر برابر با نسبت دو واریانس است و از نام دانشمند آمارشناس، رونالد فیشر برگرفته شده است. واریانسها پراکندگی دادهها در اطراف میانگین را اندازهگیری میکنند. واریانسهای با مقدار بیشتر وقتی اتفاق میافتند که نقاط دادهها تمایل به قرارگیری در فواصل دورتری از میانگین را داشته باشند.اما تفسیر واریانسها به طور مستقیم کار مشکلی است، زیرا واحد اندازهگیری آنها مجذور (توان دوم) واحد اندازهگیری دادهها است. اگر جذر واریانس را در نظر بگیریم، انحراف معیار به دست میآید که تفسیر آن سادهتر است زیرا واحد اندازهگیری آن با واحد دادهها یکسان است. گرچه تفسیر واریانسها به طور مستقیم سخت است، اما در برخی آزمونهای آماری از آنها استفاده میشود.آماره فیشر نسبت دو واریانس، یا به طور دقیقتر، نسبت دو میانگین مربعات (mean squares) است. میانگین مربعات همان واریانس است که بر درجات آزادی تقسیم شده، همان درجات آزادی که برای براورد واریانس به کار گرفته شده است.حال بیایید دقیقتر نگاه کنیم. واریانس، مجموع مربعات انحرافات از میانگین است. هر چه نمونه بزرگتری داشته باشیم، تعداد بیشتری مربع انحرافات برای جمع کردن داریم. نتیجه آن که هر چه مشاهدات بیشتری را اضافه کنیم، این مجموع بزرگتر میشود. با به کارگیری درجات آزادی، میانگین مربعات نیز نقش ایفا میکند. میانگین مربعات، تفاضل براورد هر اندازهگیری از واریانس را با توجه به تعداد اندازهگیریها محاسبه میکند. اگر از میانگین مربعات استفاده نکنیم، واریانسها قابل مقایسه نیستند و نسبت واریانسها برای آماره فیشر منطقی نخواهد بود.با توجه به این که آزمونهای فیشر نسبت دو واریانس را ارزیابی میکنند، ممکن است فکر کنیم تنها برای بررسی برابری واریانسها به کار میآیند. اما در حقیقت آزمونهای فیشر برای کارهای بیشتری نیز قابل استفاده هستند. آزمونهای فیشر به طور جالبی انعطافپذیرند، چون میتوان واریانسهای مختلفی را در آنها به کار برد و انواع مختلفی از فرضیات را آزمون کرد. آزمونهای فیشر میتوانند برای مقایسه برازش مدلهای مختلف، آزمون معناداری کلی مدلهای رگرسیون، آزمون جملات خاص در مدلهای خطی و بررسی برابری مجموعهای از میانگینها به کار روند.
آزمون فیشر در آنالیز واریانس یکطرفه
در آنالیز واریانس یکطرفه آزمون میکنیم آیا مجموعهای از میانگینها با هم برابرند یا خیر. برای آن که از آزمون فیشر برای این منظور استفاده کنیم، باید از واریانسهای مناسب در نسبت استفاده کنیم. آماره فیشر در آنالیر واریانس یکطرفه بدین صورت تعریف میشود:

برای این که ببینیم آزمونهای فیشر چگونه عمل میکنند، از یک مثال آنالیز واریانس یکطرفه استفاده میکنیم. فرض کنید در مطالعهای یک عامل داریم و میخواهیم اثر آن را بر یک متغیر پاسخ کمّی بررسی کنیم (آنالیز واریانس یک طرفه چیست؟-با مثال کاربردی در SPSS). عامل مورد نظر دارای چهار گروه و حجم نمونه 40 است. پس از اجرای تحلیل واریانس، نتایج آن به شکل زیر شده است:

صورت کسر آماره فیشر (واریانس بینگروهی)
در تحلیل واریانس یکطرفه، میانگین هر یک از چهار گروه عامل محاسبه میشود که طبق جدول 2 عبارتند از: 11.203، 8.983، 10.683 و 8.838. میانگینهای این گروهها حول میانگین کلی (9.915) که از 40 مشاهده حاصل شده قرار گرفتهاند.هر چه قدر این گروهها دارای فاصله بیشتری از میانگین کلی باشند، واریانسی که در صورت کسر آماره فیشر قرار دارد، بزرگتر میشود.راحتتر است آن است که بگوییم میانگینهای گروهها زمانی تفاوت معنیدار دارند که از یکدیگر دورتر باشند. این مسئله در آزمون فیشر به صورت بزرگتر بودن واریانس در صورت کسر لحاظ میشود.برای درک بهتر این مطلب، نمودار زیر را ببینید. این نمودار دارای دو قسمت مجزا است که برای مقایسه دو حالت با یکدیگر در قالب یک نمودار آمدهاند: یک حالت برای واریانس کوچک و حالت دیگر برای واریانس بزرگ. در هر کدام از این دو حالت، چهار نقطه قرار دارند که میانگین هر یک از چهار گروه هستند. همان طور که میبینیم، در حالت واریانس کوچک، نقاط نمودار (میانگینهای گروهها) دارای فواصل کمتری نسبت به یکدیگر هستند تا حالت واریانس بزرگ که نقاط نمودار با فواصل بیشتری نسبت به هم قرار گرفتهاند.

حال مجدداً به خروجی تحلیل واریانس یکطرفه مراجعه میکنیم. باید کدام آماره را برای واریانس بینگروهی استفاده کنیم؟ این آماره در جدول یک، به صورت مربع میانگین واقع در سطر Between Groups یعنی عدد 13.394 است. این عدد، مجموع مربع فاصلهها از میانگین کلی است که تقسیم بر درجات آزادی عامل شده است. هر چه میانگینهای گروههای عامل از یکدیگر فاصله بیشتری بگیرند، این عدد نیز افزایش مییابد.
مخرج کسر آماره فیشر (واریانس درونگروهی)
حال مخرج کسر آماره فیشر را بررسی میکنیم که واریانسهای داخل هر گروه را در نظر میگیرد. این واریانس درونگروهی، فاصله بین هر مشاهده با میانگین گروه مربوط به آن مشاهده را اندازهگیری میکند، فاصله بدستآمده را به توان دو میرساند و همه آنها را با هم جمع میکند و در نهایت بر درجات آزادی خطا تقسیم میکند.هر چه مشاهدات داخل هر گروه به میانگین گروه مربوط به خود نزدیکتر باشند، واریانس درونگروهی کوچکتر میشود. برعکس هر چه مشاهدات داخل هر گروه از میانگین مربوط به خود دورتر باشند، واریانس درونگروهی افزایش مییابد.در نمودار زیر واریانس درونگروهی کوچک با واریانس درونگروهی بزرگ مقایسه شده است. منحنیهای این نمودار نشان میدهند مشاهدات نمونه درون هر گروه چه قدر فشرده در اطراف میانگین آن گروه قرار گرفتهاند. مخرج کسر آماره فیشر، یا همان واریانس درونگروهی، در قسمت راست نمودار زیر بزرگتر است، زیرا مشاهدات نمونه در فواصل بیشتری نسبت به میانگین گروه قرار دارند.

برای آن که نتیجه بگیریم میانگینهای گروهها برابر نیستند، باید واریانس درونگروهی کوچک باشد. چرا؟ چون واریانس درونگروهی نشاندهنده واریانسی است که توسط مدل تبیین نشده است. در آمار این واریانس را خطای تصادفی مینامند. هر چه خطا افزایش یابد، احتمال بیشتری وجود دارد که تفاوتهای مشاهدهشده بین میانگینهای گروهها به جای آن که از تفاوتهای واقعی در گروههای جامعه ناشی شده باشد، به علت خطا به وجود آمده باشند. لذا واضح است که ما به دنبال مقادیر کمتری از خطا هستیم!حال بیایید دوباره به خروجی تحلیل واریانس یکطرفه نگاه کنیم. واریانس درونگروهی که در جدول 1 به نمایش درآمده برابر با 4.402 است.
آماره فیشر (نسبت واریانس بینگروهی به واریانس درونگروهی)
همان طور که گفتیم، آمارههای فیشر نسبت دو واریانس هستند. اگر فرضیه صفر درست باشد، مقدار آماره فیشر تقریباً برابر با یک میشود (برای دانستن فرضیات صفر و یک به مقاله آنالیز واریانس یک طرفه مراجعه کنید). فرضیه صفر در آنالیز واریانس یکطرفه، به صورت عدم معنیداری عامل است.در نمودار قبل، دو مقدار متفاوت واریانس را که در یک آماره آزمون فیشر تحلیل واریانس یکطرفه به کار رفتهاند دیدیم. حال این دو را کنار هم قرار میدهیم و میبینیم ترکیب آنها دو آماره فیشر کوچک و بزرگ را تولید میکند. در نمودارهای زیر گستره میانگینهای گروهها با گستره مشاهدات نمونه در داخل هر گروه قابل مقایسه است.

گراف سمت چپ (مقدار کوچک F): میانگینهای گروهها نسبت به پراکندگی درونگروهی با فشردگی بیشتری کنار هم قرار گرفتهاند. فاصله بین میانگینها نسبت به خطای تصادفی درون هر گروه، کوچک است. بنابراین نمیتوان نتیجه گرفت این گروهها واقعاً در جامعه نیز متفاوت هستند.گراف سمت راست (مقدار بزرگ): میانگین گروهها نسبت به پراکندگی مشاهدات درون هر گروه بیشتر گسترده شدهاند. در این حالت، احتمال زیادی وجود دارد که تفاوتهای مشاهدهشده بین میانگینهای گروهها واقعاً نشاندهنده تفاوت در سطوح جامعه باشند.
چگونگی محاسبه مقدار آماره فیشر
با مراجعه به خروجی مثال، میتوانیم صورت و مخرج کسر آماره فیشر را به صورت زیر محاسبه کنیم:

حال برای این که نتیجه بگیریم میانگینهای گروهها با هم برابر نیستند، باید مقدار آماره فیشر به اندازه کافی بزرگ باشد تا بتوانیم فرضیه صفر را رد کنیم. نکته قابل توجه در مورد آماره فیشر آن است که آمارهای فاقد واحد اندازهگیری است و این موضوع تفسیر آن را ساده میکند.مقدار آماره فیشر ما برابر با 3.30 شد که یعنی واریانس بینگروهی 3.3 برابرِ واریانس درونگروهی است. اما فرضیه صفر معادل با آن است که نسبت این واریانسها برابر است که یعنی مقدار آماره فیشر برابر با یک میشود. بنابراین آیا آماره فیشری با مقدار 3.3 به اندازه کافی بزرگ است که فرضیه صفر را رد کنیم؟همان طور که میدانید، مقدار آماره فیشر را باید با مقادیر بحرانی جدول فیشر مقایسه کنیم. مقدار بحرانی جدول فیشر با درجات آزادی صورت 3 و درجات آزادی مخرج 36 (جدول 1) و با مقدار آلفای 0.05 برابر با 2.87 است. البته همان طور که اطلاع دارید، از جدول فیشر زمانی استفاده میشود که به طور دستی محاسبات را انجام میدهیم. زمانی که از نرمافزار استفاده میکنیم از p-مقدار یا sig استفاده میکنیم که توسط نرمافزار محاسبه میشود. در این مثال، مقدار sig برابر با 0.031 است که چون کوچکتر از 0.05 است باز هم فرضیه صفر رد میشود.
بالاخره چرا از واریانس برای آزمون میانگینها استفاده میکنیم؟
برگردیم به سوالی که در ابتدا در مورد تحلیل واریانسها برای بررسی تفاوت میانگینهای گروهها مطرح کردیم. روی این جمله تمرکز میکنیم: «میانگینها متفاوت هستند». این مسئله دقیقاً شامل پراکندگی میانگینهای گروهها است. اگر هیچ پراکندگی در میانگینها وجود نداشته باشد، نمیتوانند متفاوت باشند. به طور مشابه، هر چه تفاوتهای بین میانگینها بیشتر باشد، پراکندگی بیشتری نیز وجود خواهد داشت.آزمونهای فیشر در مطالعات تحلیل واریانس، مقدار پراکندگی بین میانگینهای گروهها را بررسی میکنند. این بررسی بدین صورت است که در آن پراکندگی درونگروهی برای تعیین وجود تفاوت معنیدار بین میانگینهای گروهها به کار میرود. البته نتایج آزمون فیشر در صورتی که نشاندهنده تفاوت معنیدار بین میانگینهای گروهها باشد، فقط میگوید همه میانگینها برابر نیستند. اما نمیتواند بگوید کدام میانگینها برابر نیستند، برای این کار میتوان از آزمونهای تعقیبی استفاده کرد.در این مطلب سعی شد به تدوین خود مفهوم آنالیز واریانس پرداخته شود. در ادامه یکی از انواع تحلیل واریانس یعنی آماره فیشر نیز بررسی شد و همچنین در آینده مطالبی دیگر درباره آنالیز واریانس منتشر خواهد شد. چنانچه به مسائل آماری علاقه مندید میتوانید صفحه اینستاگرام آمار پیشرو را دنبال کنید و از جدید ترین مباحثی که منتشر می کنیم با خبر شوید.امیدواریم مطلب جامع و کامل برای شما ارائه اما چنانچه نارسایی در تحلیل واریانس احساس کردید می توانید در قسمت نظرات سوالات خود را مطرح کنید.چنانچه به صورت اختصاصی تر می خواهید به سوالات شما پاسخ داده شود متخصصین ما آماده اند تا تجربه چندین ساله خود را در اختیار شما قرار دهند، به منظور بهره مندی از این خدمات در قسمت مشاوره آماری رایگان می توانید پرسش های خود را مطرح کنید.با توجه به کاربرد های مختلفی که تحلیل واریانس در بخش های علمی و غیر علمی دارد، چنانچه به منظور انجام تحلیل واریانس نیاز به کمک متخصصان دارید این خدمات را شرکت های آماری ارائه می دهند. یکی از این شرکت ها که با بهره گیری از افراد متخصص خدمات با کیفیتی را ارائه می دهد شرکت آمار پیشرو است.
تحلیل واریانس چیست؟
در صورتی که بخواهیم تاثیر سطوح متغیر مستقل که یک متغیر کیفی است را بر متغیر وابسته که کمی است را بررسی کنیم از تحلیل واریانس استفاده میکنیم.
آزمون فیشر چیست؟
این آزمون از آماره فیشر برای آزمون فرضیات خود استفاده میکند. آزمون فیشر در مطالعات تحلیل واریانس، مقدار پراکندگی بین میانگینهای گروهها را بررسی میکند.









برای استفاده از آزمون من ویتنی، باید ابتدا چهار شرط زیر را بررسی کنیم و در صورت برقراری آنها میتوانیم به سراغ آزمون من ویتنی برویم:
در نمودار بالا، توزیع نمرات برای زنان و مردان دارای شکل یکسان است. در نمودار سمت چپ، نمیتوان توزیع نمرات مردان را (که با رنگ آبی در نمودار سمت راست مشخص شده) دید، زیرا دو توزیع دقیقاً یکسان هستند (یعنی هر دو توزیع دقیقاً بر هم منطبق هستند به نحوی که مثلاً توزیع آبی رنگ در پشت توزیع قرمز رنگ پنهان شده است). اما در نمودار سمت راست، حتی با وجودی که دو توزیع دارای شکل یکسان هستند، دارای مکان متفاوت هستند (یعنی توزیع یکی از گروهها دارای مقادیر کمتر یا بیشتر در مقایسه با توزیع دیگر است، مثلاً در این نمودار زنان به طور کلی دارای مقادیری بیشتر از مردان هستند).
2- پنجره آزمون من ویتنی به صورت شکل زیر است:
3- متغیر کلسترول را به قسمت فهرست متغیر آزمون و متغیر گروه را به قسمت متغیر گروهبندی همانند شکل زیر وارد میکنیم:
توجه: در پنجره فوق دقت کنید که حتماً گزینه آزمون من ویتنی فعال باشد. هم چنین قسمت مربوط به متغیر گروهبندی باید همانند شکل فوق هایلایت (زردرنگ) شده باشد. برای هایلایت شدن، کافی است روی آن کلیک کنید.4- با کلیک روی گزینه تعیین گروهها (Define Groups) در مرحله 3، پنجره مربوط به آن همانند شکل بعد ظاهر میشود.
5- همانند شکل بعد، در قسمت گروه 1 عدد 1 و در قسمت گروه 2 عدد 2 را وارد میکنیم. اعداد 1 و 2 به این علت هستند که در دادهها گروه رژیمی را با عدد 1 و گروه ورزشی را با عدد 2 نشان داده بودیم. ممکن است متغیر مستقل شامل بیش از دو گروه باشد (مثلاً گروههای رژیمی،ورزشی، دارویی و روانی) و ما علاقهمند به بررسی فقط دو گروه از آن (مثلاً رژیمی و دارویی) باشیم، در این صورت میتوانیم اعداد مربوط به آن دو گروه مورد نظر (یعنی 1 و 3) را در این قسمت وارد کنیم.6- در پنجره گام 5 روی Continue کلیک کنید.7- اگر به دنبال آمارههای توصیفی هم باشیم، میتوانیم در پنجره گام 5 روی Options کلیک کنیم و در پنجره ظاهر شده در شکل بعد، گزینه توصیفیها و چارکها را فعال کنیم.
8- در پنجره گام 7 روی Continue کلیک کنید. با این کار مجدداً به پنجره گام 3 برمیگردیم، منتها با این تفاوت که قسمت مربوط به متغیر گروهبندی اینک تکمیل شده است:
– حال روی Ok کلیک میکنیم که منجر به تولید خروجی آزمون من ویتنی خواهد شد. 10- نحوه گزارش نتایج من ویتنیپس از اجرای آزمون من ویتنی، در خروجی SPSS تعدادی جدول ظاهر میشوند که در ادامه هر کدام از آنها را شرح میدهیم.
با وجودی که آمارههای توصیفی را خودمان درخواست دادیم، این آمارهها برای آزمون من ویتنی چندان مفید نیستند. این امر دو دلیل دارد. یکی آن که برای مقایسه گروهها، به مقادیر هر گروه به طور جداگانه احتیاج داریم، نه به مقادیر ادغام شده دو گروه. در جدول بالا اطلاعات مورد نظر ارائه نشده و لذا نمیتوان بین دو گروه رژیمی و ورزشی هیچ گونه مقایسهای انجام داد.
جدول فوق بسیار مفید است زیرا نشان میدهد کدام گروه میتواند به عنوان گروهی که در کل دارای میزان کلسترول بالاتر است در نظر گرفته شود. این گروه همان گروهی است که دارای میانگین رتبه بالاتر است، یعنی گروه رژیمی با میانگین رتبه 25.00. دقت کنید که استفاده از میانگین رتبه برای مقایسه دو گروه، همان طور که پیشتر نیز ذکر شد، به دلیل تفاوت شکل توزیع این دو گروه است. چنان چه دو گروه دارای شکل مشابه باشند، باید از میانههای آنها برای مقایسه استفاده کرد.
با استفاده از جدول فوق چنین نتیجه میشود که در میزان کلسترول بین دو گروه رژیمی و ورزشی تفاوت معنیدار در سطح 5 درصد وجود دارد (U=110 و p=0.014<0.05). از طرفی چون شکل توزیع نمرات در دو گروه متفاوت است، با استفاده از میانگین رتبهها چنین مشخص میشود که گروه رژیمی با میانگین رتبه 25.00 به طور کلی دارای میزان کلسترول بیشتری نسبت به گروه ورزشی با میانگین رتبه 16.00 است.





































































با توجه به خروجی، چون مقدار معناداری یعنی Sig. کوچکتر از سطح آزمون، یعنی 05/0 شده است، فرضیه صفر را رد میکنیم. بهعبارت دیگر، خروجی نشان میدهد که تفاوت معناداری در معدل دانش آموزان و عدد 15 وجود دارد. با توجه به میانگین نمرات دانش آموزان بعد از اجرای دوره آموزشی تقویتی که 38/16 است، نتیجه میگیریم که معدل دانش آموزان بهطور معناداری از عدد 15 بیشتر است.

با توجه به خروجی فوق، چون مقدار معناداری یعنی Sig. کوچکتر از سطح آزمون، یعنی 05/0 شده است، فرضیه صفر را رد میکنیم. بهعبارت دیگر خروجی نشان میدهد که تفاوت معناداری در میانگین نمرات دانشآموزان قبل و بعد از اجرای دورهی آموزشی تقویتی وجود دارد. با توجه به مقدار میانگینها بعد از اجرای دورهی آموزشی تقویتی، میانگین نمرات به اندازهی 563/1 افزایش مییابد.
همانطور که ملاحظه میکنید، دو مقدار برای معناداری گزارش شده است. در صورتی که فرض برابری واریانسها پذیرفته شود، از اولین مقدار و در غیر این صورت از دومین مقدار استفاده میکنیم. با توجه به مقدار Sig. در ستون دوم که 536/0 است، آزمون لون نشان میدهد که فرض برابری واریانسها پذیرفته شده است. بنابراین، از اولین مقدار معناداری گزارش شده در ستون پنجم استفاده میکنیم یعنی 406/0، و چون این مقدار از 05/0 بیشتر است فرض برابری میانگینها را میپذیریم.

















