ANOVA-one-way

آنالیز واریانس یک طرفه چیست؟-با مثال کاربردی در SPSS

برای توضیح آنالیز واریانس یک طرفه ابتدا بهتر است با یک مثال کاربردی آغاز کنیم.فرض کنید می‌خواهیم میانگین دو جامعه را مقایسه کنیم. مثلاً اگر بخواهیم در یک سازمان بررسی کنیم آیا میانگین حقوق کارمندان زن با میانگین حقوق کارمندان مرد متفاوت است، از آزمون تی استفاده می‌کنیم. اما اگر میانگین بیش از دو جامعه را بخواهیم مقایسه کنیم چطور؟ مثلاً فرض کنید در همان سازمان مذکور، بخواهیم میانگین حقوق کارمندان با سطح تحصیلات مختلف (شامل دیپلم، کارشناسی، کارشناسی ارشد و دکترا) را مقایسه کنیم.در این صورت می‌توانیم از آنالیز واریانس استفاده کنیم. در ادامه به تحلیل واریانس یک‌طرفه در SPSS و همچنین یک مثال کاربردی می پردازیم.

آنالیز واریانس ابزاری آماری است که برای بررسی برابری میانگین‌های دو یا تعداد بیشتری از گروه‌ها استفاده می‌شود تا مشخص شود آیا به طور معنی‌دار با هم متفاوت هستند یا خیر. آنالیز واریانس، اثر یک یا تعداد بیشتری عامل را با مقایسه میانگین‌های نمونه‌های متفاوت، بررسی می‌کند. 

آنالیز واریانس یک‌ طرفه چیست؟

آنالیز واریانس یک‌ طرفه (one-way ANOVA) میانگین‌های دو یا تعدادی بیشتر از گروه‌های مستقل در جامعه را مقایسه می‌کند و هدفش این است که مشخص کند آیا شواهد آماری وجود دارد که میانگین آن گروه‌ها به طور معنی‌دار متفاوت هستند یا خیر. آنالیز واریانس یک‌طرفه یک آزمون پارامتری است.

این آزمون‌ با این نام‌ها نیز شناخته می‌شود: آنوای تک‌عاملی، آنوای یک‌طرفه و آنوای بین‌عاملی. متغیرهایی که در این آزمون استفاده می‌شوند عبارتند از: 1- متغیر وابسته. 2- متغیر مستقل (متغیر گروه‌بندی یا عامل نیز نامیده می‌شود). متغیر مستقل، اعضای جامعه را به چند گروه یا سطح مستقل تقسیم‌بندی می‌کند.

Used-by-ANOVA-one-way

نکته 1: تحلیل واریانس یک‌ طرفه و آزمون تی دو نمونه مستقل هر دو می‌توانند میانگین‌های دو گروه را مقایسه کنند. منتها آنالیز واریانس یک‌طرفه  قادر است میانگین‌های سه یا تعدادی بیشتری از گروه‌ها را نیز مقایسه کند.

نکته 2: اگر متغیر گروه‌بندی (متغیر مستقل) تنها دو گروه داشته باشد، آن گاه نتایج تحلیل واریانس یک‌طرفه و آزمون تی دو نمونه مستقل یکسان خواهد بود. در حقیقت، اگر هر دوی این آزمون‌ها را استفاده کنیم خواهیم دید t2=F، که در آن t آماره آزمون تی دو نمونه مستقل و F آماره آزمون فیشر در تحلیل واریانس یک‌ طرفه است.

شرایط داده‌ها برای آنالیز واریانس یک‌ طرفه

داده‌های مورد استفاده در تحلیل واریانس یک‌طرفه باید شرایط (پذیره‌های) زیر را داشته باشند:

  1. متغیر وابسته، پیوسته باشد (یعنی در مقیاس بازه‌ای یا نسبتی باشد)،
  2. متغیر مستقل، دسته‌ای باشد (یعنی دارای دو یا بیشتر گروه باشد)،
  3. هر سطر از داده‌ها دارای هر دو مقدار متغیر مستقل و متغیر وابسته باشد،
  4. گروه‌ها مستقل باشند، هیچ رابطه‌ای بین آزمودنی‌ها (اعضا) در هر نمونه وجود نداشته باشد. این یعنی:
  • آزمودنی‌های گروه اول نمی‌توانند در گروه دوم نیز باشند،
  • هیچ آزمودنی در هیچ گروهی نمی‌تواند بر آزمودنی‌های گروه‌های دیگر اثر داشته باشد،
  • هیچ گروهی نمی‌تواند بر گروه دیگر اثر داشته باشد.
  1. نمونه‌ای تصادفی از جامعه باشد.
  2. توزیع (تقریباً) نرمال از متغیر وابسته داشته باشیم. در این ارتباط به نکات زیر باید توجه کنیم:
  • توزیع غیرنرمال، مخصوصاً توزیع‌هایی که به طور جدی چولگی دارند، به مقدار زیادی توان آزمون را کاهش می‌دهند،
  • در نمونه‌های متوسط تا بزرگ، عدم نرمال بودن می‌تواند تا حدودی به p-مقدارهای تقریباً دقیق منجر شود.
  1. همگنی واریانس‌ها وجود داشته باشد. یعنی واریانس در همه‌ی گروه‌ها تقریباً برابر باشد. در این مورد داریم:
  • وقتی این پذیره نقض شود و حجم نمونه در گروه‌ها متفاوت باشد، آن گاه p-مقدار برای آزمون F کلی قابل اعتماد نیست. در این شرایط باید از آماره‌های جایگزینی استفاده کرد که شرط برابری واریانس در میان جوامع را در نظر نمی‌گیرند، از قبیل آماره براون-فورس (Browne-Forsythe) یا آماره وِلش (Welch) که در قسمت Options پنجره ANOVA در SPSS قرار دارند.
  • وقتی این پذیره نقض می‌شود، حتی وقتی حجم نمونه گروه‌ها تقریباً برابر باشد، ممکن است نتایج آزمون‌های تعقیبی درست نباشد. وقتی واریانس‌ها نابرابر باشند، باید از آزمون‌های تعقیبی که به شرط برابری واریانس احتیاج ندارند استفاده کرد (مانند آزمون سیِ دانِت (Dunnet)).
  1. هیچ داده‌ی پرتی نباید وجود داشته باشد.

نکته 3: وقتی شرایط نرمال بودن، همگنی واریانس و عدم وجود داده پرت برای آنالیز واریانس یک‌طرفه مهیا نباشد، می‌توان به جای آن از آزمون ناپارامتری کروسکال-والیس (Kruskal-Wallis) استفاده کرد.

در استفاده از آنالیز واریانس یک‌طرفه معمولاً از قوانین سرانگشتی زیر استفاده می‌شود:

  • در هر گروه باید حداقل 6 آزمودنی وجود داشته باشد (البته حجم نمونه‌ی بیشتر بهتر است).
  • طرح‌ها تا حد امکان متوازن باشند. طرح متوازن طرحی است که حجم نمونه در گروه‌ها یکسان است. در طرح‌هایی که به طور شدید نامتوازن باشند امکان نقض پذیره‌هایی که ذکر شد زیاد است و منجر به عدم اعتبار نتایج آزمون F می‌شوند.

فرضیات

فرضیه صفر و فرضیه یک در آنالیز واریانس یک‌ طرفه به صورت زیر بیان می‌شود:

(میانگین‌های هر k گروه برابر هستند)   h0=m1=m2=m3=...=mk    

                                                                                                                                        

H1

                                                                                      حداقل یکی از میانگین‌ها با بقیه متفاوت است.

که در آن H1 میانگین گروه i ام جامعه (i=1,2,…,k) است.

نکته 4: آنالیز واریانس یک‌طرفه یک آزمون کلی‌نگر است زیرا آزمون F ، معنی‌داری کل مدل را به طور کلی نشان می‌دهد؛ یعنی نشان می‌دهد آیا هیچ تفاوت معنی‌داری در میانگین‌های بین هر کدام از گروه‌ها وجود دارد یا خیر. به عبارت دیگر این آزمون بیان می‌کند حداقل یکی از میانگین‌ها با بقیه متفاوت است. اما این آزمون تعیین نمی‌کند کدام یک از میانگین‌ها متفاوت است. برای تعیین این که دقیقاً کدام یک از جفت‌های میانگین‌ها به طور معنی‌دار متفاوت هستند به آزمون‌های تعقیبی نیاز است.

آماره آزمون

آماره آزمون برای تحلیل واریانس یک‌طرفه با F نشان داده می‌شود. برای یک متغیر مستقل با k گروه، آماره F بررسی می‌کند آیا میانگین‌های گروه‌ها به طور متفاوت معنی‌دار هستند. برای محاسبه‌ی جملاتی که در فرمول F هستند از جدول زیر استفاده می‌شود:

f-formulas

که در آن:

explain-table

آماره F به صورت زیر محاسبه می‌شود:

F=MSR/MSE

در توضیحات بالا، تیمار (مدل) و خطا رایج‌ترین اصطلاحات مورد استفاده در متون علمی و متون سنتی طرح آزمایش‌ها هستند. در علوم اجتماعی، از اصطلاح بین‌گروهی برای تیمار و درون‌گروهی برای خطا استفاده می‌شود. در SPSS نیز از همین اصطلاحات استفاده می‌شود.

ایجاد فایل داده

در فایل داده‌ها باید حداقل دو متغیر وجود داشته باشد که در هر ستون نمایش داده می‌شوند. متغیر مستقل باید از نوع دسته‌ای یعنی اسمی (nominal) یا رتبه‌ای (ordinal) و شامل حداقل دو گروه باشد. متغیر وابسته نیز باید پیوسته (scale) باشد. هر سطر از داده‌ها باید اطلاعات مربوط به یک آزمودنی جداگانه را نشان دهد.

یکی از آزمون ها و روش های پر کاربرد در مباحث آماری پایان نامه آنالیز واریانس است، شما می توانید از افراد متخصص در حوزه آماری برای انجام آنالیز واریانس یک طرفه استفاده کنید.

تحلیل واریانس یک‌طرفه در SPSS

برای اجرای تحلیل واریانس یک‌ طرفه در SPSS از مسیر زیر اقدام می‌کنیم:

                                                                                                                               Analyze > Compare Means > One-Way ANOVA

Analyze-One-Way-ANOVA-in-SPSS

سپس در پنجره‌ی ظاهر‌شده، باید متغیرهای حاضر در تحلیل را مشخص کنیم. این پنجره همانند شکل بعد است. در این پنجره همگی متغیرهای حاضر در فایل داده‌ها ظاهر می‌شوند که باید با استفاده از کلید‌های فلش آبی‌رنگ آن‌ها را به قسمت‌های مربوطه منتقل کنیم.

dependent-list-One-Way-ANOVA-in-SPSS

در پنجره‌ی فوق، قسمت‌های مختلف بدین شرح است:

A- فهرست متغیرهای وابسته: در این قسمت متغیر یا متغیرهایی وارد می‌شوند که قصد مقایسه‌ی میانگین‌های سطوح آن‌ها را داریم. اگر در این قسمت بیش از یک متغیر وارد کنیم، آن گاه نرم‌افزار به طور جداگانه برای هر کدام از آن‌ها آنالیز واریانس یک‌ طرفه انجام می‌دهد.

B- عامل: متغیر مستقل است که قبلاً توضیحات آن ارائه شد. 

C- مقابله‌ها: استفاده از این گزینه اختیاری است و منجر به انجام مقایسه‌های برنامه‌ریزی شده بعد از اجرای آزمون آنالیز واریانس کلی می‌شود. پنجره مربوط به آن در شکل بعد آمده است:

contrasts-One-Way-ANOVA-in-SPSS

وقتی آزمون F اولیه وجود تفاوت معنی‌دار بین میانگین گروه‌ها را نشان دهد، مقابله‌ها برای تعیین این که کدام یک از میانگین‌ها به طور معنی‌دار متفاوت هستند می‌تواند استفاده شود. البته از آن زمانی می‌توان استفاده کرد که فرضیه‌های مشخصی درباره‌ی میانگین‌ها برای آزمون کردن داشته باشیم. در حقیقت، مقابله‌ها پیش از آغاز آنالیز واریانس یک طرفه تعیین می‌شوند. مقابله‌ها واریانس را به مؤلفه‌های تشکیل‌دهنده‌ی آن تقسیم می‌کنند. از آن‌ها برای استفاده از مقایسه‌های نامتعامد، مقابله‌های استاندارد و مقابله‌های چندجمله‌ای (تحلیل روند) استفاده می‌شود.

D- آزمون‌های تعقیبی: این آزمون‌ها با عنوان مقایسات چندگانه نیز شناخته می‌شوند و استفاده از گزینه مربوطه اختیاری است. پنجره مربوط به آن همانند شکل زیر است و در آن آزمون تعقیبی دلخواه را می‌توان فعال کرد:

Post-Hoc-Multiple-Comparisons-One-Way-ANOVA-in-SPSS

در پنجره‌ی فوق، قسمت‌های مختلف بدین شرح است:

  1. برابری واریانس: این قسمت مربوط به آزمون‌های تعقیبی است که به شرط همگنی واریانس نیاز دارد (همه گروه‌ها دارای واریانس یکسان هستند).
  2. آزمون: در آزمون دانِت، به طور پیش‌فرض، یک فرضیه دوطرفه در آزمون‌های تعقیبی مورد آزمون قرار می‌گیرد. اما به جای آن می‌توان یک فرضیه یک‌طرفه را نیزآزمون کرد. ابتدا آزمون دانت را علامت بزنید و سپس تعیین کنید آیا دسته‌ی مربوط به گروه کنترل در اولین یا آخرین گروه متغیر مستقل مورد نظر ما است. در قسمت آزمون (Test)، روی <Control یا >Control کلیک کنید. در این فرضیات باید تعیین کنیم آیا ادعای ما بر اساس کوچک‌تر بودن میانگین گروه کنترل از گروه دیگر است (>Control) یا بر اساس بزرگ‌تر بودن میانگین گروه کنترل از گروه دیگر است (<Control).
  3. عدم برابری واریانس: در این قسمت آزمون‌هایی قرار دارند که به شرط برابری واریانس گروه‌ها احتیاج ندارند. 
  4. سطح معنی‌داری: مقدار مورد نظر برای سطح معنی‌داری را در این قسمت وارد می‌کنیم. مقدار آن به طور پیش فرض برابر با 05/0 است.

آزمون‌های تعقیبی را زمانی می‌توان استفاده کرد که آزمون F وجود تفاوت‌های معنی‌دار بین میانگین‌های گروه‌ها را نشان می‌دهد. این ازمون‌ها زمانی به کار می‌آیند که بخواهیم تعیین کنیم کدام میانگین‌ها به طور مشخص با بقیه به طور معنی‌دار متفاوت هستند و از قبل نیز هیچ فرضیه‌ای در مورد آن‌ها نداریم. آزمون‌های تعقیبی همانند آزمون t جفت‌های میانگین‌ها را مقایسه می‌کنند، اما برخلاف آزمون t ، این آزمون‌ها مقدار معنی‌داری را برای لحاظ در مقایسات چندگانه تصحیح می‌کنند.

E- گزینه‌ها: با کلیک روی این گزینه، پنجره‌ای ظاهر می‌شود که در آن آماره‌هایی را که در خروجی ظاهر می‌شوند تعیین می‌کنیم. این گزینه‌ها عبارتند از: آماره‌های توصیفی، اثرات ثابت و تصادفی، آزمون همگنی واریانس، آزمون براون-فورس و آزمون ولش، رسم نمودار میانگین‌ها، و چگونگی برخورد با داده‌های گمشده. پنجره مربوطه همانند شکل زیر است:

Options-One-Way-ANOVA-in-SPSS

پیاده سازی تحلیل واریانس یک طرفه در SPSS تا اینجا قدم به قدم بیان شد، حال در ادامه شما با یک مثال کاربردی روبرو می‌شوید، اما چنانچه شما به مباحث تحلیل آماری علاقه دارید می توانید مطالب بیشتری را در مرجع تحلیل و آموزش آماری ببینید.

مثال آنالیز واریانس یک طرفه

دراین جا از مثالی استفاده می‌کنیم که نتایج آن تقریباً واضح است و هدف، نشان دادن عملیات انجام‌شده در پس تحلیل واریانس یک‌ طرفه است.

بیان مسئله: در فایل داده‌های این مثال، Sprint زمان انجام دوی سرعت (بر حسب ثانیه) در یک فاصله‌ی مشخص، و Smoking نشان‌دهنده‌ی وضعیت مصرف سیگار (صفر: غیرسیگاری، یک: قبلاً سیگاری و دو: در حال حاضر سیگاری) است. از آنوا برای آزمون وجود تفاوت معنی‌دار در زمان دوی سرعت بر حسب وضعیت مصرف سیگار استفاده می‌شود. متغیر وابسته به صورت زمان دوی سرعت و متغیر مستقل به صورت وضعیت مصرف سیگار است.

پیش از انجام آزمون، نگاهی به آماره‌های توصیفی متغیرها می‌اندازیم. برای این کار از مسیر زیر استفاده می‌کنیم:

Analyze > Compare Means > Means

در این صورت خروجی زیر ظاهر می‌شود:

Descriptive-statistics-of-variables

در خروجی فوق، میانگین دوی سرعت 6.6 با انحراف معیار 1.2 است (با تعداد 353 آزمودنی معتبر). در این خروجی، هم چنین میانگین و انحراف معیار میانگین دوی سرعت در هر کدام از گروه‌های نوع مصرف سیگار مشاهده می‌شود. توجه کنید در این مثال تعداد کل آزمودنی‌ها 374 است که به دلیل وجود داده‌های گم‌شده در برخی گروه‌ها، در خروجی فوق تعداد کل آزمودنی‌ها 353 نمایش داده شده است. در نهایت می‌توان با استفاده از نمودار جعبه‌ای به ایده‌ای کلی از توزیع داده‌ها بر حسب گروه‌ها دست یافت:

Box-diagram-ANOVA_in_SPSS

بر اساس نمودار جعبه‌ای، می‌توان دید هیچ داده‌ی پرتی وجود ندارد، توزیع داده‌ها تقریباً متقارن است، و مرکز توزیع گروه‌ها چندان متفاوت با هم به نظر نمی‌آیند. اما میانه زمان دوی سرعت برای غیرسیگاری‌ها کمی سریع‌تر (بزرگ‌تر) از میانه‌ی آن برای گروه قبلاً سیگاری‌ها بوده است.

اجرای روال: ابتدا از مسیری که پیشتر توضیح داده شد، پنجره‌ی آنالیز واریانس یک‌ طرفه را باز می‌کنیم. در قسمت متغیر وابسته Sprint و در قسمت فاکتور Smoking را وارد می‌کنیم. با کلیک روی Options، نمودار میانگین‌ها را انتخاب می‌کنیم و در نهایت OK را می‌زنیم.

اولین خروجی ظاهر‌شده، جدول آنالیز واریانس است که به صورت شکل زیر است:

table-of-ANOVA_in_SPSS

در خروجی هم‌چنین نمودار میانگین‌ها نیز به نمایش درآمده است:

Graph-of-averages-ANOVA_in_SPSS

نمودار میانگین‌ها نمایشی بصری از آن مواردی است که در جدول مقایسه میانگین‌ها دیدیم. نقاط روی این نمودار به صورت میانگین هر گروه است. در این نمودار مشاهده‌ آن که سیگاری‌های حال حاضر میانگین دوی سرعت کندتری دارند ساده‌تر است. هم چنین به سادگی نیز می‌توان دید که غیرسیگاری‌ها سریع‌ترین میانگین دوی سرعت را دارند.

تفسیر خروجی آنالیز واریانس یک طرفه

با توجه به نتایج جدول تحلیل واریانس یک طرفه ، نتیجه می‌گیریم که میانگین دوی سرعت در حداقل یکی از گروه‌های وضعیت مصرف سیگار متفاوت است (F2,350=9.209, p<0.001). توجه کنید که در این حالت آزمون تحلیل واریانس نمی‌گوید دقیقاَ کدام میانگین(ها) با بقیه متفاوت هستند. برای تشخیص آن، باید از آزمون‌های تعقیبی (مقایسات چندگانه) به شرحی که پیشتر گفته شد استفاده کرد.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *