Mann-Whitney-U-test

آزمون من ویتنی چیست؟ اجرای 10 مرحله‌ای آن در SPSS با مثال کاربردی

آزمون من ویتنی (Mann–Whitney U test) یک آزمون ناپارامتری است که هدف آن به سادگی قابل بیان است. ابتدا با مثالی ساده به بیان مفهوم آزمون من ویتنی می پردازیم و سپس شرایط استفاده از آن و در آخر با مثالی ساده آزمون من ویتنی را در SPSS اجرا خواهیم کرد، خروجی‌های مورد نظر این آزمون را نیز نمایش خواهیم داد.

آزمون من ویتنی (Mann–Whitney U test) با بیانی ملموس

در این آزمون یک متغیر هدف داریم که می‌خواهیم بدانیم آیا بین دو گروه جداگانه از افراد یا اشیا دارای تفاوت است یا خیر. به عنوان مثال، نظر افراد راجع به طعم یک نوع بستنی را در نظر بگیرید که در قالب سه گزینه «خوب»، «متوسط» و «بد» ارائه می‌شود. حال می‌خواهیم بدانیم آیا بین نظر کودکان با نظر بزرگسالان در مورد این بستنی تفاوتی وجود دارید یا خیر. در این صورت می‌توانیم از آزمون من ویتنی استفاده کنیم. در این مثال، متغیر هدف (متغیر وابسته) نظر افراد و دو گروه مورد نظر همان کودکان و بزرگسالان (متغیر مستقل) هستند.

آزمون من ویتنی معادل آزمون تی استودنت دو نمونه مستقل است. این آزمون برای مقایسه تفاوت‌ها بین دو گروه مستقل از افراد یا اشیا استفاده می‌شود که در آن متغیر وابسته از نوع ترتیبی یا کمّی غیرنرمال باشد. به عنوان مثال، می‌توانیم از آزمون من ویتنی استفاده و بررسی کنیم آیا نگرش به تبعیض در پرداخت دستمزد بر حسب جنسیت تفاوت دارد یا خیر.

در این مثال متغیر وابسته، نگرش به تبعیض در پرداخت دستمزد است که در مقیاس ترتیبی سنجیده می‌شود و متغیر مستقل، جنسیت است که در دو گروه مستقل مردان و زنان سنجیده می‌شود. به عنوان مثالی دیگر، از آزمون من ویتنی می‌توان در بررسی وجود تفاوت در میزان حقوق بر حسب سطح تحصیلی استفاده کرد که در آن متغیر وابسته میزان حقوق و از نوع کمّی غیرنرمال است و متغیر مستقل نیز سطح تحصیلی در گروه دیپلمه و دانشگاهی است.

شرایط استفاده از آزمون من ویتنی

Mann-Whitney-U-test-Terms-of-Use

برای استفاده از آزمون من ویتنی، باید ابتدا چهار شرط زیر را بررسی کنیم و در صورت برقراری آن‌ها می‌توانیم به سراغ آزمون من ویتنی برویم:

1- متغیر وابسته باید در مقیاس ترتیبی یا کمّی اندازه‌گیری شده باشد. به عنوان مثال‌هایی از مقیاس ترتیبی می‌توان از طیف لیکرت (مثلاً 5 گزینه‌ای با گزینه‌های «کاملاً مخالف» تا «کاملاً موافق»)، سطح تحصیلات (دیپلم، فوق دیپلم، کارشناسی و کارشناسی ارشد) و … نام برد. مثال‌هایی از متغیرهای کمّی نیز به صورت نمره امتحان (صفر تا 20)، نمره هوشی (آزمون IQ)، وزن (بر حسب کیلوگرم) و … نام برد.

2- متغیر وابسته باید از دو گروه مستقل تشکیل شده باشد. به عنوان مثال جنسیت (دو گروه زنان و مردان)، وضعیت استخدامی (شاغل و غیرشاغل)، وضعیت مصرف سیگاری (سیگاری و غیرسیگاری) را می‌توان نام برد.

3- مشاهدات حاضر در نمونه باید مستقل باشند، یعنی نباید هیچ ارتباطی بین مشاهدات در هر گروه یا بین خود گروه‌ها وجود داشته باشد. به عبارت دیگر، باید افراد حاضر در یک گروه با افراد حاضر در گروه دیگر متفاوت باشند. چنان چه افراد حاضر در یک گروه در گروه دیگر نیز حاضر باشند، آن گاه دیگر نمی‌توان از آزمون من ویتنی استفاده کرد و باید به سراغ آزمون‌های دیگر (مثلاً آزمون ویلکاکسون) رفت. لذا در بررسی این شرط باید خیلی دقت داشته باشیم.

4- از آزمون من ویتنی می‌توان کلاً برای زمانی استفاده کرد که داده‌های متغیر وابسته در هر کدام از دو گروه متغیر مستقل به طور نرمال توزیع نشده‌اند. اما برای دانستن نحوه تفسیر نتایج آزمون من ویتنی، باید تعیین کنیم آیا دو توزیع (یعنی توزیع نمرات متغیر وابسته برای هر دو گروه متغیر مستقل، مثلاً توزیع نمرات وزن زنان و توزیع نمرات وزن مردان) دارای شکل یکسان هستند یا خیر. برای توضیح بیشتر، ابتدا شکل بعد را ببینید:

Mann-Whitney-U-test-Distribution-chart

در نمودار بالا، توزیع نمرات برای زنان و مردان دارای شکل یکسان است. در نمودار سمت چپ، نمی‌توان توزیع نمرات مردان را (که با رنگ آبی در نمودار سمت راست مشخص شده) دید، زیرا دو توزیع دقیقاً یکسان هستند (یعنی هر دو توزیع دقیقاً بر هم منطبق هستند به نحوی که مثلاً توزیع آبی رنگ در پشت توزیع قرمز رنگ پنهان شده است). اما در نمودار سمت راست، حتی با وجودی که دو توزیع دارای شکل یکسان هستند، دارای مکان متفاوت هستند (یعنی توزیع یکی از گروه‌ها دارای مقادیر کم‌تر یا بیشتر در مقایسه با توزیع دیگر است، مثلاً در این نمودار زنان به طور کلی دارای مقادیری بیشتر از مردان هستند).

وقتی داده‌ها را تحلیل می‌کنیم، بسیار غیرمحتمل است که شکل دو توزیع کاملاً یکسان باشند، اما ممکن است دارای شکل مشابه باشند. اگر دارای شکل مشابه باشند، می‌توان از آزمون من ویتنی برای مقایسه میانه‌های (median) متغیر وابسته در هر کدام از گروه‌های متغیر مستقل استفاده کرد. اما اگر شکل توزیع‌ها مشابه نباشند، آن گاه از آزمون ویتنی تنها می‌توان برای مقایسه میانگین رتبه‌ها (mean rank) استفاده کرد.

بنابراین هنگام اجرای آزمون من ویتنی، باید از SPSS برای تعیین مشابه یا متفاوت بودن شکل توزیع‌ها نیز استفاده کرد. دقت کنید که بررسی شروط 1، 2 و 3 در SPSS انجام نمی‌شود و تعیین برقرار بودن یا نبودن آن‌ها بستگی به طرح پژوهش ما دارد. اما شرط 4 را می‌توان در SPSS بررسی کرد و بنا به نتیجه آن در نهایت میانه یا میانگین رتبه‌های دو گروه را می‌توان مقایسه نمود. در ادامه، انجام آزمون من ویتنی را در مثال خواهیم دید.

آزمون من ویتنی (Mann–Whitney U test) در SPSS

همان طور که می‌دانیم میزان کلسترول موجود در خون افراد با خطر وقوع بیماری قلبی در ارتباط است، به طوری که میزان بیشتر کلسترول نشان‌دهنده خطر بیشتر و میزان کم‌تر آن نشان‌دهنده سطح کم‌تری از خطر است. اگر بتوانیم میزان کلسترول را کاهش دهیم، میزان خطر ابتلا به بیماری قلبی نیز کاهش می‌یابد. این امر مشخص است که داشتن اضافه وزن یا نداشتن فعالیت بدنی، هر دو، میزان کلسترول در خون را افزایش می‌دهد. اما مشخص نیست دقیقاً کدام یک از این دو برای پایین آوردن میزان کلسترول مفیدتر است. بنابراین، یک پژوهشگر تصمیم گرفته بررسی کند کدام یک از این دو مورد برای کاهش سطح کلسترول موثر است.

برای این منظور، نمونه‌ای تصادفی به حجم 40 از مردانی را که اضافه وزن دارند و از لحاظ بدنی نیز غیرفعال هستند گرداوری شد. سپس این نمونه به طور تصادفی به دو گروه 20 تایی تقسیم شد: گروه اول تحت رژیم غذایی با کالری کم قرار گرفت و به عنوان گروه رژیمی نام‌گذاری شد؛ گروه دوم تحت تمرینات ورزشی قرار گرفت و به عنوان گروه ورزشی نام‌گذاری گردید. برای تعیین آن که کدام یک از این دو برنامه موثرتر بود، میزان کلسترول بین دو گروه در انتهای برنامه مقایسه شد.

داده‌های این مثال به صورت شکل بعد وارد شده است. متغیر وابسته میزان کلسترول است (Cholesterol) و متغیر مستقل (Group) که شامل دو گروه به صورت گروه 1 یعنی گروه رژیمی (diet) و گروه 2 یعنی گروه ورزشی (exercise) است. چنین فرض می‌شود که متغیر وابسته از نوع کمی غیرنرمال است، لذا از آزمون من ویتنی استفاده خواهد شد.

در 10 گام بعدی نشان می‌دهیم چه‌طور می‌توان داده‌ها را آزمون من ویتنی را برای وقتی که توزیع‌ها دارای شکل متفاوت هستند انجام داد. در این مثال فرض شده توزیع‌ها دارای شکل متفاوت هستند و بنابراین از میانگین رتبه‌ها به جای میانه متغیر وابسته مقایسه خواهند شد. نحوه بررسی شکل توزیع‌ها و تشخیص تفاوت یا مشابهت آن‌ها در SPSS در مطالب آتی وبلاگ توضیح داده خواهد شد.

1- ابتدا از مسیر زیر به پنجره آزمون ویتنی وارد می‌شویم:

Mann-Whitney-U-test-table-in-SPSS

2- پنجره آزمون من ویتنی به صورت شکل زیر است:

Mann-Whitney-U-test-table-in-SPSS-two-idependet-samples

3- متغیر کلسترول را به قسمت فهرست متغیر آزمون و متغیر گروه را به قسمت متغیر گروه‌بندی همانند شکل زیر وارد می‌کنیم:

Mann-Whitney-U-test-table-in-SPSS-two-idependet-samples2

توجه: در پنجره فوق دقت کنید که حتماً گزینه آزمون من ویتنی فعال باشد. هم چنین قسمت مربوط به متغیر گروه‌بندی باید همانند شکل فوق هایلایت (زردرنگ) شده باشد. برای هایلایت شدن، کافی است روی آن کلیک کنید.

4- با کلیک روی گزینه تعیین گروه‌ها (Define Groups) در مرحله 3، پنجره مربوط به آن همانند شکل بعد ظاهر می‌شود.

Mann-Whitney-U-test-table-in-SPSS-two-Define-Groups

5- همانند شکل بعد، در قسمت گروه 1 عدد 1 و در قسمت گروه 2 عدد 2 را وارد می‌کنیم. اعداد 1 و 2 به این علت هستند که در داده‌ها گروه رژیمی را با عدد 1 و گروه ورزشی را با عدد 2 نشان داده بودیم. ممکن است متغیر مستقل شامل بیش از دو گروه باشد (مثلاً گروه‌های رژیمی،ورزشی، دارویی و روانی) و ما علاقه‌مند به بررسی فقط دو گروه از آن (مثلاً رژیمی و دارویی) باشیم، در این صورت می‌توانیم اعداد مربوط به آن دو گروه مورد نظر (یعنی 1 و 3) را در این قسمت وارد کنیم.

6- در پنجره گام 5 روی Continue کلیک کنید.

7- اگر به دنبال آماره‌های توصیفی هم باشیم، می‌توانیم در پنجره گام 5 روی Options کلیک کنیم و در پنجره ظاهر شده در شکل بعد، گزینه توصیفی‌ها و چارک‌ها را فعال کنیم.

Mann-Whitney-U-test-table-in-SPSS-two-idependet-samples-Options

8- در پنجره گام 7 روی Continue کلیک کنید. با این کار مجدداً به پنجره گام 3 برمی‌گردیم، منتها با این تفاوت که قسمت مربوط به متغیر گروه‌بندی اینک تکمیل شده است:

Mann-Whitney-U-test-table-in-SPSS-two-idependet-samples-Continue

– حال روی Ok کلیک می‌کنیم که منجر به تولید خروجی آزمون من ویتنی خواهد شد.

 

10- نحوه گزارش نتایج من ویتنی

پس از اجرای آزمون من ویتنی، در خروجی SPSS تعدادی جدول ظاهر می‌شوند که در ادامه هر کدام از آن‌ها را شرح می‌دهیم.

آماره‌های توصیفی

جدول آماره‌های توصیفی در این مثال همانند شکل زیر است:

Mann-Whitney-U-test-table-descriptive-statistics

با وجودی که آماره‌های توصیفی را خودمان درخواست دادیم، این آماره‌ها برای آزمون من ویتنی چندان مفید نیستند. این امر دو دلیل دارد. یکی آن که برای مقایسه گروه‌ها، به مقادیر هر گروه به طور جداگانه احتیاج داریم، نه به مقادیر ادغام شده دو گروه. در جدول بالا اطلاعات مورد نظر ارائه نشده و لذا نمی‌توان بین دو گروه رژیمی و ورزشی هیچ گونه مقایسه‌ای انجام داد.

دوم آن که ما آزمون من ویتنی را انتخاب کردیم چون همان طور که پیشتر گفتیم، نمرات متغیر وابسته در گروه‌ها دارای توزیع نرمال نیست.بنابراین نمی‌دانیم آیا از میانگین و انحراف معیار باید استفاده کنیم یا از میانه و دامنه بین چارکی (interquartile range). منظور از دامنه بین چارکی همان صدک 25ام تا 75ام است و از آن به عنوان جایگزین انحراف معیار برای زمانی که داده‌ها نرمال نیستند استفاده می‌شود. بنابراین به خاطر دلایل مذکور، استفاده از جدول فوق توصیه نمی‌شود.

جدول رتبه‌ها

جدول رتبه‌ها اولین جدولی است که اطلاعات مخصوص به آزمون من ویتنی را ارائه می‌کند. این جدول میانگین رتبه و مجموع رتبه‌ها برای هر کدام از دو گروه مورد آزمون را نشان می‌دهد:

Mann-Whitney-U-test-table-ranks

جدول فوق بسیار مفید است زیرا نشان می‌دهد کدام گروه می‌تواند به عنوان گروهی که در کل دارای میزان کلسترول بالاتر است در نظر گرفته شود. این گروه همان گروهی است که دارای میانگین رتبه بالاتر است، یعنی گروه رژیمی با میانگین رتبه 25.00. دقت کنید که استفاده از میانگین رتبه برای مقایسه دو گروه، همان طور که پیشتر نیز ذکر شد، به دلیل تفاوت شکل توزیع این دو گروه است. چنان چه دو گروه دارای شکل مشابه باشند، باید از میانه‌های آن‌ها برای مقایسه استفاده کرد.

جدول آماره‌های آزمون

این جدول به ما مقدار معنی‌داری آزمون را نشان می‌دهد. این جدول به ویژه مقدار آماره آزمون U به همراه مقدار معنی‌داری مجانبی را ارائه می‌کند:

Mann-Whitney-U-test-table-test-statistics

با استفاده از جدول فوق چنین نتیجه می‌شود که در میزان کلسترول بین دو گروه رژیمی و ورزشی تفاوت معنی‌دار در سطح 5 درصد وجود دارد (U=110 و p=0.014<0.05). از طرفی چون شکل توزیع نمرات در دو گروه متفاوت است، با استفاده از میانگین رتبه‌ها چنین مشخص می‌شود که گروه رژیمی با میانگین رتبه 25.00 به طور کلی دارای میزان کلسترول بیشتری نسبت به گروه ورزشی با میانگین رتبه 16.00 است.

نکته: در جدول فوق دو مقدار برای مقدار معنی‌داری ارائه شده است: معنی‌داری مجانبی (Asymp. Sig.) و معنی‌داری دقیق (Exact Sig.). اگر حجم نمونه هر دو گروه بزرگ‌تر از 10 باشد، آن گاه می‌توان از حجم نمونه مجانبی استفاده کرد و در غیر این صورت (حجم حداقل یکی از گروه‌ها کوچک‌تر یا مساوی 10 باشد) باید از معنی‌داری دقیق استفاده کرد. در مثال حاضر نیز، همان طور که در جدول رتبه‌ها ملاحظه می‌شود، هر کدام از گروه‌ها دارای حجم 20 است و لذا می‌توان از مقدار معنی‌داری مجانبی استفاده کرد.

آزمون من ویتنی (Mann–Whitney U test)  در عین سادگی در مفهوم دارای نکات مهمی است که در صورت عدم در نظر گرفتن آن‌ها، نتایج بدست آمده از آن دارای اعتبار کافی نخواهد بود. برای دانستن این نکات و چگونگی رعایت آن‌ها و هم چنین اجرا و تفسیر کامل نتایج آزمون من ویتنی می‌توانید از خدمات مشاوره آماری شرکت آمارپیشرو استفاده کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *