بلاگ آمار پیشرو - مرجع بروزترین و معتبرترین مقالات آماری

تحلیل واریانس چیست؟-آماره فیشر

توسط لادن عباس نیا جولای 19, 2020

نوشته شده توسط لادن عباس نیا

[block id=”breadcrumb”]

تحلیل واریانس یکی از مباحث پر تکرار آماری است. در این مقاله قصد داریم ابتدا تحلیل وارینس را با مثالی ملموس و ساده توضیح دهیم و کاربرد آن را مطرح خواهیم کرد. در ادامه آزمون فیشر و تاثیر آن در آنالیز واریانس یکطرفه مطرح خواهد شد. در انتها هم علت استفاده از واریانس را در آزمون میانگین ها مطرح خواهیم کرد.

تحلیل واریانس چیست؟

فرض کنید می‌خواهیم در یک سازمان اداری بررسی کنیم آیا سطح تحصیلات بر میزان حقوق دریافتی تأثیر دارد. چون میزان حقوق، متغیری کمی و سطح تحصیلات متغیری کیفی است، برای این مسئله می‌توانیم از تحلیل واریانس (آنوا یا ANOVA) استفاده کنیم. برای این کار ابتدا میانگین میزان حقوق دریافتی را در هر یک از سطوح تحصیلات در نظر می‌گیریم. سپس توسط تحلیل واریانس بررسی می‌کنیم آیا میانگین‌های حقوق در سطوح تحصیلی مختلف با هم متفاوت هستند یا خیر.در صورت پذیرش فرضیه عدم برابر بودن میانگین‌های حقوق در سطوح مختلف تحصیلی، می‌توانیم نتیجه بگیریم سطح تحصیلات بر میزان حقوق دریافتی تأثیر دارد. در حقیقت با استفاده از تحلیل واریانس می‌توان بررسی آیا میانگین متغیر پاسخ در سطوح عامل مورد نظر دارای تفاوت هستند یا خیر.اما تحلیل واریانس شامل انواع بسیار زیادی است. معروف‌ترین انواع تحلیل واریانس، تحلیل واریانس یک‌طرفه و تحلیل واریانس دوطرفه است. تحلیل واریانس از آزمون‌‌های فیشر (F) برای بررسی برابر بودن میانگین‌ها استفاده می‌کند که متعلق به سه یا تعدادی بیشتر از گروه‌ها هستند. در این مطلب، به تعدادی از سوالات مربوط به آزمون‌های فیشر (Fisher test) پاسخ می‌دهیم که برای بسیاری از محققین مورد ابهام است. سوالاتی از قبیل:

آزمون فیشر چگونه عمل می‌کند؟
چرا از آنالیز واریانس‌ها برای آزمون میانگین‌ها استفاده می‌کنیم؟

در این مطلب از مفاهیم و نمودارهای مختلف برای پاسخ به سوالات فوق در قالب آنالیز واریانس یک‌طرفه استفاده می‌کنیم.

آزمون فیشر و آماره های فیشر چیست؟

عبارت آزمون فیشر بر اساس این حقیقت است که این آزمون‌ها از آماره فیشر برای آزمون فرضیات استفاده می‌کنند. آماره فیشر برابر با نسبت دو واریانس است و از نام دانشمند آمارشناس، رونالد فیشر برگرفته شده است. واریانس‌ها پراکندگی داده‌ها در اطراف میانگین را اندازه‌گیری می‌کنند. واریانس‌های با مقدار بیشتر وقتی اتفاق می‌افتند که نقاط داده‌ها تمایل به قرارگیری در فواصل دورتری از میانگین را داشته باشند.اما تفسیر واریانس‌ها به طور مستقیم کار مشکلی است، زیرا واحد اندازه‌گیری آن‌ها مجذور (توان دوم) واحد اندازه‌گیری داده‌ها است. اگر جذر واریانس را در نظر بگیریم، انحراف معیار به دست می‌آید که تفسیر آن ساده‌تر است زیرا واحد اندازه‌گیری آن با واحد داده‌ها یکسان است. گرچه تفسیر واریانس‌‌ها به طور مستقیم سخت است، اما در برخی آزمون‌های آماری از آن‌ها استفاده می‌شود.آماره فیشر نسبت دو واریانس، یا به طور دقیق‌تر، نسبت دو میانگین مربعات (mean squares) است. میانگین مربعات همان واریانس است که بر درجات آزادی تقسیم شده، همان درجات آزادی که برای براورد واریانس به کار گرفته شده است.حال بیایید دقیق‌تر نگاه کنیم. واریانس، مجموع مربعات انحرافات از میانگین است. هر چه نمونه‌ بزرگ‌تری داشته باشیم، تعداد بیشتری مربع انحرافات برای جمع کردن داریم. نتیجه آن که هر چه مشاهدات بیشتری را اضافه کنیم، این مجموع بزرگ‌تر می‌شود. با به کارگیری درجات آزادی، میانگین‌ مربعات نیز نقش ایفا می‌کند. میانگین مربعات، تفاضل براورد هر اندازه‌گیری از واریانس را با توجه به تعداد اندازه‌گیری‌ها محاسبه می‌کند. اگر از میانگین مربعات استفاده نکنیم، واریانس‌ها قابل مقایسه نیستند و نسبت واریانس‌ها برای آماره فیشر منطقی نخواهد بود.با توجه به این که آزمون‌های فیشر نسبت دو واریانس را ارزیابی می‌کنند، ممکن است فکر کنیم تنها برای بررسی برابری واریانس‌ها به کار می‌آیند. اما در حقیقت آزمون‌های فیشر برای کارهای بیشتری نیز قابل استفاده هستند. آزمون‌های فیشر به طور جالبی انعطاف‌پذیرند، چون می‌توان واریانس‌های مختلفی را در آن‌ها به کار برد و انواع مختلفی از فرضیات را آزمون کرد. آزمون‌های فیشر می‌توانند برای مقایسه برازش مدل‌های مختلف، آزمون معناداری کلی مدل‌های رگرسیون، آزمون جملات خاص در مدل‌های خطی و بررسی برابری مجموعه‌ای از میانگین‌ها به کار روند.

آزمون فیشر در آنالیز واریانس یک‌طرفه

در آنالیز واریانس یک‌طرفه آزمون می‌کنیم آیا مجموعه‌ای از میانگین‌ها با هم برابرند یا خیر. برای آن که از آزمون فیشر برای این منظور استفاده کنیم، باید از واریانس‌های مناسب در نسبت استفاده کنیم. آماره فیشر در آنالیر واریانس یک‌طرفه بدین صورت تعریف می‌شود:

برای این که ببینیم آزمون‌های فیشر چگونه عمل می‌کنند، از یک مثال آنالیز واریانس یک‌طرفه استفاده می‌کنیم. فرض کنید در مطالعه‌ای یک عامل داریم و می‌خواهیم اثر آن را بر یک متغیر پاسخ کمّی بررسی کنیم (آنالیز واریانس یک طرفه چیست؟-با مثال کاربردی در SPSS). عامل مورد نظر دارای چهار گروه و حجم نمونه 40 است. پس از اجرای تحلیل واریانس، نتایج آن به شکل زیر شده است:

صورت کسر آماره فیشر (واریانس بین‌گروهی)

در تحلیل واریانس یک‌طرفه، میانگین هر یک از چهار گروه عامل محاسبه می‌شود که طبق جدول 2 عبارتند از: 11.203، 8.983، 10.683 و 8.838. میانگین‌های این گروه‌ها حول میانگین کلی (9.915) که از 40 مشاهده حاصل شده قرار گرفته‌اند.هر چه قدر این گروه‌ها دارای فاصله بیشتری از میانگین کلی باشند، واریانسی که در صورت کسر آماره فیشر قرار دارد، بزرگ‌تر می‌شود.راحت‌تر است آن است که بگوییم میانگین‌های گروه‌ها زمانی تفاوت معنی‌دار دارند که از یک‌دیگر دورتر باشند. این مسئله در آزمون فیشر به صورت بزرگ‌تر بودن واریانس در صورت کسر لحاظ می‌شود.برای درک بهتر این مطلب، نمودار زیر را ببینید. این نمودار دارای دو قسمت مجزا است که برای مقایسه دو حالت با یک‌دیگر در قالب یک نمودار آمده‌اند: یک حالت برای واریانس کوچک و حالت دیگر برای واریانس بزرگ. در هر کدام از این دو حالت، چهار نقطه قرار دارند که میانگین هر یک از چهار گروه هستند. همان طور که می‌بینیم، در حالت واریانس کوچک، نقاط نمودار (میانگین‌های گروه‌ها) دارای فواصل کم‌تری نسبت به یک‌دیگر هستند تا حالت واریانس بزرگ که نقاط نمودار با فواصل بیشتری نسبت به هم قرار گرفته‌اند.

حال مجدداً به خروجی تحلیل واریانس یک‌طرفه مراجعه می‌کنیم. باید کدام آماره را برای واریانس بین‌گروهی استفاده کنیم؟ این آماره در جدول یک، به صورت مربع میانگین واقع در سطر Between Groups یعنی عدد 13.394 است. این عدد، مجموع مربع فاصله‌ها از میانگین کلی است که تقسیم بر درجات آزادی عامل شده‌ است. هر چه میانگین‌‌های گروه‌های عامل از یک‌دیگر فاصله بیشتری بگیرند، این عدد نیز افزایش می‌یابد.

مخرج کسر آماره فیشر (واریانس درون‌گروهی)

حال مخرج کسر آماره فیشر را بررسی می‌کنیم که واریانس‌های داخل هر گروه را در نظر می‌گیرد. این واریانس درون‌گروهی، فاصله بین هر مشاهده با میانگین گروه مربوط به آن مشاهده را اندازه‌گیری می‌کند، فاصله بدست‌آمده را به توان دو می‌رساند و همه آن‌ها را با هم جمع می‌کند و در نهایت بر درجات آزادی خطا تقسیم می‌کند.هر چه مشاهدات داخل هر گروه به میانگین گروه مربوط به خود نزدیک‌تر باشند، واریانس درون‌گروهی کوچک‌تر می‌شود. برعکس هر چه مشاهدات داخل هر گروه از میانگین مربوط به خود دورتر باشند، واریانس درون‌گروهی افزایش می‌یابد.در نمودار زیر واریانس درون‌گروهی کوچک با واریانس درون‌گروهی بزرگ مقایسه شده است. منحنی‌های این نمودار نشان می‌دهند مشاهدات نمونه درون هر گروه چه قدر فشرده در اطراف میانگین آن گروه قرار گرفته‌اند. مخرج کسر آماره فیشر، یا همان واریانس درون‌گروهی، در قسمت راست نمودار زیر بزرگ‌تر است، زیرا مشاهدات نمونه در فواصل بیشتری نسبت به میانگین گروه قرار دارند.

برای آن که نتیجه بگیریم میانگین‌های گروه‌ها برابر نیستند، باید واریانس درون‌گروهی کوچک باشد. چرا؟ چون واریانس درون‌گروهی نشان‌دهنده واریانسی است که توسط مدل تبیین نشده است. در آمار این واریانس را خطای تصادفی می‌نامند. هر چه خطا افزایش یابد، احتمال بیشتری وجود دارد که تفاوت‌های مشاهده‌شده بین میانگین‌های گروه‌ها به جای آن که از تفاوت‌های واقعی در گروه‌های جامعه ناشی شده باشد، به علت خطا به وجود آمده باشند. لذا واضح است که ما به دنبال مقادیر کم‌تری از خطا هستیم!حال بیایید دوباره به خروجی تحلیل واریانس یک‌طرفه نگاه کنیم. واریانس درون‌گروهی که در جدول 1 به نمایش درآمده برابر با 4.402 است.

آماره فیشر (نسبت واریانس بین‌گروهی به واریانس درون‌گروهی)

همان طور که گفتیم، آماره‌های فیشر نسبت دو واریانس هستند. اگر فرضیه صفر درست باشد، مقدار آماره فیشر تقریباً برابر با یک می‌شود (برای دانستن فرضیات صفر و یک به مقاله آنالیز واریانس یک طرفه مراجعه کنید). فرضیه صفر در آنالیز واریانس یک‌طرفه، به صورت عدم معنی‌داری عامل است.در نمودار قبل، دو مقدار متفاوت واریانس را که در یک آماره آزمون فیشر تحلیل واریانس یک‌طرفه به کار رفته‌اند دیدیم. حال این دو را کنار هم قرار ‌می‌دهیم و می‌بینیم ترکیب آن‌ها دو آماره فیشر کوچک و بزرگ را تولید می‌کند. در نمودارهای زیر گستره میانگین‌های گروه‌ها با گستره مشاهدات نمونه در داخل هر گروه قابل مقایسه است.

گراف سمت چپ (مقدار کوچک F): میانگین‌های گروه‌ها نسبت به پراکندگی درون‌گروهی با فشردگی بیشتری کنار هم قرار گرفته‌اند. فاصله بین میانگین‌ها نسبت به خطای تصادفی درون هر گروه، کوچک است. بنابراین نمی‌توان نتیجه گرفت این گروه‌ها واقعاً در جامعه نیز متفاوت هستند.گراف سمت راست (مقدار بزرگ): میانگین گروه‌ها نسبت به پراکندگی مشاهدات درون هر گروه بیشتر گسترده شده‌اند. در این حالت، احتمال زیادی وجود دارد که تفاوت‌های مشاهده‌شده بین میانگین‌های گروه‌ها واقعاً نشان‌دهنده تفاوت در سطوح جامعه باشند.

چگونگی محاسبه مقدار آماره فیشر

با مراجعه به خروجی مثال، می‌توانیم صورت و مخرج کسر آماره فیشر را به صورت زیر محاسبه کنیم:

حال برای این که نتیجه بگیریم میانگین‌های گروه‌ها با هم برابر نیستند، باید مقدار آماره فیشر به اندازه کافی بزرگ باشد تا بتوانیم فرضیه صفر را رد کنیم. نکته قابل توجه در مورد آماره فیشر آن است که آماره‌ای فاقد واحد اندازه‌گیری است و این موضوع تفسیر آن را ساده می‌کند.مقدار آماره فیشر ما برابر با 3.30 شد که یعنی واریانس بین‌گروهی 3.3 برابرِ واریانس درون‌گروهی است. اما فرضیه صفر معادل با آن است که نسبت این واریانس‌ها برابر است که یعنی مقدار آماره فیشر برابر با یک می‌شود. بنابراین آیا آماره فیشری با مقدار 3.3 به اندازه کافی بزرگ است که فرضیه صفر را رد کنیم؟همان طور که می‌دانید، مقدار آماره فیشر را باید با مقادیر بحرانی جدول فیشر مقایسه کنیم. مقدار بحرانی جدول فیشر با درجات آزادی صورت 3 و درجات آزادی مخرج 36 (جدول 1) و با مقدار آلفای 0.05 برابر با 2.87 است. البته همان طور که اطلاع دارید، از جدول فیشر زمانی استفاده می‌شود که به طور دستی محاسبات را انجام می‌دهیم. زمانی که از نرم‌افزار استفاده می‌کنیم از p-مقدار یا sig استفاده می‌کنیم که توسط نرم‌افزار محاسبه می‌شود. در این مثال، مقدار sig برابر با 0.031 است که چون کوچک‌تر از 0.05 است باز هم فرضیه صفر رد می‌شود.

بالاخره چرا از واریانس‌ برای آزمون میانگین‌ها استفاده می‌کنیم؟

برگردیم به سوالی که در ابتدا در مورد تحلیل واریانس‌ها برای بررسی تفاوت میانگین‌های گروه‌ها مطرح کردیم. روی این جمله تمرکز می‌کنیم: «میانگین‌ها متفاوت هستند». این مسئله دقیقاً شامل پراکندگی میانگین‌های گروه‌ها است. اگر هیچ پراکندگی در میانگین‌ها وجود نداشته باشد، نمی‌توانند متفاوت باشند. به طور مشابه، هر چه تفاوت‌های بین میانگین‌ها بیشتر باشد، پراکندگی بیشتری نیز وجود خواهد داشت.آزمون‌های فیشر در مطالعات تحلیل واریانس، مقدار پراکندگی بین میانگین‌های گروه‌ها را بررسی می‌کنند. این بررسی بدین صورت است که در آن پراکندگی درون‌گروهی برای تعیین وجود تفاوت معنی‌دار بین میانگین‌های گروه‌ها به کار می‌رود. البته نتایج آزمون فیشر در صورتی که نشان‌دهنده تفاوت معنی‌دار بین میانگین‌های گروه‌ها باشد، فقط می‌گوید همه میانگین‌ها برابر نیستند. اما نمی‌تواند بگوید کدام میانگین‌ها برابر نیستند، برای این کار می‌توان از آزمون‌های تعقیبی استفاده کرد.در این مطلب سعی شد به تدوین خود مفهوم آنالیز واریانس پرداخته شود. در ادامه یکی از انواع تحلیل واریانس یعنی آماره فیشر نیز بررسی شد و همچنین در آینده مطالبی دیگر درباره آنالیز واریانس منتشر خواهد شد. چنانچه به مسائل آماری علاقه مندید میتوانید صفحه اینستاگرام آمار پیشرو را دنبال کنید و از جدید ترین مباحثی که منتشر می کنیم با خبر شوید.امیدواریم مطلب جامع و کامل برای شما ارائه اما چنانچه نارسایی در تحلیل واریانس احساس کردید می توانید در قسمت نظرات سوالات خود را مطرح کنید.چنانچه به صورت اختصاصی تر می خواهید به سوالات شما پاسخ داده شود متخصصین ما آماده اند تا تجربه چندین ساله خود را در اختیار شما قرار دهند، به منظور بهره مندی از این خدمات در قسمت مشاوره آماری رایگان می توانید پرسش های خود را مطرح کنید.با توجه به کاربرد های مختلفی که تحلیل واریانس در بخش های علمی و غیر علمی دارد، چنانچه به منظور انجام تحلیل واریانس نیاز به کمک متخصصان دارید این خدمات را شرکت های آماری ارائه می دهند. یکی از این شرکت ها که با بهره گیری از افراد متخصص خدمات با کیفیتی را ارائه می دهد شرکت آمار پیشرو است.

تحلیل واریانس چیست؟

در صورتی که بخواهیم تاثیر سطوح متغیر مستقل که یک متغیر کیفی است را بر متغیر وابسته که کمی است را بررسی کنیم از تحلیل واریانس استفاده می‌کنیم.

آزمون فیشر چیست؟

این آزمون از آماره فیشر برای آزمون فرضیات خود استفاده می‌کند. آزمون‌ فیشر در مطالعات تحلیل واریانس، مقدار پراکندگی بین میانگین‌های گروه‌ها را بررسی می‌کند.

جولای 19, 2020 5 نظرات

آمار پیشرفته

رگرسیون گام به گام (stepwise) چیست؟-اجرای آن در SPSS

توسط لادن عباس نیا می 19, 2020

نوشته شده توسط لادن عباس نیا

رگرسیون گام به گام که یکی از انواع روش های رگرسیون است در این مطلب ابتدا به توضیح مفهوم آن می پردازیم. در ادامه مطلب با مثالی ملموس رگرسیون گام به گام را در SPSS اجرا می کنیم. قبل از هز چیزی بهتر است که به مطلب رگرسیون سری بزنید و مفهوم آن را دریافت کنید.

رگرسیون گام به گام چیست؟

همونطور که می‌دانیم رگرسیون، بررسی اثر چند متغیر مستقل بر متغیر وابسته است. به عنوان مثال بررسی تاثیر ویژگی‌های شخصیتی مدیران بر عملکرد کارکنان زیرمجموعه می‌تواند نمونه‌ای از رگرسیون باشد. برای توضیحات مربوط به رگرسیون گام به گام با یک مثال ساده شروع می‌کنیم.

انواع مختلف رگرسیون شامل رگرسیون خطی ساده و چندگانه، رگرسیون لجستیک و رگرسیون گام به گام است

فرض کنید مدیر یک فروشگاه بزرگ می‌خواهد میزان فروش محصولات فروشگاه خود و عوامل تاثیر گذار بر آن را بررسی کند.عواملی که از دید مدیر فروشگاه می‌تواند تاثیرگذار باشد شامل: قیمت، کیفیت و مساحت قفسه‌ها است. اما نمی‌داند کدامیک از این متغیرهای مستقل بهترین پیشگو برای متغیر وابسته (میزان فروش) هستند. برای پاسخگویی به این سوال می‌توان از رگرسیون گام به گام استفاده کرد.

در واقع در رگرسیون گام به گام (stepwise) تمامی متغیرهای مستقل وارد مدل می‌شوند و آن متغیرمستقلی که تاثیر چندانی بر متغیر وابسته نداشته باشد از مدل حذف می‌شود. در مثال قبل هر 3 متغیر قیمت، کیفیت و مساحت مغازه ها وارد مدل می‌شود و تاثیر آن بر میزان فروش بررسی می‌شود و متغیری که به میزان کمتری تبیین کننده متغیر میزان فروش باشد از مدل حذف می‌شود و این مراحل، گام به گام برای تمامی متغیرهای تحقیق انجام می‌شود.

روش رگرسیون گام به گام در واقع ترکیبی از دو روش پیش‌رونده و پس‌رونده است. در روش پیش‌رونده، در ابتدا هیچ متغیری در مدل وجود ندارد و اولین متغیری که وارد مدل می‌شود، آن متغیری است که بیشترین همبستگی را با متغیر وابسته تحقیق دارد. اگر بعد از اجرای مدل رگرسیونی، مقدار معناداری و آماره آن در حد قابل قبول باشد متغیر در مدل می‌ماند. در ادامه، متغیر دومی که بیشترین همبستگی را بر روی متغیر وابسته دارد وارد مدل می‌شود و مدل رگرسیونی اجرا می‌شود. این روند تا آنجا ادامه دارد که مقدار معناداری متغیرها در مدل از مقدار مورد نظر تجاوز نکند.

در روش پس‌رونده، در ابتدا تمامی متغیرها در مدل وجود دارند و مرحله به مرحله متغیری که در سطح معناداری قابل قبولی نباشد از مدل حذف می‌شود. در این روش، اجرای مدل تا زمانی ادامه می‌یابد که آخرین متغیر با کمترین میزان آماره از مدل حذف شود. رگرسیون گام به گام ترکیبی از دو روش توضیح داده شده است. به این صورت که در هر مرحله تمامی متغیرها وارد مدل می‌شود و علاوه بر اینکه در مدل بررسی می‌شوند، با آماره خودشان نیز مورد ارزیابی قرار می‌گیرند.

در رگرسیون گام به گام، تعدادی متغیر مستقل وارد مدل می‌شوند و مرتبه ورود آنها توسط معیار آماری که به وسیله روش گام به گام حاصل می‌شود، تعیین می‌گردد. روش ورود می‌تواند پیش‌رونده (forward)، پس‌رونده (backward) و یا ترکیبی از هر دو باشد. انتخاب هر یک از روش‌ها به اهداف پژوهشگر بستگی دارد.

رگرسیون گام به گام یکی از خدمات تحلیل آماری است که شما می توانید آن را خود انجام دهید یا به یک شرکت آماری بسپارید، اگر وقت لازم را دارید می توانید در این مطلب کامل یک مثال ملمویس را حل کردیم که کامل آموزش ببینید، اما چنانچه وقت کافی ندارید می توانید این نوع رگرسیون را به عنوان یکی از خدمات تحلیل آماری با تعریف پروژه آماری از بخش خدمات سفارش دهید.

رگرسیون گام به گام یکی از خدماتی است که شرکت آمار پیشرو می‌تواند در اختیار شما قرار دهد، چنانچه تا آخر این مقاله به سوالات شما پاسخ داده نشد می توانید با متخصصان ارتباط برقرار کنید.

نرم افزار SPSS به عنوان یکی از پر کاربرد ترین نرم افزار های آماری شناخته می شود،دوره آموزش نرم افزار SPSS یک دوره کامل که با مثال های کاربردی تمامی مباحث کاربردی در نرم افزار را گام به گام آموزش میدهد،علاوه بر این از پشتیبانی خیلی خوبی برای انجام پروژه برخوردار است.یک فرصت اشتعال خوب نیز در پروژه های آماری برای مهارت آموزان فراهم خواهد شد.

نرم افزار SPSS چیست؟ و چه کاربردی دارد؟

رگرسیون گام به گام در SPSS

با یک مثال نحوه انجام رگرسیون گام به گام در SPSS را شرح می‌دهیم. همان مثال ابتدای مقاله را در نظر بگیرید. می‌خواهیم ببینیم کدامیک از متغیرهای مستقل بهترین پیشگو برای میزان فروش است؟ بعد از بررسی فرضیات مربوط به رگرسیون که شامل: نسبت مشاهدات متغیرهای مستقل، نقاط پرت، چند هم خطی بین متغیرهای مستقل و تکینی و نرمال بودن، خطی بودن، همگنی واریانس‌ها و استقلال باقیمانده‌ها است، روش رگرسیون گام به گام را در SPSS با هم مرور می‌کنیم. ابتدا مطابق شکل زیر از منوی آنالیز به ترتیب گزینه‌های Regression و Linear… را انتخاب می‌کنیم.

بعد از باز شدن کادر مربوطه در قسمت Dependent متغیر وابسته یعنی میزان فروش و در قسمت Independents متغیرهای مستقل قیمت، کیفیت و مساحت را انتقال دهید. در قسمت Method گزینه Stepwise را انتخاب کنید.

پس از آن روی گزینه Statistics… کلیک کنید تا کادر مربوط به آن باز شود و گزینه‌های Estimates و Model fit را انتخاب کنید. سپس روی گزینه‌ی Continue و پس از آن روی OK کلیک کنید.

stepwise-in-SPSS-Linear-regression-statistics

خروجی رگرسیون گام به گام در ادامه آمده است:

با توجه به خروجی فوق مشاهده می‌کنیم که تنها متغیر price به معادله رگرسیونی وارد شده است و این متغیر به تنهایی 85 درصد از تغییرپذیری متغیر میزان فروش را با توجه به مقدار R Square بیان می‌کند. دو متغیر دیگر نتوانستند از معیار مورد نظر عبور کنند و از مدل حذف می‌شوند. بنابراین متغیر قیمت بهترین پیشگو برای میزان فروش است.

رگرسیون گام به گام یکی از انواع رگرسیون است که در این مطلب سعی کردیم به بهترین شکل ممکن به شما ارائه دهیم. با توجه به اهمیت رگرسیون گام به گام و پیچیدگی این موضوع می توانید با ارتباط با افراد مجرب در حوزه آماری بخشی از پروژه خودر ا به پایان برسانید برای بهره مندی از این افراد متخصص در بخش مشاور آماری رایگان می توانید سوال خود را مطرح کنید.

همانطور که بیان شد شما می توانید انواع دیگری از رگرسیون را با توضیحات کامل در بلاگ آمار پیشرو مشاهده کنید برای با خبر شدن از جدید ترین مطالب آماری می توانید صفحه اینستاگرام آمار پیشرو را دنبال کنید.

رگرسیون چیست؟

رگرسیون، بررسی اثر چند متغیر مستقل بر متغیر وابسته است.

رگرسیون گام به گام چیست؟

در واقع در رگرسیون گام به گام (stepwise) تمامی متغیرهای مستقل وارد مدل می‌شوند و آن متغیرمستقلی که تاثیر چندانی بر متغیر وابسته نداشته باشد از مدل حذف می‌شود.

رگرسیون پیش رونده چیست؟

در روش پیش‌رونده، در ابتدا هیچ متغیری در مدل وجود ندارد و اولین متغیری که وارد مدل می‌شود، آن متغیری است که بیشترین همبستگی را با متغیر وابسته تحقیق دارد.

رگرسیون پس رونده چیست؟

در روش پس‌رونده، در ابتدا تمامی متغیرها در مدل وجود دارند و مرحله به مرحله متغیری که در سطح معناداری قابل قبولی نباشد از مدل حذف می‌شود.

مثالی برای رگرسیون گام به گام؟

فرض کنید مدیر یک فروشگاه بزرگ می‌خواهد میزان فروش محصولات فروشگاه خود و عوامل تاثیر گذار بر آن را بررسی کند.

می 19, 2020 11 نظرات

آمار استنباطی ناپارامتری

آزمون من ویتنی به زبان ساده و روان در SPSS

توسط لادن عباس نیا می 12, 2020

نوشته شده توسط لادن عباس نیا

آزمون من ویتنی (Mann–Whitney U test) یک آزمون ناپارامتری است که هدف آن به سادگی قابل بیان است. ابتدا با مثالی ساده به بیان مفهوم آزمون من ویتنی می پردازیم و سپس شرایط استفاده از آن و در آخر با مثالی ساده آزمون من ویتنی را در SPSS اجرا خواهیم کرد، خروجی‌های مورد نظر این آزمون را نیز نمایش خواهیم داد. اگر بیش از دو گروه نمونه دارید باید از آزمون کروسکال والیس (Kruskal–Wallis H test یاone-way ANOVA on ranks ) که یک آزمون ناپارامتری است٬ استفاده کنید.

آزمون من ویتنی (Mann–Whitney U test) با بیانی ملموس

در این آزمون یک متغیر هدف داریم که می‌خواهیم بدانیم آیا بین دو گروه جداگانه از افراد یا اشیا دارای تفاوت است یا خیر. به عنوان مثال، نظر افراد راجع به طعم یک نوع بستنی را در نظر بگیرید که در قالب سه گزینه «خوب»، «متوسط» و «بد» ارائه می‌شود. حال می‌خواهیم بدانیم آیا بین نظر کودکان با نظر بزرگسالان در مورد این بستنی تفاوتی وجود دارید یا خیر. در این صورت می‌توانیم از آزمون من ویتنی استفاده کنیم. در این مثال، متغیر هدف (متغیر وابسته) نظر افراد و دو گروه مورد نظر همان کودکان و بزرگسالان (متغیر مستقل) هستند.آزمون من ویتنی معادل آزمون تی استودنت دو نمونه مستقل است. ا

ین آزمون برای مقایسه تفاوت‌ها بین دو گروه مستقل از افراد یا اشیا استفاده می‌شود که در آن متغیر وابسته از نوع ترتیبی یا کمّی غیرنرمال باشد. به عنوان مثال، می‌توانیم از آزمون من ویتنی استفاده و بررسی کنیم آیا نگرش به تبعیض در پرداخت دستمزد بر حسب جنسیت تفاوت دارد یا خیر.در این مثال متغیر وابسته، نگرش به تبعیض در پرداخت دستمزد است که در مقیاس ترتیبی سنجیده می‌شود و متغیر مستقل، جنسیت است که در دو گروه مستقل مردان و زنان سنجیده می‌شود.

به عنوان مثالی دیگر، از آزمون من ویتنی می‌توان در بررسی وجود تفاوت در میزان حقوق بر حسب سطح تحصیلی استفاده کرد که در آن متغیر وابسته میزان حقوق و از نوع کمّی غیرنرمال است و متغیر مستقل نیز سطح تحصیلی در گروه دیپلمه و دانشگاهی است.

شرایط استفاده از آزمون من ویتنی

آزمون-من-ویتنی برای استفاده از آزمون من ویتنی، باید ابتدا چهار شرط زیر را بررسی کنیم و در صورت برقراری آن‌ها می‌توانیم به سراغ آزمون من ویتنی برویم:

1- متغیر وابسته باید در مقیاس ترتیبی یا کمّی اندازه‌گیری شده باشد. به عنوان مثال‌هایی از مقیاس ترتیبی می‌توان از طیف لیکرت (مثلاً 5 گزینه‌ای با گزینه‌های «کاملاً مخالف» تا «کاملاً موافق»)، سطح تحصیلات (دیپلم، فوق دیپلم، کارشناسی و کارشناسی ارشد) و … نام برد. مثال‌هایی از متغیرهای کمّی نیز به صورت نمره امتحان (صفر تا 20)، نمره هوشی (آزمون IQ)، وزن (بر حسب کیلوگرم) و … نام برد.

2- متغیر وابسته باید از دو گروه مستقل تشکیل شده باشد. به عنوان مثال جنسیت (دو گروه زنان و مردان)، وضعیت استخدامی (شاغل و غیرشاغل)، وضعیت مصرف سیگاری (سیگاری و غیرسیگاری) را می‌توان نام برد.

3- مشاهدات حاضر در نمونه باید مستقل باشند، یعنی نباید هیچ ارتباطی بین مشاهدات در هر گروه یا بین خود گروه‌ها وجود داشته باشد. به عبارت دیگر، باید افراد حاضر در یک گروه با افراد حاضر در گروه دیگر متفاوت باشند. چنان چه افراد حاضر در یک گروه در گروه دیگر نیز حاضر باشند، آن گاه دیگر نمی‌توان از آزمون من ویتنی استفاده کرد و باید به سراغ آزمون‌های دیگر مثلاً آزمون ویلکاکسون رفت. لذا در بررسی این شرط باید خیلی دقت داشته باشیم.

4- از آزمون من ویتنی می‌توان کلاً برای زمانی استفاده کرد که داده‌های متغیر وابسته در هر کدام از دو گروه متغیر مستقل به طور نرمال توزیع نشده‌اند. اما برای دانستن نحوه تفسیر نتایج آزمون من ویتنی، باید تعیین کنیم آیا دو توزیع (یعنی توزیع نمرات متغیر وابسته برای هر دو گروه متغیر مستقل، مثلاً توزیع نمرات وزن زنان و توزیع نمرات وزن مردان) دارای شکل یکسان هستند یا خیر. برای توضیح بیشتر، ابتدا شکل بعد را ببینید: Mann-Whitney-U-test-Distribution-chart در نمودار بالا، توزیع نمرات برای زنان و مردان دارای شکل یکسان است. در نمودار سمت چپ، نمی‌توان توزیع نمرات مردان را (که با رنگ آبی در نمودار سمت راست مشخص شده) دید، زیرا دو توزیع دقیقاً یکسان هستند (یعنی هر دو توزیع دقیقاً بر هم منطبق هستند به نحوی که مثلاً توزیع آبی رنگ در پشت توزیع قرمز رنگ پنهان شده است). اما در نمودار سمت راست، حتی با وجودی که دو توزیع دارای شکل یکسان هستند، دارای مکان متفاوت هستند (یعنی توزیع یکی از گروه‌ها دارای مقادیر کم‌تر یا بیشتر در مقایسه با توزیع دیگر است، مثلاً در این نمودار زنان به طور کلی دارای مقادیری بیشتر از مردان هستند).

وقتی داده‌ها را تحلیل می‌کنیم، بسیار غیرمحتمل است که شکل دو توزیع کاملاً یکسان باشند، اما ممکن است دارای شکل مشابه باشند. اگر دارای شکل مشابه باشند، می‌توان از آزمون من ویتنی برای مقایسه میانه‌های (median) متغیر وابسته در هر کدام از گروه‌های متغیر مستقل استفاده کرد. اما اگر شکل توزیع‌ها مشابه نباشند، آن گاه از آزمون ویتنی تنها می‌توان برای مقایسه میانگین رتبه‌ها (mean rank) استفاده کرد.بنابراین هنگام اجرای آزمون من ویتنی، باید از SPSS برای تعیین مشابه یا متفاوت بودن شکل توزیع‌ها نیز استفاده کرد.

دقت کنید که بررسی شروط 1، 2 و 3 در SPSS انجام نمی‌شود و تعیین برقرار بودن یا نبودن آن‌ها بستگی به طرح پژوهش ما دارد. اما شرط 4 را می‌توان در SPSS بررسی کرد و بنا به نتیجه آن در نهایت میانه یا میانگین رتبه‌های دو گروه را می‌توان مقایسه نمود. در ادامه، انجام آزمون من ویتنی را در مثال خواهیم دید.

آزمون من ویتنی (Mann–Whitney U test) در SPSS

همان طور که می‌دانیم میزان کلسترول موجود در خون افراد با خطر وقوع بیماری قلبی در ارتباط است، به طوری که میزان بیشتر کلسترول نشان‌دهنده خطر بیشتر و میزان کم‌تر آن نشان‌دهنده سطح کم‌تری از خطر است. اگر بتوانیم میزان کلسترول را کاهش دهیم، میزان خطر ابتلا به بیماری قلبی نیز کاهش می‌یابد. این امر مشخص است که داشتن اضافه وزن یا نداشتن فعالیت بدنی، هر دو، میزان کلسترول در خون را افزایش می‌دهد. اما مشخص نیست دقیقاً کدام یک از این دو برای پایین آوردن میزان کلسترول مفیدتر است.

بنابراین، یک پژوهشگر تصمیم گرفته بررسی کند کدام یک از این دو مورد برای کاهش سطح کلسترول موثر است.برای این منظور، نمونه‌ای تصادفی به حجم 40 از مردانی را که اضافه وزن دارند و از لحاظ بدنی نیز غیرفعال هستند گرداوری شد. سپس این نمونه به طور تصادفی به دو گروه 20 تایی تقسیم شد: گروه اول تحت رژیم غذایی با کالری کم قرار گرفت و به عنوان گروه رژیمی نام‌گذاری شد؛ گروه دوم تحت تمرینات ورزشی قرار گرفت و به عنوان گروه ورزشی نام‌گذاری گردید. برای تعیین آن که کدام یک از این دو برنامه موثرتر بود، میزان کلسترول بین دو گروه در انتهای برنامه مقایسه شد.داده‌های این مثال به صورت شکل بعد وارد شده است.

متغیر وابسته میزان کلسترول است (Cholesterol) و متغیر مستقل (Group) که شامل دو گروه به صورت گروه 1 یعنی گروه رژیمی (diet) و گروه 2 یعنی گروه ورزشی (exercise) است. چنین فرض می‌شود که متغیر وابسته از نوع کمی غیرنرمال است، لذا از آزمون من ویتنی استفاده خواهد شد.در 10 گام بعدی نشان می‌دهیم چه‌طور می‌توان داده‌ها را آزمون من ویتنی را برای وقتی که توزیع‌ها دارای شکل متفاوت هستند انجام داد.

نرم افزار spss چیست؟ و چه کاربردی دارد؟

در این مثال فرض شده توزیع‌ها دارای شکل متفاوت هستند و بنابراین از میانگین رتبه‌ها به جای میانه متغیر وابسته مقایسه خواهند شد. نحوه بررسی شکل توزیع‌ها و تشخیص تفاوت یا مشابهت آن‌ها در SPSS در مطالب آتی وبلاگ توضیح داده خواهد شد.1- ابتدا از مسیر زیر به پنجره آزمون ویتنی وارد می‌شویم: Mann-Whitney-U-test-table-in-SPSS 2- پنجره آزمون من ویتنی به صورت شکل زیر است:3- متغیر کلسترول را به قسمت فهرست متغیر آزمون و متغیر گروه را به قسمت متغیر گروه‌بندی همانند شکل زیر وارد می‌کنیم: Mann-Whitney-U-test-table-in-SPSS-two-idependet-samples2 توجه: در پنجره فوق دقت کنید که حتماً گزینه آزمون من ویتنی فعال باشد. هم چنین قسمت مربوط به متغیر گروه‌بندی باید همانند شکل فوق هایلایت (زردرنگ) شده باشد. برای هایلایت شدن، کافی است روی آن کلیک کنید.4- با کلیک روی گزینه تعیین گروه‌ها (Define Groups) در مرحله 3، پنجره مربوط به آن همانند شکل بعد ظاهر می‌شود. Mann-Whitney-U-test-table-in-SPSS-two-Define-Groups 5- همانند شکل بعد، در قسمت گروه 1 عدد 1 و در قسمت گروه 2 عدد 2 را وارد می‌کنیم. اعداد 1 و 2 به این علت هستند که در داده‌ها گروه رژیمی را با عدد 1 و گروه ورزشی را با عدد 2 نشان داده بودیم. ممکن است متغیر مستقل شامل بیش از دو گروه باشد (مثلاً گروه‌های رژیمی،ورزشی، دارویی و روانی) و ما علاقه‌مند به بررسی فقط دو گروه از آن (مثلاً رژیمی و دارویی) باشیم، در این صورت می‌توانیم اعداد مربوط به آن دو گروه مورد نظر (یعنی 1 و 3) را در این قسمت وارد کنیم.6- در پنجره گام 5 روی Continue کلیک کنید.7- اگر به دنبال آماره‌های توصیفی هم باشیم، می‌توانیم در پنجره گام 5 روی Options کلیک کنیم و در پنجره ظاهر شده در شکل بعد، گزینه توصیفی‌ها و چارک‌ها را فعال کنیم. Mann-Whitney-U-test-table-in-SPSS-two-idependet-samples-Options 8- در پنجره گام 7 روی Continue کلیک کنید. با این کار مجدداً به پنجره گام 3 برمی‌گردیم، منتها با این تفاوت که قسمت مربوط به متغیر گروه‌بندی اینک تکمیل شده است: Mann-Whitney-U-test-table-in-SPSS-two-idependet-samples-Continue – حال روی Ok کلیک می‌کنیم که منجر به تولید خروجی آزمون من ویتنی خواهد شد. 10- نحوه گزارش نتایج من ویتنیپس از اجرای آزمون من ویتنی، در خروجی SPSS تعدادی جدول ظاهر می‌شوند که در ادامه هر کدام از آن‌ها را شرح می‌دهیم.

آماره‌های توصیفی در آزمون من ویتنی

جدول آماره‌های توصیفی در این مثال همانند شکل زیر است: Mann-Whitney-U-test-table-descriptive-statistics با وجودی که آماره‌های توصیفی را خودمان درخواست دادیم، این آماره‌ها برای آزمون من ویتنی چندان مفید نیستند. این امر دو دلیل دارد. یکی آن که برای مقایسه گروه‌ها، به مقادیر هر گروه به طور جداگانه احتیاج داریم، نه به مقادیر ادغام شده دو گروه. در جدول بالا اطلاعات مورد نظر ارائه نشده و لذا نمی‌توان بین دو گروه رژیمی و ورزشی هیچ گونه مقایسه‌ای انجام داد.

دوم آن که ما آزمون من ویتنی را انتخاب کردیم چون همان طور که پیشتر گفتیم، نمرات متغیر وابسته در گروه‌ها دارای توزیع نرمال نیست.بنابراین نمی‌دانیم آیا از میانگین و انحراف معیار باید استفاده کنیم یا از میانه و دامنه بین چارکی (interquartile range). منظور از دامنه بین چارکی همان صدک 25ام تا 75ام است و از آن به عنوان جایگزین انحراف معیار برای زمانی که داده‌ها نرمال نیستند استفاده می‌شود. بنابراین به خاطر دلایل مذکور، استفاده از جدول فوق توصیه نمی‌شود.

جدول رتبه‌ها آزمون من ویتنی

جدول رتبه‌ها اولین جدولی است که اطلاعات مخصوص به آزمون من ویتنی را ارائه می‌کند. این جدول میانگین رتبه و مجموع رتبه‌ها برای هر کدام از دو گروه مورد آزمون را نشان می‌دهد: Mann-Whitney-U-test-table-ranks جدول فوق بسیار مفید است زیرا نشان می‌دهد کدام گروه می‌تواند به عنوان گروهی که در کل دارای میزان کلسترول بالاتر است در نظر گرفته شود. این گروه همان گروهی است که دارای میانگین رتبه بالاتر است، یعنی گروه رژیمی با میانگین رتبه 25.00. دقت کنید که استفاده از میانگین رتبه برای مقایسه دو گروه، همان طور که پیشتر نیز ذکر شد، به دلیل تفاوت شکل توزیع این دو گروه است. چنان چه دو گروه دارای شکل مشابه باشند، باید از میانه‌های آن‌ها برای مقایسه استفاده کرد.

جدول آماره‌های آزمون

این جدول به ما مقدار معنی‌داری آزمون را نشان می‌دهد. این جدول به ویژه مقدار آماره آزمون U به همراه مقدار معنی‌داری مجانبی را ارائه می‌کند: Mann-Whitney-U-test-table-test-statistics با استفاده از جدول فوق چنین نتیجه می‌شود که در میزان کلسترول بین دو گروه رژیمی و ورزشی تفاوت معنی‌دار در سطح 5 درصد وجود دارد (U=110 و p=0.014<0.05). از طرفی چون شکل توزیع نمرات در دو گروه متفاوت است، با استفاده از میانگین رتبه‌ها چنین مشخص می‌شود که گروه رژیمی با میانگین رتبه 25.00 به طور کلی دارای میزان کلسترول بیشتری نسبت به گروه ورزشی با میانگین رتبه 16.00 است.

نکته: در جدول فوق دو مقدار برای مقدار معنی‌داری ارائه شده است: معنی‌داری مجانبی (Asymp. Sig.) و معنی‌داری دقیق (Exact Sig.). اگر حجم نمونه هر دو گروه بزرگ‌تر از 10 باشد، آن گاه می‌توان از حجم نمونه مجانبی استفاده کرد و در غیر این صورت (حجم حداقل یکی از گروه‌ها کوچک‌تر یا مساوی 10 باشد) باید از معنی‌داری دقیق استفاده کرد.

در مثال حاضر نیز، همان طور که در جدول رتبه‌ها ملاحظه می‌شود، هر کدام از گروه‌ها دارای حجم 20 است و لذا می‌توان از مقدار معنی‌داری مجانبی استفاده کرد.آزمون من ویتنی (Mann–Whitney U test) در عین سادگی در مفهوم دارای نکات مهمی است که در صورت عدم در نظر گرفتن آن‌ها، نتایج بدست آمده از آن دارای اعتبار کافی نخواهد بود. برای دانستن این نکات و چگونگی رعایت آن‌ها و هم چنین اجرا و تفسیر کامل نتایج آزمون من ویتنی می‌توانید از خدمات مشاوره آماری شرکت آمارپیشرو استفاده کنید.

چنانچه علاقه مند به مباحث آماری هستید، اخبار جدید ترین مطالب قرار گرفته بر روی سایت در صفحه اینستاگرام آمار پیشرو موجود است که می توانید آن را دنبال کنید.

آزمون من ویتنی چیست؟

آزمون من ویتنی یک آزمون ناپارامتری است که تفاوت بین دو گروه جداگانه افراد یا اشیا را بررسی می‎‌کند.

آزمون من ویتنی معادل کدام آزمون پارامتری است؟

آزمون من ویتنی معادل آزمون تی دو نمونه مستقل است.

مثالی برای آزمون من ویتنی؟

فرض کنید می‌خواهیم بدانیم بین نظر کودکان و بزرگسالان در مورد بستنی تفاوتی وجود دارد یا خیر؟

شرایط استفاده از آزمون من ویتنی چیست؟

متغیر وابسته باید ترتیبی یا کمی و از دو گروه مستقل باشد. مشاهدات باید مستقل باشند. داده‌های متغیر وابسته در هر کدام از دو گروه مستقل به طور نرمال توزیع نشده باشند.

کاربرد آزمون من ویتنی در پایان نامه چیست؟ چه زمانی از آزمون من ویتنی استفاده می‌شود؟

برای تحلیل فصل چهارم پایان نامه زمانی که در اهداف پژوهش مقایسه بین دو گروه از افراد مطرح باشد و توزیع نرمال نباشد از آزمون من ویتنی استفاده می‌کنیم.

می 12, 2020 11 نظرات

آمار استنباطی پارامتری

آنالیز واریانس دوطرفه چیست؟-اجرای آن در SPSS با مثالی کاربردی

توسط لادن عباس نیا آوریل 2, 2020

نوشته شده توسط لادن عباس نیا

[block id=”breadcrumb”]

آنالیز واریانس دوطرفه یکی از مباحث آمار پارامتری است، برای فهم بهتر این مفهوم ابتدا بهتر است مطلب واریانس چیست را مطالعه کنید. آنالیز واریانس دو طرفه یکی از خدمات تحلیل آماری است که شرکت آمار پیشرو ارائه می دهد. برای توضیح این مفهوم ابتدا توضیح بسیار مختصری از آنالیز واریانس یک طرفه ارائه می دهیم و پس از آن با بیانی ساده و با مثالی ملموس به توضیح مفهوم آنالیز واریانس دوطرفه می پردازیم. در ادامه این مقاله با یک مثال کاربردی به اجرای آنالیز واریانس دوطرفه در SPSS و ارائه گزارشات پرداخته شده است. در آنالیز واریانس یک‌طرفه، اثر یک متغیر مستقل (عامل) را که دارای چند گروه است بر یک متغیر وابسته بررسی می‌کنیم.

این بررسی از طریق مقایسه میانگین متغیر وابسته در گروه‌های آن عامل انجام می‌شود. مثلاً فرض کنید می‌خواهیم بدانیم آیا سطح تحصیلات کارمندان شاغل در یک سازمان (عامل) بر میزان حقوق آنان (متغیر وابسته) تأثیر دارد. در این صورت از آنالیز واریانس یک طرفه استفاده می‌کنیم. اما اگر بخواهیم تأثیر هم‌زمان دو عامل را بر یک متغیر وابسته بررسی کنیم چطور؟ مثلاً فرض کنید در مثال حاضر بخواهیم هم‌زمان اثر سطح تحصیلات و بخش کاری کارمندان را بر میزان حقوق بسنجیم باید از چه آزمونی استفاده کنیم؟ در این حالت می‌توانیم از آنالیز واریانس دوطرفه استفاده کنیم.

آنال

آنالیز واریانس دوطرفه به زبان ساده

آنالیز واریانس دوطرفه تفاوت‌های میانگین بین گروه‌هایی را که در بین دو متغیر مستقل (عامل) تقسیم شده‌اند مقایسه می‌کند. هدف اولیه از آنالیز واریانس دوطرفه فهمیدن آن است که آیا اثر متقابل بین دو متغیر مستقل بر روی متغیر وابسته معنی‌دار است یا خیر. به عنوان مثال می‌توانیم از آنالیز واریانس دوطرفه برای بررسی این که آیا اثر متقابل بین جنسیت و سطح تحصیلات بر آزمون اضطراب دانشجویان وجود دارد استفاده کنیم که در آن جنسیت (مرد/زن) و سطح تحصیلات (لیسانس/تحصیلات تکمیلی) متغیرهای مستقل هستند و آزمون اضطراب متغیر وابسته است.

هم چنین ممکن است بخواهیم تعیین کنیم آیا اثر متقابل بین سطح فعالیت بدنی و جنسیت بر کلسترول خون در کودکان وجود دارد یا خیر، که در آن فعالیت بدنی (کم/متوسط/زیاد) و جنسیت (دختر/پسر) متغیرهای مستقل و مقدار کلسترول، متغیر وابسته هستند. اصطلاح اثر متقابل در تحلیل واریانس دوطرفه به ما می‌گوید آیا اثر یکی از متغیرهای مستقل بر متغیر وابسته به ازای همگی مقادیر متغیر مستقل دیگر یکسان است یا خیر (و همین‌طور برای متغیر مستقل دیگر). به عنوان مثال، آیا اثر جنسیت (مرد/زن) بر آزمون اضطراب تحت تأثیر سطح تحصیلات (لیسانس/تحصیلات تکمیلی) قرار دارد؟ علاوه بر این، اگر یک اثر متقابل معنی‌دار پیدا شود، احتیاج داریم تعیین کنیم آیا اثرات اصلی ساده معنی‌دار هستند؟ (این مورد در ادامه‌ی بحث شرح داده می‌شود.)

شرایط داده‌ها برای آنالیز واریانس دوطرفه

برای انجام آنالیز واریانس دوطرفه، داده‌ها باید دارای شش شرط (پذیره) زیر باشند. البته در داده‌های واقعی ممکن است تعدادی از این پذیره‌ها برقرار نباشند، که در این صورت راه‌حل‌هایی برای آن وجود دارد. ابتدا شش شرط را شرح می‌دهیم:

متغیر وابسته باید پیوسته باشد.
دو متغیر مستقل باید شامل دو یا تعدادی بیشتر از سطوح (گروه) باشند.
مشاهدات مستقل باشند. یعنی هیچ ارتباطی بین مشاهدات در هر گروه یا بین‌ گروه‌ها وجود نداشته باشد. به عنوان مثال، شرکت‌کنندگان متفاوت در هر گروه نباید در هیچ یک از گروه‌های دیگر حضور داشته باشند. این امر بیشتر به طرح مطالعه بستگی دارد و نیاز به آزمون خاصی برای بررسی آن وجود ندارد. اگر مطالعه دارای این شرط نباشد، آن گاه باید از آزمونی متفاوت برای آن استفاده کرد (مثلاً طرح اندازه‌های مکرر).
داده پرت وجود نداشته باشد.
متغیر وابسته باید به طور تقریبی دارای توزیع نرمال باشد. البته آنالیز واریانس دوطرفه نسبت به عدم برقراری شرط نرمال بودن، کاملاً استوار است. این یعنی پذیره‌ی نرمال بودن می‌تواند تا حدودی نقض شود و در عین حال نتایج بدست‌آمده معتبر باشد.
برای ترکیبات مختلف از گروه‌های دو متغیر مستقل باید همگنی واریانس وجود داشته باشد. برای بررسی آن می‌توان از آزمون لون (Levene) استفاده کرد.

در ادامه یک مثال ملموس از آنالیز واریانس دو طرفه را در نرم افزار SPSS اجرا کردیم. اما این نرم افزار کاربرد های فراوانی را در علم آمار دارد. چنانچه علاقه مند به حوزه آماری هستیداین نرم افزار یکی از اصلی ترین نرم افزار است. شما می توانید دوره آموزش نرم فزار SPSS را بگذرانید و در کنار انجام پروژه خود پروژه های آماری دیگر را انجام دهید.

نرم افزار SPSS چیست؟

اجرای آنالیز واریانس دوطرفه در SPSS با مثالی کاربردی

پژوهشگری می‌خواهد بررسی کند آیا علاقه فردی به موضوعات سیاسی تحت تأثیر سطح تحصیلات یا جنسیت است. به همین منظور نمونه‌ای تصادفی از شرکت‌کنندگان فراهم شد و از آنان در مورد علاقه آن به موضوعات سیاسی پرسش شد و نمره آن به صورت عددی بین صفر تا 100 ثبت شد. در این نمره‌گذاری، صفر نشان‌دهنده کم‌ترین علاقه و 100 نشان‌دهنده بیشترین علاقه است. آن گاه شرکت‌کنندگان بر حسب جنسیت (مرد/زن) و سپس تحصیلات (دبیرستان/پیش‌دانشگاهی/دانشگاه) تقسیم‌بندی شدند. بنابراین متغیر وابسته علاقه به سیاست (interest in politics) و متغیرهای مستقل جنسیت (gender) و تحصیلات (education) هستند. برای انجام این آزمون در SPSS فرض کنید داده‌ها به صورت شکل زیر هستند:در ادامه طی مراحل 14 گانه زیر نحوه انجام آنالیز واریانس دوطرفه با فرض آن که هر شش پذیره‌ی مذکور برقرار هستند شرح داده می‌شود. (1) از مسیر زیر و طبق شکل زیر پنجره مربوطه را فراخوانی می‌کنیم:

Analyze > General Linear Model > Univariate

(2) در ادامه پنجره زیر ظاهر می‌شود:(3) متغیر وابسته و متغیرهای مستقل را طبق شکل زیر به قسمت‌های مربوطه منتقل می‌کنیم:(4) بر روی نمودارها (Plots) کلیک می‌کنیم و سپس پنجره زیر ظاهر می‌شود:(5) متغیر مستقل تحصیلات را از قسمت عامل‌ها (Factors) به محور افقی (Horizontal Axis) و متغیر مستقل دیگر (جنسیت) را به خطوط جداگانه (Separate Lines) منتقل می‌کنیم. این کار را مطابق شکل زیر انجام می‌دهیم:نکته 5: معمولاً متغیری را که دارای تعداد سطوح بیشتر است در محور افقی قرار می‌دهیم. (6) از کلید اضافه کردن (Add) استفاده می‌کنیم. در این صورت خواهیم دید که اثر متقابل تحصیلات و جنسیت در قسمت نمودارها (Plots) به صورت شکل زیر اضافه شده است:(7) بر روی Continue کلیک می‌کنیم. (8) بر روی آزمون‌های تعقیبی (Post Hoc) کلیک می‌کنیم. در نتیجه پنجره زیر ظاهر می‌شود: (9) متغیر تحصیلات را از قسمت عامل‌ها (Factors) به قسمت آزمون‌های تعقیبی (Post Hoc Tests for) منتقل می‌کنیم. در این صورت قسمت Equal Variances Assumed فعال می‌شود و گزینه‌های مختلفی که برای آن‌ها می‌توان آزمون‌های تعقیبی را استفاده کرد نشان می‌دهد. در مثال حاضر، از آزمون توکی (Tukey) استفاده خواهیم کرد. نکته 6: فقط کافی است متغیرهای مستقلی را که دارای بیش از دو گروه هستند به قسمت آزمون‌های تعقیبی منتقل کنیم. به همین علت متغیر جنسیت را منتقل نکردیم. در نهایت پنجره زیر را خواهیم داشت:(10) روی Continue کلیک می‌کنیم و به پنجره تک‌متغیره (Univariate) برمی‌گردیم. (11) روی گزینه‌ها (Options) کلیک می‌کنیم و در نتیجه پنجره زیر ظاهر می‌شود:(12) متغیرهای جنسیت، تحصیلات و اثر متقابل جنسیت و تحصیلات را از قسمت Factors and Factor Interactions به قسمت Display Means for همانند شکل زیر منتقل می‌کنیم.(13) روی Continue کلیک می‌کنیم و به پنجره تک‌متغیره برمی‌گردیم. (14) روی Ok کلیک می‌کنیم و خروجی تولید می‌شود.

خروجی‌های آنالیز واریانس دوطرفه

بر اساس گزینه‌هایی که در مراحل 14 گانه قبل شرح داده شد، نتایج خروجی عبارتند از: جداول آماره‌های توصیفی، اثرات بین‌آزمودنی، آزمون‌ تعقیبی توکی (مقایسات چندگانه) و نمودار نتایج. این نکته را نیز در نظر داشته باشید که در صورت معنی‌دار بودن اثر متقابل، باید اثرات اصلی ساده نیز گزارش شود. در مقابل، اگر اثر متقابل معنی‌دار نباشد باز هم تحلیل‌های بیشتری باید انجام شود. در این قسمت در این مورد نیز توضیح داده ایم‌شود.

جدول آماره‌های توصیفی:

در این قسمت آماره‌های توصیفی مناسب برای گزارش یافت می‌شود:جدول فوق بسیار مفید است زیرا میانگین و انحراف معیار برای ترکیبات گروه‌ها و متغیرهای مستقل را ارائه می‌کند. هم چنین، در این جدول مجموع ردیف‌ها نیز آمده است که میانگین‌ها و انحراف معیارهای گروه‌ها را ارائه می‌کند که فقط بر حسب یکی از متغیرهای مستقل یا هیچ کدام از آن‌ها (کلی) تقسیم‌بندی شده‌اند. این آماره‌ها برای زمانی مناسب هستند که اثر متقابل معنی‌دار نشده است.

نمودار نتایج:

نمودار میانگین امتیازات علاقه به سیاست برای هر ترکیب گروه‌های جنسیت و تحصیلات در خطوط جداگانه ترسیم شده است:گرچه این نمودار ممکن است دارای کیفیت لازم برای نشان دادن گزارش ما نباشد، اما نمایش گرافیکی خوبی برای نتایج ارائه می‌کند. اثر متقابل معمولاً می‌تواند به صورت خطوط ناموازی دیده شود. در نمودار ما نیز می‌توان دید که دو خط نمایش داده شده موازی نیستند (خطوط یک‌دیگر را قطع می‌کنند). لذا می‌توان انتظار اثر متقابل معنی‌دار را داشت که در قسمت بعد بررسی شده است.

معنی‌داری آماری آنالیز واریانس دوطرفه:

نتایج اصلی تحلیل واریانس دوطرفه در جدول زیر (جدول اثرات بین‌آزمودنی) نشان داده می‌شود. در این جدول می‌توان دید آیا متغیرهای مستقل و اثر متقابل آن‌ها به طور آماری معنی‌دار هستند یا خیر.

tow-way-ANOVA-Tests-of-Between-subjects-Effects

سطرهایی که مورد علاقه ما هستند سطرهای مربوط به جنیست، تحصیلات و جنسیت*تحصیلات هستند که در جدول بالا با مستطیل قرمز مشخص شده‌اند. این سطر‌ها به ما نشان می‌دهند آیا متغیرهای مستقل (جنسیت و تحصیلات) و اثر متقابل آن‌ها (جنسیت*تحصیلات) دارای اثر معنی‌دار بر متغیر وابسته هستند یا خیر. ابتدا باید به اثر متقابل نگاه و بررسی کرد آیا معنی‌دار است یا نه.

با توجه به ستون Sig در این سطر ملاحظه می‌شود که این اثر در سطح0.05 معنی‌دار است زیرا p=0.014<0.05. هم چنین می‌توان اثرات ساده جنسیت و تحصیلات را نیز گزارش کرد، اما باید با توجه به نتیجه اثر متقابل باشد. در جدول فوق می‌توان می‌توان دید که هیچ تفاوت معنی‌دار در میانگین علاقه به سیاست در بین مردان و زنان وجود ندارد (p=0.207>0.05)، در حالی که بین سطوح تحصیلات تفاوت معنی‌دار از این لحاظ وجود دارد (p<0.005).

آزمون‌های تعقیبی-اثرات اصلی ساده:

وقتی اثر متقابل معنی‌دار داشته باشیم، گزارش اثرات اصلی می‌تواند گمراه‌کننده باشد. لذا باید اثرات اصلی ساده را نیز گزارش کرد. در مثال ما، این امر شامل تعیین تفاوت میانگین در علاقه به سیاست بین جنسیت در هر سطح تحصیلات و هم چنین سطح تحصیلات برای هر جنسیت می‌شود. متأسفانه، نرم‌افزار SPSS اجازه انجام این کار را با استفاده از رابط گرافیکی خود نمی‌دهد و برای این کار نیاز به نوشتن syntax داریم. اما وقتی اثر متقابل معنی‌دار نباشد، دو گزینه را می‌تواینم استفاده کنیم که در ادامه شرح داده می‌شود.

جدول مقایسات چندگانه:

اگر اثر متقابل معنی‌دار نداشته باشیم، می‌توانیم نتایج آزمون تعقیبی توکی را برای سطوح مختلف تحصیلات گزارش کنیم که در جدول زیر آمده‌اند:در جدول فوق می‌توان دید برخی از نتایج تکرار شده‌اند، اما در نهایت چون سه سطح برای تحصیلات داریم، کافی است سطور مربوط به این تفاوت‌ها را بررسی کنیم: (1) دبیرستان و پیش‌دانشگاهی، (2) دبیرستان و دانشگاه، و (3) پیش‌دانشگاهی و دانشگاه. از این نتایج می‌توان دید که برای همگی این سطوح، تفاوت معنی‌دار وجود دارد زیرا برای همه آن‌ها p<0.0005.

تفسیر نتایج تحلیل واریانس دوطرفه:

ابتدا باید نتایج اثر متقابل گزارش شود. به عنوان مثال می‌توان نوشت: به منظور بررسی اثر جنسیت و تحصیلات بر علاقه به سیاست یک تحلیل واریانس دوطرفه انجام شد. اثر متقابل بین جنسیت و تحصیلات بر علاقه به سیاست معنی‌دار است (F_2,54=4.643 و p=0.14). هم چنین اثر اصلی تحصیلات بر علاقه به سیاست نیز معنی‌دار است (F_2,54=2664.05 و p<0.0005)، اما اثر اصلی جنیست معنی‌دار نیست (F_1,54=29.40 و p=0.21). درادامه با توجه به نتایج آزمون تعقیبی توکی برای اثر تحصیلات چنین مشخص شد که تفاوت بین میانگین تمامی جفت‌های سطح تحصیلات معنی‌دار است (p<0.0005).

در این مطلب سعی کردیم کلیه مطالب مربوط به آنالیز واریانس دو طرفه را پوشش دهیم. اما چنانچه پروژه ای دارید و در برخی قسمت ها با مشکل مواجه شده اید. در سایت آمار پیشرو قسمتی را برای شما در نظر گرفته ایم تا بتوانید به صورت رایگان با مشاوران با تجربه این حوزه ارتباط برقرار کنید به این منظور به قسمت مشاوره آماری رایگان رفته و فرم مربوطه را پر کنید تا کارشناسان ما در اولین فرصت با شما تماس بگیرند.

اگر علاقه مند به مباحث آماری هستید می توانید صفحه آمار پیشرو در اینستاگرام را دنبال کنید تا از جدید ترین مطالبی که بر روی سایت آمار پیشرو قرار میگیرد با خبر شوید.

از جمله خدمات شرکت آمارپیشرو، اجرای آنالیز واریانس دوطرفه در طرح‌های پژوهشی و پایان‌نامه‌های دانشجویی است. برای بهره‌گیری از این خدمات، می‌توانید به سایت شرکت آمارپیشرو مراجعه کنید.

آنالیز واریانس دوطرفه چیست؟

آنالیز واریانس دوطرفه تفاوت‌های میانگین بین گروه‌هایی را که در بین دو متغیر مستقل (عامل) تقسیم شده‌اند مقایسه می‌کند.

کاربرد آنالیز واریانس دوطرفه در فصل چهارم پایان نامه چیست؟ چه زمانی از آنالیز واریانس دوطرفه استفاده می‌شود ؟

چنانچه بیش از یک متغیر مستقل داشته باشیم مثلا بخواهیم میزان رضایت شغلی را در بین زنان و مردانی که در سمت‌ها مختلف (مدیران ارشد، مدیران رده میانی و کارمندان) مشغول به کار هستند مقایسه کنیم از آنالیز واریانس دوطرفه استفاده می‌کنیم.

مثالی برای آنالیز واریانس دوطرفه؟

بررسی اثر متقابل بین سطح فعالیت بدنی و جنسیت بر کلسترول خون در کودکان

آوریل 2, 2020 10 نظرات

آموزش آمار

روایی پرسشنامه – صوری٬ محتوایی و سازه ای

توسط لادن عباس نیا مارس 26, 2020

نوشته شده توسط لادن عباس نیا

[block id=”breadcrumb”]

روایی پرسشنامه یکی از مباحث پرتکراری است که برای پایان نامه ها بسیار حائز اهمیت است. روایی پرسشنامه انواع مختلف دارد که در این مطلب ابتدا آن را تعریف کرده و دو روش روایی که شامل روایی درونی و روایی بیرونی است را شرح می دهیم و مثال های واقعی و ملموس را برای شما نمایش می دهیم.

روایی یعنی چه ؟

روایی پرسشنامه (اعتبار پرسشنامه) به این معناست که وقتی می خواهیم پرسشنامه ای طراحی کنیم، آیا این پرسشنامه با اهداف در نظر گرفته شده مطابقت دارد یا خیر؟ برای روایی پرسشنامه دو مدل معرفی خواهیم کرد:

روایی درونی
روایی بیرونی

روایی درونی به این معناست که آیا وسیله اندازه گیری، خصیصه واقعی تحقیق را اندازه گیری می نماید یا خیر؟ به زبان ساده تر روایی درونی پرسشنامه می گوید: آیا پرسشنامه طراحی شده، متغیرها و صفت تحقیق را اندازه گیری می کند؟ به عنوان مثال پرسشنامه ای که می تواند ویژگی های شخصیتی مدیران یک سازمان را اندازه گیری کند، آیا می تواند عملکرد مدیران را نیز بررسی کند؟

روایی بیرونی به این معناست که با چه میزان دقت می توان مولفه هایی که از نمونه به دست آمده را برای جامعه ای که نمونه از آن آمده تعمیم داد. به عنوان مثال اگر جامعه آماری ما کل دانش آموزان شهر مشهد باشد. با استفاده از پرسشنامه ای میزان تاثیر استرس بر پیشرفت تحصیلی دانش آموزان 4 مدرسه در شهر مشهد را به طور تصادفی سنجیده ایم. آیا می توان مولفه های این پرسشنامه را برای کل دانش آموزان شهر مشهد استفاده کرد؟

روایی محتوایی چیست؟

برای بررسی روایی محتوایی پرسشنامه گروهی متخصص که مسلط به موضوع پژوهش هستند دور هم جمع می شوند و در مورد ابزار اندازه گیری پژوهش نظر می دهند. این گروه سوالات زیر را بررسی می کنند:

آیا سوالات پرسشنامه اهداف پژوهش را برآورده می کند؟ یا خیر؟
آیا محتوای سوالات پژوهش قابل درک برای افراد متخصص و غیر متخصص هست؟
آیا مفهوم تمامی سوالات پژوهش برای اندازه گیری صفت مورد بررسی مناسب است؟
آیا ابزار اندازه گیری همه جوانب پژوهش را پوشش می دهد یا خیر؟

به طور کلی برای تعیین روایی محتوایی پرسشنامه از قضاوت متخصصان و بررسی میزان پوشش و تناسب سوالات با اهداف موضوع تحقیق استفاده خواهد شد. جهت بررسی روایی محتوا پرسشنامه حاوی سوال های زیر به خبرگان محتوا داده خواهد شد تا در مورد تک تک سوال ها به سوال های زیر پاسخ دهند :

ضرورت سوال مورد نظر تا چه اندازه می باشد؟

کاملا ضروری نه ضروری و نه غیر ضروری غیر ضروری

مرتبط بودن سوال مورد نظر تا چه اندازه می باشد؟

کاملا مرتبط مرتبط با مختصر تغییر نیاز به مقداری تغییر غیر مرتبط

شفافیت سوال مورد نظر تا چه اندازه می باشد؟

کاملا شفاف شفاف با مختصرتغییر نیاز به مقداری تغییر غیر شفاف

سادگی سوال مورد نظر تا چه اندازه می باشد؟

کاملا ساده ساده با مختصرتغییر نیاز به مقداری تغییر غیر ساده

ابهام مفهوم سوال مورد نظر تا چه اندازه می باشد؟

کاملا روشن روشن با مختصرتغییر نیاز به مقداری تغییر مبهم

لازم به توضیح است که تعداد متخصصین که سوال های مورد نظر را مورد ارزیابی قرار خواهند داد حداقل باید چهار نفر باشد. به هر کدام از سوالات طراحی شده بر حسب امتیاز دهی عدد 1، 2، 3 و یا 4 داده خواهد شد. میانگین امتیاز نظرات خبرگان محاسبه خواهد شد که میانگین امتیاز کل پرسشنامه نیز با محاسبه میانگین سوالات بدست خواهد آمد.

شاخص دیگری که روایی محتوایی را مورد ارزیابی قرار خواهد داد ‘نرخ روایی محتوا’ است. این شاخص با استفاده از سوال اول و بر اساس ضرورت سوال مطرح شده اندازه گیری خواهد شد. پس از محاسبه بر اساس مقدار آن به ترتیب زیر در خصوص سوال تصمیم گیری خواهد شد:

اگر مقدار آن منفی باشد ضرورت سوال مورد نظر را رد کرده و سوال باید از پرسشنامه حذف گردد.
اگر مقدار آن صفر یا بیشتر باشد از جدول لاوشه برای مقایسه استفاده خواهیم نمود.

جهت بررسی شاخص روایی محتوا از روش والتز و باسل استفاده خواهد شد بدین صورت که متخصصان «مربوط بودن»، «واضح بودن» و «ساده بودن» هر گویه را بر اساس یک طیف لیکرتی 4 قسمتی مشخص می کنند. متخصصان مربوط بودن هر گویه را از نظر خودشان از 1 «مربوط نیست»، 2 «نسبتاً مربوط است»، 3 «مربوط است»، تا 4 «کاملاً مربوط است» مشخص می کنند. ساده بودن گویه نیز به ترتیب از 1 «ساده نیست»، 2 «نسبتاً ساده است»، 3 «ساده است»، تا 4 «ساده مربوط است» و واضح بودن گویه نیز به ترتیب از 1 «واضح نیست»، 2 «نسبتاً واضح است»، 3 «واضح است»، تا 4 «واضح مربوط است» مشخص می شود.

CVI=تعداد کل متخصصین/تعداد متخصصینی که به گویه نمره 3 و 4 داده اند

حداقل مقدار قابل قبول برای شاخص CVI برابر با 0/79 است و اگر شاخص CVI گویه ای کمتر از 0/79 باشد آن گویه بایستی حذف شود.

چگونه روایی محتوایی را محاسبه کنیم با مثال کاربردی

همانطور که قبلا گفتیم یکی از مهم‌ترین اعتبارسنجی‌های پرسشنامه شامل بررسی روایی محتوایی آن است. در ابتدای مقاله درخصوص محاسبه شاخص CVI صحبت کردیم. حال می‌خواهیم شاخص CVR را معرفی کنیم. حتما دقت کنید که برای محاسبه روایی محتوایی از یکی از شاخص‌ها استفاده کنید و همزمان هر دو شاخص CVI و CVR را محاسبه نکنید. برای محاسبه شاخص CVR، ابتدا به خبرگان می‌گوییم برای تمام سوالات پرسشنامه یکی از گزینه‌های زیر را علامت بزنند:

این گویه ضروری است
این گویه مفید است ولی ضروری نیست
این گویه ضروری نیست

حال بر اساس تعداد متخصصینی که سوالات پرسشنامه را ارزیابی کردند، شاخص CVR را از فرمول زیر محاسبه می‌کنیم:

در فرمول بالا N تعداد کل متخصصین است و n تعداد متخصصینی است که گزینه ضروری را انتخاب کرده‌اند.

حال سوال اینجاست که براساس نظرات خبرگان کدام سوال از پرسشنامه حذف و کدام سوال باقی می‌ماند؟ برای این موضوع حداقل مقدار CVR بستگی به تعداد خبرگان دارد و براساس جدول زیر تعیین می‌شود:

حداقل مقدار CVR قابل قبول بر اساس تعداد خبرگان

تعداد خبرگان	مقدار CVR	تعداد خبرگان	مقدار CVR
5	0/99	13	0/54
6	0/99	14	0/51
7	0/99	15	0/49
8	0/78	20	0/42
9	0/75	25	0/37
10	0/62	30	0/33
11	0/59	35	0/31
12	0/56	40	0/29

حال با یک مثال ساده شاخص CVR را محاسبه می‌کنیم. فرض کنید در پژوهشی می‌خواهیم شیوه‌های ارتقای رضایتمندی زائران از خدمات مدیریت انتظامی ترافیک و حمل و نقل شهری را مورد بررسی قرار دهیم. برای این منظور پرسشنامه با سوالات زیر درنظر گرفته‌ایم و از 5 نفر خبره در این حوزه می‌خواهیم درخصوص سوالات این پرسشنامه نظر بدهند. نتایج به شرح زیر است:

لطفاً پاسخ مناسب را با علامت P مشخص کنید.	این گویه ضروری است	این گویه مفید است ولی ضروری نیست	این گویه ضروری نیست
1-رفع معضلات ترافیکی اطراف حرم مطهر رضوی با اجرای طرح زوج و فرد	5
2- ایجاد پارکینگ در مناطق تجاری مشهد	4	1
3-حضور پررنگ ماموران راهنمایی رانندگی در سطح شهر مشهد	3	2
4-ایجاد مسیرهای یک طرفه به سمت حرم مطهر رضوی	2	2	1
5-استقرار کانکس و ایستگاه راهور در مناطق تجاری راهور	5
6-ارائه اطلاعات و راهنمایی‏های لازم به گردشگران در خصوص جابجایی درون‏شهری و خطوط حمل و نقل عمومی	5
7-نصب تابلوهای هدایت‏کننده و هشدار دهنده در مسیرهای تردد گردشگران در شهر جهت جلوگیری از سردرگمی آنها	5
8- نظارت نیروی انتظامی بر امنیت و ایمنی حمل‏و نقل درون شهری با تأکید بر تورها و مسیرهای توریستی	5
9-هوشمندسازی موضوعات متناظر بر امنیت و استفاده از شیوه‌های نوین	5

حال شاخص CVR را برای هر گویه محاسبه می‌کنیم.

شاخص CVR برای گویه اول برابر است با:

پس گویه اول در پرسشنامه باقی می‌ماند.

شاخص CVR برای گویه دوم برابر است با:

پس گویه دوم از پرسشنامه حذف می‌شود.

شاخص CVR برای گویه سوم برابر است با:

پس گویه سوم از پرسشنامه حذف می‌شود.

شاخص CVR برای گویه چهارم برابر است با:

پس گویه چهارم از پرسشنامه حذف می‌شود.

شاخص CVR برای گویه 5، 6، 7، 8 و 9 نیز مانند گویه اول برابر با 1 است و این گویه‌ها در پرسشنامه باقی می‌مانند.

روایی صوری

روایی صوری شباهت زیادی به روایی محتوایی دارد با این تفاوت که در روایی صوری شاخص ها و ضرایب محاسبه نمی شود. نظرات اصلاحي متخصصان در چک لیست گنجانده می شود و پرسش نامه اصلاح شده در اختيار کارشناسان قرار می گیرد و از نظرات اصلاحي آنان در مورد نحوة تدوين سؤالات و گزينه‌ها‌ استفاده می شود و به صورت صوری و با نظر گروه متخصص سوالات حذف، اضافه و یا تغییر می کنند.

روایی ملاکی

روایی ملاکی به این معناست که ابزار اندازه گیری در موقعیت های خاص چگونه عمل می کند؟ در روایی ملاکی، عملکرد افراد شرکت کننده در آزمون با یک ملاک مقایسه می شود. روایی ملاک به دو گروه تقسیم می شود:

روایی پیش بین: این روایی رابطه بین نمره های آزمودنی و آنچه ادعای آن را دارد می سنجد. به عنوان مثال در یک پژوهش ارتباط بین انگیزه و پیشرفت کاری کارکنان یک سازمان سنجیده شده است و این نتیجه حاصل شده که هر چه انگیزه بیشتر باشد پیشرفت کاری کارکنان نیز بیشتر است. حال 4 سال دیگر به همان سازمان مراجعه می شود و می بینیم که 60 درصد کارکنان با انگیزه، پیشرفت خوبی در کار خود داشته اند. این داده ها اعتبار پیش بین این ابزار اندازه گیری را نشان می دهند و اعتبار پیش بین به صورت ضریب همبستگی بین نمره های آزمون و نمره ملاک محاسبه می شود.
روایی همزمان: روایی همزمان در واقع به این معناست که نمره های حاصل از اندازه گیری در دو آزمون در یک زمان در دسترس باشد. به عنوان مثال فرض کنید پرسشنامه جهت اندازه گیری متغیر انگیزه کارکنان سازمان تهیه می کنیم. برای اینکه این ابزار اندازه گیری دارای روایی همزمان بالایی باشد باید افرادی که به پرسشنامه مذکور جواب داده اند به پرسشنامه های استاندارد دیگر در زمینه اندازه گیری متغیر انگیزه نیز جواب مشابهی دهند. محاسبه روایی همزمان، از تعیین ضریب همبستگی بین امتیازات پرسشنامه طراحی شده با امتیازهای پرسشنامه استاندارد به دست خواهد آمد.

روایی سازه

روایی سازه بررسی کلی روابط بین عامل‌ها با یکدیگر و عامل‌ها با سوالات مربوط به هر عامل در پرسشنامه است. در روایی سازه می خواهیم به طور کلی بررسی کنیم که ابزار اندازه گیری ما تا چه اندازه صفت مورد نظر را اندازه گیری می کند. هر چه همبستگی بین عامل ها بیشتر باشد اعتبار پرسشنامه و یا سازه ما بالاتر است. فرض کنید می خواهید تاثیر ویژگی های شخصیتی مدیران را بر عملکرد کارکنان زیرمجموعه آن ها بسنجید. بنابراین مدلی مانند زیر داریم:

در مدل بالا ضرایب مسیر بین دو عامل ویژگی های شخصیتی و عملکرد کارکنان و ضرایب مسیر بین هر عامل با سوالاتش نشان دهنده اعتبار سازه است که همان تحلیل عاملی تاییدی است. تحلیل عاملی تأییدی توسط مدل‌یابی معادلات ساختاری قابل انجام است.

روایی همگرا

روایی همگرا میزان همبستگی بین هر عامل با سوالاتش است. در مدل بالا سوال های 1 تا 5 فقط باید با عامل ویژگی های شخصیتی، همبستگی داشته باشند و این میزان همبستگی باید از حدی بالاتر باشد تا روایی همگرا تایید شود. معيار AVE نشان‌دهنده ميانگين واريانس به اشتراک گذاشته شده بين هر عامل با سوالات خود مي‌باشد. به بيان ساده‌تر AVE ميزان همبستگي يک عامل با سوالات خود را نشان مي‌دهد که هرچه اين همبستگي بيشتر باشد، برازش نيز بيشتر است. روش فورنل و لارکر مقدار مناسب براي AVE (Average Variance Extracted) را 5/0 به بالا معرفي کرده‌اند. فرمول AVE به صورت زیر است:

روایی واگرا

روایی واگرا در واقع دو موضوع را پوشش می دهد:

مقايسه ميزان همبستگي بين سوال‌هاي يک عامل با آن عامل در مقابل همبستگي آن سوال‌ها با عامل‌هاي ديگر (Cross Loading). در اين روش ميزان همبستگي بين سوالات يک عامل با آن عامل و ميزان همبستگي بين سوالات يک عامل با عامل‌هاي ديگر مقايسه مي‌گردد. در صورتي که مشخص شود ميزان همبستگي بين يک سوال با عامل‌هاي ديگر غير از عامل خود بيشتر از همبستگي آن سوال با عامل مربوط به خود است، روايي واگراي مدل زير سوال مي‌رود.
مقايسه ميزان همبستگي يک عامل با سوال‌هايش در مقابل همبستگي آن عامل با ساير عامل‌ها. معيار مهم ديگري که با روايي واگرا مشخص مي‌گردد،‌ ميزان رابطه يک عامل با سوالاتش در مقايسه با رابطه آن عامل با ساير عامل‌هاست، به طوري که روايي واگراي قابل قبول يک مدل حاکي از آن است که يک عامل در مدل تعامل بيشتري با سوالات خود دارد تا با عامل‌هاي ديگر. روايي واگرا وقتي در سطح قابل قبول است که ميزان AVE براي هر عامل بيشتر از واريانس اشتراکي بين آن عامل و عامل‌هاي ديگر در مدل باشد.

به بیان ساده تر در مدل معرفی شده در بخش روایی سازه، برای اینکه روایی واگرا در مدل تایید شود اولا می بایست همبستگی بین سوالات 1 تا 5 با عامل ویژگی های شخصیتی مدیران بیشتر از همبستگی بین سوالات 1 تا 5 با عامل عملکرد کارکنان باشد. دوما می بایست همبستگی بین عامل ویژگی های شخصیتی مدیران با سوالات 1 تا 5 بیشتر از همبستگی بین عامل ویژگی های شخصیتی مدیران و عملکرد کارکنان باشد.

با توچه به اهمیت اعتبار پرسشنامه در مقالات پژوهشی و همچنین پایان نامه ها شماا باید نسبت به روایی و انواع آن دید لازم را پیدا کنید. برای اینکه دقت شما در بررسی روایی پرسشنامه بیش از پیش باشد بهتر است با متخصصان آمار مشورت کنید. آمار پیشرو پل ارتباطی رایگانی را بین شما و متخصصان خود قرار داده است برای بهره مندی از این خدمات می توانید با مراجعه به بخش مشاوره آماری رایگان مشکلات خود را با آن ها درمیان بگذارید.

در بسیاری از موارد افراد برای بررسی روایی پرسشنامه خود از خدمات شرکت های آماری استفاده می کنند. بسیار اهمیت دارد که در این مسیر خود نیز اطلاعات لازم را داشته باشید. متخصصان آمار پیشرو در ارائه خدمات خود تا آخرین لحظه در کنار شما خواهند بود. شما می توانید برای آگاهی لازم نسبت به خدمات انجام تحلیل آماری و تحلیل آماری پایان نامه با استفاده از معادلات ساختاری می توانید به این بخش ها مراجعه کنید.

چنانچه می خواهید از این خدمات استفاده کنید به قسمت ثبت سفارش مراجعه کرده و با تکمیل فرم در اولین فرصت کارشناسان ما با شما تماس برقرار خواهند کرد. همچنین اگر علاقه مند به مباحث آماری هستید می توانید با دنبال کردن صفحه اینستاگرام آمار پیشرو از جدید نرین مطالب اینحوزه با خبر شوید.

روایی چیست؟

روایی پرسشنامه (اعتبار پرسشنامه) به این معناست که وقتی می خواهیم پرسشنامه ای طراحی کنیم، آیا این پرسشنامه با اهداف در نظر گرفته شده مطابقت دارد یا خیر؟

روایی محتوایی چگونه انجام می‌شود؟

برای تعیین روایی محتوایی پرسشنامه از قضاوت متخصصان و بررسی میزان پوشش و تناسب سوالات با اهداف موضوع تحقیق استفاده می‌شود.

روایی صوری چگونه انجام می‌شود؟

برای تعیین روایی صوری از نظرات اصلاحی کارشناسان در مورد نحوه تدوین سوالات و گزینه ها استفاده می‌شود.

روایی ملاکی چگونه انجام می‌شود؟

در روایی ملاکی عملکرد افراد شرکت کننده در آزمون با یک ملاک مقایسه می‌شود.

روایی سازه چیست؟

روایی سازه بررسی کلی روابط بین عامل‌ها با یکدیگر و عامل‌ها با سوالات مربوط به هر عامل در پرسشنامه است.

روایی همگرا چیست؟

روایی همگرا میزان همبستگی بین هر عامل با سوالاتش است.

روایی واگرا چیست؟

مقایسه میزان همبستگی بین سوال های یک عامل با آن عامل در مقابل همبستگی آن سوال با عامل های دیگر و مقایسه میزان همبستگی یک عامل با سوال هایش در مقابل همبستگی آن عامل با سایر عامل هاست.

مارس 26, 2020 3 نظرات

آموزش آمار

تحلیل سلسله مراتبی فازی(FAHP) چیست؟با مثالی کاربردی

توسط لادن عباس نیا مارس 19, 2020

نوشته شده توسط لادن عباس نیا

[block id=”breadcrumb”]

تحلیل سلسله مراتبی فازی در واقع فازی سازی روش تحلیل سلسله مراتبی کلاسیک است. با توجه به این امر ابتدا تحلیل سلسله مراتبی را تبیین می کنیم و پس از آن مراحل تحلیل سلسله مراتبی فازی را با مثالی ملموس اجرا می کنیم.

تحلیل سلسله مراتبی چیست؟ با مثال ساده

فرآيند تحليل سلسله مراتبي (AHP) براي تصميم‌گيري با معيارهاي چندگانه به‌کار می‌رود زیرا با استفاده از این مدل می‌توان معیارها را به صورت سلسله مراتبی با هم مقایسه کرد. این معیارها می‌توانند کمی و یا کیفی باشند. تحليل سلسله مراتبي (AHP) توسط توماس ال، ساعتي در دهه 1970 ارائه شده است. اين روش بر اساس مقايسات زوجي انجام می‌شود.

به عنوان مثال می‌خواهیم چندین مکان را برای احداث سالن ورزشی با هم مقایسه کنیم. این مکان‌ها دارای ویژگی‌های متفاوت هستند. تمام معیارهایی که برای انتخاب یک سالن ورزشی مناسب باید در نظر گرفته شود را بررسی کرده‌ایم. می‌خواهیم با استفاده از این معیارها زمین‌های مناسب را شناسایی و اولویت بندی کنیم. برای اینکار از روش تحلیل سلسله مراتبی استفاده می‌کنیم و با توجه به نظرات خبرگان تصمیم‌گیری چندمعیاره را انجام می‌دهیم.

تحلیل سلسله مراتبی فازی چیست؟ با مثال ساده

فرآيند تحليل سلسله مراتبي فازي (FAHP) عبارتست از فازي سازي روش AHP كلاسيك با استفاده از اعداد و محاسبات فازي. هنگامی که اولویت‌ها عدم اطمینان و عدم دقت را نشان می‌دهند، اعداد قطعی و دقیق برای نشان دادن قضاوت زمانی خیلی مناسب نیست.در جهت مقابله با ابهام، اعداد فازی مثلثی و AHP در روش فازی برای حل تصمیم‌گیری مسائل ادغام شده‌اند.

براي برخورد با ابهام موجود در نظرات انسان‌ها، لطفي عسگر‌زاده در سال 1965، نظريه مجموعه‌هاي فازي را ارائه داد تا عدم قطعيتي را كه به علت ابهام و عدم دقت در رويدادها ايجاد شده است، تحت مدل درآورد. چانگ در سال 1992 روشي بسيار ساده را براي بسط فرآيند تحليل سلسله مراتبي به فضاي فازي ارائه داد. اين روش كه مبتني بر ميانگين حسابي نظرات خبرگان و روش نرمال‌سازی ساعتي و با استفاده از اعداد مثلثي فازي توسعه داده شده بود، مورد استقبال محققان قرار گرفت.

با یک مثال ساده سلسله مراتبی فازی را بیشتر توضیح می‌دهیم. فرض کنید برای اولویت بندی دروس دانشجویان معیارهایی وجود دارد، اما برای این معیارها اعداد قطعی جوابگو نیستند، پس ناچاریم از اعداد غیر قطعی یا فازی استفاده کنیم.

تحلیل سلسله مراتبی فازی یکی از خدمات تحلیل آماری است که شما می توانید آن را خود انجام دهید یا به یک شرکت آماری بسپارید، اگر وقت لازم را دارید می توانید در این مطلب کامل یک مثال ملمویس را حل کردیم که کامل آموزش ببینید، اما چنانچه وقت کافی ندارید می توانید این نوع تحلیل را به عنوان یکی از خدمات تحلیل آماری با تعریف پروژه آماری از بخش خدمات سفارش دهید.

مراحل انجام تحلیل سلسله مراتبی فازی چانگ

مرحله 1: ترسيم درخت سلسله مراتبي، در اين مرحله ابتدا ساختار سلسله مراتبي تصميم با استفاده از سطوح هدف، معيار و زيرمعيارها ترسيم مي‌شود.

مرحله2: تعریف اعداد فازی به‌منظور انجام مقایسه‌های زوجی

مرحله3: تشكيل ماتريس مقايسات زوجي، در اين مرحله ماتريس‌هاي توافقي را مطابق با درخت تصميم و با استفاده از نظرات خبرگان تشكيل داده و سپس نرخ ناسازگاري مطابق روش گوگوس و بوچر محاسبه مي‌گردد.

ماتریس مقایسه زوجی به‌صورت زیر خواهد بود:

كه اين ماتريس حاوي اعداد فازي زير است:

مرحله4: محاسبه براي هر يك از سطرهاي ماتريس مقايسه زوجي كه خود يك عدد فازي مثلثي است از رابطه زير محاسبه مي‌شود:

كه در اين رابطه i بيان‌گر شماره سطر و j بيان‌گر شماره ستون مي‌باشد.در اين رابطه اعداد فازي مثلثي ماتريس‌هاي مقايسه زوجي هستند. مقادير و ورا مي‌توان به ترتيب از روابط زير محاسبه كرد:

در روابط بالا به ترتيب مولفه‌هاي اول تا سوم اعداد فازي هستند.

مرحله 5: محاسبه درجه بزرگي ها نسبت به همديگر

به طور كلي اگر دو عدد فازي مثلثي باشند، طبق ماتریس مقایسه زوجی درجه بزرگي نسبت به به صورت زير تعريف مي‌شود:

دو عدد فازی و مقدار درجه بزرگی

از طرف ديگر ميزان بزرگي يك عدد فازي مثلثي از K عدد فازي مثلثي ديگر از رابطه زير به دست مي‌آيد:

مرحله 6: محاسبه وزن معيارها و گزينه‌ها در ماتريس‌هاي مقايسه زوجي بدين منظور از رابطه زير استفاده مي‌شود:

بنابراين بردار وزن نرمال‌سازی نشده به صورت زير خواهد بود:

مرحله 7: براي محاسبه بردار وزن نهايي بايد بردار وزن محاسبه شده در مرحله قبل را نرمال‌سازی كرد بنابراين:

سایر مراحل مشابه روش تحلیل سلسله مراتبی کلاسیک خواهد بود.

برای روشن شدن این موضوع تمامی مراحل را در قالب مثالی، مرحله به مرحله انجام می‌دهیم. هدف اولويت‌بندي دروس اختياري دانشجويان تحصيلات تكميلي رشته آمار با روش AHP و رويكرد فازي از فارغ‌التحصيلان مقطع دكتري دانشكده علوم ریاضی دانشگاه فردوسي مشهد در سال 1398 می‌باشد.

یکی از مهمترین تصمیمات دانشجویان تحصیلات تکمیلی در طول تحصیل انتخاب صحیح دروس اختیاری است. به این دلیل که دروس اختیاری منجر به افزایش مهارت‌های علمی-پژوهشی و حرفه‌ای-شغلی می‌شود. به این منظور این مطالعه با هدف اولویت‌بندی دروس اختیاری دانشجویان تحصیلات تکمیلی بر اساس دو معیار ذکر شده، از دید فارغ‌التحصیلان دکتری انجام شده است. تحلیل داده‌ها با استفاده از روش تحلیل سلسله مراتبی فازی بوده است.

مطالعه تحلیلی حاضر در سال 98 از تعداد 12 نفر از فارغ‌التحصیلان دکتری تخصصی دانشکده علوم ریاضی دانشگاه فردوسی مشهد انجام گرفت. ابزار پژوهش پرسشنامه طراحی شده شامل دو بخش: سوالات دموگرافیک و سوالات مقایسه زوجی معیارها بود.

روش انجام تحلیل سلسله مراتبی فازی با مثال کاربردی

به منظور كسب نظرات نخبگان در ماتريس‌ مقايسه‌هاي زوجي از پرسشنامه استفاده شده است. پرسشنامه‌ها طوري طراحي شده بود كه به پاسخ‌دهندگان اين امكان را مي‌داد كه با مقايسه زوجي معيارها و زيرمعيارها در گروه خودشان اهميت هر يك از آن‌ها را مشخص كنند. براي سنجش روايي پرسشنامه از نظرات خبرگان دانشگاهي و اساتيد گروه آمار دانشگاه فردوسي مشهد استفاده گرديده است.

همچنين به منظور سنجش پايايي پرسشنامه از نرخ ناسازگاري استفاده شده است، که در تمام موارد، نرخ ناسازگاری کمتر از 1/0 به‌دست آمده است. پس از جمع‌آوري پاسخ‌هاي خبرگان در قالب گويه‌هاي كلامي بايستي پاسخ‌هاي مذكور به مقياس فازي تبديل شوند. مقياس مورد استفاده در اين پژوهش، مقياس فازي 9 تايي (ماتریس مقایسه زوجی) است كه كائول و ورما بر اساس مقياس ساعتي پيشنهاد كرده‌اند.

Fuzzy-spectrum-and-corresponding-verbal-expressions-FAHP

محاسبات فرآیند تحلیل سلسله مراتبی فازی

با استفاده از ساختار سلسله مراتبی و با دنبال کردن گام‌های فرآیند فازی که در بالا به آن اشاره شد، نخست نظرات خبرگان (از طریق تبدیل عبارات کلامی به اعداد فازی مثلثی فازی) جمع‌آوری و سپس وزن هر یک از معیارهای سطوح ساختار سلسله مراتبی محاسبه می‌شود. نتایج محاسبات فازی برای 10 اولویت اول در ادامه جداول آمده است.

A hierarchical tree diagram of FAHP model

درخت سلسله مراتبی عوامل موثر بر اتخاذ تصمیم‌گیری (دروس دکتری)

Primary-Pairwise-Fuzzy-Comparison-Matrix-FAHP

محاسبه وزن نهایی (مهارت افزایی علمی-پژوهشی)

ماتریس مقایسات فازی زوجی (مهارت افزایی حرفه‌ای-شغلی)

ماتریس مقایسات فازی زوجی (مهارت افزایی حرفه‌ای-شغلی)

محاسبه وزن نهایی (مهارت افزایی حرفه‌ای-شغلی)

اولویت بندی مهارت فارغ‌التحصیلان دکتری

اولویت بندی دروس دکتری بر اساس مهارت افزایی علمی-پژوهشی

اولویت بندی دروس دکتری بر اساس مهارت افزایی حرفه‌ای-شغلی

نتیجه‌گیری مثال

یافته‌های تحقیق نشان می‌دهد که برای دانشجویان دکتری، مهارت افزایی علمی-پژوهشی از دید خبرگان در رتبه نخست قرار دارد. در نتایج اولویت‌بندی دروس دکتری بر اساس مهارت افزایی علمی-پژوهشی، سه رتبه اول به ترتیب مربوط به دروس فرآیند تصادفی پیشرفته 1، متغیرهای تصادفی وابسته و مباحث مرتبط با آن‌ها و مباحث پیشرفته در داده‌های ترتیبی و بر اساس مهارت‌ افزایی حرفه‌ای-شغلی، سه رتبه اول به ترتیب مربوط به دروس فرآیند تصادفی پیشرفته 1، مباحث پیشرفته در داده‌های ترتیبی و متغیرهای تصادفی وابسته و مباحث مرتبط با آن‌ها می‌باشد.

شما می توانید برای دریافت خدمات مربوط به تحلیل سلسله مراتبی فازی می‌توانید با متخصصان ما در شرکت آمار پیشرو ارتباط برقرار کنید.

چنانچه علاقه مند به مباحث آماری هستید می توانید مطالب و ویدیوهای جدید را در صفحه اینستاگرام آمارپیشرو ببینید.

تحلیل سلسله مراتبی (AHP) چیست؟

فرآيند تحليل سلسله مراتبي (AHP) براي تصميم‌گيري با معيارهاي چندگانه به‌کار می‌رود زیرا با استفاده از این مدل می‌توان معیارها را به صورت سلسله مراتبی با هم مقایسه کرد.

تحلیل سلسله مراتبی فازی (FAHP) چیست؟

فرآيند تحليل سلسله مراتبي فازي (FAHP) عبارتست از فازي سازي روش AHP كلاسيك با استفاده از اعداد و محاسبات فازي

برای فرآیند تحلیل سلسله مراتبی از چه نرم افزاری استفاده می‌شود؟

از نرم افزار Expert choice و Excel استفاده می‌شود.

مارس 19, 2020 3 نظرات

آمار استنباطی پارامتری

تحلیل کواریانس (ANCOVA) چیست؟ مثال کاربردی در spss

توسط لادن عباس نیا مارس 2, 2020

نوشته شده توسط لادن عباس نیا

تحلیل کواریانس یکی از مهمترین مباحث آماری است. ابتدا با مثال ملموس شروع می‌کنیم. مدیر فروشی می خواهد بررسی کند که آیا فروشنده های مرد موفق تر هستند یا فروشنده های زن؟ او می داند سابقه کار هم در موفقیت فروشندگان موثر است.در آنالیز کوواریانس علاوه بر متغیر وابسته و متغیرهای مستقل، متغیرهای اضافی که بر نتیجه آزمایش تاثیر می گذارد نیز وجود دارند که می توان این متغیرها را به عنوان متغیر مستقل به مدل اضافه کرد.

در این حالت، آن ها را به عنوان متغیرهای کمکی (covariate) می شناسیم. توجه کنید که این متغیرهای کمکی، کمی هستند. هدف اصلی استفاده از متغیرهای کمکی، افزایش دقت در تصمیم گیری است. با یک مثال ساده دیگر آنالیز کوواریانس را بیشتر توضیح می دهیم.آنالیز کواریانس چند متغیره یکی از روش های پیچیده اماری است که پیشنهاد می کنیم آن را از دست ندهید.

فرض کنید دو گروه از افراد را داریم که بیماری دیابت دارند. می خواهیم تاثیر داروی جدید را روی قند خون ناشتا این دو گروه بسنجیم. قبل از شروع آزمایش میزان قند خون هر دو گروه را اندازه می گیریم و بعد به گروه اول دارو را تزریق می کنیم و به گروه دوم دارو را تزریق نمی کنیم. بعد از یک هفته دوباره میزان قند خون ناشتا هر دو گروه را اندازه می گیریم. آن گاه اثر دارو را روی قند خون دو گروه می سنجیم.

آنالیز کواریانس به زبان ساده

آنالیز کوواریانس یا آنکوا، نوعی آنالیز و تحلیل همانند آنوا (ANOVA) می‌باشد و هرگاه در آنالیز واریانس بخواهیم اثر متغیرهای مداخله‌گر را به روش‌های آماری حذف کنیم تا نتایج با دقت بیشتری به دست آید از آنالیز کوواریانس استفاده می‌شود. در این روش هم از کنترل آماری استفاده می‌شود و هم از واریانس، به‌عبارت‌ بهتر به جای تحلیل واریانس تحلیل کوواریانس مورد استفاده قرار می‌گیرد.

درحقیقت آنکوا (ANCOVA) مدل ادغام شده آنوا (ANOVA) و همچنین رگرسیونی برای متغیرهای پیوسته است. تحلیل کوواریانس مناسبترین آزمون آماری برای طرح پیش آزمون و پس آزمون ٢ گروهی است و تنها عامل تهدید کننده اعتبار درونی تحلیل کوواریانس طرح پیش آزمون است. طرح‌هایی که در آن‌ها چندین متغیر مستقل کمی و در ارتباط با عامل‌های کیفی بکار برده می‌شوند، طرح‌های تحلیل کواریانس نامیده می‌شوند.

فرضیاتی که قبل از انجام تحلیل کواریانس باد برقرار باشد.

استقلال: امتیازهای مربوط به هر فرد (آزمودنی) در هر دو متغیر مستقل و کمکی باید از امتیازهای دیگر افراد (آزمودنی‌ها) مستقل باشد.
نرمال بودن: متغیر وابسته باید دارای توزیع نرمال برای آزمودنی‌هایی با امتیاز یکسان در متغیر کمکی و در گروهی یکسان باشد. در واقع می‌خواهیم نرمال بودن را به ازای هر امتیاز متغیر کمکی به‌دست آوریم. اگر متغیر کمکی به‌طور نرمال توزیع شده باشد، آن‌گاه ANCOVA نسبت به این فرض نیرومند است. یعنی تخطی از این فرض زمانی که متغیر کمکی شما نرمال باشد، مساله‌ای ایجاد نمی‌کند و تنها کافی‌ است نرمال بودن متغیر کمکی بررسی شود.
خطی بودن: برای هر گروه، میان متغیر وابسته و کمکی می‌بایستی یک رابطه‌ی خطی وجود داشته باشد. این بررسی را می‌توان توسط نمودار پراکنش برای هر گروه انجام داد.
همگنی شیب‌های رگرسیونی: رابطه متغیر وابسته و کمکی در هر گروه باید یکسان باشد. در فرض 3 گفتیم که یک رابطه خطی می‌بایستی بین این دو متغیر در هر گروه وجود داشته باشد، هر رابطه‌ی خطی دارای یک شیب است، و این شیب‌ها در هر گروه باید تقریبا یکسان باشند.رگرسیون چیست؟
استقلال متغیر کمکی و تیمارها: زمانی که نسبت (سهم) تغییرپذیری مشترک بین متغیر وابسته و کمکی را حذف می‌کنید، می‌بایستی دقت کنید که برخی از اثرات متغیر مستقل را حذف نکرده‌اید. با اندازه‌گیری متغیر کمکی قبل شروع آزمایش و همچنین جایگذاری تصادفی آزمودنی‌ها در سطوح مختلف متغیر مستقل می‌توان در این مورد تا اندازه‌ای چشم‌پوشی کرد.
اعتبار متغیر کمکی: وسیله‌ای که برای اندازه‌گیری متغیر کمکی به‌کار می‌رود، باید قابل اطمینان باشد.
همگنی واریانس‌ها: گروه‌ها می‌بایستی از جوامعی با واریانس‌های برابر برداشته شوند. برای آزمون برابری واریانس‌ها، SPSS از آزمون لوین (Levene) استفاده می‌کند. اگر این آزمون معنادار باشد آن‌گاه فرضیه صفر یعنی برابری واریانس‌ها را رد می‌کنیم و اگر این آزمون معنادار نباشد آن‌گاه فرضیه‌ی صفر یعنی برابری واریانس‌ها را می‌پذیریم. یعنی تفاوت معناداری میان واریانس‌های گروه‌ها وجود ندارد.

نمودار پراکنش قبل از تحلیل کوواریانس

قبل از انجام آزمون باید فرض خطی بودن و همگنی شیب‌های رگرسیونی را از طریق رسم نمودار پراکنش، بررسی کنیم:

هر دو نمودار پراکنش رابطه‌ی خطی میان متغیر وابسته (نمرات پس آزمون) و کمکی (نمرات پیش آزمون) را برای هر دو گروه آزمایش و گواه نشان می‌دهند. به‌علاوه، نمودارها نشان می‌دهند که شیب خط (فرضی) رگرسیونی در بین این دو گروه یکسان است.

تحلیل کواریانس در SPSS

در اینجا مراحل انجام آزمون آنالیز کوواریانس را شرح می دهیم. پس از بررسی پیش فرض‌ها و برقراری فرضیات مطرح شده آزمون آنالیز کواریانس را از منوی Analyze گزینه General Linear Model و سپس گزینه Univariate را انتخاب می کنیم.

نرم افزار SPSS چیست؟ و چه کاربردی دارد؟

حال در پنجره ای که باز می‌شود، متغیر وابسته را در کادر Dependent variable و متغیر مستقل را در کادر Fixed Factor و متغیر کنترل را در کادر Covariate وارد می کنیم و سپس در قسمت Options گزینه‌هایی که در تصویر می بینید را تیک بزنید و با کلیک بر روی گزینه OK آزمون را اجرا کنید.

خروجی‌های نرم افزار به صورت زیر است:

با توجه به جدول فوق، آزمون لوین معنادار نیست. چون مقدار معناداری 0/07 شده‌است که بیشتر از سطح آزمون یعنی 0/05 است، بنابراین فرض برابری واریانس‌ها برقرار است.

جدول فوق نشان می‌دهد که اثر اصلی متغیر گروه معنادار است چون مقدار معناداری کوچکتر از 0/05 (0/000) است.

آزمون تحلیل کوواریانس و کاربرد آن در پایان نامه

از رایج‌ترین کاربردهای آزمون آنالیز کوواریانس در فصل چهارم پایان نامه می‌توان به پژوهش نیمه تجربی با طرح پیش‌آزمون و پس‌آزمون با گروه کنترل اشاره کرد. فرض کنید پژوهشگری بخواهد تاثیر اجرای یک طرح آموزشی را بر خلاقیت دانش آموزان پایه ابتدایی بسنجد. به این منظور دو گروه همگن از دانش آموزان را انتخاب می‌کند و خلاقیت آن‌ها را با استفاده آزمون خلاقیت عابدی اندازه‌گیری می‌کند. سپس یک گروه (گروه آزمایش) را در طرح آموزشی مذکور شرکت داده و به گروه دوم (گروه کنترل) کاری ندارد.

بعد از اتمام طرح آموزشی مجدد خلاقیت دانش آموزان هر دو گروه را اندازه‌گیری می‌کند و نمرات هر دو گروه را قبل و بعد از اجرای طرح آموزشی به شکل زیر در نرم افزار SPSS ثبت می‌کند:

برای بررسی خطی بودن رابطه بین متغیرهای پیش آزمون و پس آزمون از نمودارهای پراکنش و رگرسیون خطی استفاده شد.

در هر دو گروه آزمایش و کنترل رابطه بین نمرات پیش آزمون و پس آزمون متغیر خلاقيت خطی است چون مقدار معناداری آزمون رگرسیون در دو گروه کوچکتر از 0/05 به‌دست آمده است. و نقاط روی نمودار پراکنش روی یک خط فرضی قرار گرفته اند.

برای بررسی پیش فرض همگنی شیب خط رگرسیون تعامل متغیر کمکی (پیش آزمون) و مستقل (گروه) نباید معنادار باشد.

تعامل نمرات پیش آزمون خلاقيت و گروه معنادار نشده است. چون مقدار معناداری بزرگتر از 0/05 به دست آمده است. بنابراین از پیش فرض همگنی شیب‌های رگرسیونی تخطی نشده است.

چون مقدار معناداري آزمون لوین براي متغير خلاقيت بزرگتر از 0/05 (0/308) به‌دست آمده است بنابراين اين آزمون معنادار نیست. بنابراین فرض برابری واریانس‌ها براي اين متغير برقرار است.

آنالیز واریانس یکی از موارد پر کاربرد است و به عنوان مفاهیم پایه ای علم آمار شناخته می شود. در این مقاله سعی بر این بود که تمامی زوایای این آزمون به خوبی در نظر گرفته شود اما چنانچه نسبت به برخی پروژه ها مشکلاتی برای شما ایجاد کرده سایت آمار پیشرو با ایجاد قسمتی که در آن شما را به افراد متخصص علم آمار متصل می کندو به واسطه آن شما ی توانید مشکلات خود را در میان بگذارید. در قسمت مشاوره آماری رایگان فرم را تکمیل کنید متخصصان در سریعترین زمان ممکن به شما پاسخ خواهند داد.

چنانچه به مباحث علم آمار علاقه مند هستید می توانید مارا در صفحه اینستاگرام آمار پیشرو دنبال کنید. همچنین اگر پروژه شما آنالیز کوواریانس شما با مشکلات خاصی همراه است. شما می توانید آن را به متخصصان با تجربه ای بسپارید که در کمترین زمان و هزینه و با بالاترین کیفیت پروژه شما را انجام دهند. برای بهره مندی از این خدمات می توانید در قسمت ثبت سفارش سفارشات خود را ثبت نمایید.

تحلیل کوواریانس چیست؟

تحلیل کوواریانس مناسب‌ترین آزمون برای طرح پیش‌آزمون و پس‌‍‌آزمون دو گروهی است.

مثالی برای آنالیز کوواریانس؟

فرض کنید بخواهیم تاثیر داروی جدید راروی قند خون ناشتا دو گروه از افراد دارای بیماری دیابت بسنجیم.

شرایط استفاده از آنالیز کوواریانس چیست؟

نرمال بودن متغیر وابسته، استقلال، خطی بودن، همگنی شیب‌های رگرسیونی، استقلال و اعتبار متغیر کمکی و همگنی واریانس‌ها.

کاربرد آنالیز کوواریانس در پایان نامه چیست؟ چه زمانی از آنالیز کوواریانس استفاده می‌شود؟

برای تحلیل فصل چهارم پایان نامه زمانی که پژوهشگر بخواهد طرح پیش آزمون و پس آزمون را با گروه کنترل بررسی کند از آنالیز کوواریانس استفاده می‌کند مثلا تاثیر یک طرح آموزشی را بر خلاقیت دانش‌آموزان.

مارس 2, 2020 4 نظرات

آموزش آمار

آموزش آزمون t با مثال ساده و کاربردی

توسط لادن عباس نیا فوریه 18, 2020

نوشته شده توسط لادن عباس نیا

آزمون t یکی از اصلی ترین مفاهیم در مباحث آماری است. یکی از خدمات شرکت آمار پیشرو اجرای آزمونt است. این آزمون به عنوان یکی از خدمات زیر مجموعه تحلیل آماری است. در این مقاله سعی شده به صورت کاربردی آزمون t را در نرم افزار SPSS اجرا کنیم. اگر چنانچه علاقه مند به مباحث آماری هستید می توانید از دوره هایی همچون دوره جامع آموزش نرم افزار SPSS استفاده کنید.

آزمون t به زبان ساده

آزمون t برای تعیین اختلاف معناداری میانگین یک گروه با یک مقدار پیش فرض و یا میانگین های دو گروه به کار می روند. این تعاریف را شاید در بسیاری از کتاب ها دیده باشید اما فارغ از تعریف های آماری که با اصطلاحات بسیار سخت آغاز می شود با مثالی این آزمون را برای شما بهتر توضیح می دهیم.

فرض کنید معلمی می خواهد نمرات دانش آموزان را در دو ترم تحصیلی و یا نمرات دانش آموزان دو کلاس را با هم مقایسه کند، آنگاه می تواند از آزمون های t استفاده کند. همچنین معلم می تواند تاثیر کلاس های تقویتی را بر نمرات دانش آموزان بسنجد.برای انجام آزمون های t برخی فرضیات مشترک و کلی وجود دارند که به صورت زیر است:

مقیاس اندازه گیری: داده های تحلیل باید کمی باشند.
نمونه تصادفی: مشاهدات باید به صورت تصادفی از جامعه، نمونه برداری شده باشند.
نرمال بودن: مشاهدات می بایست به طور نرمال در جامعه توزیع شده باشند.

مثال: در پژوهشی که به منظور بررسی عملکرد دانش آموزان دبیرستانی قبل و بعد از اجرای یک دوره آموزشی تقویتی ریاضی انجام شده است، برای 34 دانش آموز قبل از اجرای دوره آموزشی تقویتی و بعد از اجرای دوره آموزشی تقویتی دو آزمون ریاضی مجزا برگزار شده است. همچنین به‌منظور بررسی تاثیر جنسیت، برای دانش آموزان دختر کد 1 و برای دانش آموزان پسر کد 2 را در نظر می‌گیریم. داده‌ها را در SPSS وارد کرده‌ایم که بخشی از آن در زیر مشاهده می‌شود:

[gravityform id=”3″ title=”true” description=”true”]

آزمون های t و انواع آن

آزمون های t انواع مختلفی دارد که در ادامه به سه نوع پر کاربرد آن اشاره می کنیم:‌می‌خواهیم به سوالات زیر پاسخ دهیم:

آیا معدل دانش آموزان بعد از اجرای دوره آموزشی تقویتی برابر با 15 است یا خیر؟ (آزمون t یک نمونه‌ای)

آزمون t یک نمونه ای

این آزمون برای بررسی میانگین یک جامعه استفاده می شود. با یک مثال ساده آزمون t یک نمونه ای را توضیح می دهیم. فرض کنید میانگین نمرات ریاضی کلاس A در ترم اول سال تحصیلی 17.56 بوده است.

حالا می خواهیم نمرات ریاضی همین کلاس را در ترم دوم سال تحصیلی با عدد 17.56 مقایسه کنیم تا ببینیم میانگین نمرات دانش آموزان کلاس A در دو ترم مختلف با هم تفاوت معناداری دارد؟ یا خیر؟ آیا کلاس A در ترم دوم سال تحصیلی پیشرفت قابل ملاحظه ای داشته یا تغییر چندانی نداشته است؟در واقع در آزمون تی یک نمونه ای می خواهیم میانگین اعداد را با یک عدد ثابت مقایسه کنیم.

در این مثال خاص میانگین نمرات ترم دوم کلاس A را با عدد ثابت ترم قبل مقایسه کردیم. این عدد ثابت در مثال های دیگر متفاوت است.

آزمون t یک نمونه ای با مثال کاربردی در SPSS

برای انجام آزمون تی یک نمونه ای در SPSS از منوی Analyze به ترتیب گزینه های compare Means و … One sample T Test را انتخاب تا کادر مربوطه باز شود.در کادر Test variable متغیری که نمرات ترم دوم دانش آموزان را دارد وارد می کنیم.در قسمت Test value عدد ثابت مورد نظر که در اینجا 17.56 است را وارد می کنیم و آزمون را اجرا می کنیم.

نرم افزار SPSS چیست؟ معرفی و آموزش شروع کار با SPSS به زبان ساده

آزمون t جفت نمونه ای

این آزمون برای بررسی دو میانگین از یک جامعه استفاده می شود که به آن t جفت نمونه ای یا t زوجی می گویند. با یک مثال ساده آزمون تی جفت نمونه ای را توضیح می دهیم. فرض کنید برای کلاس A، کلاس های آموزش ریاضی فوق برنامه برگزار می کنیم. حال می خواهیم تاثیر این کلاس های فوق برنامه را در نمرات ریاضی دانش آموزان مشاهده کنیم.

در آزمون جفت نمونه ای مقایسه میانگین نمرات ریاضی کلاس A قبل و بعد از برگزاری کلاس های فوق برنامه انجام می شود. که در این جا اول باید قبل از برگزاری دوره آموزشی، امتحان ریاضی از دانش آموزان گرفته شود و پس از برگزاری دوره نیز یک بار دیگر امتحان ریاضی از دانش آموزان می گیریم و در t تست جفت نمونه ای میانگین این دو آزمون با هم مقایسه می شود.

آزمون t جفت نمونه ای با مثال کاربردی در SPSS

می خواهیم ببینیم دوره آموزشی تاثیرگذار بوده است یا خیر؟ و چقدر باعث افزایش و یا کاهش نمرات ریاضی دانش آموزان شده است. برای انجام آزمون تی جفت نمونه ای در SPSS از منوی Analyze به ترتیب گزینه های compare Means و … Paired-samples T Test را انتخاب تا کادر مربوطه باز شود. متغیرهای قبل و بعد را به سمت راست انتقال دهید و آزمون را انجام دهید. متغیر After را به سمت راست انتقال دهید و در فیلد مربوط به Test Value میانگین مورد آزمون را وارد کنید. برای این مثال، مقدار 15 را وارد کنید.در واقع این فرضیه را آزمون می‌کنیم:اگر روی دکمه‌ی Options… کلیک کنید، کادر زیر باز می‌شود که در آن می‌توانید سطح آزمون را تعیین کنید. همان سطح پیش فرض یعنی 95% را پذیرفته و روی Continue کلیک نمایید، سپس روی OK کلیک کنید تا خروجی نمایش یابد. one-sample t-test-report با توجه به خروجی، چون مقدار معناداری یعنی Sig. کوچکتر از سطح آزمون، یعنی 05/0 شده است، فرضیه صفر را رد می‌کنیم. به‌عبارت دیگر، خروجی نشان می‌دهد که تفاوت معناداری در معدل دانش آموزان و عدد 15 وجود دارد. با توجه به میانگین نمرات دانش آموزان بعد از اجرای دوره آموزشی تقویتی که 38/16 است، نتیجه می‌گیریم که معدل دانش آموزان به‌طور معناداری از عدد 15 بیشتر است.این آزمون برای بررسی میانگین دو جامعه مستقل استفاده می شود.

البته یکی از فرضیات این آزمون برابری واریانس دو جامعه است. برای مثال فرض کنید میخواهیم میانگین نمرات ریاضی دو کلاس A و B را با هم مقایسه کنیم. میخواهیم ببینیم آیا دانش آموزان کلاس A و B در درس ریاضی با هم متفاوت اند و اگر تفاوت معناداری دارند این تفاوت به چه میزان است؟ کلاس A بهتر است؟ یا کلاس B؟

آزمون t جفت نمونه ای

این آزمون برای بررسی دو میانگین از یک جامعه استفاده می شود که به آن t جفت نمونه ای یا t زوجی می گویند. آزمون t جفت نمونه‌ای را زمانی به‌کار می‌بریم که داده‌های ما تنها از روی یک گروه برداشته شده باشند. به‌عبارت دیگر، داده‌ها از یک گروه مشابه در دو شرایط مختلف (پیشین و پسین) برداشته می‌شوند. با یک مثال ساده آزمون t جفت نمونه ای را توضیح می دهیم. فرض کنید برای کلاس A، کلاس های آموزش ریاضی فوق برنامه برگزار می کنیم.

حال می خواهیم تاثیر این کلاس های فوق برنامه را در نمرات ریاضی دانش آموزان مشاهده کنیم. پس در آزمون t جفت نمونه ای مقایسه میانگین نمرات ریاضی کلاس A قبل و بعد از برگزاری کلاس های فوق برنامه انجام می شود. که در این جا اول باید قبل از برگزاری دوره آموزشی، امتحان ریاضی از دانش آموزان گرفته شود و پس از برگزاری دوره نیز یک بار دیگر امتحان ریاضی از دانش آموزان می گیریم و در آزمون t جفت نمونه ای میانگین این دو آزمون با هم مقایسه می شود.

می خواهیم ببینیم دوره آموزشی تاثیرگذار بوده است یا خیر؟ و چقدر باعث افزایش و یا کاهش نمرات ریاضی دانش آموزان شده است.

آزمون t جفت نمونه ای در SPSS

قبل از انجام آزمون باید شرط اضافی دیگری را که برای انجام این آزمون لازم است، تعریف کنیم:نرمال بودن تفاضل امتیازات: تفاضل امتیازات برای هر شرکت کننده یا آزمودنی (یعنی تفاضل مقادیر قبل و بعد) می‌بایستی به‌صورت نرمال توزیع شده باشد.با انجام آزمون t جفت نمونه‌ای فرضیه زیر را آزمون می‌‌کنیم:از منوی Analyze به‌ترتیب گزینه‌های Compare Means و Paired-Samples T Test… را انتخاب کنید تا کادر مربوطه باز شود. متغیرهای Before و After را به سمت راست انتقال دهید:سپس روی OK کلیک کنید تا خروجی نمایش یابد: Paired-Samples-output با توجه به خروجی فوق، چون مقدار معناداری یعنی Sig. کوچکتر از سطح آزمون، یعنی 05/0 شده است، فرضیه صفر را رد می‌کنیم. به‌عبارت دیگر خروجی نشان می‌دهد که تفاوت معناداری در میانگین نمرات دانش‌آموزان قبل و بعد از اجرای دوره‌ی آموزشی تقویتی وجود دارد. با توجه به مقدار میانگین‌ها بعد از اجرای دوره‌ی آموزشی تقویتی، میانگین نمرات به اندازه‌ی 563/1 افزایش می‌یابد.

آزمون t گروه های مستقل

این آزمون برای بررسی میانگین دو جامعه مستقل استفاده می شود. البته یکی از فرضیات این آزمون برابری واریانس دو جامعه است. استفاده از این آزمون زمانی مناسب است که بخواهیم میانگین‌های دو مجموعه داده مستقل را با هم مقایسه کنیم. فرضیه‌ی این آزمون همانند آزمون t جفت نمونه‌ای است، با این تفاوت که آزمودنی‌های دو نمونه متفاوتند.

به‌عبارت دیگر مایلیم بدانیم که آیا میانگین‌های دو گروه مستقل، تفاوت معناداری دارند یا نه؟ برای مثال فرض کنید میخواهیم میانگین نمرات ریاضی دو کلاس A و B را با هم مقایسه کنیم. میخواهیم ببینیم آیا دانش آموزان کلاس A و B در درس ریاضی با هم متفاوت اند و اگر تفاوت معناداری دارند این تفاوت به چه میزان است؟ کلاس A بهتر است؟ یا کلاس B؟

آزمون t گروه های مستقل با مثال کاربردی در SPSS

برای انجام این آزمون نیاز به دو فرض اضافی زیر داریم:استقلال گروه‌ها: آزمودنی‌های هر گروه می‌بایستی متفاوت بوده و تنها در یکی از گروه‌ها وجود داشته باشند.همگنی واریانس: گروه‌ها می‌بایستی از جوامعی با واریانس‌های برابر برداشته شوند. برای آزمون برابری واریانس‌ها، SPSS از آزمون لون (Levene) استفاده می‌کند.

اگر این آزمون معنادار باشد آن‌گاه فرضیه صفر یعنی برابری واریانس‌ها را رد می‌کنیم و اگر این آزمون معنادار نباشد آن‌گاه فرضیه‌ی صفر یعنی برابری واریانس‌ها را می‌پذیریم. یعنی تفاوت معناداری میان واریانس‌های گروه‌ها وجود ندارد.برای انجام آزمون t نمونه‌های مستقل، از منوی Analyze به‌ترتیب گزینه‌های Compare Means و Independent-Samples T Test… را انتخاب کنید تا کادر مربوطه باز شود. با توجه به این‌که تحلیل را فقط برای متغیر After انجام می‌دهیم، این متغیر را به سمت راست به قسمت Test Variable(s) و متغیر Sex را به قسمت Grouping Variable انتقال دهید، سپس روی دکمه‌ی Define Groups… کلیک کنید.

کد 1 را در قسمت اول و کد 2 را در قسمت دوم که بیانگر دانش آموزان دختر و پسر هستند، وارد و روی Continue کلیک نمایید.

روی دکمه‌ی OK کلیک کنید تا خروجی نمایش یابد. Independent-groups-output همانطور که ملاحظه می‌کنید، دو مقدار برای معناداری گزارش شده است. در صورتی که فرض برابری واریانس‌ها پذیرفته شود، از اولین مقدار و در غیر این صورت از دومین مقدار استفاده می‌کنیم. با توجه به مقدار Sig. در ستون دوم که 536/0 است، آزمون لون نشان می‌دهد که فرض برابری واریانس‌ها پذیرفته شده است. بنابراین، از اولین مقدار معناداری گزارش شده در ستون پنجم استفاده می‌کنیم یعنی 406/0، و چون این مقدار از 05/0 بیشتر است فرض برابری میانگین‌ها را می‌پذیریم.

به عبارت دیگر، بعد از اجرای دوره‌ی آموزشی تقویتی میانگین نمرات در دختران و پسران یکسان است. اگر در حین انجام آزمون t به مشکلی برخورد کردید می توانید با کارشناسان مرجع تحلیل و آموزش آماری ارتباط برقرار کنید.

در این سایت بخشی از مطالب را قرار داده ایم. به منظور دریافت ویدیوها و آموزش های کوتاه کاربردی بیشتر می تانید صفحه اینستاگرام آمار پیشرو را دنبال کنید.

سوالات پر تکرار

آزمون t چیست؟

آزمون t برای تعیین اختلاف میانگین بین دو گروه استفاده می‌شود

آزمون t تک نمونه‌ای چیست؟

آزمون t تک نمونه‌ای برای بررسی میانگین یک جامعه استفاده می‌شود. مثلا بررسی اختلاف میانگین نمرات کلاس A در ترم اول و دوم

آزمون t جفت نمونه‌ای چیست؟

آزمون t جفت نمونه‌ای برای بررسی دو میانگین از یک جامعه استفاده می‌شود. مثلا بررسی نمرات کلاس A قبل و بعد از برگزاری دوره تخصصی

آزمون t گروه‌های مستقل چیست؟

آزمون t گروه‌های مستقل برای بررسی میانگین دو جامعه مستقل استفاده می‌شود. مثلا بررسی اختلاف میانگین نمرات دو کلاس A و B

کاربرد آزمون t در پایان نامه چیست؟ چه زمانی از آزمون t استفاده می‌شود؟

برای تحلیل فصل چهارم پایان نامه از آزمون t استفاده می‌شود. زمانی که در اهداف پژوهش مقایسه متغیری با عدد ثابت و یا مقایسه بین متغیرها در یک جامعه و یا دو جامعه مستقل مطرح باشد از آزمون t استفاده می‌کنیم.

برای انجام آزمون t چه فرضیاتی باید انجام شود؟

داده‌ها باید از نوع کمی باشند. مشاهدات باید به صورت تصادفی از جامعه برداشته شده باشد. مشاهدات باید به طور نرمال در جامعه توزیع شده باشند.

فوریه 18, 2020 25 نظرات

آموزش آمار

محاسبه آنلاین فرمول کوکران برای تعیین حجم نمونه

توسط لادن عباس نیا فوریه 12, 2020

نوشته شده توسط لادن عباس نیا

یکی از فرمول های پر کاربرد تعیین حجم نمونه فرمول کوکران است. محاسبه آنلاین فرمول کوکران تنها با وارد کردن حجم جامعه. در بسیاری از تحقیقات قرار است یک فرضیه را درباره‌ی یک جامعه‌ی خاص بررسی کنیم‌. مثلاً می‌خواهیم بدانیم آیا میانگین وزن دانش‌آموزان پسر سال سوم دبستان در ایران با متوسط جهانی آن برابر است یا خیر. طبق آمار اعلام‌شده، تعداد این دانش‌آموزان در ایران حدود ۶۵۰ تا ۷۰۰ هزار نفر است.این تعداد (حجم جامعه) حقیقتاً عدد بزرگی است و ناگفته پیداست که مراجعه به تک‌تک این دانش‌آموزان و ثبت میزان وزن آنان، کاری اگر نه غیرممکن ولی بسیار مشکل، وقت‌گیر و هزینه‌بر است.برای راحت تر شدن کار از فرمول کوکران استفاده می کنیم و حجم نمونه را به دست می آوریم. در ادبیات آماری، مراجعه به تک‌تک اعضای جامعه‌ی مورد بررسی «سرشماری» نامیده می‌شود.

محاسبه آنلاین تعیین حجم نمونه با فرمول کوکران

حجم نمونه یا سر شماری؟

معمولاً انجام سرشماری تنها از عهده‌ی سازمان‌های بزرگ و عمدتاً دولتی برمی‌آید. اما در مورد تیم‌های پژوهشی کوچک و به‌ویژه دانشجویان چه‌طور؟ پژوهش‌های آن‌ها از طریق مراجعه به اعضای جامعه‌ی مورد نظر باید انجام شود. اما این جامعه به لحاظ جمعیت آن قدر بزرگ یا به لحاظ دسترسی آن قدر پراکنده است که امکان مراجعه به همه‌ی اعضای آن وجود ندارد.

این افراد چگونه می‌توانند پژوهش خود را به انجام برسانند؟ این جاست که آمار استنباطی می‌تواند به کمک پژوهش‌گران بیاید. آمار استنباطی به ما می‌گوید که نیاز نیست به سراغ همگی افراد جامعه برویم و می‌توانیم پژوهش خود را فقط با درصد نسبتاً کمی از جامعه انجام بدهیم، در حالی که نتایج به دست‌آمده هم‌چنان معتبر و علمی باشد.

اما چگونه چنین امری ممکن است؟ عقل سلیم می‌گوید اگر بر اساس اطلاعات یک بخش از جامعه در مورد کل آن نتیجه‌گیری کنیم، این نتیجه‌گیری احتمالاً دچار اشتباه و خطاست. آمار استنباطی هم این حقیقت را تأیید می‌کند، اما دستاوردی که در اختیار ما قرار می‌دهد آن است که خطای نتیجه‌گیری را از یک مقدار مبهم و کنترل‌نشده به یک مقدار روشن و مهارشده تبدیل می‌کند.

در واقع آمار استنباطی شاخه‌ای از علم آمار است که با بهره‌گیری از قوانین متقَن ریاضی، مجوز علمی برای تعمیم نتایج به دست‌آمده از نمونه یک جامعه به کل جامعه را فراهم می‌کند.

آمار استنباطی می‌گوید ابتدا از جامعه‌ی خود نمونه‌ای را اختیار کنید و سپس سوالات یا فرضیات خود را با استفاده از آن بررسی و نتیجه‌گیری کنید. در نهایت این نتایج را به جامعه تعمیم دهید ولی بدانید که این نتیجه‌گیری را با در نظر گرفتن یک درصد مشخص و البته کوچکی خطا انجام داده‌اید. این خطا چون با روش‌های دقیق و منطقی لحاظ شده، نتایج ما را علمی و قابل پذیرش می‌کند.

حجم نمونه چیست؟

حال که دانستیم آمار استنباطی چه ابزار ارزشمندی را در اختیار ما قرار می‌دهد این را نیز باید بدانیم که استفاده از این ابزار اگر با رعایت شرایط آن همراه نباشد نتایج نادرست و گمراه‌کننده به دست خواهد داد. به عبارت دیگر، یک پژوهش‌گر برای آن که بتواند نتایج نمونه را به جامعه تعمیم دهد به دنبال مجوز علمی است و آمار استنباطی این مجوز را در اختیار وی قرار می‌دهد، ولی این مجوز همراه با اما و اگرهایی است. یکی از این اما و اگرهای بزرگ، حجم نمونه است.

حجم نمونه، تعداد اعضایی از جامعه است که در نمونه حضور پیدا می‌کنند. این تعداد چه قدر باید باشد؟شاید ساده‌ترین و رایج‌ترین پاسخ به این سوال بدین صورت باشد: هر چه حجم نمونه بیش‌تر باشد بهتر است! خبر تکان‌دهنده این است که طبق قوانین آمار استنباطی، این باور عمومی اشتباه است!!! ازدیاد نامتناسب حجم نمونه، تنها باعث افزایش نامتناسب دقت می‌شود اما کیفیت نتایج نهایی را افزایش نمی‌دهد.

چرا باید حجم نمونه را مشخص کنیم

برای توضیح این موضوع در مثالی که پیشتر ذکر شد، فرضیه‌ی برابری میانگین وزن دانش‌آموزان پسر سوم دبستان با مقدار 29 کیلوگرم را در نظر بگیرید (فرضیه صفر). دراین صورت فرضیه مقابل (فرضیه یک) به صورت عدم برابری میانگین وزن با 29 است.

برای این که فرضیه‌ صفر را رد کنیم، باید شواهد کافی ارائه کنیم که نشان دهند میانگین وزن، عددی غیر از 29 است. این شواهد از طریق داده‌های موجود در نمونه فراهم می‌شود. بدین صورت که با استفاده از اطلاعات موجود در داده‌ها و به کارگیری روش‌های آماری مناسب، در نهایت تصمیم می‌گیریم که باید فرضیه صفر را رد کنیم یا خیر.

رد فرضیه صفر معادل با پذیرش فرضیه یک است و پذیرش آن نیز معادل با رد فرضیه یک قلمداد می‌شود. اما این تصمیم می‌تواند در واقعیت درست یا غلط باشد. به عبارت دیگر، ممکن است میانگین وزن دانش‌‌آموزان در واقعیت 29 کیلوگرم باشد، اما آن را به اشتباه نابرابر با 29 تشخیص بدهیم و در نهایت، فرضیه صفر را رد کنیم.

نتایج نمونه و خطا های آن

در این صورت طبق تعاریف آماری، دچار خطای نوع یک شده‌ایم. در حالت دیگر، ممکن است مرتکب یک نوع دیگر از خطا بشویم که آن را خطای نوع دو می‌نامیم. این نوع خطا زمانی رخ می‌دهد که فرضیه یک را به اشتباه رد کنیم.

زمانی که تصمیم نهایی در مورد قبول یا رد فرضیات بر اساس نتایج نمونه را می‌گیریم، نمی‌دانیم که تصمیم اتخاذ‌شده در حقیقت درست است یا غلط. زیرا درست یا غلط بودن آن بستگی به مشخصات جامعه دارد و ما نیز از اطلاعات کل جامعه آگاهی نداریم. اطلاعات ما فقط محدود به نمونه است و به همین علت به استفاده از روش‌های آمار استنباطی روی آورده‌ایم.

اما با وجودی که در واقعیت نمی‌دانیم در تصمیم اتخاذ‌شده دچار خطا شده‌ایم، می‌توانیم «احتمال» ارتکاب آن را در نظر بگیریم و آن را تا حد ممکن کاهش دهیم. به عبارت دیگر، در حالی که این امکان را نداریم که بدانیم تصمیم ما دچار خطا هست یا نه، می‌توانیم سعی کنیم طوری عمل تصمیم‌گیری را انجام دهیم که احتمال بروز خطا در آن بسیار کم باشد.

در این صورت، می‌توانیم با اطمینان بسیار بالایی نتایج تصمیم اتخاذشده را بیان و از آن در پژوهش‌های علمی استفاده کنیم. به طور دقیق‌تر اگر مقدار احتمال خطای نوع یک را با آلفا (alpha) و مقدار احتمال خطای نوع دو را با بِتا (beta) نشان دهیم، باید سعی کنیم کلیه‌ی عملیات مربوط به محاسبات آماری را طوری انجام دهیم که آلفا و بتا تا حد ممکن کوچک باشند.

اما مقادیر مناسب و معقول برای آلفا و بتا را چگونه انتخاب کنیم؟

حالت مطلوب این است که هر دوی آن‌ها با هم و تا حد امکان کوچک شوند، اما این کار در عمل غیرممکن است و می‌توانیم یکی را ثابت نگه داریم و دیگری را کوچک کنیم. در پژوهش‌ها، فرضیه صفر از اهمیت بیشتری برخوردار است، بدین معنا که اگر آن را به اشتباه رد کنیم (یعنی دچار خطای نوع یک شویم)، زیان ناشی از آن بیشتر از رد اشتباه فرضیه یک است (خطای نوع دو).

لذا در انجام آزمون فرضیه‌ها، آلفا برابر با یک مقدار ثابت و کوچک (معمولاً 0.001، 0.05 یا 0.1) در نظر گرفته و سعی می‌شود بتا تا حد ممکن کوچک شود. البته در ادبیات آماری، معمولاً به جای بتا از توان آماری (statistical power) استفاده می‌شود. توان برابر است با یک منهای بتا، و لذا رابطه‌ی معکوس با بتا دارد. بنابراین در طراحی آزمون فرضیه، آلفا ثابت در نظر گرفته و مقدار توان تا حد ممکن بزرگ می‌شود.

تعیین حجم نمونه چه اهمیتی دارد؟

حال می خواهیم به تبیین حجم نمونه بپردازیم. همان طور که پیشتر گفتیم، کم‌تر بودن یا بیشتر بودن حجم نمونه از حد مورد لزوم، هر دو مشکلات خاص خود را به دنبال دارند. اگر حجم نمونه کم‌تر از حد لازم باشد، آن گاه آزمون مربوطه از توان و دقت کافی برای کشف حقیقت برخوردار نیست.

در مثال وزن دانش‌آموزان، ممکن است میانگین واقعی وزن دانش‌آموزان پسر در ایران 34 کیلوگرم باشد که در این صورت فرضیه صفر درست نیست. اما اگر نمونه با حجمی کم‌تر از مقدار مورد نیاز گردآوری شود، ممکن است آزمون نتواند اختلاف بین مقدار واقعی (34) با مقدار فرضیه‌ای (29) را تشخیص دهد و لذا فرضیه یک به اشتباه رد شود.

در این حالت، حجم نمونه کم باعث کاهش بیش از حد توان آزمون و در نتیجه کاهش دقت آن شده است. اما از طرف دیگر، اگر حجم نمونه بیش از حد بزرگ انتخاب شود، توان آزمون و در نتیجه، دقت آن بیش از حد افزایش می‌یابد. این یعنی آزمون به اختلافات حتی کوچکِ شناسایی‌شده از نمونه با مقادیر فرضیه‌ای نیز حساس می‌شود.

در مثال مورد بحث، ممکن است میانگین واقعی وزن برابر با 28.5 باشد که در این صورت تقریباً می‌توان گفت فرضیه صفر درست است. اما اگر حجم نمونه بسیار بالا در نظر گرفته شود، آزمون ممکن است در نهایت از اطلاعات نمونه این اختلاف جزئی را معنی‌دار تشخیص دهد و به اشتباه فرضیه صفر را رد کند. در این حالت توان آزمون (و در نتیجه دقت آن) به نسبت آلفا بیش از حد بزرگ است که باعث می‌شود باز هم نتایج غیرواقعی برای آزمون به دست بیاید. بنابراین همان طور که می‌بینید در هر دو حالت، کوچک یا بزرگ بودن بیش از حد حجم نمونه، نتایج نامطلوبی ممکن است به بار بیاورد.

حجم نمونه را چگونه تعیین کنیم؟

تا این جا دانستیم که حجم نمونه را نباید بر اساس باورهای نادرست تعیین کرد، چرا که ممکن است نتایج نامطلوبی به دست بدهد. پس چگونه باید حجم نمونه را تعیین نمود؟ پاسخ این است که حجم نمونه را باید با توجه به شرایط عمومی و شرایط اختصاصی هر مسئله تعیین کرد. منظور از شرایط عمومی، شرایطی هستند که در هر مسئله‌ی آزمون فرضیه جدا از نوع و هدف آن وجود دارند.

به عنوان مثال، مقادیر آلفا و توان که در این بحث توضیح داده شدند، در هر مسئله آزمون فرضیه وجود دارند و لذا در تعیین حجم نمونه باید در در نظر گرفته شوند. اما شرایط اختصاصی، شرایطی هستند که بستگی به نوع مسئله دارند و در آزمون فرضیه‌‌ی مربوط به آن ظاهر می‌شوند.

مثلاً در مطالعات همبستگی که در آن‌ها از ضریب همبستگی پیرسون (Pearson) استفاده می‌شود، مهم است که بدانیم اندازه‌اثر (که در مطالب آینده توضیح داده خواهد شد) چه قدر باید باشد. لذا میزان اندازه‌اثر در نظر گرفته شده نیز در حجم نمونه تأثیر خواهد داشت.

تعیین حجم نمونه و اهمیت آن

همان طور که بیان شد، عمل تعیین حجم نمونه را باید در هر مسئله با توجه به شرایط و خصوصیات آن مسئله انجام داد. بر این اساس، مبحث تعیین حجم نمونه در طیف گسترده‌ای از مسائل آماری مطرح می‌شود. مسائلی از قبیل مطالعات مربوط به میانگین، مطالعات همبستگی، مطالعات تحلیل بقا، مطالعات مورد شاهدی و غیره از جمله مسائل پرکاربرد در انواع پژوهش‌ها هستند که هر کدام روش‌ها و نکات خاص خود در تعیین حجم نمونه را دارند.

در مطلب حاضر، فقط مقدمه‌ای کوتاه بر لزوم تعیین حجم نمونه و اهمیت دقت در انجام آن بیان شد. امروزه برای انتشار نتایج تحقیقات در منابع معتبر، در هر شاخه از علوم انسانی یا علوم تجربی، علاوه بر نیاز به کیفیت مطالب در حوزه مورد نظر، نیازمند به معتبر بودن روش‌های آماری به‌کارگرفته شده در آن مطالعات هستیم.

به عنوان مثال، داوران ژورنال‌های علمی معتبر، بخش‌های مربوط به روش‌های آماری مقاله را به دقت و با دید نقادانه مطالعه می‌کنند و در مورد آن به ارائه‌ی نظر می‌پردازند. در این میان، حجم نمونه و چگونگی انتخاب آن نیز یکی از مواردی است که نویسندگان مقاله باید دلایل و توضیحات معتبری برای آن داشته باشند.

لذا آگاهی و تسلط پژوهش‌گران حوزه‌های مختلف به بحث تعیین حجم نمونه، امری مهم و اجتناب‌ناپذیر است. شما می توانید برای دستیابی به حجم نمونه از خدمات شرکت های آماری استفاده کنید. در مطالب آینده، بحث تعیین حجم نمونه در هر کدام از مسائل آماری مختلف برای پژوهش‌گران فعال در زمینه‌های مختلف، به تفصیل بیان خواهد شد.در ادامه، به معرفی و بررسی یکی از روش‌های معروف در تعیین حجم نمونه پرداخته می‌شود.

فرمول کوکران

در مسیر انجام پژوهش، قسمتی از فصل سوم پایان نامه یا رساله به توضیح جامعه آماری، نمونه آماری، روش نمونه‌گیری و حجم نمونه مناسب اختصاص دارد. حال آن‌که این موضوع باید در اولین قدم و در زمان تهیه پروپوزال پژوهشی مورد توجه قرار گیرد. پژوهشگر بایستی جامعه هدف مورد نظر خود را به صورت شفاف تعریف نماید، تعداد کل افراد که در جامعه قرار دارند را مشخص کند و با توجه به روش انجام پژوهش نسبت به محاسبه حجم نمونه مناسب و اختصاص روش نمونه‌گیری بهینه اقدام کند.

یکی از روش‌های پرکاربرد در تعیین حجم نمونه، استفاده از فرمول کوکران است. این فرمول در دو حالت مورد استفاده قرار می‌گیرد و در اکثر پایان‌نامه‌ها و رساله‌ها می‌تواند مورد استفاده قرار بگیرد اما استفاده نابجا از این فرمول پیامدهایی در پی دارد که پیش‌تر از آن یاد کردیم. قبل از این که وارد بحث محاسبه حجم نمونه با استفاده از فرمول کوکران شویم در ابتدا تعریف جامعه آماری و فرآیند نمونه‌گیری را یادآوری می‌کنیم.

جامعه آماری مجموعه‌ای از افراد و یا اشیا هستند که حداقل در یک صفت اشتراک دارند. نمونه‌گیری در واقع انتخاب نمونه‌ای از جامعه آماری است که نمونه انتخابی باید ویژگی‌های خاصی داشته باشد تا بتوان نتایج حاصل از نمونه را برای جامعه آماری تعمیم داد.

تعیین حجم نمونه با فرمول کوکران

تعیین اندازه نمونه اهمیت فراوانی در قابلیت تعمیم نتایج آزمون به جامعه دارد. روش‌های مختلفی جهت تعیین اندازه نمونه وجود دارد که دقیق‌ترین روش‌ها، روش‌های ریاضی جهت محاسبه اندازه نمونه است. یکی از این روش‌ها استفاده از فرمول کوکران است. همانطور که می‌دانیم جامعه آماری می‌تواند مقداری معلوم باشد مانند دانش‌آموزان مقطع دبستان شهرستان مشهد و یا مدیران ارشد بانک صادرات شهرستان بیرجند و همچنین می‌تواند مقداری نامعلوم باشد مانند افراد مراجعه‌کننده به بیمارستان‌ها و درمانگاه‌ها. با استفاده از فرمول کوکران می‌توانیم برای هر دو جامعه آماری معلوم و نامعلوم، حجم نمونه را تعیین کنیم.

حجم نمونه وقتی حجم جامعه آماری معلوم است.
حجم نمونه وقتی حجم جامعه آماری نامعلوم است.

فرمول کوکران امکان محاسبه‌ی حجم مناسب نمونه بر اساس سطح مشخصی از دقت، سطح مشخصی از اطمینان و نسبت اعضایی که دارای صفت خاصی هستند می‌دهد. فرمول کوکران عبارت است از:

که در آن

p نسبت (براوردشده) از افرادی از جامعه است که دارای صفت مورد نظر هستند؛

e سطح دلخواه دقت (حاشیه خطا) است. این مقدار تعیین می‌کند که مقدار نسبت براوردشده حداکثر چقدر با مقدار واقعی آن تفاوت داشته باشد؛

Z صدک مرتبه است که از جدول توزیع نرمال پیدا می‌شود ونیز همان احتمال خطای نوع یک است. مقداررا همان سطح اطمینان می‌نامند.

فرمول کوکران برای جامعه نامحدود

در این قسمت می بینید که فرمول کوکران برای جامعه نامحدود چگونه برقرار است.

مثال کاربردی برای محاسبه فرمول کوکران برای جامعه نامحدود

فرض کنید در حال انجام مطالعه بر روی افراد مقیم در یک شهر بزرگ هستیم، و می‌خواهیم تعداد افرادی را که صبح‌ها در خانه به صرف صبحانه می‌پردازند بدانیم. اطلاعات چندانی در مورد این که از کجا شروع کنیم نداریم و لذا فرض می‌کنیم نیمی از خانواده‌ها در خانه صبحانه را صرف می‌کنند. در این صورت p=0.5 و واریانس حداکثر را خواهیم داشت. حال فرض کنید می‌خواهیم سطح اطمینان 95 درصد داشته باشیم، و دقت هم 5 درصد باشد. در سطح اطمینان 95 درصد مقدار Z برابر با 1.96 است، لذا داریم:

فرمول کوکران برای جامعه محدود (تصحیح فرمول کوکران برای محاسبات حجم نمونه در جوامع کوچک)

فرمول کوکران برای مواقعی که با جوامع بزرگ (جامعه نامحدود) سر و کار داریم به کار می‌آید. اگر حجم نمونه ثابت باشد، اطلاعاتی که از یک جامعه‌ی کوچک به دست می‌آید بیشتر از جامعه‌ی بزرگ است. لذا در فرمول کوکران، تصحیحی در نظر گرفته شده که در صورت کوچک بودن حجم جامعه، عدد به دست آمده از این فرمول را کاهش می‌دهد.

دقت کنید که جوامع با حجم بزرگ به عنوان جوامع نامحدود و جوامع با حجم کوچک به عنوان جوامع محدود در نظر گرفته می‌شوند. در این حالت، حجم نمونه عبارت است از:

Sample-size-determination-formula-in-a-finite-population

در فرمول بالا، N حجم جامعه،

حجم نمونه‌ در فرمول اصلی کوکران و n حجم نمونه‌ی تصحیح‌شده و جدید است.

در مثال قبل، اگر تعداد کل خانواده‌ها در جامعه‌ی مورد نظر 1000 باشد، آن گاه

example-Sample-size-determination-formula-in-a-finite-population

نکات مهم در استفاده از فرمول کوکران برای تعیین حجم نمونه

1- در صورت معلوم نبودن p می‌توان مقدار آن را از طریق یک نمونه اولیه (پایلوت) براورد کرد. بدین صورت که ابتدا نمونه‌ای کوچک (مثلاً با حجم 20 تا 30) از جامعه فراهم و مقدار p را به ازای آن براورد می‌کنیم. سپس از مقدار براوردشده در فرمول کوکران استفاده می‌کنیم.

2- استفاده از فرمول مورگان برای تعیین حجم نمونه تنها زمانی مجاز است که به دنبال براورد نسبت یک صفت در جامعه هستیم. استفاده از این فرمول برای اهدافی غیر از این مورد، اشتباه و غیرمنطقی است.

محاسبه تعیین حجم نمونه با فرمول کوکران در اکسل

فایلی که برای دانلود در اختیار شما قرار داده شده به شما کمک می کند تا با وارد کردن اطلاعات پایان نامه خود بتوانید، حجم نمونه خود را دریافت کنید. برای دانلود این فایل بر روی عبارت تعیین حجم نمونه با فرمول کوکران در اکسل کلیک کنید.

در چه صورت نمی‌توان از فرمول کوکران استفاده کرد؟

از آنجایی که شیوه درست تعیین حجم نمونه برای هر مطالعه تحقیقاتی حائز اهمیت است، بنابراین نمی‌شود در تمام موارد از فرمول کوکران برای انتخاب حجم نمونه استفاده کرد. به‌عنوان مثال در بعضی تحقیقات کیفی تعداد 15 تا 30 نفر برای حجم نمونه کفایت می‌کند و یا در بعضی تحقیقات تعداد حجم نمونه نامشخص است و تا رسیدن به اجماع نظر باید ادامه پیدا کند. همچنین در مواردی مانند طرح‌های آزمایش پیش‌آزمون و پس‌آزمون، تحلیل سلسله مراتبی، در بعضی موارد مدلسازی معادلات ساختاری و … نمی‌توان از فرمول کوکران استفاده کرد. معمولا در نظرسنجی‌ها و افکارسنجی‌ها به شرط برقراری سایر شرایط استفاده از فرمول کوکران مجاز است.

جدول مورگان

جدول مورگان از محاسبه‌ی حجم نمونه به ازای مقادیر مشخص پارامترها در فرمول کوکران به دست آمده است. در این جدول، مقدار p برابر با 0.5، مقدار برابر با 0.05 و مقدار e نیز برابر با 0.05 قرار داده شده و سپس به ازای مقادیر مختلف N مقادیر حجم نمونه محاسبه و در جدولی ارائه شده است. این مقادیر برای پارامترها، منجر به بیشترین حجم نمونه ممکن می‌شود و لذا استفاده از این جدول که متأسفانه تعداد زیادی از کارهای پژوهشی نیز از آن بهره می‌گیرند، درست نیست.

دلایل این امر نیز پیشتر مطرح شد. اول آن که جدول مورگان (که برگرفته از فرمول کوکران است) فقط برای مواردی که براورد نسبتی از یک صفت در جامعه مورد نظر باشد مجاز است. دوم آن که هر مسئله شرایط خاص خود را دارد و بر اساس آن شرایط باید مقادیر پارامترها تعیین گردد، نه آن که مقادیر یکسانی از پارامترها برای همه‌ی مسائل مورد استفاده قرار گیرد.

موضوع تعیین حجم نمونه و انتخاب یک نمونه مناسب، یکی از مسائلی است که اکثر پژوهشگران در شروع مطالعه خود با آن سر و کار دارند. همانطور که می‌دانید تعداد حجم نمونه باید طوری انتخاب شود که قابل تعمیم به کل جامعه آماری باشد. بر هیچ‌کس پوشیده نیست که چنانچه حجم نمونه کمتر از میزان لازم در نظر گرفته شود، ممکن است نتایج استنباط شده از آن در مورد جامعه از دقت کافی برخوردار نباشد.

اما این برداشت نادرست نیز وجود دارد که حجم نمونه هر چه بزرگ‌تر باشد (یعنی هر چه حجم نمونه به حجم جامعه نزدیک‌تر باشد)، وضعیت بهتری برای مطالعه انتظار می‌رود. باید توجه داشت که همواره در نمونه‌های با حجم بزرگ، تضمینی برای اتخاذ تصمیم منطبق بر واقعیت وجود ندارد. بنابراین مشکلات استفاده از حجم نمونه بزرگ در مطالعات بر همگان آشکار نیست.

روش تعیین حجم نمونه یکی از مهم ترین مباحث در پرپوزال است.بسیاری از افراد به دلیل نداشتن تخصص لازم در رشته های مختلف نمی توانند روش مناسب را انتخاب کنند. به منظور مشورت با افراد متخصص در تحلیل آماری پایان نامه پل ارتباطی را در سایت آمار پیشرو ایجاد کردیم که شما می توانید از نظر خبرگان استفاده کنید. برای بهره مندی از افراد متخصص به صورت رایگان به بخش مشاوره آماری رایگان مراجعه کنید.

چنانچه به دنبال آموزش های بیشتر در مسیر تحلیل آماری پایان نامه هستید، میتوانید مباحث معادلات ساختاری، آنالیز واریانس ، آزمون t را در بلاگ سایت آمار پیشرو ببینید. برای با خبر شدن از مطالب جدید آماری و بروز نگه داشتن علم آماری خود می توانید صفحه اینستاگرام آمار پیشرو را دنبال کنید.

در این مقاله سعی کردیم نکات مهم تعیین حجم نمونه را برای شما شرح دهیم. اما چنانچه در مسیر تحلیل آماری پایان نامه نیاز به خدمات آماری مختلف در حوزه پایان نامه هستید می توانید شرح خدمات این حوزه را در بخش تحلیل آماری پایان نامه مشاهده کنید. با تکمیل فرم در بخش ثبت سفارش می توانید بخش آماری پایان نامه خود را به افراد خبره در گروه آمار پیشرو بسپارید.

حجم نمونه چیست؟

حجم نمونه، تعداد اعضایی از جامعه است که در نمونه حضور پیدا می‌کنند.

چگونه باید حجم نمونه را تعیین کنیم؟

حجم نمونه باید با توجه به شرایط عمومی و اختصاصی هر مسئله تعیین شود که در هر مسئله‌ی آزمون فرضیه جدا از نوع و هدف آن وجود دارند.

تعیین حجم نمونه با استفاده از فرمول کوکران چگونه انجام می‌شود؟

فرمول کوکران امکان محاسبه‌ی حجم مناسب نمونه بر اساس سطح مشخصی از دقت، سطح مشخصی از اطمینان و نسبت اعضایی که دارای صفت خاصی هستند می‌دهد که در سایت آمارپیشرو به صورت رایگان قابل انجام است.

در چه صورت نمی‌توان از فرمول کوکران استفاده کرد؟

در بعضی از تحقیقات کیفی، در طرح‌های پیش آزمون و پس آزمون، تحلیل سلسله مراتبی و در بعضی موارد مدلسازی معادلات ساختاری و …

جدول مورگان چیست؟

جدول مورگان از محاسبه‌ی حجم نمونه به ازای مقادیر مشخص پارامترها در فرمول کوکران به دست آمده است.

فوریه 12, 2020 25 نظرات

آموزش آمار

آلفای کرونباخ و پایایی پرسشنامه در SPSS

توسط لادن عباس نیا فوریه 6, 2020

نوشته شده توسط لادن عباس نیا

ضریب آلفای کرونباخ و ضریب پایایی مرکب از جمله روش هایی برای سنجش سازگاری درونی پرسشنامه است. آلفای کرونباخ که براساس میانگین کواریانس (و یا همبستگی) سوالات موجود در یک پرسشنامه بدست می‌آید. در نرم افزار SPSS به راحتی قابل محاسبه است و معمولا مقادیر مثبت بالای 0.7 را مناسب در نظر می‌گیرند و اگر منفی بدست بیاید نشان دهنده ناهمگنی (ناسازگاری) زیاد است. روش دیگر برای بررسی سازگاری درونی، ضریب پایایی مرکب است که بر اساس بارهای عاملی بدست می‌آید.

ضریب آلفای کرونباخ برای سنجش پایایی همگنی توسط لی جوزف کرونباخ (Lee Joseph Cronbach) روانشناس آمریکایی در سال 1951 معرفی شد. این ضریب جهت بررسی اعتماد به توانایی یک ابزار جهت اندازه گیری به طور مداوم اشاره دارد؛ به این صورت که تا چه حد تمام اجزای یک مقیاس، یک مفهوم یکسان را بیان کرده و نشان دهنده ارتباط درونی این اجزاست.

محاسبه ضریب آلفای کرونباخ به عنوان یکی از بخش های تحلیل آماری شناخته می شود. تحلیل آماری به عنوان جزء جدایی ناپذیر در پاسخگویی به نیازهای دانشجویان، دانش پژوهان، شرکت‌ها، مؤسسات مختلف و… (اعم از تحلیل مقاله، پایان نامه، پروژه‌های دانشجویی، ارائه ها، بررسی سود و زیان و بهینه سازی مخارج شرکت‌ها، کنترل کیفیت آماری و… ) بر آن است که با بهره‌گیری از نرم افزارهای مختلف مانند (Excel، R، SPSS، Smart PLS و…) آن‌ها را در تحلیل داده‌ها و رسیدن به اهداف پژوهشی و آماری خود یاری نماید.

آلفای کرونباخ چیست؟

برای سنجش سازگاری(پایایی همگنی) درونی(داخلی) پرسشنامه، روش‌های مختلفی وجود دارد که یکی از پرکاربردترین آن‌ها ضریب آلفای کرونباخ می‌باشد که براساس میانگین کواریانس (و یا همبستگی) سوالات (گویه‌ها، آیتم‌ها) موجود در یک پرسشنامه (آزمون) بدست می‌آید. زمانی که چندین خرده مقیاس در پرسشنامه موجود است، آلفا به تفکیک خرده مقیاس ها (جدا جدا) محاسبه می‌شود.

آلفای كرونباخ را مي توان برای تمامي مقیاس‌هايي كه سطح سنجش معرف‌های آنها رتبه ای، فاصله‌ای یا نسبی است مورد استفاده قرار داد. برای محاسبه ضريب آلفای كرونباخ ابتدا بايد واريانس نمره‌های سوال‌های پرسشنامه و واريانس کل (واریانس مجموع نمرات) را محاسبه كرد و سپس با استفاده از فرمول زير:

صورت دیگر فرمول فوق به صورت زیر است:

اگر نمرات آیتم‌ها را استاندارد کنیم (و یا به عبارتی از ماتریس همبستگی بجای ماتریس کواریانس استفاده کنیم)، ضریب آلفا به صورت زیر محاسبه می‌شود:

ضریب آلفای کرونباخ باید چند باشد؟

معمولا اين سوال وجود دارد كه مقدار آلفای كرانباخ از چه مقدار بیشتر باشد گويیم همگني وجود دارد. متاسفانه هیچ جواب جامعي برای اين سوال وجود ندارد و دلیل آن اين است كه سازه های مختلف از حیث همگني قابل دسترس متفاوت اند و مقدار مرزی بايد با توجه به مقدار آلفای ابزارهای استفاده شده در متون پیشین در نظر گرفته شود. برای مثال همگني قابل دسترسي در ابزار اندازه گیری هوش ممكن است بسیار بیشتر از همگني قابل دسترسي در اندازه گیری افسردگي باشد.

با این حال جدول زیر می‌تواند در کمک به تعیین کران‌های آلفای کرونباخ و میزان سازگاری درونی گویه‌ها مؤثر باشد:

آلفای کرونباخ منفی

مقدار آلفای كرونباخ مي تواند منفي باشد كه نشان دهنده ناهمگني زياد است که علت آن می‌تواند به دلیل وجود داده‌های پرت، عدم حذف کد اعداد گمشده (وقتی اعداد گمشده با کدی مثل 999 وارد شده‌اند)، عدم وجود روابط منطقی مدل نظری، عدم معکوس سازی کد سوالات منفی و وجود همبستگی منفی بین آیتم‌ها (inter item correlation) باشد.

پایایی ترکیبی

پایایی ترکیبی یا پایایی مرکب (Composite Reliability) روش دیگر و جدیدتری نسبت به آلفای کرونباخ برای سنجش سازگاری (پایایی همگنی) است که بر مبنای آیتم‌های استاندارد شده است و پس از انجام تحلیل عاملی تأییدی و محاسبه پارامترهای آن (بارهای عاملی استاندارد) قابل محاسبه می‌باشد.

روش پایایی مرکب، نسبت به روش آلفای کرونباخ، نیازمند حجم نمونه‌ی بیشتری برای محاسبه شدن است و به این دلیل معمولاً در هنگام تعیین حجم نمونه، در نمونه گیری‌های اولیه(به خصوص زمانی که نمونه اولیه کم می‌باشد) از آلفای کرونباخ (که در حجم نمونه‌های کم هم قابل محاسبه است) برای بررسی پایایی همگنی استفاده می‌کنند. همچنین در خروجی نرم افزار spss آلفای کرونباخ‌هایی که هر بار با حذف یک از سوالات بدست آمده نیز موجود هست تا به کمک آن بتوان در انتخاب سوالات مناسب در هنگام نمونه گیری اولیه قدم برداشت. البته باید توجه نمود که محاسبه CR در نرم‌افزار spss قابل محاسبه نیست و باید از نرم افزارهایی مانند pls و یا R استفاده نمود.

پس از پایان یافتن مرحله جمع آوری تمام داده‌ها می‌توان هم ضریب آلفای کرونباخ و هم ضریب CR را گزارش نمود.

این ضریب به صورت زیر محاسبه می‌شود:

مقادیر قابل قبول برای CR، مقادیر بالای 0.7 است. (CR>0.7)

آلفای کرونباخ در spss

در نرم افزار spss بعضی روش‌های مختلف سنجش سازگاری (مانند: Split-half، Guttman، Parallelو Strict parallel) وجود دارد، اما محاسبه ضریب آلفای کرونباخ از مسیر زیر میسر می‌باشد:

Analyze> Scale> Reliability Analysis

(نکته: دقت کنید در قسمت Model عبارت Alpha قرار گرفته باشد.)

نرم افزار SPSS چیست؟ و چه کاربردی دارد؟

reliability-analysis-statistics- Cronbach's-alpha

در نرم افزار spss هر دو آلفا که یکی بر اساس سوالات استاندارد نشده و یکی بر حسب سوالات استاندارد شده بود، گزارش می‌شود؛ اما برای مشاهده آلفا برای ضرایب استاندارد شده باید از زبانه statistics در قسمت inter-item گزینه correlations و یا covariances را فعال کنید تا این مقدار هم در ستونی در کنار آلفای اولیه ظاهر شود.

معمولا استفاده از مقادیر استاندارد شده در زمان‌هایی کاربرد دارد که مقادیر آیتم‌ها اختلاف زیادی با یکدیگر داشته باشند، چون در این صورت مقدار آلفای کرونباخ مقادیر استاندارد نشده تحت تأثیر اختلاف ناشی از واحد اندازه گیری آیتم به غلط کوچک بدست می‌آید و آلفای استاندارد شده، سازگاری واقعی را نشان می‌دهد. در غیر این صورت، معمولا مقدار این دو آلفا تفاوت زیادی با یکدیگر نخواهند داشت.

بايد توجه داشت كه محاسبه آلفا پايان كار نیست. محقق بايد از خود سوال كند آيا امكان افزايش آلفا وجود دارد؟ آيا در اين مقیاس سوالاتی وجود دارد كه میزان آلفای کرونباخ كل مي توانست با نبود آنها افزايش پیدا كند؟ اينجاست كه محقق برای محاسبه تاثیر يكايك سوالات بر همگني مقیاس بايد مقدار آلفا را به تعداد سوالات (هر بار با حذف یکی از سوالات) محاسبه نمايد. برای این منظور می‌توانید از زبانه statistics در قسمت Descriptives for گزینه Scales if item deleted را فعال کنید تا جدول Item-Total Statistics در خروجی نرم افزار ظاهر شود. در ستون آخر این جدول مقدار آلفای مقیاس در صورت حذف سوال (آیتم) مربوطه درج شده است تا سوالاتی که حذف آن‌ها باعث افزایش مقدار آلفای کرونباخ می‌شود معلوم گردد. سوالاتی که حذف آن‌ها باعث کاهش مقدار آلفا می‌شود، سوالات مناسبی هستند و نباید حذف شوند.

نکته: در هنگام حذف سوالات نامناسب به منظور افزايش ضريب همگنی، نبايد روايی محتوايی مقیاس خدشه دار شود. گاهي اوقات با حذف يك سوال ممكن است همگنی تا حدّی افزايش يابد، اما در عین حال ممكن است روايی محتوايی به سبب حذف آن کاهش یابد.

یکی از موضوعات مهم در پایان نامه سنجش پایایی پرسشنامه است. یکی از رایج ترین روش ها برای این موضوع آلفای کرونباخ است، که می توانید با کمک متخصصان آمار پیشرو به خوبی آن را برای پرسشنامه خود اجرا کنید

آلفای کرونباخ چیست؟

ضریب آلفای کرونباخ از جمله روش هایی برای سنجش سازگاری درونی پرسشنامه است.

ضریب آلفای کرونباخ باید چند باشد؟

آلفای کرونباخ باید بالاتر از 7/0 باشد.

آلفای کرونباخ منفی چیست؟

مقدار آلفای كرونباخ مي تواند منفي باشد كه نشان دهنده ناهمگني زياد است.

پایایی ترکیبی چیست؟

پایایی ترکیبی یا پایایی مرکب (Composite Reliability) روش دیگر و جدیدتری نسبت به آلفای کرونباخ برای سنجش سازگاری (پایایی همگنی) است که بر مبنای آیتم‌های استاندارد شده است.

فوریه 6, 2020 4 نظرات

پست های جدیدتر

پست های قدیمی تر