پیشبینی خوشههای بهینه در تحلیل خوشهای از اهمیت بالایی برخوردار است. برای یک دادهی معین ما باید ارزیابی کنیم که کدام مدل خوشهبندی به بهترین نحو با دادهها مطابقت دارد، یا کدام پارامترهای یک مدل، خوشههای بهینه را ارائه میدهند. ما اغلب نیاز داریم که دو خوشه را با یکدیگر مقایسه کنیم یا تحلیل کنیم که کدام مدل برای رویارویی با نقاط پرت بهینه است. برای ارزیابی روشهای خوشه بندی از معیارهای عملکرد و ارزیابی متفاوتی استفاده میشود. همانطور که میدانید تحلیل خوشهبندی یک روش با نظارت میباشد و به همین دلیل روش ارزیابی آن با روشهای نظارت شده متفاوت است.

در مسائل خوشهبندی ارزیابی مدل به منظور اندازهگیری کیفیت خوشهبندی صورت میگیرد. برخی از معیارهای ارزیابی مدل خوشهبندی به شرح زیر میباشند.
۱ . معیار ارتباطات داخلی (Internal Cohesion)
۲ . معیار ارتباطات بین خوشهها یا جداسازی برگردانده (Returned Separation)
۳ . اندازه خوشهها و تعداد آنها
۴ . همپوشانی خوشهها (Overlap)
۵ . معیارهای انطابق خوشهبندی با برچسبهای خروجی مدل
۶ . مدت زمان اجرای مدل و مصرف حافظه آن
حال به توضیح هر یک از موارد بالا میپردازیم.
معیار ارتباطات داخلی در خوشهبندی به عنوان یک معیار ارزیابی که در الگوریتمهای خوشهبندی استفاده میشود به میزان ارتباط بین نقاط داخلی یک خوشه اشاره دارد. با داشتن یه میزان ارتباط قوی و خوب بین اعضای یک خوشه میتوانیم خوشهبندی بهتری را بدست آوریم. به طورکلی ارتباطات داخلی بیشتر و ارتباطات بین خوشهای کمتر به خوشهبندی بهتری اشاره دارد.

معیارهای مختلفی برای ارتباطات بین خوشهها وجود دارد که استفاده از هرکدام بستگی به مسئله و دادههای مورد بررسی دارد. بعضی از معیارهای معمول شامل موارد زیر است:
ن شباهت جفتهای کمینه : این معیار مجموع شباهت کمینه بین تمام نقاط در دو خوشه را اندازهگیری میکند.
• شباهت انتروپی : این معیار شامل ترکیبی از فاصله اقلیدسی و شباهت کسینوسی برای اندازهگیری ارتباط بین خوشهها است.
• شباهت سیلوئت : این معیار براساس فاصله بین نقاط در یک خوشه و فاصله میان خوشهها به عنوان معیاری برای ارتباط بین خوشهها استفاده میشود.
• راند : این معیار ارتباط بین خوشهها را بر اساس تعداد جفت نقاطی که در هر دو خوشه قرار دارند یا در هیچکدام از خوشهها نیستند اندازهگیری میکند.
ن شباهت جرمی : این معیار براساس تعداد جفت نقاطی که در هر دو خوشه قرار دارند به تعداد کل جفتها در هر دو خوشه را اندازهگیری میکند.
ن شباهت رندو : این معیار تعداد جفت نقاطی که در هر دو خوشه قرار دارند و تعداد جفت نقاطی که در هیچکدام از خوشهها نیستند را با توجه به احتمال شانس دستهبندی در خوشهها اندازهگیری میکند.
همهی این معیارها درواقع برای ارزیابی کیفیت خوشهبندی مورد استفاده قرار میگیرند.
همپوشانی خوشهها یک روش در داده کاوی و تحلیل خوشههاست که در آن اعضایی که به چندین خوشه تعلق دارند در همان تعداد خوشه نیز شناسایی میشوند. به عبارت دیگر همپوشانی خوشهها به معنی این است که ممکن است برخی اعضا در چندین خوشه قرار بگیرند و بدون نیاز به انتخاب تنها یک خوشه برای آنها میتوان آنها را در تمامی خوشههای مرتبط قرار داد.
این روش در بعضی موارد به دلیل صرفه جویی در زمان و افزایش دقت در نتایج کاربرد دارد. به عنوان مثال در تحلیل داده های پزشکی همپوشانی خوشهها میتواند به شناسایی بیماریهایی که چندین علامت مشترک دارند کمک کند.
در ارزیابی مدلهای خوشه بندی اندازه خوشهها و تعداد آنها معیارهای مهمی هستند.
میانگین اندازه خوشهها : این معیار به ما میگوید میانگین تعداد نمونههایی که در هر خوشه وجود دارد چقدر است. در صورتی که اندازهی خوشهها متفاوت باشند ممکن است دلیلی بر عدم توازن در خوشهبندی مدل وجود داشته باشد به این معنا که برخی خوشهها بسیار بزرگ و برخی دیگر بسیار کوچک هستند.
تعداد خوشهها : تعداد خوشهها نشان دهنده تعداد دستهبندیهای مختلف است. این معیار نشان میدهد که مدل چند دستهبندی انجام داده است و خوشهبندی را با چه تنوعی در دستهبندیهای متفاوت پیدا کرده است. تعداد خوشهها میتواند در صورتی که زیاد باشد نشانهای از خطا در مدلسازی یا برخی نمونهها با خصوصیات یکسان از قبل وجود داشته باشد و برعکس در صورتی که کم باشد ممکن است نشان دهندهی ادغام نمونههای متفاوت یا عدم توانایی مدل در تجزیه کردن دادهها به دستههای مختلف باشد از این دو معیار میتوان برای ارزیابی کیفیت و قابلیت عمومی مدلهای خوشهبندی استفاده کرد.
معیارهای انطباق خوشهبندی با برچسبهای خروجی مدل معیارهایی هستنند که برای ارزیابی کیفیت خوشهبندی مورد استفاده قرار میگیرند. این معیارها با استفاده از برچسبهای پیشبینی شده توسط مدل و برچسبهای حقیقی دادهها، کیفیت خوشهبندی را ارزیابی میکنند.
مثالهایی از این معیارها عبارتاند از :
• ارزیابی دقت با استفاده از ماتریس درهمریختگی.
• معیارهای F1,precision,recall که برروی هر خوشه به صورت جداگانه محاسبه میشوند.
• اندازه خوشهها مانند تعداد عناصر در هر خوشه و میانگین فاصله بین اعضای هر خوشه.
ن مقیاس داوطلبانه که ارتباط فاصله دادههای داخلی خوشه و تمایز آن با خوشههای دیگر را ارزیابی میکند.
استفاده از معیار انطباق مناسب با هدف خاصی که برای کاربرد خود نیاز دارید بسیار مهم است.

زمان اجرای مدل و میزان مصرف حافظهی آن دو معیار مهم در ارزیابی عملکرد یک مدل هستند. زمان اجرای مدل به معنای زمانی است که برای پردازش دادههای ورودی توسط مدل صرف میشود به عیارت دیگر زمانی که مدل برای تولید خروجیهای مورد نظرش صرف میکند. این میتواند به صورت ثانیه، دقیقه، ساعت یا حتی روز شمارش شود.
مصرف حافظهی مدل به معنای مقدار حافظهی مورد استفاده توسط مدل در هنگام اجراست. این شامل حافظهی مورد استفاده برای نگهداری شبکهی عصبی، دادههای ورودی و خروجی، پارامترهای مدل و موارد دیگر مربوط به عملکرد مدل است. مصرف حافظهی مدل میتواند به صورت کیلوبایت، مگابایت، گیگابایت یا ترابایت محاسبه شود.
این دو معیار به طور کلی باهم متناسب هستند. به عنوان مثال مدلهای پیچیدهتر و بزرگتر به طور معمول زمان اجرای بیشتری نیاز دارند و میتوانند مصرف حافظهی بیشتری داشته باشند.
در ادامه به توضیح چند معیار ارزیابی کیفیت خوشه بندی می پردازیم:
معیار سیلوئت یکی از پرکاربردترین و شهودیترین معیارهای ارزیابی کیفیت خوشهبندی است که همزمان انسجام درونخوشهای و جداسازی بینخوشهای را در نظر میگیرد. برای هر نمونه، مقدار سیلوئت نشان میدهد که آن نمونه تا چه اندازه به خوشهی خود نزدیک است و در عین حال چقدر از خوشههای دیگر فاصله دارد. مقدار این معیار بین ۱- تا ۱ قرار میگیرد؛ مقادیر نزدیک به ۱ نشاندهندهی خوشهبندی مناسب، مقادیر نزدیک به صفر نشاندهندهی همپوشانی خوشهها و مقادیر منفی بیانگر تخصیص نادرست نمونه به خوشه است. میانگین مقدار سیلوئت برای کل دادهها بهعنوان یک شاخص کلی برای مقایسه مدلهای مختلف خوشهبندی مورد استفاده قرار میگیرد.
معیار Davies-Bouldin یکی دیگر از معیارهای متداول ارزیابی خوشهبندی است که بر اساس نسبت پراکندگی درونخوشهای به فاصله بین خوشهها تعریف میشود. در این معیار، هرچه مقدار نهایی کوچکتر باشد، کیفیت خوشهبندی بهتر ارزیابی میشود. این معیار بهویژه در مقایسهی چند مدل خوشهبندی یا تعیین تعداد بهینه خوشهها کاربرد دارد. مزیت اصلی Davies-Bouldin سادگی محاسبات و عدم نیاز به برچسبهای واقعی است، اما در مقابل ممکن است نسبت به نویز و نقاط پرت حساس باشد.
معیار Calinski-Harabasz که با نام نسبت واریانس نیز شناخته میشود، یکی از معیارهای مبتنی بر پراکندگی دادههاست. این معیار نسبت پراکندگی بین خوشهها به پراکندگی درون خوشهها را اندازهگیری میکند. مقادیر بالاتر این معیار نشاندهندهی تفکیک بهتر خوشهها و انسجام بیشتر درون آنهاست. این معیار بهطور گسترده در تعیین تعداد بهینه خوشهها، بهویژه در الگوریتمهایی مانند K-means، استفاده میشود و از نظر محاسباتی نیز کارایی بالایی دارد.
پایداری خوشهبندی به این موضوع میپردازد که آیا ساختار خوشهها در برابر تغییرات جزئی در دادهها حفظ میشود یا خیر. در این روش، دادهها با نمونهگیری مجدد یا افزودن نویز جزئی چندین بار خوشهبندی میشوند و نتایج حاصل با یکدیگر مقایسه میگردند. اگر خوشهها در اجراهای مختلف شباهت زیادی داشته باشند، مدل از پایداری بالایی برخوردار است. این معیار بهویژه در دادههای بزرگ و واقعی که شامل عدم قطعیت هستند اهمیت زیادی دارد.
نقاط پرت یا Outliers میتوانند تأثیر قابلتوجهی بر کیفیت خوشهبندی داشته باشند. برخی الگوریتمها مانند K-means بهشدت به این نقاط حساس هستند، در حالی که روشهایی مانند DBSCAN بهصورت ذاتی توانایی شناسایی و حذف نقاط پرت را دارند. در ارزیابی مدل خوشهبندی، بررسی نحوهی برخورد الگوریتم با نقاط پرت یک معیار مهم محسوب میشود. مدلی که بتواند خوشههای معنادار را بدون تأثیرپذیری شدید از دادههای غیرعادی استخراج کند، معمولاً عملکرد بهتری دارد.
برخلاف یادگیری نظارتشده، استفاده از اعتبارسنجی متقاطع در خوشهبندی چالشبرانگیزتر است، اما همچنان میتوان از روشهایی برای ارزیابی تعمیمپذیری مدل استفاده کرد. یکی از این روشها تقسیم دادهها به چند بخش و مقایسه ساختار خوشهها در هر بخش است. اگر مدل بتواند الگوهای مشابهی را در بخشهای مختلف داده شناسایی کند، نشاندهندهی قابلیت تعمیمپذیری بالای آن خواهد بود.
انتخاب معیار ارزیابی خوشهبندی بهشدت به نوع مسئله و هدف کاربرد بستگی دارد. برای مثال، در کاربردهای بازاریابی ممکن است تفسیرپذیری خوشهها و اندازه آنها اهمیت بیشتری داشته باشد، در حالی که در مسائل زیستی یا پزشکی، جداسازی دقیق خوشهها و حداقل همپوشانی اولویت دارد. بنابراین استفادهی همزمان از چند معیار ارزیابی و تحلیل نتایج آنها میتواند دید جامعتری نسبت به کیفیت مدل ارائه دهد.
ارزیابی خوشهبندی در بسیاری از حوزههای عملی نقش کلیدی ایفا میکند. در تحلیل رفتار مشتریان، خوشهبندی برای تقسیمبندی بازار استفاده میشود و معیارهای ارزیابی کمک میکنند تا مناسبترین مدل برای شناسایی گروههای مشتری انتخاب شود. در حوزه پردازش تصویر، ارزیابی خوشهبندی برای تشخیص نواحی مشابه در تصاویر کاربرد دارد. همچنین در تحلیل شبکههای اجتماعی، کیفیت خوشهبندی در شناسایی جوامع و گروههای تأثیرگذار اهمیت بالایی دارد.

در مجموع، ارزیابی مدلهای خوشهبندی فرآیندی چندبعدی است که نمیتوان آن را تنها به یک معیار محدود کرد. بررسی همزمان انسجام درونخوشهای، جداسازی بین خوشهها، پایداری مدل، حساسیت به نقاط پرت و هزینههای محاسباتی میتواند تصویری دقیق از عملکرد مدل ارائه دهد. انتخاب آگاهانه معیارهای ارزیابی و تفسیر صحیح آنها نقش مهمی در موفقیت تحلیل خوشهبندی و کاربرد عملی نتایج آن دارد.
برای مشاوره و استفاده از خدمات ما، درخواست خود را همین حالا ثبت کنید تا کارشناسان ما در کوتاهترین زمان با شما تماس بگیرند.
ثبت سفارشتماس با ما


دیدگاه بگذارید