خوشه بندی مبتنی بر Grid
چهارشنبه, ۱۱ دی ۱۳۹۲، ۱۰:۱۶ ق.ظ
multi resolution grid data sturcture:
سلسله مراتبی از grid ها که هر سلول سطح بالاتر مجموعه ای از سلول های سطح پایین تر است.
روشها:
در هر سلول سطح پایین یک اطلاعات آماری (مثل مینیمم، ماکسیمم، میانگین، مجموع) یا پارامترهای یک توزیع آماری (مثل: میانگین و واریانس در نرمال؛ البته چون نمی توانیم از واریانس grid ریزتر، مقدار آن برای درشت تر را به دست بیاوریم، به جای آن توان دوم نقاط و میانگین آنها را نگه می داریم.) نگه داشته می شود. هر بار آن سلولهایی که در بازه ی اطمینان سطح فعلی قرار نمی گیرند را محاسبه کن و حذف کن. از بالا به پایین این عمل را انجام می دهیم. برای کوئری هم همین طور جواب می دهیم. ایراد این روش این است که خوشه های آن شکل عمودی و افقی دارند. (البته هر چه grid را ریزتر بگیریم این مرزها دقیقتر می شود.)
WaveCluster
با استفاده از روش wavelet
CLIQUE (CLustering In QUEst)
هم بر مبنای Grid هم بر مبنای خوشه بندی زیرفضا - هم بر مبنای چگالی هم بر مبنای grid
هر بعد را به بازه های مساوی تقسیم می کند. (در m بعد به واحدهای مکعبی)
یک خانه دارای چگالی زیاد است اگر از مقداری که در ورودی تعیین می شود نقطه های بیشتری در آن باشد.
یک خوشه ماکسیمال اجتماع واحدهای چگال یک زیر فضا است. همچنین باید مینیمال واحدهای پوشاننده ی خوشه هم باشد.
(خیلی شبیه اون روش P3C است که ارائه ی من بود، فقط فرقش اینه که تستهای آماری کمتری انجام میده که نتیجه اش هم اینه که خوشه بندیشون با وجود سادگی و scalability خیلی نتیجه ی خوبی نمیده.)
۹۲/۱۰/۱۱