یک دستهبند انجمنی[1] (AC) یک مدل یادگیری نظارتشده است که از قوانین انجمنی برای پیشبینی برچسبهای کلاس استفاده میکند. این مدل، تکنیکهای کاوش قوانین انجمنی (شناسایی الگوهای مکرر در دادهها) و دستهبندی (اختصاص برچسبهای هدف) را ترکیب میکند و نتایج قابل تفسیر و اغلب دقیقی ارائه میدهد.
1. ساختار مدل:
- متشکل از قوانین "اگر-آنگاه" که در آن مقدم (سمت چپ) مجموعهای از ویژگیها و نتیجه (سمت راست) یک برچسب کلاس است.
- قوانین به ترتیب اعمال میشوند؛ اولین قانون تطبیق، کلاس را برای یک نمونه جدید تعیین میکند [1][3].
2. تولید قانون و معیارها:
- قوانین با استفاده از معیارهایی مانند پشتیبانی (فراوانی قانون در دادهها) و اطمینان (احتمال نتیجه با توجه به مقدم) استخراج میشوند [1][4].
- معیارهای جالب بودن (مانند افزایش، محکومیت) قوانین اضافی یا ضعیف را حذف میکنند و دقت و کارایی دستهبند را افزایش میدهند [4].
۳. پیادهسازیهای کلیدی:
- CBA (دستهبندی مبتنی بر وابستگیها[2]): با ادغام کاوش قانون با دستهبندی، AC را محبوب کرد [1].
- CMAR/CPAR: بهینهسازی انتخاب قانون و هرس آن برای عملکرد بهتر [1][4].
- دستهبندهای انجمنی عمیق: مدلهای ترکیبی (به عنوان مثال، SigD2) دستهبندهای انجمنی را با شبکههای عصبی لایهبندی میکنند تا دقت را بهبود بخشند و ابرپارامترها را کاهش دهند [2].
مزایا
- تفسیرپذیری: قوانین برای انسان قابل خواندن هستند و به شفافیت در تصمیمگیری کمک میکنند [5].
- دقت: اغلب در سناریوهایی با الگوهای انجمنی قوی، از دستهبندهای سنتی (به عنوان مثال، درختهای تصمیمگیری) بهتر عمل میکند [3][4].
- دادههای با ابعاد بالا را مدیریت میکند: در حوزههایی مانند خردهفروشی (تحلیل سبد بازار) و مراقبتهای بهداشتی (پیشبینی تشخیص) مؤثر است [3][5].
چالشها
- پیچیدگی محاسباتی: تولید قانون میتواند برای مجموعه دادههای بزرگ منابع زیادی مصرف کند [3][5]. - حساسیت به نویز: ویژگیهای نامربوط یا قوانین تکراری ممکن است بدون هرس مناسب، عملکرد را کاهش دهند [4].
- تنظیم آستانه: نیاز به تنظیم دقیق آستانههای پشتیبانی/اطمینان در مجموعه دادهها دارد [2][5].
کاربردها
- خردهفروشی: شناسایی الگوهای خرید مشتری برای بازاریابی هدفمند [3][5].
- مراقبتهای بهداشتی: پیشبینی بیماریها (به عنوان مثال، دیابت) با استفاده از سابقه و علائم بیمار [5].
- تشخیص تقلب: علامتگذاری تراکنشهای مشکوک از طریق الگوهای انجمنی در دادههای بانکی [5].
پیشرفتهای اخیر
- مدلهای ترکیبی عمیق: معماریهای لایهای (به عنوان مثال، دستهبند انجمنی عمیق) AC را با شبکههای عصبی ترکیب میکنند، مقیاسپذیری را بهبود میبخشند و تنظیم دستی را کاهش میدهند [2].
- تکنیکهای هرس قانون: معیارهایی مانند lift و conscension کیفیت قانون را اصلاح میکنند و فشردگی دستهبند را افزایش میدهند [4].
نتیجهگیری
دستهبندهای انجمنی، کاوش و دستهبندی قانون انجمنی را به هم پیوند میدهند و مدلهای قابل تفسیر و دقیقی را برای دادههای ساختاریافته ارائه میدهند. در حالی که چالشهایی مانند سربار محاسباتی همچنان پابرجاست، نوآوریها در معماریهای ترکیبی و استراتژیهای هرس همچنان کاربرد خود را در صنایعی مانند مراقبتهای بهداشتی و مالی گسترش میدهند.
References:
[1] Wikipedia · [2] Deep Associative Classifier (PDF) · [3] Tutorialspoint · [4] IJRTE Paper · [5] Pickl.ai Blog
[1] https://en.wikipedia.org/wiki/Associative_classifier
[2] https://webdocs.cs.ualberta.ca/~zaiane/postscript/ICKG_22_Deep_Associative_Classifier.pdf
[3] https://www.tutorialspoint.com/associative-classification-in-data-mining
[4] https://www.ijrte.org/wp-content/uploads/papers/v8i2S11/B15800982S1119.pdf
[5] https://www.pickl.ai/blog/associative-classification-in-data-mining/
[6] https://ask.orkg.org/item/59797/Looking-at-the-class-associative-classification-training-algorithm
[7] https://www.slideshare.net/jagdeepsingh/jagdeep-thesis-synopsis
[8] https://www.igi-global.com/dictionary/distributed-algorithm-mining-fuzzy-association/1627
[9] https://www.sciencedirect.com/topics/computer-science/associative-classification
[10] https://www.sciencedirect.com/science/article/abs/pii/S0957417425010760