یک دستهبند انجمنی[1] (AC) یک مدل یادگیری نظارتشده است که از قوانین انجمنی برای پیشبینی برچسبهای کلاس استفاده میکند. این مدل، تکنیکهای کاوش قوانین انجمنی (شناسایی الگوهای مکرر در دادهها) و دستهبندی (اختصاص برچسبهای هدف) را ترکیب میکند و نتایج قابل تفسیر و اغلب دقیقی ارائه میدهد.
1. ساختار مدل:
- متشکل از قوانین "اگر-آنگاه" که در آن مقدم (سمت چپ) مجموعهای از ویژگیها و نتیجه (سمت راست) یک برچسب کلاس است.
- قوانین به ترتیب اعمال میشوند؛ اولین قانون تطبیق، کلاس را برای یک نمونه جدید تعیین میکند [1][3].
2. تولید قانون و معیارها:
- قوانین با استفاده از معیارهایی مانند پشتیبانی (فراوانی قانون در دادهها) و اطمینان (احتمال نتیجه با توجه به مقدم) استخراج میشوند [1][4].
- معیارهای جالب بودن (مانند افزایش، محکومیت) قوانین اضافی یا ضعیف را حذف میکنند و دقت و کارایی دستهبند را افزایش میدهند [4].
۳. پیادهسازیهای کلیدی:
- CBA (دستهبندی مبتنی بر وابستگیها[2]): با ادغام کاوش قانون با دستهبندی، AC را محبوب کرد [1].
- CMAR/CPAR: بهینهسازی انتخاب قانون و هرس آن برای عملکرد بهتر [1][4].
- دستهبندهای انجمنی عمیق: مدلهای ترکیبی (به عنوان مثال، SigD2) دستهبندهای انجمنی را با شبکههای عصبی لایهبندی میکنند تا دقت را بهبود بخشند و ابرپارامترها را کاهش دهند [2].
یادگیری ماشین مبتنی بر قانون[1] (RBML) اصطلاحی در علوم کامپیوتر است که شامل هر روش یادگیری ماشینی میشود که «قوانین» را برای ذخیره[2]، دستکاری[3] یا اعمال شناسایی[4]، یادگیری یا تکامل میدهد.[1][2][3] ویژگی تعیینکننده یک یادگیرنده ماشین مبتنی بر قانون، شناسایی و استفاده از مجموعهای از قوانین رابطهای است که در مجموع نشاندهنده دانش کسبشده توسط سیستم هستند.
رویکردهای یادگیری ماشین مبتنی بر قانون شامل سیستمهای دستهبند یادگیری[5] [۴]، یادگیری قانون انجمنی[6] [۵]، سیستمهای ایمنی مصنوعی[7] [۶]، و هر روش دیگری است که به مجموعهای از قوانین متکی است که هر کدام دانش زمینهای را پوشش میدهند.
در حالی که یادگیری ماشین مبتنی بر قانون از نظر مفهومی نوعی سیستم مبتنی بر قانون است، با سیستمهای مبتنی بر قانون سنتی که اغلب به صورت دستی ساخته میشوند و سایر تصمیمگیرندگان مبتنی بر قانون متمایز است. دلیل این امر آن است که یادگیری ماشین مبتنی بر قانون، نوعی الگوریتم یادگیری مانند نظریه مجموعههای راف[8] [7] را برای شناسایی و به حداقل رساندن مجموعه ویژگیها و شناسایی خودکار قوانین مفید اعمال میکند، نه اینکه انسان نیاز به اعمال دانش قبلی دامنه برای ساخت دستی قوانین و انتخاب مجموعه قوانین داشته باشد.