یادگیری ماشینی مبتنی بر قانون

خلاصه

سیستم‌های طبقه‌بندی کننده یادگیری (LCS) یادگیری ماشین را با محاسبات تکاملی و سایر روش‌های اکتشافی ترکیب می‌کنند تا یک سیستم تطبیقی ایجاد کنند که حل یک مشکل خاص را یاد می‌گیرد. LCS ها به طور نزدیک با همان مولفه های الگوریتم ژنتیک (GA) که بیشتر مورد استفاده قرار می گیرد، مرتبط هستند و معمولاً آنها را جذب می کنند. هدف LCS شناسایی بهترین مدل یا راه‌حل واحد نیست، بلکه ایجاد مجموعه‌ای از قوانین یا مدل‌هایی است که با هم کار را حل می‌کنند. راه حل تکامل یافته توسط یک LCS به عنوان جمعیتی از قوانین یا مجموعه قوانین نشان داده می شود که به طور جمعی برای تصمیم گیری/طبقه بندی استفاده می شوند. شماتیک زیر زمینه های مطالعه مرتبط را به صورت درختی سازماندهی می کند که به جامعه تحقیقاتی LCS تغذیه می کند.

LCSها الگوریتم‌های مبتنی بر قانون با مجموعه‌ای از ویژگی‌های منحصر به فرد و انعطاف‌پذیر هستند که آن‌ها را متمایز می‌کند. دو ژانر اصلی از الگوریتم‌های LCS شامل سیستم‌های سبک میشیگان و سبک پیتسبورگ وجود دارد. سیستم های به سبک میشیگان سنتی تر از دو معماری LCS هستند و تمرکز علاقه و کار من است. LCSهای سبک میشیگان به طور منحصر به فردی الگوهای آموخته شده را بر روی یک جمعیت رقابتی و در عین حال مشترک از قوانین قابل تفسیر (IF: THEN) به صورت جداگانه توزیع می کنند. این به الگوریتم اجازه می دهد تا به طور انعطاف پذیر و موثر فضاهای مسئله پیچیده و متنوع موجود در مدل سازی رفتار، تقریب تابع، طبقه بندی و داده کاوی را توصیف کند. LCSهای سبک میشیگان نیز به جای یادگیری دسته‌ای، تکراری را اعمال می‌کنند، به این معنی که قوانین به جای ارزیابی فوری در مجموعه داده آموزشی در یک زمان، ارزیابی می‌شوند و یک نمونه آموزشی را تکامل می‌دهند. این باعث می‌شود که آنها کارآمد باشند و طبیعتاً برای یادگیری موضوعات مختلف موجود در حوزه‌های مشکل چند کلاسه، کلاس پنهان یا ناهمگن مناسب باشند.

ماهیت LCSهای سبک میشیگان چندین مزیت قابل توجه را به آنها می دهد: (1) آنها بدون مدل هستند و بنابراین در مورد داده ها فرضیاتی ایجاد نمی کنند (به عنوان مثال، ارتباط می تواند خطی، اپیستاتیک یا ناهمگن باشد؛ تعداد پیش بینی ها). ویژگی‌ها؛ سیگنال نویزدار یا تمیز؛ کلاس‌های متعادل یا نامتعادل؛ نحوه مدیریت داده‌های از دست رفته؛ یا ویژگی‌هایی که ترکیبی از هر دو گسسته و پیوسته هستند، (2) قوانین فردی مستقیماً به عنوان عبارات IF: THEN قابل تفسیر هستند، (3) آنها به طور ضمنی هستند. قوانین چندهدفه و در حال تکامل به سمت حداکثر دقت و کلیت (یعنی سادگی قوانین) برای بهبود عملکرد پیش بینی، (4) به خودی خود، موضوعات مشترکی با یک سیستم یادگیری گروهی دارند که در آن قواعد فردی یا گروهی از قوانین راه حل های مختلفی را در یک سیستم پیشنهاد می کنند. جمعیت قواعد جمعی، (5) آنها با تغییر محیط های داده سازگار هستند، به طوری که بخش هایی از یک راه حل می توانند بدون شروع مجدد از ابتدا تطبیق دهند، (6) با تکیه بر محاسبات تکاملی برای کشف فضای جستجو، آنها یک گزینه عملی را در صورت قطعی ارائه می دهند. جستجوی جامع غیرقابل حل است، و (7) الگوریتم به گونه‌ای تقسیم‌بندی می‌شود که اجزای جداگانه را می‌توان برای رسیدگی به حوزه‌های مشکل تخصصی به‌روزرسانی یا جایگزین کرد. معایب کلیدی LCS عبارتند از: (1) این باور که کاربرد صحیح آنها تا حدودی دشوارتر است، (2) آنها فاقد درک نظری قابل مقایسه در کنار سایر استراتژی‌های معروف یادگیری ماشین هستند و تضمینی برای همگرایی در راه حل بهینه وجود ندارد. (3) آنها از نظر محاسباتی نسبتاً نیازمند هستند و در حوزه‌های مشکل خاصی ممکن است زمان بیشتری طول بکشد تا روی یک راه حل همگرا شوند، و (4) بیشتر پیاده‌سازی‌های تا به امروز مقیاس پذیری نسبتاً محدودی دارند.

شماتیک یک سیستم طبقه بندی کننده یادگیری تحت نظارت عمومی

Review Papers

علی روحانی فر پنج‌شنبه 1 تیر 1402 ساعت 08:35

GML (Graph Machine Learning)

GML (Graph Machine Learning)

درباره من