خلاصه
سیستمهای طبقهبندی کننده یادگیری (LCS) یادگیری ماشین را با محاسبات تکاملی و سایر روشهای اکتشافی ترکیب میکنند تا یک سیستم تطبیقی ایجاد کنند که حل یک مشکل خاص را یاد میگیرد. LCS ها به طور نزدیک با همان مولفه های الگوریتم ژنتیک (GA) که بیشتر مورد استفاده قرار می گیرد، مرتبط هستند و معمولاً آنها را جذب می کنند. هدف LCS شناسایی بهترین مدل یا راهحل واحد نیست، بلکه ایجاد مجموعهای از قوانین یا مدلهایی است که با هم کار را حل میکنند. راه حل تکامل یافته توسط یک LCS به عنوان جمعیتی از قوانین یا مجموعه قوانین نشان داده می شود که به طور جمعی برای تصمیم گیری/طبقه بندی استفاده می شوند. شماتیک زیر زمینه های مطالعه مرتبط را به صورت درختی سازماندهی می کند که به جامعه تحقیقاتی LCS تغذیه می کند.
LCSها الگوریتمهای مبتنی بر قانون با مجموعهای از ویژگیهای منحصر به فرد و انعطافپذیر هستند که آنها را متمایز میکند. دو ژانر اصلی از الگوریتمهای LCS شامل سیستمهای سبک میشیگان و سبک پیتسبورگ وجود دارد. سیستم های به سبک میشیگان سنتی تر از دو معماری LCS هستند و تمرکز علاقه و کار من است. LCSهای سبک میشیگان به طور منحصر به فردی الگوهای آموخته شده را بر روی یک جمعیت رقابتی و در عین حال مشترک از قوانین قابل تفسیر (IF: THEN) به صورت جداگانه توزیع می کنند. این به الگوریتم اجازه می دهد تا به طور انعطاف پذیر و موثر فضاهای مسئله پیچیده و متنوع موجود در مدل سازی رفتار، تقریب تابع، طبقه بندی و داده کاوی را توصیف کند. LCSهای سبک میشیگان نیز به جای یادگیری دستهای، تکراری را اعمال میکنند، به این معنی که قوانین به جای ارزیابی فوری در مجموعه داده آموزشی در یک زمان، ارزیابی میشوند و یک نمونه آموزشی را تکامل میدهند. این باعث میشود که آنها کارآمد باشند و طبیعتاً برای یادگیری موضوعات مختلف موجود در حوزههای مشکل چند کلاسه، کلاس پنهان یا ناهمگن مناسب باشند.
ماهیت LCSهای سبک میشیگان چندین مزیت قابل توجه را به آنها می دهد: (1) آنها بدون مدل هستند و بنابراین در مورد داده ها فرضیاتی ایجاد نمی کنند (به عنوان مثال، ارتباط می تواند خطی، اپیستاتیک یا ناهمگن باشد؛ تعداد پیش بینی ها). ویژگیها؛ سیگنال نویزدار یا تمیز؛ کلاسهای متعادل یا نامتعادل؛ نحوه مدیریت دادههای از دست رفته؛ یا ویژگیهایی که ترکیبی از هر دو گسسته و پیوسته هستند، (2) قوانین فردی مستقیماً به عنوان عبارات IF: THEN قابل تفسیر هستند، (3) آنها به طور ضمنی هستند. قوانین چندهدفه و در حال تکامل به سمت حداکثر دقت و کلیت (یعنی سادگی قوانین) برای بهبود عملکرد پیش بینی، (4) به خودی خود، موضوعات مشترکی با یک سیستم یادگیری گروهی دارند که در آن قواعد فردی یا گروهی از قوانین راه حل های مختلفی را در یک سیستم پیشنهاد می کنند. جمعیت قواعد جمعی، (5) آنها با تغییر محیط های داده سازگار هستند، به طوری که بخش هایی از یک راه حل می توانند بدون شروع مجدد از ابتدا تطبیق دهند، (6) با تکیه بر محاسبات تکاملی برای کشف فضای جستجو، آنها یک گزینه عملی را در صورت قطعی ارائه می دهند. جستجوی جامع غیرقابل حل است، و (7) الگوریتم به گونهای تقسیمبندی میشود که اجزای جداگانه را میتوان برای رسیدگی به حوزههای مشکل تخصصی بهروزرسانی یا جایگزین کرد. معایب کلیدی LCS عبارتند از: (1) این باور که کاربرد صحیح آنها تا حدودی دشوارتر است، (2) آنها فاقد درک نظری قابل مقایسه در کنار سایر استراتژیهای معروف یادگیری ماشین هستند و تضمینی برای همگرایی در راه حل بهینه وجود ندارد. (3) آنها از نظر محاسباتی نسبتاً نیازمند هستند و در حوزههای مشکل خاصی ممکن است زمان بیشتری طول بکشد تا روی یک راه حل همگرا شوند، و (4) بیشتر پیادهسازیهای تا به امروز مقیاس پذیری نسبتاً محدودی دارند.
شماتیک یک سیستم طبقه بندی کننده یادگیری تحت نظارت عمومی