CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی
CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی

معیارها در سیستم‌های دسته‌بند یادگیری


سیستم‌های دسته‌بند یادگیری (LCS) نوعی از روش‌های یادگیری ماشینی مبتنی بر قانون هستند که یک جزء کشف را با یک جزء یادگیری ترکیب می‌کنند [۱].

هدف LCS شناسایی مجموعه‌ای از قوانین وابسته به زمینه است که به طور جمعی دانش را به صورت تکه‌ای ذخیره و به کار می‌برند تا پیش بینی کنند [۱].

مؤلفه یادگیری LCS می‌تواند یادگیری تحت نظارت، یادگیری تقویتی یا یادگیری بدون نظارت را انجام دهد [۱].

در LCS، قوانین به صورت جفت شرط-عمل نشان داده می‌شوند، که در آن شرط مجموعه‌ای از ویژگی‌هایی است که ورودی را توصیف می‌کند، و عمل، خروجی است [۲].

قوانین در یک جمعیت ذخیره می‌شوند و جمعیت در طول زمان از طریق یک الگوریتم ژنتیک تکامل می‌یابد [۲].

الگوریتم ژنتیک مناسب‌ترین قوانین را انتخاب می‌کند و آنها را برای ایجاد قوانین جدید ترکیب می‌کند [۲].

برای اندازه‌گیری عملکرد یک LCS می‌توان از معیارهای مختلفی استفاده کرد. این معیارها را می‌توان به دو دسته تقسیم کرد: معیارهای قواعد فردی و معیارهای وضعیت جمعیت [۳].

معیارهای قواعد فردی کیفیت هر قانون را ارزیابی می‌کنند، در حالی که معیارهای وضعیت جمعیت عملکرد کلی جامعه را ارزیابی می‌کنند [۳].

برخی از نمونه‌های معیارهای وضعیت جمعیت عبارتند از دقت، پوشش و تنوع [۳].

دقت درصد پیش‌بینی‌های صحیح انجام‌شده توسط جمعیت را اندازه‌گیری می‌کند، پوشش درصد الگوهای ورودی را که توسط جمعیت پوشش داده می‌شود، و تنوع درجه تنوع بین قوانین را در جامعه اندازه‌گیری می‌کند [۳].

1. Learning classifier system - Wikipedia

2. Classifier Systems | SpringerLink

3. What should a classifier system learn and how should we measure it? - ResearchGate

مزایای استفاده از سیستم‌های دسته‌بند یادگیری

سیستمهای دستهبند یادگیری (LCS) دارای چندین مزیت هستند، از جمله:

تطبیقی: LCSها میتوانند در مورد یادگیری آنلاین به یک محیط در حال تغییر عادت کنند [۱].

بدون مدل: آنها مفروضات محدودی در مورد دادهها میکنند، به این معنی که نیازی به مدل یا ساختار خاصی برای تحمیل دادهها ندارند [۲]

راه‌حل‌های قابل تفسیر: با توجه به سایر رویکردهای پیشرفته یادگیری ماشین، مانند شبکه‌های عصبی مصنوعی، جنگل‌های تصادفی یا برنامه‌نویسی ژنتیکی، LCS به‌ویژه برای مسائلی که نیاز به راه‌حل‌های قابل تفسیر دارند، مناسب هستند [۱].

سادگی قانون: LCSها می توانند از سادگی قوانین برای بهبود عملکرد پیش بینی استفاده کنند [۳].

یادگیری گروهی: LCSها به تنهایی دارای مضامین مشترک با یک سیستم یادگیری گروهی هستند که در آن قواعد فردی یا گروه‌هایی از قوانین راه‌حل‌های مختلفی را در یک جمعیت قوانین جمعی پیشنهاد می‌کنند [۳].

تطبیق پذیر با تغییر محیطهای داده: بخش‌هایی از یک راه حل می‌توانند بدون شروع دوباره از ابتدا تطبیق داده شوند، و LCSها را با محیط‌های داده تغییر تطبیق دهند [۳].

گزینه عملی: با تکیه بر محاسبات تکاملی برای کشف فضای جستجو، LCSها زمانی که جستجوی قطعی و جامع امکان‌پذیر نباشد، یک گزینه عملی ارائه می‌دهند [۳].

.

1. Learning classifier system

2. Learning Classifier Systems - Ryan Urbanowicz

3. Rule-Based Machine Learning

چند الگوریتم یادگیری خاص ارائه شده توسط sknet برای شبکه‌های پیچیده

کتابخانه sknet الگوریتم‌های یادگیری را برای شبکه‌های پیچیده فراهم می‌کند [۱-۲-۳-۴-۵]. برخی از الگوریتم‌های یادگیری خاص ارائه شده توسط sknet برای شبکه‌های پیچیده عبارتند از:

Graph Convolutional Networks (GCN): نوعی شبکه عصبی که بر روی نمودارها کار می‌کند و می‌تواند برای کارهایی مانند طبقه‌بندی گره‌ها، پیش بینی پیوندها و طبقه‌بندی گراف استفاده شود [۱-۲-۴].

شبکه‌های توجه گراف (GAT): نوعی شبکه عصبی که از مکانیسم‌های توجه برای اختصاص وزن‌های مختلف به گره‌های مختلف در یک نمودار استفاده می‌کند و به آن اجازه می‌دهد بر روی مرتبط‌ترین گره‌ها برای یک کار معین تمرکز کند [۱-۲].

رمزگذار خودکار گراف (GAE): نوعی شبکه عصبی که می تواند برای کارهایی مانند جاسازی گره، پیش بینی پیوند و تولید گراف استفاده شود [۱-۲].

روش‌های مبتنی بر پیاده‌روی تصادفی: نوعی روش که از پیاده‌روی‌های تصادفی روی یک نمودار برای ایجاد جاسازی گره‌ها استفاده می‌کند، که سپس می‌تواند برای کارهایی مانند طبقه‌بندی گره و پیش‌بینی پیوند استفاده شود [۱-۲].

ماشین‌های بردار پشتیبانی مبتنی بر شبکه (SVM): نوعی از SVM که از اطلاعات شبکه برای بهبود عملکرد خود استفاده می‌کند [۱-۶].

این الگوریتم‌های یادگیری را می‌توان برای بهبود عملکرد الگوریتم‌های یادگیری ماشین با شناسایی جنبه‌های توپولوژیکی داده‌ها که طبقه‌بندی‌کننده‌های سطح پایین به راحتی قادر به شناسایی آن‌ها نباشند، استفاده کرد [۱].

منابع

1. sknet - A library for machine learning in complex networks - Tiago Toledo Junior

2. sknet: A Python framework for Machine Learning in Complex Networks

3. [PDF] sknet: A Python framework for Machine Learning in Complex Networks - Open Journals

4. (PDF) sknet: A Python framework for Machine Learning in Complex Networks

5. scikit-net - PyPI

6. Using Complex Networks to improve Machine Learning methods | by Tiago Toledo Jr.