در این پست وبلاگ، اصول یادگیری ماشین گراف را پوشش میدهیم.
ما ابتدا مطالعه میکنیم که گراف چیست، چرا از آنها استفاده میشود و چگونه آنها را به بهترین شکل نشان دهیم. سپس به طور مختصر نحوه یادگیری بر روی گرافها، از روشهای Pre-Neural (کاوش در ویژگیهای گراف به طور همزمان) تا آنچه که معمولاً شبکههای عصبی گراف نامیده میشوند، پوشش میدهیم. در نهایت، ما به دنیای Transformers برای گرافها نگاه میکنیم.
گراف چیست؟
در اصل، یک گراف توصیفی از مواردی است که توسط روابط به هم مرتبط شدهاند.
نمونههایی از گرافها شامل شبکههای اجتماعی (توئیتر، ماستودون، هر شبکه استنادی که مقالات و نویسندگان را به هم پیوند میدهد)، مولکولها، گرافهای دانش(مانند گرافهای UML، دایرهالمعارفها، و هر وبسایتی با پیوند بین صفحات آن)، جملاتی که بهعنوان درخت نحوی آنها بیان میشوند، هر مش سه بعدی، و بیشتر! بنابراین، هذلولی نیست که بگوییم گرافها همه جا هستند.
آیتمهای یک گراف (یا شبکه) گرهها (یا رئوس) و اتصالات آنها لبهها (یا پیوندها) نامیده میشوند. به عنوان مثال، در یک شبکه اجتماعی، گرهها کاربران هستند و اتصالات آنها را لبه میکنند. در یک مولکول، گرهها اتم و لبههای پیوند مولکولی آنها هستند.
· یک گراف با گرههای تایپشده یا لبههای تایپشده ناهمگن نامیده میشود (مثال: شبکههای استنادی با مواردی که میتوانند مقاله باشند یا نویسندگان، گرههای تایپشده دارند، و گراف XML که در آن روابط تایپ میشود، دارای لبههای تایپشده است). نمیتوان آن را صرفاً از طریق توپولوژی آن نشان داد، به اطلاعات اضافی نیاز دارد. این پست بر روی گرافهای همگن تمرکز دارد.
· یک گراف همچنین میتواند جهتدار باشد (مانند یک شبکه پیرو، که در آن A به دنبال B است، به این معنی نیست که B به دنبال A است) یا غیر جهتدار (مانند یک مولکول، که در آن رابطه بین اتمها به هر دو سمت میرود). لبهها میتوانند گرههای مختلف یا یک گره را به خود متصل کنند (خود لبهها)، اما همه گرهها نیازی به اتصال ندارند.
اگر میخواهید از دادههای خود استفاده کنید، ابتدا باید بهترین خصوصیات آن را در نظر بگیرید (همگن/ناهمگن، جهتدار/غیر جهتدار و غیره).
1. هدف
در این آموزش یادگیری ماشینی، به برترین الگوریتمهای شبکه عصبی خواهیم پرداخت. از این الگوریتمها برای آموزش شبکه عصبی مصنوعی استفاده میشود. این وبلاگ به شما آموزش عمیقی از گرادیان نزول، الگوریتمهای تکاملی و الگوریتم ژنتیک در شبکه عصبی ارائه میدهد.
2. الگوریتمهای شبکه عصبی برتر
یادگیری شبکه عصبی بر اساس نمونهای از جامعه مورد مطالعه صورت میگیرد. در طول دوره یادگیری، ارزش ارائه شده توسط واحد خروجی را با مقدار واقعی مقایسه کنید. پس از آن وزن تمام واحدها را طوری تنظیم کنید تا پیش بینی بهبود یابد.
الگوریتمهای شبکه عصبی زیادی برای آموزش شبکه عصبی مصنوعی موجود است. اکنون چند الگوریتم مهم برای آموزش شبکههای عصبی را مشاهده میکنیم:
· Gradient Descent - برای یافتن حداقل محلی یک تابع استفاده میشود.
· الگوریتمهای تکاملی - بر اساس مفهوم انتخاب طبیعی یا بقای بهترینها در زیست شناسی.
· الگوریتم ژنتیک – مناسبترین قوانین را برای حل یک مسئله فعال کرده و آن را انتخاب کنید. بنابراین، آنها "مواد ژنتیکی" خود را به قوانین "فرزند" ارسال میکنند. در ادامه با جزئیات بیشتر با آنها آشنا خواهیم شد.
رویکرد هم افزایی خوشهبندی احتمالی و تخصص انسانی برای کاهش هشدارهای کاذب
چکیده:
سیستمهای تشخیص نفوذ[1] (IDS) تعداد فزایندهای از پیشنهادات توسط محققانی که از یادگیری عمیق (DL) برای محافظت از شبکههای حیاتی استفاده میکنند، دیدهاند. با این حال، آنها اغلب از نرخ هشدار نادرست بالا رنج میبرند، که چالشی قابل توجه برای استقرار آنها در شبکههای حیاتی است. این مقاله یک چارچوب جامع انسان و ماشین برای کاهش هشدارهای کاذب در سیستمهای تشخیص نفوذ مبتنی بر DL ارائه میکند. رویکرد پیشنهادی از خوشهبندی احتمالی برای فعال کردن همکاری انسان و ماشین به شیوهای هم افزایی استفاده میکند. خوشهبندی احتمالی شامل گروهبندی مجدد ترافیک شبکه به خوشهها بر اساس احتمالات آنها (محاسبه شده با استفاده از مدل DL ) است. خوشههایی با آلارمهای کاذب بالا[2] (H-FAR) شناسایی میشوند و تمام ترافیکی که در آنها قرار میگیرد برای دستهبندی کارآمد توسط مدل DL به عنوان مخرب یا خوشخیم نامشخص در نظر گرفته میشود. آنها برای تجزیه و تحلیل و تصمیمگیری نهایی به متخصصان انسانی هدایت میشوند. چارچوب پیشنهادی دارای یک فایروال نسل بعدی (NGFW) است تا به متخصصان انسانی کمک کند تا ترافیک پردازش شده را به طور موثر مدیریت کنند. چارچوب پیشنهادی عملکرد دستهبندهای تشخیص نفوذ مبتنی بر DL را با کاهش آلارمهای کاذب افزایش میدهد. برای اعتبارسنجی مفهوم پیشنهادی، ارزیابیها با استفاده از یک شبکه عصبی کانولوشنال سفارشی با کارایی بالا (CNN) و یک مدل شبکه عصبی بازگشتی ترکیبی (RNN) با سه مجموعه داده معیار دسترسی باز (CICDDoS2019، UNSW-NB15، و CICIDS2017) انجام شد. ارزیابی از طریق شبیهسازی نشان داد که ترکیب تخصص انسانی با فناوری یادگیری عمیق میتواند به طور قابلتوجهی تعداد مثبتهای کاذب (FP) و منفیهای کاذب (FNs) را به ترتیب تا ۷۹.۶۱ درصد و ۸۶.۹۹ درصد کاهش دهد.
https://ieeexplore.ieee.org/abstract/document/10415442