CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی
CNDM (Complex Networks and Data Mining)

CNDM (Complex Networks and Data Mining)

شبکه‌های پیچیده و داده کاوی

یادگیری ماشین گراف

در این پست وبلاگ، اصول یادگیری ماشین گراف را پوشش می‌دهیم.

ما ابتدا مطالعه می‌کنیم که گراف چیست، چرا از آنها استفاده می‌شود و چگونه آنها را به بهترین شکل نشان دهیم. سپس به طور مختصر نحوه یادگیری بر روی گراف‌ها، از روش‌های Pre-Neural (کاوش در ویژگی‌های گراف به طور همزمان) تا آنچه که معمولاً شبکه‌های عصبی گراف نامیده می‌شوند، پوشش می‌دهیم. در نهایت، ما به دنیای Transformers برای گراف‌ها نگاه می‌کنیم.

 

گراف چیست؟

در اصل، یک گراف توصیفی از مواردی است که توسط روابط به هم مرتبط شده‌اند.

نمونه‌هایی از گراف‌ها شامل شبکه‌های اجتماعی (توئیتر، ماستودون، هر شبکه استنادی که مقالات و نویسندگان را به هم پیوند می‌دهد)، مولکول‌ها، گراف‌های دانش(مانند گراف‌های UML، دایره‌المعارف‌ها، و هر وب‌سایتی با پیوند بین صفحات آن)، جملاتی که به‌عنوان درخت نحوی آن‌ها بیان می‌شوند، هر مش سه بعدی، و بیشتر! بنابراین، هذلولی نیست که بگوییم گراف‌ها همه جا هستند.

آیتم‌های یک گراف (یا شبکه) گره‌ها (یا رئوس) و اتصالات آن‌ها لبه‌ها (یا پیوندها) نامیده می‌شوند. به عنوان مثال، در یک شبکه اجتماعی، گره‌ها کاربران هستند و اتصالات آنها را لبه می‌کنند. در یک مولکول، گره‌ها اتم و لبه‌های پیوند مولکولی آنها هستند.

·         یک گراف با گره‌های تایپ‌شده یا لبه‌های تایپ‌شده ناهمگن نامیده می‌شود (مثال: شبکه‌های استنادی با مواردی که می‌توانند مقاله باشند یا نویسندگان، گره‌های تایپ‌شده دارند، و گراف XML که در آن روابط تایپ می‌شود، دارای لبه‌های تایپ‌شده است). نمی‌توان آن را صرفاً از طریق توپولوژی آن نشان داد، به اطلاعات اضافی نیاز دارد. این پست بر روی گراف‌های همگن تمرکز دارد.

·         یک گراف همچنین می‌تواند جهت‌دار باشد (مانند یک شبکه پیرو، که در آن A به دنبال B است، به این معنی نیست که B به دنبال A است) یا غیر جهت‌دار (مانند یک مولکول، که در آن رابطه بین اتم‌ها به هر دو سمت می‌رود). لبه‌ها می‌توانند گره‌های مختلف یا یک گره را به خود متصل کنند (خود لبه‌ها)، اما همه گره‌ها نیازی به اتصال ندارند.

اگر می‌خواهید از داده‌های خود استفاده کنید، ابتدا باید بهترین خصوصیات آن را در نظر بگیرید (همگن/ناهمگن، جهت‌دار/غیر جهت‌دار و غیره).

  ادامه مطلب ...

الگوریتم‌های شبکه عصبی – نحوه آموزش ANN برای یادگیری ماشینی


1. هدف

در این آموزش یادگیری ماشینی، به برترین الگوریتم‌های شبکه عصبی خواهیم پرداخت. از این الگوریتم‌ها برای آموزش شبکه عصبی مصنوعی استفاده می‌شود. این وبلاگ به شما آموزش عمیقی از گرادیان نزول، الگوریتم‌های تکاملی و الگوریتم ژنتیک در شبکه عصبی ارائه می‌دهد.

 

2. الگوریتمهای شبکه عصبی برتر

یادگیری شبکه عصبی بر اساس نمونه‌ای از جامعه مورد مطالعه صورت می‌گیرد. در طول دوره یادگیری، ارزش ارائه شده توسط واحد خروجی را با مقدار واقعی مقایسه کنید. پس از آن وزن تمام واحدها را طوری تنظیم کنید تا پیش بینی بهبود یابد.

الگوریتم‌های شبکه عصبی زیادی برای آموزش شبکه عصبی مصنوعی موجود است. اکنون چند الگوریتم مهم برای آموزش شبکه‌های عصبی را مشاهده می‌کنیم:

·         Gradient Descent - برای یافتن حداقل محلی یک تابع استفاده می‌شود.

·         الگوریتمهای تکاملی - بر اساس مفهوم انتخاب طبیعی یا بقای بهترینها در زیست شناسی.

·         الگوریتم ژنتیک مناسب‌ترین قوانین را برای حل یک مسئله فعال کرده و آن را انتخاب کنید. بنابراین، آنها "مواد ژنتیکی" خود را به قوانین "فرزند" ارسال می‌کنند. در ادامه با جزئیات بیشتر با آنها آشنا خواهیم شد.

 

  ادامه مطلب ...

تشخیص نفوذ با دسته‌بند‌های یادگیری عمیق

رویکرد هم افزایی خوشه‌بندی احتمالی و تخصص انسانی برای کاهش هشدارهای کاذب

چکیده:

سیستم‌های تشخیص نفوذ[1] (IDS) تعداد فزاینده‌ای از پیشنهادات توسط محققانی که از یادگیری عمیق (DL) برای محافظت از شبکه‌های حیاتی استفاده می‌کنند، دیده‌اند. با این حال، آنها اغلب از نرخ هشدار نادرست بالا رنج می‌برند، که چالشی قابل توجه برای استقرار آنها در شبکه‌های حیاتی است. این مقاله یک چارچوب جامع انسان و ماشین برای کاهش هشدارهای کاذب در سیستم‌های تشخیص نفوذ مبتنی بر DL ارائه می‌کند. رویکرد پیشنهادی از خوشه‌بندی احتمالی برای فعال کردن همکاری انسان و ماشین به شیوه‌ای هم افزایی استفاده می‌کند. خوشه‌بندی احتمالی شامل گروه‌بندی مجدد ترافیک شبکه به خوشه‌ها بر اساس احتمالات آنها (محاسبه شده با استفاده از مدل DL ) است. خوشه‌هایی با آلارم‌های کاذب بالا[2] (H-FAR) شناسایی می‌شوند و تمام ترافیکی که در آنها قرار می‌گیرد برای دسته‌بندی کارآمد توسط مدل DL به عنوان مخرب یا خوش‌خیم نامشخص در نظر گرفته می‌شود. آنها برای تجزیه و تحلیل و تصمیم‌گیری نهایی به متخصصان انسانی هدایت می‌شوند. چارچوب پیشنهادی دارای یک فایروال نسل بعدی (NGFW) است تا به متخصصان انسانی کمک کند تا ترافیک پردازش شده را به طور موثر مدیریت کنند. چارچوب پیشنهادی عملکرد دسته‌بند‌های تشخیص نفوذ مبتنی بر DL را با کاهش آلارم‌های کاذب افزایش می‌دهد. برای اعتبارسنجی مفهوم پیشنهادی، ارزیابی‌ها با استفاده از یک شبکه عصبی کانولوشنال سفارشی با کارایی بالا (CNN) و یک مدل شبکه عصبی بازگشتی ترکیبی (RNN) با سه مجموعه داده معیار دسترسی باز (CICDDoS2019، UNSW-NB15، و CICIDS2017) انجام شد. ارزیابی از طریق شبیه‌سازی نشان داد که ترکیب تخصص انسانی با فناوری یادگیری عمیق می‌تواند به طور قابل‌توجهی تعداد مثبت‌های کاذب (FP) و منفی‌های کاذب (FNs) را به ترتیب تا ۷۹.۶۱ درصد و ۸۶.۹۹ درصد کاهش دهد.

https://ieeexplore.ieee.org/abstract/document/10415442



[1] Intrusion detection systems

[2] next-generation firewall