GML (Graph Machine Learning)

GML (Graph Machine Learning)

یادگیری ماشین گراف
GML (Graph Machine Learning)

GML (Graph Machine Learning)

یادگیری ماشین گراف

بررسی روش‌های شبکه عصبی گراف برای پیش‌بینی پیوند پویا

پیش‌بینی پیوند پویا (DLP) در شبکه‌های در حال تکامل، به دلیل ماهیت زمانی تعاملات، چالش‌های منحصر به فردی را ارائه می‌دهد. شبکه‌های عصبی گراف (GNN) به عنوان ابزارهای قدرتمندی برای DLP ظهور کرده‌اند و از الگوهای ساختاری و زمانی بهره می‌برند. در زیر، ترکیبی ساختاریافته از روش‌ها، پیشرفت‌ها و چالش‌های DLP مبتنی بر GNN، که توسط تحقیقات اخیر ارائه شده است، آورده شده است.

 

   

1. روش‌های اصلی

الف. شبکه‌های عصبی گراف زمانی (TGNN)

TGNNها با گنجاندن زمان در نمایش گره‌ها و لبه‌ها، نمودارهای پویا را مدل‌سازی می‌کنند. رویکردهای کلیدی عبارتند از:

 

* GNNهای پویای گسسته: پردازش تصاویر لحظه‌ای از نمودار در فواصل گسسته.

- توجه زمانی: مدل‌هایی مانند DySAT از مکانیسم‌های توجه برای وزن‌دهی تصاویر لحظه‌ای تاریخی استفاده می‌کنند.

- تجمیع متوالی: EvolveGCN پارامترهای GCN را در طول زمان به‌روزرسانی می‌کند تا ویژگی‌های در حال تکامل را ثبت کند.

 

* GNNهای پویای پیوسته: با استفاده از معادلات دیفرانسیل معمولی عصبی (ODEهای عصبی) با زمان به عنوان یک متغیر پیوسته رفتار می‌کنند.

- TGN: تعاملات را با مهرهای زمانی رمزگذاری می‌کند و از ماژول‌های حافظه برای حفظ تاریخچه گره‌ها استفاده می‌کند.

 

ب. استخراج زیرگراف محلی

* چارچوب SEAL: زیرگراف‌های محصورکننده محلی اطراف لینک‌های هدف را استخراج می‌کند و GNNها را برای یادگیری الگوهای ساختاری به کار می‌برد.

- نظریه اکتشافی γ-Decaying: اکتشافات سنتی (مثلاً همسایه‌های مشترک) را تحت یک چارچوب واحد متحد می‌کند و نشان می‌دهد که می‌توان آنها را از زیرگراف‌های محلی تقریب زد.

- تطبیق پویا: SEAL را با نمونه‌برداری از زیرگراف‌ها در پنجره‌های زمانی به گراف‌های زمانی گسترش می‌دهد.

 

ج. معماری‌های ترکیبی

- گروه‌های اکتشافی-GNN: اکتشافات سنتی (مثلاً Adamic-Adar) را با GNNها ترکیب می‌کند تا از ویژگی‌های قابل تفسیر و الگوهای آموخته شده بهره ببرد.

- ادغام تشخیص انجمن: GNNها (مثلاً GAT) را با ساختارهای جامعه (مثلاً الگوریتم Louvain) تقویت می‌کند و نمرات AUC را در شبکه‌های همکاری علمی حدود 6٪ بهبود می‌بخشد.

 

۲. پیشرفت‌ها و عملکرد

 

مدل‌های کلیدی

نوع

مدل

نوآوری کلیدی

عملکرد

SEAL

GNN استاتیک

یادگیری زیرگراف محلی با GNNها

در وظایف متنوع از الگوریتم‌های اکتشافی بهتر عمل می‌کند

TGN

DGNN پیوسته

ماژول‌های حافظه برای به‌روزرسانی‌های بلادرنگ

برتر از DGNNهای گسسته در داده‌های جریانی

EvolveGCN

DGNN گسسته

تکامل پارامتر در سراسر تصاویر لحظه‌ای

موثر برای شبکه‌های دوره‌ای (به عنوان مثال، رسانه‌های اجتماعی)

DySAT

DGNN گسسته

خودتوجهی ساختاری-زمانی

وابستگی‌های بلندمدت را ثبت می‌کند

 

 

بینش‌های معیار

- الگوریتم‌های اکتشافی در مقابل GNNها: الگوریتم‌های اکتشافی ساده اغلب از GNNهای ایستا بهتر عمل می‌کنند، اما DGNNها به طور مداوم از هر دو، به ویژه در تنظیمات پویا، پیشی می‌گیرند.

- تأثیر پنجره کشویی: پنجره‌های بزرگتر یادآوری را بهبود می‌بخشند اما دقت را کاهش می‌دهند؛ تنظیم خاص وظیفه بسیار مهم است.

- دستاوردهای گروهی: ترکیب روش‌های اکتشافی، شبکه‌های عصبی مصنوعی (GNN) و شبکه‌های عصبی مصنوعی (DGNN) در گروه‌ها، عملکرد را تا 55٪ افزایش می‌دهد.

 

 

3. چالش‌ها

·         مقیاس‌پذیری: پردازش گراف‌های میلیارد لبه‌ای در زمان واقعی برای اکثر DGNNها همچنان دشوار است.

·         ثبات ارزیابی: فقدان معیارهای استاندارد، مقایسه‌های بین مطالعاتی را پیچیده می‌کند.

·         دانه‌بندی زمانی: متعادل کردن دانه‌بندی (تقسیم‌های زمانی ریز در مقابل درشت) بر استحکام مدل تأثیر می‌گذارد.

·         مدیریت نویز: گراف‌های پویا اغلب حاوی تعاملات گذرا یا نویزی هستند که نیاز به فیلترینگ قوی دارند.

 

 

4. مسیرهای آینده

- تشخیص پویای انجمن: ادغام به‌روزرسانی‌های جامعه در زمان واقعی در DGNNها برای اولویت‌بندی بهتر لینک.

- یادگیری تقویتی (RL): استفاده از RL برای نمونه‌برداری تطبیقی ​​زیرگراف‌ها یا تنظیم پنجره‌های کشویی.

- تعمیم بین حوزه‌ای: توسعه مدل‌هایی که بینش‌ها را از یک شبکه پویا (مثلاً رسانه‌های اجتماعی) به سایر شبکه‌ها (مثلاً شبکه‌های استنادی) منتقل می‌کنند.

 

- ملاحظات اخلاقی: کاهش سوگیری در گرافهای زمانی، جایی که نابرابری‌های تاریخی ممکن است گسترش یابند.

 

نتیجه‌گیری

روش‌های مبتنی بر GNN برای DLP از روش‌های اکتشافی ایستا به معماری‌های پیچیده‌ای تکامل یافته‌اند که پویایی زمانی، یادگیری ساختار محلی و طرح‌های ترکیبی را ادغام می‌کنند. در حالی که DGNNها نویدبخش هستند، چالش‌هایی در مقیاس‌پذیری و ارزیابی همچنان پابرجاست. کارهای آینده باید بر مدل‌های مقیاس‌پذیر و اخلاق‌مدار متمرکز شوند که از جزئیات زمانی و بینش‌های بین حوزه‌ای بهره می‌برند و شکاف بین پیشرفت‌های نظری و کاربردپذیری در دنیای واقعی را پر می‌کنند.

 

منابع کلیدی:

- چارچوب SEAL (ژانگ و چن، ۲۰۱۸).

- TGN (روسی و همکاران، ۲۰۲۰).

- DySAT (سانکار و همکاران، ۲۰۲۰).

 

- شبکه‌های عصبی مصنوعی تقویت‌شده با جامعه (لیو و همکاران، ۲۰۲۴).

 

- مطالعه‌ی معیارسنجی (اسکاردینگ و همکاران، ۲۰۲۱).

 

این نظرسنجی، پتانسیل دگرگون‌کننده‌ی شبکه‌های عصبی مصنوعی در DLP را برجسته می‌کند و در عین حال، نیاز به معیارهای استاندارد و راه‌حل‌های مقیاس‌پذیر را برجسته می‌سازد.


[1] https://www.sciencedirect.com/science/article/pii/S1877050925007938

[2] https://arxiv.org/html/2404.18211v1

[3] https://paperswithcode.com/task/dynamic-link-prediction

[4] https://proceedings.neurips.cc/paper/7763-link-prediction-based-on-graph-neural-networks.pdf

[5] https://openreview.net/forum?id=I2KAe7x67JU

[6] https://dl.acm.org/doi/10.5555/3327345.3327423

[7] https://proceedings.neurips.cc/paper_files/paper/2018/file/53f0d7c537d99b3824f0f99d62ea2428-Paper.pdf

[8] https://opus.lib.uts.edu.au/bitstream/10453/172690/2/02whole.pdf

[9] https://ouci.dntb.gov.ua/en/works/lDLnAMGl/

 

نظرات 0 + ارسال نظر
ایمیل شما بعد از ثبت نمایش داده نخواهد شد