GML (Graph Machine Learning)

GML (Graph Machine Learning)

یادگیری ماشین گراف
GML (Graph Machine Learning)

GML (Graph Machine Learning)

یادگیری ماشین گراف

GraphSAGE: آموزش بازنمایی استقرایی در گراف‌های بزرگ

GraphSAGE چارچوبی برای یادگیری بازنمایی استقرایی بر روی گراف‌های بزرگ است. GraphSAGE برای تولید بازنمایی‌های برداری با ابعاد پایین برای گره‌ها استفاده می‌شود و به ویژه برای گراف‌هایی که اطلاعات ویژگی گره غنی دارند مفید است.

تعبیه‌های برداری با ابعاد پایین گره‌ها در گراف‌های بزرگ کاربردهای متعددی در یادگیری ماشین دارند (به عنوان مثال، دسته‌بندی گره، خوشه‌بندی، پیش‌بینی پیوند). با این حال، اکثر چارچوب‌های تعبیه ذاتاً انتقال‌دهنده هستند و فقط می‌توانند تعبیه‌هایی را برای یک گراف ثابت ایجاد کنند. این رویکردهای انتقالی به طور مؤثر به گره‌های دیده نشده تعمیم نمی‌یابند (مثلاً در گراف‌های در حال تکامل)، و این رویکردها نمی‌توانند تعمیم در گراف‌های مختلف را یاد بگیرند. در مقابل، GraphSAGE یک چارچوب استقرایی است که از اطلاعات ویژگی گره برای تولید کارآمد بازنمایی روی داده‌های دیده نشده استفاده می‌کند.

برای اجرای GraphSAGE، باید روی یک گراف نمونه یا مجموعه‌ای از گراف‌ها آموزش ببیند. پس از آموزش، GraphSAGE را می‌توان برای ایجاد تعبیه گره‌ها برای گره‌های قبلا دیده نشده یا گراف‌های ورودی کاملاً جدید استفاده کرد، تا زمانی که این گراف‌ها دارای طرح ویژگی‌های مشابه با داده‌های آموزشی باشند.

کد

GraphSAGE در TensorFlow پیاده‌سازی شده است و می‌تواند به راحتی در خطوط لوله یادگیری ماشین دیگر ادغام شود. کد و جزئیات پیاده‌سازی را می‌توان در GitHub یافت.

https://github.com/williamleif/GraphSAGE

مجموعه داده‌ها

پیوندها به مجموعه داده‌های مورد استفاده در مقاله:

تعاملات پروتئین و پروتئین [منبع] [پیش پردازش]

http://thebiogrid.org/download.php

https://snap.stanford.edu/graphsage/ppi.zip

 

Reddit [منبع] [پیش پردازش شده]

https://pushshift.io/

https://snap.stanford.edu/graphsage/reddit.zip

 

مراجع

Inductive Representation Learning on Large Graphs. W.L. Hamilton, R. Ying, and J. Leskovec arXiv:1706.02216 [cs.SI], 2017.

https://arxiv.org/abs/1706.02216

پل زدن شکاف بین ترجمه انسانی و ماشینی

سیستم ترجمه ماشین عصبی Google (GNMT) یک رویکرد یادگیری سرتاسری است که برای بهبود ترجمه خودکار با رفع نقاط ضعف سیستم‌های ترجمه مبتنی بر عبارت مرسوم طراحی شده است. گوگل این سیستم را در سال 2016 معرفی کرد و خاطرنشان کرد که خطاهای ترجمه در Google Translate را 55٪ به 85٪ کاهش می دهد.

 

ادامه مطلب ...

یادگیری عمیق همه جا هست

یادگیری عمیق به مجموعه‌ای از تکنیک‌های یادگیری ماشین مولد نسبتاً توسعه‌یافته اشاره دارد که به‌طور مستقل بازنمایی‌های سطح بالا را از منابع داده خام تولید می‌کنند و با استفاده از این بازنمایی‌ها می‌توان کارهای معمولی یادگیری ماشین مانند دسته‌بندی، رگرسیون و خوشه‌بندی را انجام داد. تکنیک‌های یادگیری عمیق مبتنی بر ایده قدیمی روش‌های شبکه عصبی مصنوعی، اما معمولاً با لایه‌های بسیار بیشتری نسبت به شبکه‌های عصبی 10 سال پیش هستند. با در نظر گرفتن ورودی داده‌های خام در لایه اول، می‌توانیم خروجی لایه بعدی را به عنوان مجموعه‌ای از ویژگی‌های سطح بالاتر در نظر بگیریم که به لایه دیگری منتقل می‌شود که به نوبه خود مجموعه‌ای از ویژگی‌های سطح بالاتر و غیره را ایجاد می‌کند. این برای تعدادی از لایه‌ها ادامه می‌یابد تا در نهایت خروجی (مثلاً یک پیش بینی) تولید شود.

تصویر زیر یک تصویر ساده از یک شبکه عصبی عمیق را نشان می‌دهد که برای دسته‌بندی تصاویر ساخته شده است. در حالی که داده‌های ارائه شده به شبکه مقادیر پیکسل خام هستند، در داخل شبکه را می‌توان به عنوان ایجاد ویژگی‌های سطح بسیار بالاتر در نظر گرفت. برای مثال، ممکن است گره‌ای در شبکه وجود داشته باشد که به وجود خطوط مورب در یک تصویر یا حتی در سطح بالاتر، به حضور چهره‌ها پاسخ می‌دهد.

  ادامه مطلب ...