گراف ترانسفورمرها (GTs) به طور فزایندهای در وظایفی که زبان و بینایی را با هم ترکیب میکنند، استفاده میشوند و از توانایی آنها برای پردازش دادههای ساختار یافته گراف و ادغام اطلاعات چندوجهی استفاده میشود. در زیر مروری بر کاربردهای آنها در این حوزهها آورده شده است:
وظایف گراف کلی در یادگیری ماشین
گراف ماشین یادگیری (GML) شامل انواع وظایف با هدف استخراج بینش و پیشبینی از دادههای ساختار یافته گراف است. این وظایف به طور کلی به وظایف سطح گره، سطح لبه (پیوند)، و سطح گراف و همچنین رویکردهای یادگیری بدون نظارت مانند خوشهبندی و یادگیری بازنمایی دستهبندی میشوند. در زیر یک نمای کلی از رایجترین وظایف گراف کلی آورده شده است:
1. وظایف سطح گره: وظایف سطح گره بر پیشبینی ویژگیها یا برچسبها برای گرههای منفرد در یک گراف تمرکز دارند.
دستهبندی گره:
- برچسب یا دسته گره را بر اساس ویژگیهای آن و ساختار گراف پیشبینی میکند.
- مثال: طبقهبندی کاربران در یک شبکه اجتماعی به عنوان "اسپمر" یا "غیر هرزنامه".
- برنامهها: تشخیص تقلب، تجزیه و تحلیل شبکههای اجتماعی، سیستمهای توصیه.
رگرسیون گره:
- مقادیر پیوسته (به عنوان مثال، امتیازات یا رتبهبندی) را برای گرهها پیشبینی میکند.
- مثال: پیشبینی امتیاز محبوبیت یک کاربر در یک شبکه.
2. وظایف سطح لبه: هدف وظایف سطح لبه پیشبینی روابط یا تعاملات بین گرهها است.
پیشبینی پیوند
- پیشبینی میکند که آیا یک یال بین دو گره وجود دارد یا قدرت/نوع آن لبه.
- مثال: توصیه به دوستان در شبکههای اجتماعی یا پیشبینی تعاملات پروتئین-پروتئین.
- برنامههای کاربردی: سیستمهای توصیه، وضوح موجودیت، بیوانفورماتیک.
دستهبندی لبه:
- برچسبها را به لبهها اختصاص میدهد تا نوع یا دسته آنها را نشان دهد.
- مثال: برچسبگذاری روابط در یک گراف دانش به عنوان "دوست"، "همکار" یا "خانواده".
3. وظایف سطح گراف: وظایف سطح گراف شامل پیشبینی کل گرافها یا زیرگرافها است.
دستهبندی گراف:
- یک برچسب به کل گراف اختصاص میدهد.
- مثال: دستهبندی مولکولها به سمی یا غیر سمی بر اساس ساختار آنها.
- کاربردها: کشف دارو، علم مواد، شیمی.
رگرسیون گراف:
- خواص پیوسته برای گرافها را پیشبینی میکند.
- مثال: تخمین حلالیت یک ترکیب در طراحی دارو.
تولید گراف:
- ایجاد گرافهای جدید با ویژگیهای خاص.
- مثال: طراحی مولکولهای جدید با خواص شیمیایی مطلوب.
4. وظایف آموزشی بدون نظارت: این وظایف نیازی به دادههای برچسبدار ندارند و هدف آنها کشف الگوهای پنهان در گرافها است.
آموزش بازنمایی:
- تعبیههای کمبعد برای گرهها، لبهها یا کل گرافها را با حفظ اطلاعات ساختاری و ویژگیها یاد میگیرد.
- برنامهها: استخراج ویژگی برای کارهای پایین دستی مانند دستهبندی یا خوشهبندی.
تشخیص انجمن:
- گروههای متراکم گرهها را در یک گراف شناسایی میکند.
- مثال: تشخیص انجمنها در شبکههای اجتماعی یا ماژولهای کاربردی در شبکههای بیولوژیکی.
- برنامههای کاربردی: تجزیه و تحلیل شبکههای اجتماعی، کشف تقلب، زیستشناسی.
جستجوی شباهت:
- شباهت بین گرهها، لبهها یا زیرگرافها را بر اساس ویژگیها و اتصال آنها اندازهگیری میکند.
- کاربردها: سیستمهای توصیه، تشخیص ناهنجاری.
5. وظایف تحلیلی : در حالی که همیشه مبتنی بر یادگیری ماشین نیستند، این وظایف در تجزیه و تحلیل گراف اساسی هستند:
تحلیل مرکزیت:
- گرههای مهم یا تاثیرگذار را در یک گراف با استفاده از معیارهایی مانند درجه مرکزی یا PageRank شناسایی میکند.
- کاربردها: بهینهسازی زنجیره تامین، برنامهریزی زیرساخت.
راهیابی:
- مسیرهای بهینه را بین گرهها بر اساس وزن لبهها (به عنوان مثال، کوتاهترین مسیر) پیدا میکند.
- برنامههای کاربردی: لجستیک، شبکههای حمل و نقل.
نتیجهگیری
وظایف گراف عمومی طیف وسیعی از کاربردها را در صنایعی مانند شبکههای اجتماعی، زیستشناسی، تدارکات و سیستمهای توصیه در بر میگیرد. این وظایف توسط هر دو رویکرد نظارت شده (به عنوان مثال، دستهبندی گره) و بدون نظارت (به عنوان مثال، تشخیص انجمن) پشتیبانی میشوند. شبکههای عصبی گراف (GNN) و گراف ترانسفورمرها به عنوان ابزارهای پیشرفته برای حل این وظایف با استفاده از اطلاعات ساختاری و رابطهای ذاتی در گرافها پدیدار شدهاند.
[1] https://towardsdatascience.com/graph-machine-learning-an-overview-c996e53fab90?gi=58ec5f5b1f22
[2] https://arxiv.org/html/2201.01288v2
[3] https://linkurious.com/graph-machine-learning/
[4] https://towardsdatascience.com/machine-learning-tasks-on-graphs-7bc8f175119a
[5] https://www.techtarget.com/searchenterpriseai/definition/graph-neural-networks-GNNs
[6] https://huggingface.co/blog/intro-graphml
[7] https://neptune.ai/blog/graph-neural-network-and-some-of-gnn-applications
مقدمه
همانطور که سال 20۲۵ آغاز میشود، نقطه عطف یادگیری عمیق که واقعاً شروع به ورود به جریان اصلی کرده است، رسیدهایم. 10 سال. در مورد آن فکر کنید. فقط ۱۰ سال گذشته است و ما کاملاً انقلابی در نگاه خود به قابلیتهای ماشینها، نحوه ساخت نرمافزار و روشهایی که در مورد ایجاد محصولات و شرکتها فکر میکنیم را متحول کردهایم. کارهایی که تا یک دهه پیش غیرممکن به نظر میرسیدند قابل انجام شدن هستند، البته به شرطی که مجموعه داده برچسبگذاری شده مناسب و قدرت محاسباتی داشته باشید.
در این پست، چند سال گذشته را در یادگیری عمیق، با تمرکز بر کاربردهای صنعتی مرور خواهیم کرد و با بحث در مورد آینده ممکن پایان میدهیم.