GML (Graph Machine Learning)

GML (Graph Machine Learning)

یادگیری ماشین گراف
GML (Graph Machine Learning)

GML (Graph Machine Learning)

یادگیری ماشین گراف

هوش‌مصنوعی در سال 2024: شبکه‌های عصبی گراف

مزایای واقعی یادگیری ماشین گراف چیست؟ و چرا شبکه‌های عصبی گراف در سال 2024 اهمیت دارند؟ این مقاله برخی از کاربردهای بسیار تاثیرگذار GNNها را خلاصه می‌کند و همه چیزهایی را که برای سرعت بخشیدن به موج بزرگ بعدی هوش مصنوعی باید بدانید را در اختیار شما قرار می‌دهد.


داده‌های گراف در همه جای دنیا وجود دارد: هر سیستمی که از موجودیتها و روابط بین آنها تشکیل شده باشد، می‌تواند به عنوان یک گراف نمایش داده شود. اگرچه الگوریتم‌های یادگیری عمیق در دهه گذشته به دلیل توانایی آنها در استخراج ویژگی‌های سطح بالا از داده‌ها با عبور از لایه‌های غیرخطی، پیشرفت چشمگیری در زمینه‌هایی مانند پردازش زبان طبیعی، بینایی کامپیوتری و تشخیص گفتار داشته‌اند. معماری‌های یادگیری به‌طور خاص برای داده‌های ساختار یافته اقلیدسی، مانند داده‌های جدولی، تصاویر، متن و صدا طراحی شده‌اند، در حالی که داده‌های گراف عمدتاً نادیده گرفته شده است.

روش‌های سنتی هوش‌مصنوعی برای استخراج اطلاعات از اشیاء رمزگذاری‌شده توسط ساختارهای تا حدی «سخت[1]» طراحی شده‌اند. برای مثال، تصاویر معمولاً به صورت شبکه‌های دوبعدی پیکسل‌ها با اندازه ثابت و متن به‌عنوان دنباله‌ای یک بعدی از کلمات (یا نشانه‌ها[2]) کدگذاری می‌شوند. از سوی دیگر، بازنمایی داده‌ها به روشی ساختاریافته گرافی ممکن است اطلاعات ارزشمندی را که از بازنمایی ابعاد بالاتر این موجودات و روابط آنها پدید می‌آید، آشکار کند و در غیر این صورت از بین می‌رود.

  

گراف‌های مجاورت منطقه یکی از روش‌های متعدد برای بازنمایی نقطه داده تصویر به عنوان یک گراف در مقابل شبکه‌ای با اندازه ثابت از پیکسل‌های مربعی است که با وجود پیچیدگی بیشتر برای رمزگذاری، تقسیم‌بندی تصویری را فراهم می‌کند که نزدیک‌تر به درک انسان از آن است.

https://vcansimplify.wordpress.com/2014/05/16/graph-based-image-segmentation/?ref=assemblyai.com

متأسفانه، انعطاف‌پذیری بالای گرافها در اجازه دادن به تعداد زیادی از احتمالات برای نمایش یک قطعه داده، به قیمت پیچیدگی طراحی چارچوب‌های همگن است که قادر به یادگیری بر روی آن داده‌ها و تعمیم در حوزه‌های مختلف هستند. در دو دهه گذشته روش‌های مختلفی برای سیستم‌های هوش‌مصنوعی پیشنهاد شده است که قادر به پردازش داده‌های گرافی در مقیاس هستند، اما این پیشرفت‌ها اغلب به موارد و تنظیمات خاصی که برای آن توسعه داده شده بودند، مرتبط بود.

از جهاتی، این منعکس کننده اتفاقی است که در طول انقلاب یادگیری عمیق یک دهه پیش رخ داد، زمانی که سیستم‌های تشخیص گفتار که قبلاً از ترکیبی از مدل‌های پنهان مارکوف، مدل‌های ترکیبی گاوسی و سیستم‌های بینایی رایانه‌ای که به شدت به پردازش سیگنال سنتی[3] متکی بودند، به تدریج به هم نزدیک شدند. به سیستم‌های یادگیری عمیق سرتاسری که حتی اغلب از معماری‌های بنیادی یکسانی استفاده می‌کنند: یک مثال استاندارد برای آن، ترانسفورمرها[4] و مکانیسم توجه[5] است. در زمینه پردازش زبان طبیعی و اخیراً در بسیاری از حوزه‌های مختلف گسترش یافته است.

در سال‌های اخیر، جامعه نسبتاً کوچکی از پژوهشگران یادگیری عمیق سطح بالا گام‌های بزرگی برداشته‌اند تا نشان دهند که چگونه مسائل داده‌های مختلف در حوزه‌های مختلف به بهترین شکل به‌عنوان مسائل گراف تبدیل می‌شوند، جایی که شبکه‌های عصبی گراف - همراه با برخی از تغییرات آنها - نشان داده شده است که از روش‌های اصلی در انواع وظایف یادگیری عمیق بهتر عمل می‌کند. GNNها عملاً به ابزاری حیاتی برای حل مسائل دنیای واقعی در بسیاری از زمینههای کاملاً متفاوت و به ظاهر نامرتبط مانند کشف دارو، سیستمهای توصیه، پیشبینی ترافیک و بسیاری موارد دیگر تبدیل شده‌اند، که در آنها روش‌های سنتی و مورد خاص شکست می‌خورند.

نقش فعلی GNNها در چشم‌انداز وسیعتر تحقیقات هوش مصنوعی چیست؟ بیایید ابتدا نگاهی به آماری بیندازیم که نشان می‌دهد چگونه GNN‌ها در جامعه تحقیقاتی افزایش چشمگیری داشته‌اند.

شبکه‌های عصبی گراف در چشم‌انداز تحقیقاتی هوش‌مصنوعی

اگر به انتشارات تحقیقاتی پذیرفته شده در چند سال گذشته برای ICLR و NeurIPS نگاهی بیندازیم، دو کنفرانس بزرگ سالانه که بر روی تحقیقات پیشرفته هوش‌مصنوعی تمرکز دارند، می‌توانیم اولین نگاهی به رشد GNN در تحقیقات داشته باشیم. ما متوجه شدیم که اصطلاح شبکه عصبی گراف به طور مداوم در 3 کلمه کلیدی برتر سال به سال رتبه‌بندی می‌شود.

50 کلمه کلیدی برتر در مقالات تحقیقاتی ارسال شده در ICLR 2022

یک مطالعه کتاب‌سنجی اخیر به طور سیستماتیک این روند تحقیقاتی را تجزیه و تحلیل کرد و رشد تصاعدی تحقیقات منتشر شده مربوط به GNNها را با میانگین سالانه مثبت 447 درصد افزایش در دوره 201۹-201۷ نشان داد. گزارش وضعیت هوش‌مصنوعی 2021 همچنین تأیید کرد که شبکه عصبی گراف به عنوان کلیدواژه در نشریات تحقیقاتی هوش‌مصنوعی "با بیشترین افزایش استفاده از سال 2019 تا 2020" است.

تعداد انتشارات برای GNNها به طور کلی و برای زیرشاخه "محاسبات GNN " به طور خاص

https://www.researchgate.net/publication/344447399_Computing_Graph_Neural_Networks_A_Survey_from_Algorithms_to_Accelerators?ref=assemblyai.com

همچنین می‌توانیم تطبیق‌پذیری شبکه‌های عصبی گراف را با بررسی تأثیر آن‌ها در حوزه‌های مختلف کاربرد بررسی کنیم. هدف شکل زیر نشان دادن توزیع مقالات GNN در 22 دسته است.

توزیع مقالات GNN در 22 دسته مجزا

https://www.sciencedirect.com/science/article/pii/S2666827022000780?ref=assemblyai.com

همانطور که می‌بینیم، GNNها رشد چشمگیری در تحقیقات هوش‌مصنوعی داشته‌اند و تاثیر آنها در دامنه‌های بسیار متفاوتی توزیع شده است. بیایید اکنون به چند مورد از این موارد استفاده نگاهی بیندازیم و بیاموزیم که چگونه GNNها تأثیر قابل اندازه‌گیری در آنجا ایجاد کرده‌اند.

شبکه‌های عصبی گراف: موارد استفاده منتخب

شبکه‌های عصبی گراف به یک عنصر کلیدی در پشت بسیاری از پروژه‌های هیجان انگیز اخیر تبدیل شده‌اند. بیایید نگاهی دقیق‌تر به چند مثال و نتایج به‌کارگیری GNN در مدل‌های مقیاس بزرگ در تولید بیندازیم.

 

GNN برای سیستمهای توصیه

تیم Uber Eats یک برنامه کاربردی برای تحویل غذا ایجاد کرده است و اخیراً شروع به معرفی تکنیک‌های یادگیری گراف در سیستم توصیه‌هایی کرده است که این برنامه را قدرتمند می‌کند، که هدف آن کشف غذاهایی است که به احتمال زیاد برای یک کاربر جذاب است.

با توجه به اندازه بزرگ گراف‌ها در چنین تنظیماتی (Uber Eats به عنوان پورتالی برای بیش از 320000 رستوران در بیش از 500 شهر در سراسر جهان عمل می‌کند)، شبکه‌های عصبی گراف انتخاب بسیار جذابی است. در واقع، GNNها فقط به مقدار ثابتی از پارامترها نیاز دارند که به اندازه گراف ورودی بستگی ندارد و یادگیری را تا گراف‌های بزرگ مقیاسپذیر می‌کند.

در اولین آزمایش برای مدل در مورد غذاهای و رستوران‌های پیشنهادی، تیم افزایش عملکرد بیش از 20 درصد را در مقایسه با مدل تولید موجود در معیارهای کلیدی مانند Mean Reciprocal Rank، Precision@K و NDCG گزارش کرد. پس از ادغام مدل GNN در سیستم توصیه Uber Eats (که سایر ویژگی‌های غیر مبتنی بر گراف را در بر می‌گیرد)، توسعه‌دهندگان جهشی را از 78% به 87% در AUC[6] در مقایسه با مدل پایه تولیدی موجود مشاهده کردند و تجزیه و تحلیل بعدی تاثیر را مشاهده کردند. نشان داد که ویژگی مبتنی بر GNN تا حد زیادی تأثیرگذارترین ویژگی در مدل توصیه به عنوان یک کل است.

اهمیت ویژگی‌های مبتنی بر GNN در مقابل سایر ویژگی‌های سیستم توصیه Uber Eats

https://www.uber.com/en-GR/blog/uber-eats-graph-learning/?ref=assemblyai.com

Pinterest یک موتور کشف بصری است که به عنوان یک شبکه اجتماعی عمل می‌کند، جایی که کاربران با بوکمارک‌های بصری، معروف به پین، که به منابع مبتنی بر وب پیوند می‌دهند، تعامل دارند. این پلتفرم به کاربران امکان سازماندهی پینها را در مجموعه‌های موضوعی به نام تخته[7] می‌دهد. "گراف Pinterest " که شامل 2 میلیارد پین، 1 میلیارد تخته و بیش از 18 میلیارد لبه است، یک اکوسیستم بصری غنی و پیچیده را با پیامدهای بالقوه برای درک رفتار و ترجیحات کاربر نشان می‌دهد.

Pinterest در حال حاضر به طور فعال PinSage را استقرار می‌دهد، یک سیستم توصیه مبتنی بر GNN که برای کار بر روی گراف Pinterest مقیاس شده است. PinSage می‌تواند به روش‌های جدیدی پیش‌بینی کند که کدام مفاهیم بصری که کاربران برایشان جالب بوده‌اند، می‌توانند به چیزهای جدیدی که ممکن است برایشان جذاب باشد، ترسیم کنند.

به منظور اندازه‌گیری دقت آن، تیم تحقیقاتی عملکرد PinSage را در برابر سایر پایه های یادگیری عمیق مبتنی بر محتوا (بر اساس نزدیک ترین همسایگان روش های تعبیه بصری یا حاشیه نویسی) ارزیابی کرده و از دو معیار کلیدی زیر استفاده کرده است. برای وظیفه توصیه آنها:

نرخ ضربه[8] - اندازه گیری مستقیم احتمال اینکه توصیه های ارائه شده توسط الگوریتم حاوی موارد مربوط به پرس و جو باشد.

میانگین رتبه متقابل (MRR)[9] -  اندازه‌گیری میزان نزدیکی نتایج مرتبط به بالای نتایج جستجو.

به طور کلی، PinSage نسبت به بهترین مدل تولید شده پایه 150 درصد بهبود در نرخ ضربه و 60 درصد بهبود در MRR ایجاد می‌کند.

هر دو تیم Uber Eats و Pinterest به دلیل ویژگی‌های مقیاس‌پذیری قوی، سیستم‌های هوش‌مصنوعی خود را بر روی خاصی از شبکه عصبی گراف به نام GraphSAGE ساخته‌اند. GraphSAGE (یک چارچوب منبع باز GNN که توسط محققان استنفورد توسعه یافته است) به صراحت برای ایجاد کارآمد تعبیه گره‌های مفید بر روی داده‌های دیده نشده طراحی شده است و نشان دهنده یک پیشرفت بزرگ در سیستمهای توصیه است. هنگامی که در برابر سه معیار دسته‌بندی سخت[10] ارزیابی شد، در مقایسه با استفاده از ویژگی‌های گره به تنهایی، به طور متوسط ​​51٪ از تمام خطوط پایه مربوطه بهتر بود (دسته‌بندی F1-Score) و همچنین به طور مداوم از خط پایه قوی (DeepWalk) با کاهش 100 برابری در زمان استنتاج بهتر بود.

GNN برای پیشبینی ترافیک

یکی دیگر از کاربردهای بسیار تاثیرگذار شبکه‌های عصبی گراف توسط تیمی از محققان از DeepMind ارائه شد که نشان دادند چگونه GNNها را می‌توان در نقشه‌های حمل و نقل به کار برد تا دقت زمان تخمینی رسیدن[11] (ETA) را بهبود بخشد. ایده این است که از یک GNN برای یادگیری بازنمایی‌هایی از شبکه حمل و نقل استفاده کنیم که ساختار زیربنایی شبکه و پویایی آن را نشان می‌دهد.

این سیستم در حال حاضر به طور فعال در مقیاس توسط Google Maps در چندین شهر بزرگ در سراسر جهان مستقر شده است و رویکرد جدید منجر به کاهش شدید نسبت نتایج منفی کاربر هنگام پرس و جو از ETA شده است (با دقت 50 درصد بهبود در مقایسه با رویکرد قبلی در تولید به کار گرفته شده است).

GNN برای پیشبینی آب و هوا

در نوامبر 2023، Google DeepMind GraphCast، یک مدل جدید پیش‌بینی آب و هوا را معرفی کرد و کد مدل را منبع باز کرد.

این معماری بر اساس یک شبکه عصبی گراف با پیکربندی رمزگذار-پردازنده-رمزگشا است، که در آن سطح زمین به عنوان یک گراف فضایی همگن با اصلاح مکرر یک ایکوساهدر معمولی شش بار مدل‌سازی می‌شود (منبع).

https://www.science.org/doi/10.1126/science.adi2336?ref=assemblyai.com

GraphCast اکنون به عنوان دقیقترین سیستم پیشبینی آب و هوای جهانی 10 روزه در جهان در نظر گرفته می‌شود و می‌تواند رویدادهای آب و هوایی شدید را در آینده بیشتر از آنچه قبلا ممکن بود پیشبینی کند.

این مدل همچنین بسیار کارآمد است و می‌تواند پیش بینی های 10 روزه را در کمتر از یک دقیقه در یک TPU گوگل انجام دهد. برای مقایسه، یک پیش‌بینی 10 روزه با استفاده از یک رویکرد مرسوم می‌تواند ساعت‌ها محاسبه در یک ابررایانه با صدها ماشین طول بکشد.

 

یافته های تحقیق مفصل در Science منتشر شد.

https://www.science.org/doi/10.1126/science.adi2336?ref=assemblyai.com

 

GNN برای داده کاوی

یک حوزه کاربردی جدید هیجان انگیز برای شبکههای عصبی گراف داده کاوی است.

اکثر سازمان ها داده‌های کلیدی کسب و کار خود را در پایگاه داده‌های رابطه‌ای ذخیره می‌کنند، جایی که اطلاعات در بسیاری از جداول مرتبط پخش می‌شود. به طور سنتی، یادگیری ماشین بر روی این داده‌ها به مهندسی ویژگی‌های دستی نیاز داشت تا ابتدا داده‌ها را از تمام جداول مربوطه در یک جدول واحد قبل از مدل‌سازی جمع کند. فرآیندی که زمان بر است و به راحتی اطلاعات را از دست می‌دهد.

اخیراً، محققان رویکرد جدیدی به نام یادگیری عمیق رابطه‌ای پیشنهاد کرده‌اند که از GNN‌ها برای یادگیری الگوها و تعبیه‌های مفید مستقیماً از پایگاه داده رابطه‌ای و بدون مهندسی ویژگی استفاده می‌کند.

با توجه به فراگیر بودن پایگاههای داده رابطه‌ای، این فناوری پتانسیل بسیار زیادی برای فعال کردن برنامه‌های کاربردی هوش‌مصنوعی جدید در صنایع بیشماری دارد.

 

GNN برای علم مواد

در مقاله‌ای که نوامبر گذشته در نیچر منتشر شد، تیم Google DeepMind شبکه‌های گراف برای اکتشاف مواد[12] (یا GNoME) را معرفی کرد، یک ابزار یادگیری عمیق جدید که می‌تواند مواد جدید را کشف کند و پایداری آنها را در مقیاس پیش‌بینی کند.

GNoME یک شبه تعداد مواد پایداری را که برای بشریت شناخته شده است، به ترتیب بزرگی افزایش داد.

https://deepmind.google/discover/blog/millions-of-new-materials-discovered-with-deep-learning/?ref=assemblyai.com

GNOME از GNNها برای مدل‌سازی مواد در سطح اتمی استفاده می‌کند. اتم‌ها و پیوندهای آن‌ها به صورت گراف بازنمایی می‌شوند، با گره‌هایی که اتم‌های منفرد را نشان می‌دهند و یال‌هایی که برهمکنش‌های بین اتمی را نشان می‌دهند. توصیف کننده‌های ویژگی‌های عنصری در ویژگی‌های گره تعبیه شده است. با کار بر روی این گراف‌ها، GNNها می‌توانند به طور موثری یاد بگیرند که خواص انرژی مولکول‌ها را پیشبینی کنند.

مهم‌تر از همه، GNoME از یادگیری فعال در ارتباط با محاسبات نظریه تابعی چگالی[13] (DFT) استفاده می‌کند تا دانش خود را به طور مکرر گسترش دهد. این به معنای این است: چارچوب بین استفاده از GNNهای خود برای غربالگری مواد کاندید، با شبیهسازی DFT در حلقه که اساساً برای تأیید نامطمئن‌ترین پیشبینی‌های مدل استفاده می‌شود، تغییر می‌کند. این یک حلقه بازخورد خودکار ایجاد می‌کند که در آن مدل به طور مداوم در مجموعه داده توسعه یافته بازآموزی می‌شود.

این ترکیب از شبکه‌های عصبی و شبیه‌سازی‌های فیزیک اصول اول، یادگیری بسیار کارآمد و دقیق را از نظر داده‌ها امکان‌پذیر می‌سازد. قابل توجه است که GNoME برخی از "توانایی‌های نوظهور" را نشان می‌دهد، زیرا می‌تواند به ترکیبات کاملاً جدید فراتر از توزیع آموزشی خود تعمیم دهد.

 

GNN برای کشف دارو

شاید یکی از معروف‌ترین کاربردهای اخیر روش‌های هوش مصنوعی در حوزه دارویی از یک پروژه تحقیقاتی از موسسه فناوری ماساچوست بیرون آمده باشد که به انتشار در مجله علمی معتبر Cell تبدیل شد.

https://www.sciencedirect.com/science/article/pii/S0092867420301021?ref=assemblyai.com

هدف این بود که از مدل‌های هوش مصنوعی برای پیش‌بینی فعالیت آنتی‌بیوتیکی مولکول‌ها با یادگیری گراف‌های آن‌ها استفاده کنیم، به این ترتیب فعالیت آنتی‌بیوتیکی بالقوه آن‌ها را ثبت کنیم. انتخاب رمزگذاری اطلاعات با گراف‌ها در این تنظیمات بسیار طبیعی است، زیرا آنتی‌بیوتیکها را می‌توان به صورت گراف‌های مولکولی کوچک نشان داد، جایی که گره‌ها اتم هستند و لبه‌ها با پیوندهای شیمیایی آنها مطابقت دارد.

مدل هوش‌مصنوعی از این داده‌ها می‌آموزد تا امیدوارکننده‌ترین مولکول‌ها را تحت شرایط مطلوب خاص پیش‌بینی کند، و متعاقباً این پیش‌بینی‌ها در آزمایشگاه آزمایش و تأیید می‌شوند، به این ترتیب به زیست‌شناسان کمک می‌کند تا مولکول‌هایی را که قرار است مورد تجزیه و تحلیل قرار گیرند، از بین میلیاردها مولکول نامزدهای ممکن اولویت‌بندی کنند.

مولکول‌ها به صورت گراف نمایش داده می‌شوند و یک GNN برای پیشبینی خواص آنها آموزش داده می‌شود

https://www.sciencedirect.com/science/article/pii/S0092867420301021?ref=assemblyai.com

این منجر به شناسایی یک ترکیب ناشناخته قبلی به نام هالیسین[14] شد که یک آنتی بیوتیک بسیار قوی و همچنین در برابر باکتری‌های مقاوم به آنتی‌بیوتیک موثر است، نتیجهای که توسط کارشناسان میدانی در تحقیقات کشف آنتی بیوتیک به عنوان یک پیشرفت بزرگ در نظر گرفته می‌شود.

این خبر با مقالات برجسته بی‌بی‌سی و فایننشال تایمز در میان رسانه‌ها منتشر شد، اما به سختی توجهی به این واقعیت داده شد که رویکرد مبتنی بر GNN در ستون فقرات مدل خاص هوش‌مصنوعی مستقر شده است. از سوی دیگر، محققان گزارش کردند که چگونه استفاده از یک رویکرد شبکه عصبی عمیق ارسال پیام هدایت‌شده، یکی از ویژگی‌های اصلی GNN‌ها، برای این کشف ضروری است: سایر مدل‌های پیشرفته که در برابر هالیسین نیز آزمایش شدند. در واقع، برخلاف مدل هوش‌مصنوعی مبتنی بر گراف، نتوانست رتبه پیش‌بینی بالایی را تولید کند.

GNN برای هوش‌مصنوعی قابل توضیح

مدل‌های هوش مصنوعی کشف دارو مانند مواردی که در بالا توضیح داده شد برای ایجاد پیش‌بینی‌های عددی استفاده می‌شوند که سپس باید در آزمایشگاه آزمایش شوند. خود مدل قادر به توضیح پیشینی نتایج خود نیست. این وضعیت در اکثر مدل‌های فعلی هوش مصنوعی رایج است و به همین دلیل است که بسیاری از افراد از آنها به عنوان «جعبه‌های سیاه» یاد می‌کنند.

یک مقاله موفقیت آمیز منتشر شده در Nature در پایان سال 2023 از MIT و هاروارد به دنبال نشان دادن چیزی متفاوت در این زمینه است. نویسندگان GNNها را برای غربالگری ترکیبات شیمیایی برای آنهایی که استافیلوکوکوس اورئوس[15] مقاوم به متی سیلین[16] را می‌کشند، آموزش دادند، کشندهترین باکتری در میان باکتری‌هایی که در برابر آنتی‌بیوتیکهای معمولی آسیب ناپذیر هستند.

محققان نه تنها قادر به پیش‌بینی فعالیت آنتی‌بیوتیکی بیش از 12 میلیون ترکیب بودند، بلکه این کار را با استفاده از الگوریتم‌های گراف قابل توضیح انجام دادند که با طراحی قادر به توضیح منطق پشت پیش‌بینی‌هایشان هستند.

 

GNN برای طراحی پروتئین

هدف از طراحی پروتئین ایجاد پروتئینهایی است که دارای خواص مطلوب هستند و می‌توانند از طریق روش‌های تجربی (معمولاً با هزینه بالا) انجام شوند که به محققان اجازه میدهد پروتئینهای جدید را با دستکاری مستقیم توالی اسید آمینه یک پروتئین مهندسی کنند. طراحی پروتئین‌های جدید دارای کاربردهای بالقوه بسیار زیادی، مانند توسعه داروها، آنزیمها یا مواد جدید است.

 

آزمایشگاه بیکر اخیراً شبکه‌های عصبی گراف و تکنیک‌های انتشار را ترکیب کرده و یک سیستم هوش‌مصنوعی به نام RosettaFoldDiffusion (RFDiffusion) ایجاد کرده است که مشخص شده است که قادر به طراحی ساختارهای پروتئینی است که محدودیت‌های سفارشی را برآورده می‌کند. مدل هوشمصنوعی از طریق یک شبکه عصبی E(n)-Equivariant Graph عمل می‌کند، نوع خاصی از GNN که به صراحت برای پردازش ساختارهای داده با تقارن‌های حرکتی سفت و سخت (مانند ترجمه، چرخش و انعکاس در فضا) طراحی شده است و به صورت دقیق تنظیم شده denoiser، یعنی یک مدل انتشار است.

یک مجموعه الیگومر متقارن طراحی شده توسط RFDiffusion، تایید شده توسط میکروسکوپ الکترونی تک مولکولی (منبع)

https://www.bakerlab.org/wp-content/uploads/2022/11/Diffusion_preprint_12012022.pdf?ref=assemblyai.com

RFDiffusion که در نوامبر 2022 منتشر شد، یک سیستم بسیار پیچیده است که قادر به مقابله با تعداد زیادی از وظایف خاص در طراحی پروتئین است و بر این اساس در برابر انواع معیارها و معیارها آزمایش شده است. نتایج پیشرفت‌های چشمگیری را نسبت به رقبای پیشرفته نشان داده است: RFDiffusion 100% مسائل معیار بیشتری را (23 از 25) نسبت به مدل قبلی شبکه عصبی عمیق در طراحی داربست‌ها برای نقوش ساختاری پروتئین حل کرد. و به میزان موفقیت 18 درصدی در طراحی binderهای پروتئینی دست یافت مسئله‌ای که از آن به عنوان "چالش بزرگ" در طراحی پروتئین یاد می‌شود. علاوه بر این، میزان موفقیت آزمایشی RFDiffusion بسته به پروتئین مورد نظر از 5 برابر تا 214 برابر بهبود متغیر است.

 

برخی از کارشناسان در این زمینه معتقدند که RFDiffusion می‌تواند یکی از "بزرگترین پیشرفتها در زیستشناسی ساختاری این دهه همراه با AlphaFold " باشد، پیشرفتی که به شدت بر آخرین پیشرفتها در شبکه‌های عصبی گراف متکی است.

کلمات پایانی

شبکه‌های عصبی گراف، زمینه‌ای به سرعت در حال تکامل با بسیاری از پیشرفت‌های هیجان‌انگیز هستند، و جامعه تحقیقاتی هوش‌مصنوعی در چند سال اخیر توجه قابل‌توجهی به این حوزه را افزایش داده است.

در صنعت، کاربردهای یادگیری ماشین گراف در حوزه‌های بسیار متفاوت اخیراً شروع به ظهور کرده‌اند و GNN‌ها قبلاً خود را به عنوان یک تغییردهنده بازی در برخی از مدل‌های مدرن آماده تولید که در مقیاس بزرگ مستقر شده‌اند، تثبیت کرده‌اند. این موفقیت‌های اخیر فرصتی را برای طیف جدیدی از برنامه‌های کاربردی به ارمغان می‌آورد، و دیدن اینکه این حوزه امسال چه چیزی به ارمغان می‌آورد، جذاب خواهد بود.

 



[1] Rigid

[2] Tokens

[3] Traditional Signal Processing

[4] Transformers

[5] Attention Mechanism

[6] Area Under the Curve

[7] Board

[8] Hit-rate

[9] Mean Reciprocal Rank

[11] Estimated Time of Arrival

[13] Density Functional Theory

[14] Halicin

[15] Staphylococcus Aureus

[16] Methicillin-resistant

نظرات 0 + ارسال نظر
ایمیل شما بعد از ثبت نمایش داده نخواهد شد