توکنسازی گراف به فرآیند تبدیل دادههای ساختاریافته گراف به قالبی مناسب برای مدلهای یادگیری ماشین، بهویژه در زمینه تبدیل گراف (GTs) اشاره دارد. برخلاف توکنسازی سنتی در پردازش زبان طبیعی (NLP)، که بر تجزیه متن به واحدهای کوچکتر (مثلاً کلمات یا زیرکلمهها) تمرکز میکند، توکنسازی گراف شامل کدگذاری اطلاعات ساختاری و ویژگیهای یک گراف در توکنهایی است که توپولوژی و ویژگیهای آن را نشان میدهد.
ترانسفورمرهای گراف (GTs) به عنوان یک جایگزین قدرتمند برای شبکههای عصبی گراف (GNN) برای وظایف یادگیری گراف ظاهر شدهاند. مبانی نظری آنها ریشه در مفاهیمی مانند بیان، تعمیم و بهینهسازی دارد که به توضیح قابلیتها و محدودیتهای آنها کمک میکند. در زیر یک نمای کلی از زیربنای نظری GTها آورده است:
ترانسفورمرهای گراف (GTs) معماری ترانسفورمر را به دادههای ساختار یافته گرافی گسترش میدهند و امکان مدلسازی پیشرفته روابط و الگوها را در حوزههای مختلف فراهم میکنند. در زیر خلاصهای از برنامههای کاربردی کلیدی آمده است: