پیشرفتهای اخیر نشان میدهد که مدلهای زبانی بزرگ (LLM) میتوانند با بهرهگیری از قابلیتهای تبدیل متن به کد و استدلال خود، ساختارهای گراف تولید کنند، حتی اگر ذاتاً برای وظایف گراف طراحی نشده باشند. در زیر ترکیبی از روشها، بینشها و چالشهای تحقیقات پیشرفته آمده است:
1. روشهای اصلی
الف. تولید گراف از طریق سنتز کد
* طراحی سریع: LLMها (مثلاً GPT-4) وادار به تولید کدی (مثلاً پایتون با NetworkX) میشوند که گرافهایی با ویژگیهای خاص (مثلاً ضریب خوشهبندی، توزیع درجه) میسازد.
- مثال: تزریق دانش دامنه (مثلاً "ایجاد یک شبکه اجتماعی با بسته شدن سهگانه بالا") LLMها را به تولید گرافهایی همسو با ساختارهای دنیای واقعی هدایت میکند [1][3]. * استدلال چند مرحلهای: ایجاد زنجیره فکری، LLMها را قادر میسازد تا با تجزیه و تحلیل نقصهای ساختاری (مثلاً اجزای جدا از هم) به طور مکرر گرافها را اصلاح کنند [1].
ب. معماریهای ترکیبی
· LLM به عنوان تقویتکننده: تولید ویژگیهای گره/یاخته یا ترمیم اتصالات نویزی (مثلاً GraphEdit از طریق پیشبینی لبه مبتنی بر LLM، نویز گرافها را کاهش میدهد) [6]. افزایش گرافهای پراکنده با استنباط روابط پنهان (مثلاً اضافه کردن یالهای "همنویسنده" در شبکههای دانشگاهی) [7].
· LLM به عنوان همترازکننده: نگاشت توصیفات متنی به عناصر گراف (مثلاً تبدیل "کاربر A محصول B را دوست دارد" به یک یال گراف دوبخشی) [2][4].
2. مزایای کلیدی
- سازگاری دامنه: LLMها زمینه متنی (مثلاً توصیفات مولکول، نظرات کاربران) را در تولید گراف ادغام میکنند و از مدلهای سنتی مانند Erdős-Rényi یا Barabási-Albert در وظایف متنی بهتر عمل میکنند [1][4].
- بهینهسازی ساختاری: LLMها در متعادل کردن معیارهای شبکه چندگانه (مثلاً به حداقل رساندن طول مسیر در عین به حداکثر رساندن ماژولاریتی) برتری دارند [1][3].
- تعمیم Zero-Shot: برخلاف GNNها، LLMها نیازی به آموزش مختص به وظیفه ندارند، که آنها را برای سناریوهای کم داده (مثلاً گرافهای دانش بیماریهای نادر) مناسب میکند [5][8].
3. چالشها و محدودیتها
- خروجیهای غیرقابل کنترل: LLMها ممکن است لبهها/گرهها را توهم کنند یا محدودیتهای ساختاری را نقض کنند (مثلاً ایجاد وابستگیهای چرخهای در DAGها) [5][6].
- مقیاسپذیری: تولید گرافهای بزرگ (مثلاً بیش از 10 هزار گره) به دلیل محدودیتهای توکن و پردازش متوالی، از نظر محاسباتی پرهزینه است [2][8].
- شکافهای ارزیابی: معیارهای موجود (مثلاً GLBench) عملکرد متناقضی را در تنظیمات نظارتشده در مقابل تنظیمات Zero-Shot برجسته میکنند، به طوری که LLMها در وظایفی که نیاز به کنترل دقیق توپولوژی دارند، از GNNها عقب میمانند [5].
4. مطالعات موردی
- شبکههای اجتماعی: LLMها با شبیهسازی تعاملات انسانی، گرافهایی با ساختارهای جامعه واقعبینانه تولید میکنند (مثلاً "گرافی ایجاد کنید که در آن اینفلوئنسرها 10 برابر دنبالکننده داشته باشند") [1][3].
- گرافهای دانش: LLMها روابط ضمنی را از متن استنباط میکنند (مثلاً پیوند دادن "COVID-19" به "گیرندههای ACE2" در گرافهای زیستپزشکی) [4][8]. - سیستمهای توصیه: GraphEdit با پیشبینی لبههای گمشده، گرافهای تعامل کاربر-آیتم را اصلاح میکند (به عنوان مثال، بهبود دقت 15 درصدی در مجموعه دادههای آمازون) [6].
5. مسیرهای آینده
- مدلهای ترکیبی: ترکیب LLMها با GNNها برای تولید مقیاسپذیر (به عنوان مثال، LLM لبههای کاندید را پیشنهاد میدهد، GNN اعتبارسنجی میکند) [2][7].
- گرافهای پویا: LLMها را برای مدیریت تکامل گراف زمانی گسترش دهید (به عنوان مثال، شبیهسازی گسترش همهگیری در طول زمان) [4][8].
- حفاظتهای اخلاقی: کاهش خطرات تولید گرافهای مضر (به عنوان مثال، شبکههای اجتماعی جعلی برای اطلاعات نادرست) [6].
نتیجهگیری
LLMها با ترکیب استدلال متنی با محدودیتهای ساختاری، الگوهای جدید تولید گراف را باز میکنند، اما اثربخشی آنها به مهندسی دقیق و سریع و معماریهای ترکیبی بستگی دارد. در حالی که آنها در سناریوهای زمینهای و کم داده برتری دارند، چالشهای مقیاسپذیری و کنترل، تحقیقات بیشتر را ضروری میسازد. ادغام LLMها در خطوط لوله گراف، نویدبخش پیشرفتهایی در حوزههایی مانند زیستپزشکی، سیستمهای توصیهگر و علوم شبکه است.
Key References:
[1] Wang et al. (2025): *Demystifying LLMs in Graph Generation* (NAACL Findings).
[6] Guo et al. (2024): *GraphEdit: LLMs for Graph Structure Learning*.
[5] GLBench (2024): *Benchmarking GraphLLM Methods*.
[4] LLM-Powered Enterprise Knowledge Graphs (2025).
Citations:
[1] https://aclanthology.org/2025.findings-naacl.456/
[2] https://arxiv.org/html/2312.02783v2
[3] https://aclanthology.org/2025.findings-naacl.456.pdf
[4] https://arxiv.org/html/2503.07993v1
[5] https://openreview.net/forum?id=01lhHg8H9p¬eId=9pGbznPCAB
[6] https://arxiv.org/abs/2402.15183
[7] https://www.mdpi.com/2227-7390/13/7/1147
[8] https://www2024.thewebconf.org/docs/tutorial-slides/large-language-mdoels-for-graphs.pdf
[9] https://openreview.net/forum?id=qWLgJCl1Y6
[10] https://openreview.net/forum?id=IutH9tRtMI
[11] https://www.mdpi.com/2227-7390/13/7/1147
[13] https://arxiv.org/abs/2410.05298
[14] https://www.computer.org/csdl/magazine/ex/2024/01/10453398/1UUv40tPJU4
[15] https://www.sciencedirect.com/special-issue/10C05PM18JB
[16] https://www.sciencedirect.com/science/article/pii/S0950705125001078
[17] https://ojs.aaai.org/index.php/AAAI/article/view/28769/29476
[18] https://aclanthology.org/2024.emnlp-main.54.pdf
[19] https://www.nature.com/articles/s41524-025-01540-6
[20] https://www.mdpi.com/2504-4990/7/2/38
[22] https://www.yworks.com/blog/empowering-llm-development-visualization-knowledge-graphs
[23] https://arxiv.org/abs/2410.21071
[24] https://www.plainconcepts.com/graphrag/
[25] https://github.com/PGraphRAG-benchmark/PGraphRAG
[26] https://memgraph.com/blog/nasa-memgraph-people-knowledge-graph
[27] https://arxiv.org/pdf/2308.16622.pdf
[30] https://arxiv.org/abs/2403.14358
[31] https://aclanthology.org/2025.findings-naacl.456.pdf
[32] https://openreview.net/forum?id=IuXR1CCrSi