حافظه مشترک توزیع شده

Distributed shared memory

حافظه مشترک توزیع شده (DSM) یک شکل از معماری حافظه است که در آن حافظه‌هایی که به صورت فیزیکی از یکدیگر جدا هستند، این قابلیت را دارند که به عنوان یک فضای آدرس که از نظر منطقی مشترک است، بیان شوند. اینجا، عبارت «مشترک» بدان معنی نیست که یک حافظه متمرکز تنها وجود دارد بلکه یعنی فضای آدرس «مشترک» است (آدرس فیزیکی یکسان روی دو پردازنده به یک مکان در حافظه اشاره دارد). فضای آدرس کلی توزیع شده (DGAS) یک عبارت مشابه برای دست‌های گسترده از پیاده‌سازیهای نرم‌افزاری و سخت‌افزاری است که در آنها هر گره از دسته علاوه بر حافظه اختصاصی هر گره غیرمشترک، به حافظه مشترک نیز دسترسی دارد.

یک سیستم حافظه توزیع شده که اغلب یک مالتی کامپیوتر نامیده می‌شود، متشکل از چندین گره پردازنده مستقل با ماژول‌های محلی حافظه است که توسط یک شبکه کلی با اتصال درونی، ارتباط یافته‌اند. سیستم‌های نرم‌افزاری DSM در یک سیستم عامل یا به عنوان یک کتابخانه برنامه‌نویسی قابل پیاده‌سازی هستند و به عنوان تعمیم‌های معماری حافظه مجازی اساسی قابل تصور هستند. هنگامی که در سیستم عامل پیاده‌سازی شوند، چنین سیستمهایی برای توسعه دهنده شفاف هستند؛ که بدان معنی است که حافظه توزیع شده اساسی کاملاً از کاربران مخفی است. در مقابل، سیستمهای نرم افزاری DSM پیاده‌سازی شده در سطح کتابخانه یا زبان برنامه‌نویسی شفاف نیستند و توسعه دهندگان معمولاً مجبور هستند تا آنها را به طور مختلف برنامه‌نویسی کنند. با این حال، این سیستمها یک روش قابل حمل تر برای پیاده‌سازی‌های سیستم DSM پیشنهاد می‌کنند. یک سیستم حافظه مشترک توزیع شده، مدل حافظه مشترک را روی یک سیستم حافظه مشترک توزیع شدهی فیزیکی پیاده‌سازی می‌کند.

روش‌های دستیابی به DSM

معمولاً دو روش برای دستیابی به یک حافظه مشترک توزیع شده وجود دارد:

· سخت‌افزار، مانند مدارهای همبستگی نهان و رابطه‌ای شبکه.

· نرم‌افزار

پیاده‌سازی DSM نرم‌افزاری

سه روش برای پیاده‌سازی یک حافظه مشترک توزیع شده نرم‌افزاری وجود دارد:

· روش مبتنی بر صفحه با استفاده از حافظه مجازی سیستم؛

· روش متغیر مشترک با استفاده از برخی کارهای مرسوم برای دسترسی به متغیرهای مشترک؛

· روش مبتنی بر شیء که به طور ایده‌آل از طریق اصول شیءگرایی به داده‌های مشترک دسترسی پیدا می‌کند.

انتقال پیام در مقابل DSM

عبور پیام	حافظه مشترک توزیع شده
متغیرها باید مرتب شوند	متغیرها مستقیماً به اشتراک گذاشته می‌شوند
هزینه ارتباط قابل توجه است	هزینه ارتباط غیرمشهود است
فرایندها با داشتن فضای آدرس اختصاصی محافظت شده‌اند	با عوض کردن داده‌ها ممکن است فرایندها دچار خطا شوند
فرایندها باید در زمان یکسان انجام شوند	انجام دادن فرایندها ممکن است با طول عمرهای غیرهمپوشان رخ دهد

سیستم‌های DSM نرم‌افزاری همچنین انعطاف‌پذیری لازم برای سازماندهی ناحیه حافظه مشترک را به روش‌های مختلف دارند. روش مبتنی بر صفحه، حافظه مشترک را در صفحاتی با اندازه ثابت سازماندهی می‌کند. در مقابل، روش مبتنی بر شیء، ناحیه حافظه مشترک را به صورت یک فضای انتزاعی برای ذخیره کردن اشیاء قابل اشتراک گذرای با اندازه‌های متغیر سازماندهی می‌کند. یک پیاده‌سازی مرسوم دیگر از فضای چندتایی استفاده می‌کند که در آن واحد اشتراک گذاری، یک چندتایی است.

معماری حافظه مشترک ممکن است شامل جداسازی حافظه به بخش‌های مشترک توزیع شده بین گره‌ها و حافظه اصلی شود؛ یا تمام حافظه را بین گره‌ها توزیع کند. یک پروتکل هم بسته که مطابق با یک مدل ثبات انتخاب شده است، همبستگی حافظه را حفظ می‌کند.

DSM از منظر انتزاعی

مزایای استفاده از DSM

· با تعداد وسیعی از گره‌ها به خوبی مقیاس می‌پذیرد

· عبور پیام، مخفی است

· می‌تواند پایگاه داده‌های بزرگ و پیچیده را بدون تکرار یا ارسال داده‌ها به فرایندها، مدیریت کند

· به طور کلی نسبت به استفاده از یک سیستم چندپردازنده ارزانتر است

· فضای حافظه مجازی بزرگی را فراهم می‌کند برنامه‌ها به سبب رابطه‌ای برنامه‌نویسی رایج، قابل حمل‌تر هستند

· برنامه نویسان را از ارسال یا دریافت مطالب ابتدایی حفاظت می‌کند

معایب DSM

· به طور کلی در دسترسی، کندتر از حافظه مشترک توزیع نشده است

· باید حفاظت اضافی در برابر دسترسی‌های همزمان به داده‌های به اشتراک گذاشته شده فراهم کند

همبستگی حافظه دایرکتوری

همبستگی حافظه ضروری است به نحوی که سیستمی که DSM را سازماندهی می‌کند، قادر است وضعیت بلوک‌های داده در گره‌های میان حافظه‌های تشکیل دهنده سیستم را حفظ و ردیابی کند.

وضعیت‌ها

یک DSM پایه‌ای، حداقل سه وضعیت در بین گره‌ها را برای هر بلوک داده شده در دایرکتوری ردیابی خواهد کرد. برخی وضعیت‌ها که بلوک را مجبور به عنوان نهان نشده (U) می‌کنند، یک وضعیت یک بلوک را مجبور به عنوان متعلق انحصاری یا متعلق اصلاح شده (EM) می‌کند و یک وضعیت، یک بلوک را مجبور به عنوان به اشتراک گذاشته شده (S) می‌کند وجود خواهند داشت.

وقتی بلوک‌ها وارد سازماندهی دایرکتوری می‌شوند، آنها در گره اولیه از U به EM (وضعیت تعلق) منتقل می‌شوند، سپس هنگامی که سایر گره‌ها بلوک را خواندند وضعیت می‌تواند به S انتقال یابد.

دو روش اصلی برای اجازه به سیستم برای ردیابی اینکه بلوک‌ها کجا و در چه شرایطی در هر گره نهان می‌شوند وجود دارد. درخواست-پاسخ خانه محور از خانه استفاده می‌کند تا به درخواست‌ها سرویس دهد و وضعیت‌ها را کنترل کند، درحالی که درخواست کننده محور به هر گره این امکان را می‌دهد تا درخواست‌های خود را از طریق خانه کنترل و مدیریت کند.

درخواست و پاسخ خانه محور

در یک سیستم خانه محور، DSM با دادن اجازه رخدادن تنها یک تراکنش در یک زمان از مجبوربودن به کنترل رقابت‌های درخواست و پاسخ بین گره‌ها جلوگیری خواهد کرد، تا زمانی که گره خانه تصمیم بگیرد که تراکنش پایان یافته است که معمولاً زمانی است که خانه تمام پاسخ‌های پردازنده‌های پاسخ به درخواست را دریافت کرده باشد. یک مثال از این، حالت خانه-منبع QPI اینتل است [۱].

نمودار وضعیت یک بلوک از حافظه در DSM.

مزایا

· رقابت داده‌ها غیرممکن است

· پیاده‌سازی ساده دارد

معایب

· کند، استراتژی درخواست – پاسخ بافرشده، محدودشده توسط گره خانه

درخواست و پاسخ درخواست کننده محور

در یک سیستم درخواست کننده محور، DSM به گره‌ها این امکان را می‌دهد تا از طریق خانه با یکدیگر صحبت کنند. این بدان معنی است که چندین گره می‌توانند شروع به تراکنش کنند ولی این نیازمند ملاحظات اضافی است تا همبستگی تضمین شود. به عنوان مثال، هنگامی که یک گره در حال پردازش یک بلوک است، اگر یک درخواست برای آن بلوک از گرهی دیگر دریافت کند، یک NAck (تأیید منفی) ارسال خواهد کرد تا به ارسال کننده بگوید که گره پردازنده نمی‌تواند آن درخواست را در آن لحظه انجام دهد. یک مثال از این، حالت جستجوگر-منبع QPI اینتل است [۱].

مزایا

· سریع

معایب

· ذاتاً از شرایط رقابل جلوگیری نمی‌کند

· ترافیک باس بیشتری تولید می‌کند

مدل‌های ثبات

DSM باید از قوانین خاصی تبعیت کند تا ثبات را پیرامون اینکه چگونه ترتیب اینکه گره‌ها خوانده و نوشته شوند را حفظ کند که مدل ثبات سیستم نامیده می‌شود.

فرض کنید n فرایند و M_i عملیات حافظه برای هر پردازش i داریم و فرض کنید تمام عملیات‌ها به ترتیب انجام می‌شوند. می‌توانیم نتیجه بگیریم که (M_1+M_2+⋯+M_n)!/((M_1 !M_2 !…M_n !)) عملیات بین عملیات‌ها ممکن است. این مسئله با این نتیجه‌گیری درستی این عملیات‌های بینابینی را تعیین می‌کند. همبستگی حافظه برای DSM تعیین می‌کند که کدام عملیات‌های بینابینی مجاز هستند.

تکرار در DSM

به طور کلی تکرار داده‌های اشتراکی قصد دارد تا:

· ترافیک شبکه را کاهش دهد

· موازیبودن افزایشیافته را رایج کند

· منتج به خطاهای صفحهی کمتری شود

با این حال، جلوگیری از همبستگی و ثبات ممکن است چالش برانگیزتر شود.

ثبات انتشار و ورود

ثبات انتشار: هنگامی که یک فرایند از یک بخش بحرانی خارج می‌شود، مقادیر جدیدی از متغیرها برای تمام محل‌ها انتشار پیدا می‌کنند.

ثبات ورود: هنگامی که یک فرایند وارد یک بخش بحرانی می‌شود، به طور خودکار مقادیر متغیرهای به اشتراک گذاشته شده را به روزرسانی می‌کند.

ثابت مبتنی بر مشاهده: یک نوع از ثبات ورود است، با این تفاوت که متغیرهای به اشتراک گذاشته شده از بخش بحرانی به طور خودکار توسط سیستم شناسایی می‌شوند. یک پیاده‌سازی از ثبات مبتنی بر مشاهده VODCA است که در کامپیوترهای دسته، عملکرد قابل مقایسهای نسبت به MPI دارد.

منبع

[1] Sorin, Daniel J.; Hill, Mark D.; Wood, David A. (2011). A Primer on Memory Consistency and Cache Coherence. Morgan & Claypool. p. 174. ISBN 978-1-60845-564-5.

علی روحانی فر چهارشنبه 3 اردیبهشت 1404 ساعت 06:35

GML (Graph Machine Learning)

GML (Graph Machine Learning)

درباره من