مدل یادگیری ماشین شما در مجموعه آموزشی به خوبی عمل میکند، سپس در مجموعه آزمایشی نیز به خوبی عمل میکند. وقت جشن گرفتن است. اما هنوز همه چیز تمام نشده است. استقرار مدل یادگیری ماشینی چالشهای زیادی دارد.
صحبت در مورد چالشهای آماری شامل Data Drift و Concept Drift است. اجازه میدهد از طریق مثالها را درک کنیم.
1) فرض کنید شما در حال ساخت یک سیستم بینایی کامپیوتری برای تشخیص ترک در قطعاتی هستید که در یک کارگاه یا واحد کارخانه تولید میشوند. این مدل ترکهای قطعه را تشخیص میدهد و بر اساس آن مهندسان مکانیک قطعه را قبول یا رد میکنند و یا با تعمیرات اساسی بر اساس اندازه ترک (عیب) آن را میپذیرند.
به طور معمول در واحد تولید ممکن است یک دستگاه با نرم افزار و دوربین داشته باشد که تصاویر قطعه ساخته شده را میگیرد و آن را به سرور ارسال میکند (به دنبال تماس API) جایی که مدل ML مستقر است. مدل یادگیری ماشینی پیش بینی را انجام میدهد و نتیجه را از طریق رابط API به نرمافزار برمیگرداند. شما مدل را بر اساس n چنین دادهای آموزش دادهاید و مدل شما به خوبی از آن استفاده کرده است.
در حال حاضر تغییرات نوری در واحد تولیدی به وجود آمده است که به دلیل آن تصاویر به صورت متفاوتی ظاهر میشوند. چنین تغییراتی به معنای تغییر در توزیع دادهها است. ممکن است جلوه نور در دادههای آموزشی یا آزمایشی شما لحاظ نشده باشد. با توجه به این تغییر، مدل ممکن است عملکرد خوبی نداشته باشد. این Data Drift است. توزیع دادهها تغییر کرده است
2) دریفت مفهومی زمانی اتفاق میافتد که در رابطه بین متغیرهای وابسته و مستقل تغییر ایجاد شود. فرض کنید موادی مانند فولاد یا آلومینیوم دارید و این ماده بخشی را تشکیل میدهد. متخصصان مواد، نمونه مواد را در آزمایشگاه آزمایش میکنند، نتایج آزمایشات را در کشش، فشردهسازی و پیچش دریافت میکنند.
مهندس ML یک مدل رگرسیون را بر اساس دادههای ارائه شده توسط متخصصان مواد برای بازنمایی دادههای آزمایشی به درستی برازش میدهد. مهندسین مکانیک شبیهسازی، شبیهسازی یک جزء (که از مواد ساخته شده است) را با استفاده از مدل یادگیری ماشین ارائه شده توسط مهندسین ML انجام میدهند. معلوم میشود که جزء تحت بار (در سرویس) شروع به ترک خوردن میکند.
دلیل ترک خوردگی (پس از بررسی) مشخص شد که رفتار مواد در حالت تنش چند محوری (یعنی تنش و پیچش ترکیبی یا ترکیبی از حالتهای تنش) با حالتهای تک محوری خالص متفاوت است. این رانش مفهومی است زیرا نگاشت متغیرها متفاوت است زیرا تغییر مفهومی از حالت تک محوری به حالت تنش ترکیبی وجود دارد.
3) مثال سادهتر Concept Drift میتواند تغییر در قیمت ملک در مواردی باشد که شما یک مدل ML برای پیشبینی قیمت مسکن بر اساس چندین ویژگی مانند اندازه، تعداد اتاق خواب، امکانات مجاورت و غیره ساختهاید. اما با گذشت زمان قیمتها به دلیل تحولات مختلف افزایش یافته است. بنابراین بازآموزی مدل مهم است