مدلهای یادگیری ماشین به دلایل مختلفی نظیر کیفیت پایین دادهها، مشکلات در پایپ لاین تولید، یا باگهای فنی دچار کاهش کیفیت پیش بینی میشوند. همچنین، رانش داده و رانش مفهوم از جمله دلایل دیگری هستند که میتوانند به تنزل عملکرد مدل منجر شوند.
به طور کلی، رانش داده به تغییر در توزیع دادهها در طول زمان گفته میشود که میتواند باعث کاهش کیفیت عملکرد مدل یادگیری ماشین در شرایط ناشناخته داده شود.
همچنین رانش مفهوم به تغییر در روابط بین دادهها و ویژگیها در طول زمان گفته میشود. در این حالت، دنیا و یا محیط دادهها تغییر کرده و مدل نیاز به بروزرسانی دارد. این تغییرات میتواند به صورت تدریجی، ناگهانی یا تکراری باشد و ممکن است تفاوت کوچک یا بزرگی را در معنای دادهها ایجاد کند. به عبارت دیگر، در رانش مفهوم، نه تنها توزیع دادهها بلکه روابط بین دادهها و ویژگیها نیز تغییر میکند.
در صورتی که تغییرات اساسی در دادهها ایجاد شود، ممکن است مدل یادگیری ماشین دیگر به درستی عمل نکند. در چنین شرایطی، مدل ممکن است به کمک انسانی نیاز داشته باشد تا بهبود یابد. در چنین شرایطی، تا زمانی که دادههای بیشتری جمعآوری نشده، ممکن است لازم باشد که مدل را موقتاً از دسترس خارج کرد و بهعنوان یک راهبرد پشتیبان، از قوانین تخصصی یا روشهای ابتکاری استفاده کنید.
برای بازگرداندن مدل یادگیری ماشین به حالت فعال، روشهای متفاوتی وجود دارد:
- با استفاده از تمام دادههای موجود قبل و بعد از تغییرات، مدل را دوباره آموزش دهید.
- از تمام دادهها برای آموزش دوباره استفاده کنید، اما به دادههای جدید وزن بیشتری اختصاص دهید تا مدل به الگوهای جدید تمرکز کند.
- در صورتی که دادههای جدید به اندازه کافی جمعآوری شده باشند، میتوانید دادههای گذشته را حذف کنید و تنها با داده های جدید مدل خود را آموزش دهید.
بازآموزش مدل یادگیری ماشین راهکار همیشگی برای بازگرداندن یک مدل دچار درهم ریختگی شده نیست. اگر تغییرات به وجود آمده به مدل آسیب رسانده باشند، ممکن است نیاز به تغییر تنظیمات پارامترهای مدل باشد. راهحلهای مختلفی مانند استفاده از استراتژیهای تطبیق دامنه، ساختار ترکیبی از مدلهای قبلی و جدید، افزودن منابع داده جدید یا تست ساختارهای کاملاً جدید وجود دارد.
گاهی اوقات لازم است دامنه مدل یادگیری ماشین یا فرآیند کسب و کار تغییر کند. ممکن است دوره پیشبینی کوتاه شود و یا مدل به صورت مکرر اجرا شود. به عنوان مثال، فروشندگان خردهفروشی که با تغییر در رفتار خرید مشتریان روبرو هستند، ممکن است از پیشبینی تقاضای هفتگی به روزانه تغییر مفهومی دهند. همچنین، بهروزرسانی رابط کاربری و سایر تغییرات داخلی امری عادی در روند کسب و کار به نظر می رسد. درچنین شرایطی، صاحبان کسب و کار باید با سازندگان مدلهای یادگیری ماشین هماهنگی لازم را داشته باشند تا به سرعت تغییرات لازم برای بازآموزی مدل انجام شود.

رانش مفهومی در الگوی دورهای
بعضی از پژوهشگران از اصطلاح “رانش مفهوم در الگوی دورهای” برای توصیف تغییرات تکراری در مدلهای پیشبینی کننده استفاده میکنند. به نظر میرسد که این مفهوم با “فصلی بودن” متفاوت است، چرا که فصلی بودن تنها تغییرات موقتی در تابع هدف را نشان میدهد. افرادی که در طول سال نسبتا کم خرید میکنند، ممکن است در “جمعههای سیاه” الگوی غیرعادی نشان دهند. همچنین، تعطیلیهای بانکی ممکن است همه چیز را تحت تأثیر قرار دهد. تغییرات در الگوی دورهای قابل انتظار است و ممکن است باعث کاهش کیفیت مدل یادگیری ماشین شود. بنابراین لازم است تا این دسته از تغییرات چرخهای و رویدادهای خاص را در طراحی سیستم مدلسازی کنیم.
برخی از رانش های تکراری مانند رانش در الگوی دوره ای که هر هفته رخ میدهد، میتواند به صورت مداوم و برای مدت طولانی در دادههای ما وجود داشته باشد و برای همین ممکن است اهمیت زیادی نداشته باشد. اما در مواردی که رانش جدیدی در دادهها به وجود آید، بهتر است یک سیستم نظارت بر مدل یادگیری ماشین داشته باشیم تا بتوانیم به سرعت به این تغییرات واکنش نشان دهیم و مدل را با دادههای جدید آموزش دهیم تا کیفیت آن را حفظ کنیم. همچنین در برخی موارد، مثلاً در مسائل مالی، رانشهای مکرر و تکراری ممکن است به علت وجود عوامل ناشناخته باشند و در نتیجه، نظارت بر مدل یادگیری ماشین و رفع رانشها، اهمیت دارد.

چگونه با رانش های غیر دقیق ( not-exactly drift) در تولید برخورد کنیم؟
با توجه به رانش غیر دقیق (not-exactly drift) در تولید، از چند روش میتوان برای برخورد با آن استفاده کرد. اولین راهکار این است که به مدل یادگیری ماشین خود الگوهای دوره ای دادهها را یاد دهید. در صورتی که این موضوع برای اولین بار در فرآیند تولید رخ می دهد، میتوانید از رویدادهای مشابه به عنوان نمونه استفاده کنید. به عنوان مثال، در صورتی که یک تعطیلی بانکی جدید اتفاق بیافتد ، شما میتوانید از داده های یک تعطیلی دیگر که شباهت با شرایط کنونی شما دارد استفاده کنید. روش دیگر، استفاده از قوانین پسپردازش دستی یا ضرایب اصلاحی بر روی خروجی مدل است. در صورتی که میبینید مدل یادگیری ماشین شما با دادههای جدید دچار رانش غیر دقیق شده است، میتوانید از این روش برای تصحیح خروجی مدل استفاده کنید. در این روش، کارشناسان خبره در حوزه محصول تولیدی شما میتوانند به شما در تعیین قوانین پسپردازش دستی یا ضرایب اصلاحی برای خروجی مدل کمک کنند.