مدل‌های یادگیری ماشین به دلایل مختلفی نظیر کیفیت پایین داده‌ها، مشکلات در پایپ لاین تولید، یا باگ‌های فنی دچار کاهش کیفیت پیش بینی می‌شوند. همچنین، رانش داده و رانش مفهوم از جمله دلایل دیگری هستند که می‌توانند به تنزل عملکرد مدل منجر شوند.

به طور کلی، رانش داده به تغییر در توزیع داده‌ها در طول زمان گفته می‌شود که می‌تواند باعث کاهش کیفیت عملکرد مدل یادگیری ماشین در شرایط ناشناخته داده شود.

همچنین رانش مفهوم  به تغییر در روابط بین داده‌ها و ویژگی‌ها در طول زمان گفته می‌شود. در این حالت، دنیا و یا محیط داده‌ها تغییر کرده و مدل نیاز به بروزرسانی دارد. این تغییرات می‌تواند به صورت تدریجی، ناگهانی یا تکراری باشد و ممکن است تفاوت کوچک یا بزرگی را در معنای داده‌ها ایجاد کند. به عبارت دیگر، در رانش مفهوم، نه تنها توزیع داده‌ها بلکه روابط بین داده‌ها و ویژگی‌ها نیز تغییر می‌کند.

در صورتی که تغییرات اساسی در داده‌ها ایجاد شود، ممکن است مدل یادگیری ماشین دیگر به درستی عمل نکند. در چنین شرایطی، مدل ممکن است به کمک انسانی نیاز داشته باشد تا بهبود یابد. در چنین شرایطی، تا زمانی که داده‌های بیشتری جمع‌آوری نشده، ممکن است لازم باشد که مدل را موقتاً از دسترس خارج کرد و به‌عنوان یک راهبرد پشتیبان، از قوانین تخصصی یا روش‌های ابتکاری استفاده کنید.

برای بازگرداندن مدل یادگیری ماشین به حالت فعال، روش‌های متفاوتی وجود دارد:

  • با استفاده از تمام داده‌های موجود قبل و بعد از تغییرات، مدل را دوباره آموزش دهید.
  • از تمام داده‌ها برای آموزش دوباره استفاده کنید، اما به داده‌های جدید وزن بیشتری اختصاص دهید تا مدل به الگوهای جدید تمرکز کند.
  • در صورتی که داده‌های جدید به اندازه کافی جمع‌آوری شده باشند، می‌توانید داده‌های گذشته را حذف کنید و تنها با داده های جدید مدل خود را آموزش دهید.

بازآموزش مدل یادگیری ماشین راهکار همیشگی برای بازگرداندن یک مدل دچار درهم ریختگی شده نیست. اگر تغییرات به وجود آمده به مدل آسیب رسانده‌ باشند، ممکن است نیاز به تغییر تنظیمات پارامترهای مدل باشد. راه‌حل‌های مختلفی مانند استفاده از استراتژی‌های تطبیق دامنه، ساختار ترکیبی از مدل‌های قبلی و جدید، افزودن منابع داده جدید یا تست ساختارهای کاملاً جدید وجود دارد.

گاهی اوقات لازم است دامنه مدل یادگیری ماشین یا فرآیند کسب و کار تغییر کند. ممکن است دوره پیش‌بینی کوتاه شود و یا مدل به صورت مکرر اجرا شود. به عنوان مثال، فروشندگان خرده‌فروشی که با تغییر در رفتار خرید مشتریان روبرو هستند، ممکن است از پیش‌بینی تقاضای هفتگی به روزانه تغییر مفهومی دهند. همچنین، به‌روزرسانی رابط کاربری و سایر تغییرات داخلی امری عادی در روند کسب و کار به نظر می رسد. درچنین شرایطی، صاحبان کسب و کار باید با سازندگان مدل‌های یادگیری ماشین هماهنگی لازم را داشته باشند تا به سرعت تغییرات لازم برای بازآموزی مدل انجام شود.

رانش داده و رانش مفهوم از جمله دلایلی هستند که می‌توانند به تنزل عملکرد مدل یادگیری ماشین منجر شوند.

رانش مفهومی در الگوی دوره‌ای

بعضی از پژوهشگران از اصطلاح “رانش مفهوم در الگوی دوره‌ای” برای توصیف تغییرات تکراری در مدل‌های پیش‌بینی کننده استفاده می‌کنند. به نظر می‌رسد که این مفهوم با “فصلی بودن” متفاوت است، چرا که فصلی بودن تنها تغییرات موقتی در تابع هدف را نشان می‌دهد. افرادی که در طول سال نسبتا کم خرید می‌کنند، ممکن است در “جمعه‌های سیاه” الگوی غیرعادی نشان دهند. همچنین، تعطیلی‌های بانکی ممکن است همه چیز را تحت تأثیر قرار دهد. تغییرات در الگوی دوره‌ای قابل انتظار است و ممکن است باعث کاهش کیفیت مدل یادگیری ماشین شود. بنابراین لازم است تا این دسته از تغییرات چرخه‌ای و رویدادهای خاص را در طراحی سیستم مدل‌سازی کنیم.

برخی از رانش های تکراری مانند رانش در الگوی دوره ای که هر هفته رخ می‌دهد، می‌تواند به صورت مداوم و برای مدت طولانی در داده‌های ما وجود داشته باشد و برای همین ممکن است اهمیت زیادی نداشته باشد. اما در مواردی که رانش جدیدی در داده‌ها به وجود آید، بهتر است یک سیستم نظارت بر مدل یادگیری ماشین داشته باشیم تا بتوانیم به سرعت به این تغییرات واکنش نشان دهیم و مدل را با داده‌های جدید آموزش دهیم تا کیفیت آن را حفظ کنیم. همچنین در برخی موارد، مثلاً در مسائل مالی، رانش‌های مکرر و تکراری ممکن است به علت وجود عوامل ناشناخته باشند و در نتیجه، نظارت بر مدل یادگیری ماشین و رفع رانش‌ها، اهمیت دارد.

الگوی خرید مصرف‌کنندگان در آخر هفته بیشتر است (رانش مفهوم دوره‌ای) و مدل پیش‌بینی آن را نشان می‌دهد

چگونه با رانش های غیر دقیق ( not-exactly drift) در تولید برخورد کنیم؟

با توجه به رانش غیر دقیق (not-exactly drift) در تولید، از چند روش می‌توان برای برخورد با آن استفاده کرد. اولین راهکار این است که به مدل یادگیری ماشین خود الگوهای دوره ای داده‌ها را یاد دهید. در صورتی که این موضوع برای اولین بار در فرآیند تولید رخ می دهد، می‌توانید از رویدادهای مشابه به عنوان نمونه استفاده کنید. به عنوان مثال، در صورتی که یک تعطیلی بانکی جدید اتفاق بیافتد ، شما می‌توانید از داده های یک تعطیلی دیگر که شباهت با شرایط کنونی شما دارد استفاده کنید. روش دیگر، استفاده از قوانین پس‌پردازش دستی یا ضرایب اصلاحی بر روی خروجی مدل است. در صورتی که می‌بینید مدل یادگیری ماشین شما با داده‌های جدید دچار رانش غیر دقیق شده است، می‌توانید از این روش برای تصحیح خروجی مدل استفاده کنید. در این روش، کارشناسان خبره در حوزه محصول تولیدی شما می‌توانند به شما در تعیین قوانین پس‌پردازش دستی یا ضرایب اصلاحی برای خروجی مدل کمک کنند.