✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
An LLM deployed in a real-time recommendation system is having noticeable slowdowns during peak usage times. What would be the most effective approach to solve this performance issue?