Runtime-биллинг: практический уровень
Эта страница для команды, которой нужно не только понимать модель, но и управлять стоимостью в продакшене.
Как читать Usage
Заголовок раздела «Как читать Usage»В Usage отслеживайте минимум 4 базовые метрики Runtime:
invocationscpu_secondsmemory_gb_secondsresidency_seconds
Если у вас есть streaming/WebSocket, добавьте:
streaming_secondswebsocket_connection_seconds
Смотрите не только абсолютные значения, но и скорость роста по дням.
Что сильнее всего влияет на стоимость
Заголовок раздела «Что сильнее всего влияет на стоимость»| Драйвер | Что увеличивает расход | Что обычно помогает |
|---|---|---|
invocations | лишние фоновые вызовы, дубли запросов | кэш, дедупликация, rate limiting |
cpu_seconds | тяжёлые вычисления на запрос | precompute, профилирование, оптимизация hot-path |
memory_gb_seconds | большие объекты и долгие операции | уменьшение рабочей выборки, потоковая обработка |
residency_seconds | избыточное удержание готовых экземпляров | корректные idle/pool настройки, авто-пауза |
streaming_seconds | очень долгие стримы | сокращение времени сессии, раннее завершение |
websocket_connection_seconds | долгоживущие соединения без активности | таймауты неактивности, heartbeat-политика |
Практический цикл контроля затрат
Заголовок раздела «Практический цикл контроля затрат»- Зафиксируйте бюджет и лимиты Runtime на месяц.
- Настройте предупреждения на 50%, 80% и 100% бюджета.
- Ежедневно проверяйте тренд по
cpu_secondsиmemory_gb_seconds. - При всплеске делайте разбор по проектам, окружениям и релизам.
- После оптимизаций сверяйте эффект на 7-дневном окне.
- Для защиты от перерасхода используйте Hard Cap.
Как расследовать резкий рост счёта
Заголовок раздела «Как расследовать резкий рост счёта»- Проверьте, какая метрика дала основной вклад в рост.
- Сопоставьте рост с релизами, миграциями и маркетинговыми кампаниями.
- Посмотрите, не выросла ли длительность единичного выполнения.
- Проверьте burst-активность и повторные вызовы.
- Если рост необъясним, передайте период и разрезы в поддержку.
Как работать с Hard Cap
Заголовок раздела «Как работать с Hard Cap»Hard Cap ограничивает максимальные overage-расходы за период.
- До порога сервис работает штатно.
- На пороге срабатывает защитный режим (ограничения ресурсоёмких операций).
- После пересечения порога нужен следующий расчётный период или ручная корректировка политики.