Перейти к содержимому

Биллинг: базовый уровень

Эта страница для случая «хочу быстро понять, за что именно плачу».

Если считать только количество запросов, лёгкий и тяжёлый запросы стоят одинаково. Это несправедливо.

Поэтому биллинг смотрит на фактическую нагрузку: сколько вычислительных ресурсов занято, сколько данных доставлено пользователю и как долго хранятся файлы. Billable-метрики тарифицируются с первой единицы и затем покрываются usage credit плана.

Полноценный runtime для ресурсоёмких задач: SSR, API, бэкенд-операции.

  1. Process Compute (process_compute_cu_seconds) — единая CU-метрика для серверного runtime
  2. В расчёт входят фактическое CPU, фактическая память во времени, активное удержание процесса, streaming/WebSocket и discounted warm retention после freeze
  3. 1 CU соответствует 1 vCPU + 4 ГБ RAM. Низкая нагрузка с долгим удержанием процесса получает минимальный CU-floor, а CPU/RAM-heavy нагрузка считается по фактическому потреблению
  • Запросы, отклонённые до запуска пользовательского кода
  • Полностью статическая выдача без выполнения Runtime
  • Технические системные ретраи без пользовательского ответа

Лёгкий runtime для edge-сценариев: edge functions, middleware, ISR.

  1. Isolate Compute (isolate_compute_cu_seconds) — единая CU-метрика для edge runtime
  2. Процессорное время (cpu_seconds) — активное runtime CPU-like время, без ожидания внешнего I/O
  3. Время-памяти (memory_gb_seconds) — интеграл effective memory limit на время выполнения
  4. Внешние операции (subrequests) — обращения isolate к внешним сервисам: операции KV, HTTP fetch
  • ISR cache hits без выполнения isolate-кода
  • Внутренние health-check и telemetry вызовы
  • Системные ретраи без пользовательского ответа

Доставка статических файлов, хранение артефактов деплоя, оптимизация изображений.

  1. Egress (egress_gb) — объём данных, доставленных пользователю
  2. Storage (storage_gb_month) — хранение файлов деплоя
  3. Image transforms (image_transforms) — трансформации изображений (resize, конвертация формата)
  4. Origin fetch (origin_fetch_gb) — запросы к origin-серверу при cache miss
  • Внутренний service-to-service трафик платформы
  • Кэш-хиты, не создающие origin egress
  • Retry/rehydration без пользовательского ответа

Managed PostgreSQL с автомасштабированием, ветвлением баз данных и pay-as-you-go биллингом.

  1. CU-часы (cu_hours) — CU-weighted время работы сервера (cu_size × active_time). 1 час на 2 CU = 2 CU-часа
  2. Storage (storage_gb) — пиковый объём данных и WAL за расчётный период (стоимость включает written_data)
  3. Data transfer (data_transfer_gb) — объём данных, переданных между приложением и базой
  4. Базы данных (extra_databases) — количество активных БД за период
  5. Ветки БД (extra_branches) — количество активных веток за период
  • Время простоя (auto-suspend) — за suspended сервер compute не начисляется
  • Внутренние операции платформы (репликация, бэкапы)
  • Autoscale events (compute автоматически учитывает resize через CU-секунды)

Часть метрик считается вне конкретного runtime-слоя:

  1. build_minutes — время сборки проектов
  2. kv_storage_gb_month — billable объём KV хранилища во времени
  3. kv_read_million_units и kv_write_million_units — операции KV, нормализованные по размеру payload

Финальный счёт формируется по отдельным gross line items каждого слоя. Затем применяется included usage credit плана. Это делает расчёт прозрачным и проверяемым: всегда можно определить, какая метрика какого слоя дала основной вклад, какая часть покрыта credit и какая часть попала в extra usage.