Сократили ежемесячные расходы на аналитическое видеонаблюдение, перенёсши инференс моделей vision с облака на on-prem-кластер с GPU.

Сеть объектов с системой видеонаблюдения (ритейл, склады, производство), использующая облачный сервис аналитики видео.
Собрали статистику: число камер, fps, разрешение, часы пиковой нагрузки, текущие расходы в облаке
Оценили варианты железа: одиночный сервер с несколькими GPU, несколько узлов меньшей мощности, гибрид (часть потоков остаётся в облаке)
Выбрали и спроектировали on-prem-кластер под нужные модели vision: рассчитали необходимое количество GPU, VRAM, storage, сеть; заложили резерв для роста
Организовали поэтапную миграцию: сначала часть камер, параллельный прогон облако/on-prem; затем полное переключение с возможностью fallback
Настроили мониторинг и алерты по производительности и качеству
Разберём вашу задачу и предложим оптимальное решение