AI-копилоты для fleet- и логистических SaaS

AI-копилоты для fleet- и логистических SaaS

Fleet-копилот, который красиво работает в демо и уходит в дрейф в продакшене, стоит дороже, чем плохой прогноз — он стоит доверия водителей. Достаточно диспетчеру трижды за неделю кликнуть по выдуманному номеру рейса — и копилот мёртв, какой бы точной ни была его работа на happy-path. Мы работаем с логистическими и телематическими платформами, у которых AI уже в проде и начинает показывать швы: счёт за токены обгоняет ценность фичи, в трейсах — выдуманные ID, латентность прыгает.

Планирование маршрута делается внутри LLM, а не вокруг неё

Оптимизация маршрута — решённая детерминированная задача. Просить модель «выбрать лучший порядок остановок» — это трата токенов и дрейф под нагрузкой. Модель должна обрабатывать неоднозначность (запросы водителей, ограничения на естественном языке); типизированный solver маршрутов обрабатывает структуру.

Выдумывание статуса рейса

Модель эмитирует ID рейсов, ID перевозчиков или имена водителей в UI-элементах. Когда ID не совпадает, кнопка сломана. Тот же паттерн, что и в диспетчеризации бетона: брать ID из JSON tool-а, никогда из памяти LLM.

Мульти-вендорная оркестрация маршрутизации платит дважды

Fleet-ops продукты всё чаще вызывают несколько провайдеров (Anthropic для рассуждений, OpenAI для tool use, Gemini для зрения). Многоуровневая таблица маршрутизации сопоставляет тип запроса с самой дешёвой моделью, которая держит качество. Строится один раз, перебенчмаривается ежеквартально; типичная экономия — 30–50% LLM-расходов без падения качества.

Диспетчерский копилот задаёт вопросы, на которые телематический слой уже ответил

Текущая позиция миксера, статус текущей смены, недавние задания — всё в телематическом API. Слой prefill заменяет три–пять ходов Q&A на взаимодействие.

Что мы делаем

Аудит стоимости AI по 7-слойному фреймворку — оркестрация, дисциплина промпта, кэширование, выбор модели, UX, инфраструктура, governance

Гибридная архитектура, разделяющая то, чем владеет LLM (неоднозначность, язык), от того, чем владеют solver-ы (маршрутизация, ETA, удовлетворение ограничений)

Production-контроли: наблюдаемость, governance стоимости, kill-switch-и, откат — возможности, которые демо не требовало

Интеграция в старые диспетчерские UI через типизированные UI-контракты, а не bolt-on виджеты

Eval-harness частоты фабрикаций как часть релизного гейта

Подробнее