Бетон — один из самых недружелюбных к AI процессов. Заказ должен лечь на реальный завод, реальный миксер, реального водителя, реальное окно заливки. Выдуманный номер тикета или неправильный объём — это не «галлюцинация», это сбой логистики, который ломает целую смену. Мы довели production-копилот для американского SaaS-диспетчера бетона с 75K токенов на диалог до меньше 26K и полностью убрали класс ошибок «выдуманные ID». Модель не меняли.
Tool-ы прошлых заказов и деталей заказа возвращают сырой JSON из десятков полей. Модель перечитывает, пересуммирует и жжёт токены на каждом последующем ходу. Тонкий серверный нормализатор срезает эту стоимость примерно на 75% на вызов tool-а.
Выбор UI-элементов — подписи кнопок, массивы опций, когда рендерить карту — проходит через модель как инструкции tool-ов и выводы tool-ов. Токены платят за UI дважды: чтобы поручить модели и чтобы повторить, когда она пропускает обязательный рендер. Перенос эмиссии UI в детерминированный код экономит токены и делает выдуманные ID структурно невозможными.
Объём загрузки, интервал между миксерами, количество, адрес — всё в таблице прошлых заказов. Хорошо спроектированный повторный заказ заполняет всё это на сервере в один шаг; наивный превращает их в четыре уточняющих вопроса и четыре лишних хода LLM.
Типичные dispatch-промпты несут 40–60% своего содержимого ради правил, которые окружающее приложение могло бы принудить детерминированно. Каждый ход платит за эти правила токенами. Их вырезание — самый быстрый структурный выигрыш.
Наблюдаемость токенов и стоимости на каждый вызов, чтобы любая регрессия была запросом, а не расследованием
Серверная стейт-машина для потока заказ / повторный заказ / перенос — LLM перестаёт рулить, рулит код
Слой нормализации выводов tool-ов — компактный текст заменяет сырой JSON, в 3–5× меньше токенов на вызов tool-а
Эмиссия UI убрана из модели — выдуманные ID и потерянные кнопки становятся структурно невозможны
Eval-harness, который следит за важным классом ошибок (выдуманные ID, дрейф количества, не тот завод) в каждом релизе