Un copilot de flota que funciona en demo y deriva en producción cuesta más que una mala previsión: cuesta la confianza del conductor. Basta con que un dispatcher pulse tres veces en una semana un ID de envío inventado — y el copilot está muerto, por muy precisa que sea su respuesta en el happy path. Trabajamos con plataformas de logística y telemática cuya IA ya está en producción y empieza a mostrar costuras: factura de tokens por encima del valor de la feature, IDs inventados en las trazas, latencias que espantan al operador.
La optimización de rutas es un problema determinista resuelto. Pedirle al modelo que «elija el mejor orden de paradas» malgasta tokens y deriva bajo carga. El modelo debería manejar la ambigüedad (peticiones del conductor, restricciones en lenguaje natural); un solver de rutas tipado maneja la estructura.
El modelo emite IDs de envío, IDs de transportista o nombres de conductor en elementos de UI. Cuando el ID no coincide, el botón está roto. El mismo patrón que en dispatch de hormigón: tomar los IDs del JSON del tool, nunca de la memoria del LLM.
Los productos de fleet-ops llaman cada vez más a varios proveedores (Anthropic para razonamiento, OpenAI para tool use, Gemini para visión). Una tabla de routing por niveles mapea el tipo de petición al modelo más barato que cumple la calidad. Se construye una vez, se re-benchmarkea cada trimestre; el ahorro típico es del 30–50% del gasto en LLM sin caída de calidad.
Posición actual del camión, estado del turno en curso, trabajos recientes — todo en la API de telemática. Una capa de prefill reemplaza tres a cinco turnos de Q&A por interacción.
Auditoría de coste de IA contra el framework de 7 capas — orquestación, disciplina de prompt, caching, selección de modelo, UX, infra, governance
Arquitectura híbrida que separa lo que posee el LLM (ambigüedad, lenguaje) de lo que poseen los solvers (routing, ETA, satisfacción de restricciones)
Controles de producción: observabilidad, governance de coste, kill-switches, rollback — las capacidades que la demo no necesitaba
Integración en UIs de dispatcher legacy mediante contratos de UI tipados, no widgets pegados encima
Harness de evaluación de tasa de fabricación como parte de la puerta de release