Question 1

El LLM lee payloads JSON completos de pedidos en cada turno

Accepted Answer

Los tools de pedidos pasados y de detalle de pedido devuelven JSON crudo de decenas de campos. El modelo los relee, los re-resume y quema tokens en cada turno posterior. Un normalizador del servidor recorta ese coste un ~75% por llamada de tool.

Question 2

Los botones y selectores de mapa los emite el LLM

Accepted Answer

La elección de elementos de UI — etiquetas de botón, arrays de opciones, cuándo renderizar el mapa — viaja por el modelo como instrucciones de tool y salidas de tool. Los tokens pagan el UI dos veces: para instruir al modelo y para reintentar cuando se salta un render obligatorio. Mover la emisión de UI a código determinista ahorra tokens y hace los IDs inventados estructuralmente imposibles.

Question 3

El flujo de repetición vuelve a preguntar datos que el sistema ya tiene

Accepted Answer

Tamaño de carga, espaciado de camiones, cantidad, dirección — todo en la tabla de pedidos pasados. Una repetición bien diseñada los rellena en el servidor en un paso; una ingenua los convierte en cuatro preguntas de seguimiento y cuatro turnos extra de LLM.

Question 4

El system prompt carga reglas que el código podría imponer

Accepted Answer

Los prompts de dispatch típicos cargan un 40–60% de su contenido en reglas que la aplicación que lo rodea podría imponer de forma determinista. Cada turno paga esas reglas en tokens. Quitarlas es la victoria estructural más rápida.

IA para software de dispatch de hormigón