Cómo redujimos los costes de LLM en la nube un 93% con inferencia on-premise