Как мы снизили затраты на облачный LLM на 93% с помощью on-premise инференса