GPUStack 0.2: Heterogeneous Distributed Inference – GPUStack.ai GPUStack é uma plataforma de código aberto projetada para orquestrar clusters de GPU heterogêneos, facilitando a execução de Modelos de Linguagem Grande (LLMs) em hardware variado. A partir da versão 0.2, o GPUStack introduziu suporte aprimorado para inferência distribuída heterogênea, permitindo agrupar diferentes tipos de GPUs (mesmo de fabricantes distintos) e CPUs para rodar modelos de IA de forma otimizada https://gpustack.ai/introducing-gpustack-0-2/ #CodigoAberto #ComputacaoHeterogenea #selfhosted