Quantification dans Diffusers : rendre l’IA plus accessible
Réduire la taille des modèles de diffusion avec la quantification tout en préservant la qualité des images.
·
3 min
Réduire la taille des modèles de diffusion avec la quantification tout en préservant la qualité des images.
Découvrez comment accélérer l'inférence LoRA avec Flux, jusqu'à 2,3x plus rapide, grâce aux optimisations Diffusers et PEFT.