Google DeepMind Quantification extrême LLM : optimisation en 1.58 bits Optimise les modèles de langage à grande échelle avec une précision de seulement 1.58 bits : le futur de l'efficacité computationnelle. mars 30, 2026 · 3 min