Nouvelle gestion de coût et fiabilité pour développeurs avec API Gemini. Flex réduit coût de 50%, Priority garantit fiabilité pour applications critiques.
Google vient de dévoiler deux nouveaux niveaux de service pour son API Gemini : Flex et Priority. Ces options permettent aux développeurs de mieux gérer les coûts et la fiabilité, le tout via une interface unifiée.
Flex Inference : Réduction de coûts sans compromis sur la synchronisation
Flex Inference est une nouvelle option optimisée pour réduire les coûts de 50%. Elle est idéale pour les tâches tolérantes à la latence qui ne nécessitent pas de réponses instantanées. Contrairement à l’API Batch asynchrone, Flex utilise des points de terminaison synchrones familiers, simplifiant ainsi la gestion des requêtes.
Priority Inference : Garantir la fiabilité des applications critiques
Priority Inference offre un niveau de fiabilité accru à un tarif premium, assurant que les flux de trafic les plus critiques ne sont pas interrompus même pendant les pics d’utilisation. Les requêtes qui dépassent la limite Priority sont automatiquement servies au niveau Standard, garantissant ainsi la continuité des opérations.
Flex et Priority de Gemini permettent une gestion fine des coûts et de la fiabilité : Flex pour des économies avec une latence accrue, Priority pour une fiabilité maximale des applications critiques.
Intégration simplifiée pour les développeurs
Grâce à la configuration du paramètre service_tier dans vos requêtes, vous pouvez rapidement adopter ces nouveaux niveaux de service. Ces options sont disponibles pour les requêtes GenerateContent et Interactions API, rendant la transition fluide pour les projets en cours.
« Maîtriser la balance entre coûts et performance est désormais accessible à tous via les nouvelles offres de Gemini. »
Lucia Loher, Product Manager, Gemini API
Implications pour les entreprises
En permettant aux développeurs de choisir entre Flex et Priority, Google offre une flexibilité qui peut transformer la façon dont les entreprises gèrent leurs opérations numériques. Que vous ayez besoin de simulations de recherche à grande échelle ou d’un support client en temps réel, ces outils offrent des solutions ajustées à vos besoins.
Avec ces nouvelles fonctionnalités, Google redéfinit la façon dont les développeurs et entreprises perçoivent l’optimisation des API. Il est temps de s’adapter et de profiter des gains économiques et opérationnels offerts par Flex et Priority.