Sélections d'outils

4 excellentes IA open-source chinoises (Octobre 2025)

Ces dernières années, la Chine a franchi des étapes importantes dans le développement de modèles d’intelligence artificielle open-source de grande qualité. Voici quatre exemples remarquables, avec ce que les observateurs ou benchmarks en tirent comme points forts et faiblesses.


1. GLM-4.5 (Z.ai / Zhipu AI)

Ce que c’est
GLM-4.5 est un modèle large (large language model) open-source développé par Zhipu AI (réputé aussi sous le nom Z.ai). Il utilise une architecture Mixture of Experts (MoE), ce qui permet d’activer uniquement certaines parties du réseau selon la tâche, optimisant ainsi efficacité et coût. Tech Times+2PR Newswire+2

Deux versions sont proposées :

  • la version « flagship » de ~ 355 milliards de paramètres PR Newswire+1,

  • et une version plus légère, « GLM-4.5-Air », de ~ 106 milliards de paramètres. news.omeganext.com+1

Points forts

  • Grande capacité de raisonnement, génération de code, et tâches d’agent (workflow, planification, etc.). GLM-4.5 intègre ces capacités de manière native. PR Newswire+2Global Times+2

  • Très bon rapport performance / coût : un des arguments avancés est que le modèle est beaucoup moins cher que certains modèles concurrents, y compris occidentaux. Global Times+1

  • Bonne vitesse de génération de texte, prix réduit pour les utilisateurs ou entreprises, et licence open-source permettant personnalisation ou déploiement local. PR Newswire+1

Limites / critiques / défis

  • Infrastructure nécessaire assez forte malgré la version « Air » : pour certaines tâches complexes, le hardware requis reste élevé.

  • Questions de sécurité / de régulation : comme tous les modèles chinois, il y a des préoccupations concernant la modération, les biais, et la conformité aux réglementations locales.

  • Moins d’expérience utilisateur (ou moins d’applications “grand public”) en dehors de la Chine comparé à certains modèles américains, donc certaines fonctions (multimodalité, outils externes) sont encore en développement.


2. DeepSeek (R1, V3, etc.)

Ce que c’est

DeepSeek est une startup chinoise qui a publié plusieurs modèles open-source ou partiellement open-source, dont DeepSeek-R1 et DeepSeek-V3. Leurs modèles MoE et architectures d’attention spécifique sont conçus pour être efficaces, compétitifs aux benchmarks internationaux, mais avec des coûts de calcul plus modérés. asianfin.com+3arXiv+3Reuters+3

Points forts

  • Très bons résultats en dialogue multi-tour, raisonnement, compréhension de contexte, ce qui le rend fort pour les usages interactifs. South China Morning Post+1

  • Moins coûteux à entraîner que certains modèles occidentaux, ce qui le rend plus accessible à des entreprises ou chercheurs avec moins de ressources. Reuters+1

  • Transparence dans les publications techniques (rapports, blog, etc.), et engagement clair vers l’open source (code, infrastructures, etc.). Reuters+1

Limites / critiques / défis

  • Sécurité et alignement : plusieurs études montrent que certains modèles DeepSeek, notamment R1, présentent des vulnérabilités (par exemple quand on leur présente des “prompts dangereux”). arXiv+2arXiv+2

  • Censure / limitations réglementaires possibles dans la version utilisée via les serveurs officiels, ou dans la pratique, selon les lois chinoises sur le contenu. Cela peut restreindre l’ouverture selon l’endroit ou la version employée. Reddit+1

  • Déploiement local ou hors Chine : bien que le modèle soit open source, certaines dépendances ou serveurs d’inférence peuvent rester centralisés, ce qui pose des questions sur la latence, la protection des données ou la souveraineté.


3. Qwen (Alibaba, série Qwen3, Qwen-Image etc.)

Ce que c’est

Qwen est la série de modèles d’Alibaba / Tongyi Qianwen. On distingue plusieurs déclinaisons :

  • Qwen3 : nouvelle génération, avec des variantes selon taille / architecture (MoE, etc.), conçue pour meilleurs raisonnements, suivi d’instructions, usages multilingues. CNBC

  • Qwen-Image : modèle dédié génération d’images avec rendu de texte intégré, très bon rendu du texte en chinois et anglais et dans des dispositions complexes. qwenimages.com

Points forts

  • Polyvalence : Qwen3 couvre de nombreuses tailles de modèles, ce qui permet de choisir selon ressources disponibles. CNBC

  • Bonne capacité multilingue, bons benchmarks sur des tâches de raisonnement, ce qui le place comme concurrent sérieux des modèles occidentaux. CNBC+1

  • Qwen-Image particulièrement apprécié pour l’intégration native du texte dans les images, ce qui est souvent un point faible des modèles “text-to-image”. Le rendu textuel (chinois / anglais) est jugé à “niveau commercial” dans plusieurs benchmarks. qwenimages.com

Limites / critiques / défis

  • Tous les modèles Qwen ne sont pas nécessairement “full open source” selon ce que l’on entend : certains poids peuvent ne pas être accessibles publiquement, ou certaines versions avancées ne sont disponibles que via API ou Cloud. CometAPI+1

  • Taille & coût : les versions les plus performantes restent gourmandes en ressources, coût élevé en matériel ou infrastructure.

  • Comme pour les autres, questions de modération, biais, sécurité surtout dans les versions déployées “grand public”.


4. Kimi K2 (Moonshot AI)

Ce que c’est

Kimi K2 est un modèle open-source développé par Moonshot AI, startup soutenue par Alibaba. Il est apparu comme l’un des meilleurs modèles dans les classements d’open source, notamment selon la plateforme LMArena. en.tmtpost.com+3South China Morning Post+3asianfin.com+3

Points forts

  • Très bon classement global : dans les comparaisons “modèles open source vs open source / vs modèles commerciaux”, il se place en tête ou près du sommet. South China Morning Post+1

  • Fortes performances aussi en code / tâches de programmation. Alibaba indique que Kimi K2 a surpassé Claude Opus 4 sur certains benchmarks, et mieux que GPT-4.1 “orienté code” selon certains metrics. CNBC

  • Coût relativement bas par rapport à certains modèles fermés ; cela peut le rendre intéressant pour les développeurs ou entreprises ne souhaitant pas payer de fortes licences. CNBC

Limites / critiques / défis

  • Comme toujours, les versions les plus performantes exigent des ressources importantes. Si on veut en tirer le meilleur, il faut un bon GPU / infrastructure.

  • Moins de recul que les modèles plus anciens pour certaines tâches très spécialisées ou très exigeantes.

  • Potentiellement des contraintes légales ou de sécurité selon le lieu de déploiement (modération, conformité, etc.).


Comparaison et conclusion

Modèle Meilleure force distinctive Idéal pour… À surveiller / lorsqu’on utilise (risques)
GLM-4.5 Intégration du code, raisonnement, agent native, MoE → efficacité forte Entreprises ou projets qui veulent un modèle polyvalent, puissant, mais avec contrôle (open source) Coût/ressources, assurer modération, conformité, potentiellement complexité de déploiement
DeepSeek Raisonnement, conversation multi-tour, bon rapport performance/coût Chatbots, assistants interactifs, projets de recherche avec budget limité Sécurité / vulnérabilités, censure ou biais implicites, dépendance aux données chinoises pour certains usages
Qwen Multimodalité, images / texte, rendu natif du texte dans images, bons benchmarks multilingues Applications visuelles, génération d’images à texte, usages multilingues, outils de productivité Poids des modèles, certaines versions fermées, contrôle de contenu et biais, ressources hardware élevées
Kimi K2 Performance de pointe en open source, très compétitif dans le code et benchmarks globaux Développeurs, startups, usages intensifs de code, R&D Ressources, documentation / support selon usage, vérification de sécurité / fiabilité pour usage critique

Pourquoi ces modèles sont “excellents” (et qu’est-ce qu’on attend)

  • Ils montrent que le monde open source ne rime plus seulement avec “modèles plus petits ou de laboratoire” : ces modèles chinois rivalisent avec les meilleurs modèles commerciaux dans beaucoup de benchmarks.

  • Ils ouvrent des possibilités pour les utilisateurs hors des grandes plateformes, pour ceux qui veulent héberger localement, ou adapter fortement le modèle.

  • Mais l’excellence technique ne résout pas tout : la sécurité, l’éthique, la modération, les biais, la conformité légale sont des éléments déterminants qui peuvent faire la différence selon le contexte.