🧠
NPHardEval : Évaluer la logique des modèles via des classes de complexité
NPHardEval redéfinit l'évaluation des LLMs avec 900 questions algorithmiques contre l'overfitting.
·
3 min