Cet article est un article miroir de traduction automatique, veuillez cliquer ici pour accéder à l’article original.

Vue: 1600|Répondre: 1

[IA] (1) Classements open source de grands modèles

[Copié le lien]
Publié le 28-12-2024 à 10:03:05 | | | |
Chatbot Arena LLMListe:La connexion hyperlientérée est visible.

Chatbot Arena est une plateforme ouverte pour le crowdsourcing de benchmarking IA, développée par des chercheurs de SkyLab et LMArena à l’Université de Californie à Berkeley. Avec plus de 1 000 000 de votes d’utilisateurs, la plateforme utilise le modèle Bradley-Terry pour générer des classements en temps réel qui classent les meilleurs LLM et chatbots IA. Pour les détails techniques, consultez notre article.



LiveBenchLa connexion hyperlientérée est visible.

Des benchmarks conçus spécifiquement pour les LLM, conçus en tenant compte de la contamination par ensemble de tests et d’une évaluation objective.



SuperCLUEClassement général :La connexion hyperlientérée est visible.

Positionnement CLUE : Afin de mieux servir la compréhension de la langue chinoise, les tâches et l’industrie, en complément de l’évaluation générale des modèles linguistiques, améliorez l’infrastructure en collectant, triant et publiant les tâches chinoises ainsi que les évaluations standardisées, et favorisez finalement le développement du NLP chinois.



Classement Open LLMLa connexion hyperlientérée est visible.

Comparez de grands modèles de langage de manière ouverte et reproductible



Comparaison des benchmarks d’évaluation de grands modèles et des performancesLa connexion hyperlientérée est visible.

Cette page montre la performance de plusieurs grands modèles grand public sur divers benchmarks d’évaluation, y compris MMLU, GSM8K, HumanEval et d’autres ensembles de données standards. Nous aidons les développeurs et chercheurs à comprendre la performance de différents grands modèles dans diverses tâches grâce à des résultats d’évaluation mis à jour en temps réel. Les utilisateurs peuvent choisir de comparer des modèles personnalisés avec des benchmarks d’évaluation afin d’obtenir rapidement les avantages et inconvénients de différents modèles dans des applications pratiques.





Précédent:Copiez l’image du blob dans le presse-papiers
Prochain:Suppression angulaire Zone.js Explorez de nouvelles solutions sans zone
 Propriétaire| Publié le 28-12-2024 à 10:20:27 |
Qwen est une série de grands modèles de langage et de grands modèles multimodaux développés par l’équipe Qwen du groupe Alibaba.
Qwen2.5La connexion hyperlientérée est visible.

DeepSeek-V3 est un modèle MoE auto-développé avec des paramètres 671B, 37B activés, et pré-entraîné sur des tokens 14.8T.
DeepSeek-V3La connexion hyperlientérée est visible.

Zhipu est une entreprise transformée par les réalisations technologiques du département d’informatique de l’Université Tsinghua
GLM-4-9BLa connexion hyperlientérée est visible.

Démenti:
Tous les logiciels, supports de programmation ou articles publiés par Code Farmer Network sont uniquement destinés à l’apprentissage et à la recherche ; Le contenu ci-dessus ne doit pas être utilisé à des fins commerciales ou illégales, sinon les utilisateurs assumeront toutes les conséquences. Les informations sur ce site proviennent d’Internet, et les litiges de droits d’auteur n’ont rien à voir avec ce site. Vous devez supprimer complètement le contenu ci-dessus de votre ordinateur dans les 24 heures suivant le téléchargement. Si vous aimez le programme, merci de soutenir un logiciel authentique, d’acheter l’immatriculation et d’obtenir de meilleurs services authentiques. En cas d’infraction, veuillez nous contacter par e-mail.

Mail To:help@itsvse.com