Тази статия е огледална статия за машинен превод, моля, кликнете тук, за да преминете към оригиналната статия.

Изглед: 1600|Отговор: 1

[AI] (1) Open Source класации на големи модели

[Копирай линк]
Публикувано на 28.12.2024 10:03:05 | | | |
Чатбот Арена LLMСписък:Входът към хиперлинк е видим.

Chatbot Arena е отворена платформа за краудсорсинг на AI бенчмаркинг, разработена от изследователи в SkyLab и LMArena в Калифорнийския университет, Бъркли. С над 1 000 000 гласа от потребители, платформата използва модела Bradley-Terry, за да генерира класации в реално време, които класират най-добрите LLM и AI чатботове. За технически подробности разгледайте нашата статия.



LiveBenchВходът към хиперлинк е видим.

Бенчмаркове, проектирани специално за LLM, с оглед на замърсяването на тестовите комплекти и обективната оценка.



SuperCLUEОбща класация:Входът към хиперлинк е видим.

CLUE позициониране: За да се обслужва по-добре разбирането на китайски език, задачите и индустрията, като допълнение към общата оценка на езиковите модели, да се подобри инфраструктурата чрез събиране, сортиране и публикуване на китайски задачи и стандартизирани оценки, и в крайна сметка да се насърчи развитието на китайския езиков език.



Open LLM класацияВходът към хиперлинк е видим.

Сравнявайте големите езикови модели по открит и повторяем начин



Сравнение на бенчмаркове за оценка на големи модели и представянеВходът към хиперлинк е видим.

Тази страница показва представянето на множество големи основни модели по различни оценъчни тестове, включително MMLU, GSM8K, HumanEval и други стандартни набори от данни. Помагаме на разработчиците и изследователите да разберат представянето на различни големи модели в различни задачи чрез актуализирани резултати от оценката в реално време. Потребителите могат да изберат да сравняват персонализирани модели с оценъчни тестове, за да получат бързо предимствата и недостатъците на различните модели в практическите приложения.





Предишен:Копирай изображението на петната в клипборда
Следващ:Ъглово премахване Zone.js Изследвайте нови беззонни решения
 Хазяин| Публикувано на 28.12.2024 10:20:27 |
Qwen е серия от големи езикови модели и големи мултимодални модели, разработени от екипа Qwen на Alibaba Group.
Qwen2.5Входът към хиперлинк е видим.

DeepSeek-V3 е саморазработен MoE модел с 671B параметри, активиран 37B и предварително обучен на 14.8T токени.
DeepSeek-V3Входът към хиперлинк е видим.

Zhipu е компания, трансформирана от технологичните постижения на Катедрата по компютърни науки на Университета Цинхуа
GLM-4-9BВходът към хиперлинк е видим.

Отричане:
Целият софтуер, програмни материали или статии, публикувани от Code Farmer Network, са само за учебни и изследователски цели; Горното съдържание не трябва да се използва за търговски или незаконни цели, в противен случай потребителите ще понесат всички последствия. Информацията на този сайт идва от интернет, а споровете за авторски права нямат нищо общо с този сайт. Трябва напълно да изтриете горното съдържание от компютъра си в рамките на 24 часа след изтеглянето. Ако ви харесва програмата, моля, подкрепете оригинален софтуер, купете регистрация и получете по-добри услуги. Ако има нарушение, моля, свържете се с нас по имейл.

Mail To:help@itsvse.com