Tämä artikkeli on konekäännöksen peiliartikkeli, klikkaa tästä siirtyäksesi alkuperäiseen artikkeliin.

Näkymä: 1600|Vastaus: 1

[AI] (1) Avoimen lähdekoodin suurten mallien rankingit

[Kopioi linkki]
Julkaistu 2024-12-28 10:03:05 | | | |
Chatbot Arena LLMLista:Hyperlinkin kirjautuminen on näkyvissä.

Chatbot Arena on avoin alusta tekoälyn vertailujen joukkoistamiseen, jonka ovat kehittäneet SkyLabin ja LMArenan tutkijat Kalifornian yliopistossa Berkeleyssä. Yli 1 000 000 käyttäjääänellä alusta käyttää Bradley-Terry-mallia luodakseen reaaliaikaisia tulostauluja, jotka rankkaavat parhaat LLM:t ja tekoälychatbotit. Teknisiä tietoja löydät artikkelistamme.



LiveBenchHyperlinkin kirjautuminen on näkyvissä.

Vertailuarvot, jotka on suunniteltu erityisesti LLM-malleille, suunniteltu testisarjan saastumista ja objektiivista arviointia silmällä pitäen.



SuperVIHJEKokonaistulostaulu:Hyperlinkin kirjautuminen on näkyvissä.

VIHJEIDEN sijoittaminen: Kiinan kielen ymmärryksen, tehtävien ja teollisuuden parantamiseksi, yleisen kielimallin arvioinnin täydentämiseksi, infrastruktuurin parantamiseksi keräämällä, lajittelemalla ja julkaisemalla kiinalaisia tehtäviä ja standardoituja arviointeja, ja lopulta edistämällä kiinalaisen NLP:n kehitystä.



Open LLM -tulostaulukkoHyperlinkin kirjautuminen on näkyvissä.

Vertaa suuria kielimalleja avoimesti ja toistettavalla tavalla



Suurten mallien arviointikriteerien ja suorituskyvyn vertailuHyperlinkin kirjautuminen on näkyvissä.

Tämä sivu näyttää useiden valtavirran suurten mallien suorituskyvyn erilaisissa arviointivertailuissa, mukaan lukien MMLU, GSM8K, HumanEval ja muut standardiaineistot. Autamme kehittäjiä ja tutkijoita ymmärtämään eri suurten mallien suorituskykyä eri tehtävissä reaaliaikaisesti päivitettyjen arviointitulosten avulla. Käyttäjät voivat verrata räätälöityjä malleja arviointivertailuihin saadakseen nopeasti eri mallien hyödyt ja haitat käytännön sovelluksissa.





Edellinen:Kopioi blob-kuva lehtiöön
Seuraava:Kulmapoisto Zone.js Tutustu uusiin vyöhykkeettömiin ratkaisuihin
 Vuokraisäntä| Julkaistu 2024-12-28 10:20:27 |
Qwen on sarja suuria kielimalleja ja suuria multimodaalisia malleja, jotka on kehittänyt Alibaba Groupin Qwen-tiimi.
Qwen2.5Hyperlinkin kirjautuminen on näkyvissä.

DeepSeek-V3 on itse kehittämä MoE-malli, jossa on 671B parametrit, 37B aktivoitu ja esikoulutettu 14,8T tokeneilla.
DeepSeek-V3Hyperlinkin kirjautuminen on näkyvissä.

Zhipu on yritys, joka on muuttunut Tsinghuan yliopiston tietojenkäsittelytieteen laitoksen teknologisista saavutuksista
GLM-4-9BHyperlinkin kirjautuminen on näkyvissä.

Vastuuvapauslauseke:
Kaikki Code Farmer Networkin julkaisemat ohjelmistot, ohjelmamateriaalit tai artikkelit ovat tarkoitettu vain oppimis- ja tutkimustarkoituksiin; Yllä mainittua sisältöä ei saa käyttää kaupallisiin tai laittomiin tarkoituksiin, muuten käyttäjät joutuvat kantamaan kaikki seuraukset. Tämän sivuston tiedot ovat peräisin internetistä, eikä tekijänoikeuskiistat liity tähän sivustoon. Sinun tulee poistaa yllä oleva sisältö kokonaan tietokoneeltasi 24 tunnin kuluessa lataamisesta. Jos pidät ohjelmasta, tue aitoa ohjelmistoa, osta rekisteröityminen ja hanki parempia aitoja palveluita. Jos rikkomuksia ilmenee, ota meihin yhteyttä sähköpostitse.

Mail To:help@itsvse.com