See artikkel on masintõlke peegelartikkel, palun klõpsake siia, et hüpata algse artikli juurde.

Vaade: 1600|Vastuse: 1

[AI] (1) Avatud lähtekoodiga suurte mudelite edetabelid

[Kopeeri link]
Postitatud 2024-12-28 10:03:05 | | | |
Chatbot Arena LLMLoend:Hüperlingi sisselogimine on nähtav.

Chatbot Arena on avatud platvorm AI võrdluste ühiskasutuseks, mille on välja töötanud SkyLabi ja LMArena teadlased California ülikoolist Berkeley's. Üle 1 000 000 kasutajahäälega kasutab platvorm Bradley-Terry mudelit, et genereerida reaalajas edetabeleid, mis hindavad parimaid LLM-e ja tehisintellekti vestlusroboteid. Tehniliste detailide jaoks vaata meie artiklit.



LiveBenchHüperlingi sisselogimine on nähtav.

Võrdlusstandardid, mis on loodud spetsiaalselt LLM-ide jaoks, loodud katsekomplekti saastumise ja objektiivse hindamise silmas pidades.



SuperCLUEÜldine edetabel:Hüperlingi sisselogimine on nähtav.

CLUE positsioneerimine: Hiina keele mõistmise, ülesannete ja tööstuse paremaks teenindamiseks, kui üldise keelemudeli hindamise täiendamiseks, paranda infrastruktuuri hiina ülesannete ja standardiseeritud hindamiste kogumise, sorteerimise ja avaldamise kaudu ning lõpuks edendada hiina NLP arengut.



Open LLM edetabelHüperlingi sisselogimine on nähtav.

Võrdle suuri keelemudeleid avatud ja korduval viisil



Suurte mudelite hindamiskriteeriumide ja jõudluse võrdlusHüperlingi sisselogimine on nähtav.

See leht näitab mitme peavoolu suurmudeli jõudlust erinevatel hindamiskriteeriumidel, sealhulgas MMLU, GSM8K, HumanEval ja teised standardandmestikud. Aitame arendajatel ja uurijatel mõista erinevate suurte mudelite jõudlust erinevates ülesannetes reaalajas uuendatud hindamistulemuste kaudu. Kasutajad saavad valida kohandatud mudelite võrdlemise hindamistestidega, et kiiresti saada erinevate mudelite eeliseid ja puudusi praktilistes rakendustes.





Eelmine:Kopeeri blob-pilt lõikelauale
Järgmine:Nurkade eemaldamine Zone.js Avasta uusi tsoonita lahendusi
 Üürileandja| Postitatud 2024-12-28 10:20:27 |
Qwen on suurte keelemudelite ja suurte multimodaalsete mudelite seeria, mille on välja töötanud Alibaba Grupi Qweni meeskond.
Qwen2.5Hüperlingi sisselogimine on nähtav.

DeepSeek-V3 on ise arendatud MoE mudel, millel on 671B parameetrid, 37B aktiveeritud ja eeltreenitud 14,8T tokenitel.
DeepSeek-V3Hüperlingi sisselogimine on nähtav.

Zhipu on ettevõte, mis on arenenud Tsinghua Ülikooli arvutiteaduse osakonna tehnoloogilistest saavutustest
GLM-4-9BHüperlingi sisselogimine on nähtav.

Disclaimer:
Kõik Code Farmer Networki poolt avaldatud tarkvara, programmeerimismaterjalid või artiklid on mõeldud ainult õppimiseks ja uurimistööks; Ülaltoodud sisu ei tohi kasutada ärilistel ega ebaseaduslikel eesmärkidel, vastasel juhul kannavad kasutajad kõik tagajärjed. Selle saidi info pärineb internetist ning autoriõiguste vaidlused ei ole selle saidiga seotud. Ülaltoodud sisu tuleb oma arvutist täielikult kustutada 24 tunni jooksul pärast allalaadimist. Kui sulle programm meeldib, palun toeta originaaltarkvara, osta registreerimist ja saa paremaid ehtsaid teenuseid. Kui esineb rikkumist, palun võtke meiega ühendust e-posti teel.

Mail To:help@itsvse.com