Šis raksts ir mašīntulkošanas spoguļraksts, lūdzu, noklikšķiniet šeit, lai pārietu uz oriģinālo rakstu.

Skats: 1600|Atbildi: 1

[AI] (1) Atvērtā koda lielo modeļu klasifikācija

[Kopēt saiti]
Publicēts 2024-12-28 10:03:05 | | | |
Čatbots Arēna LLMSaraksts:Hipersaites pieteikšanās ir redzama.

Chatbot Arena ir atvērta platforma pūļa resursu AI salīdzinošajai novērtēšanai, ko izstrādājuši SkyLab un LMArena pētnieki Kalifornijas universitātē Bērklijā. Ar vairāk nekā 1 000 000 lietotāju balsīm platforma izmanto Bredlija-Terija modeli, lai izveidotu reāllaika līderu sarakstus, kuros tiek vērtēti labākie LLM un AI tērzēšanas roboti. Lai iegūtu tehnisku informāciju, skatiet mūsu dokumentu.



LiveBenchHipersaites pieteikšanās ir redzama.

Etaloni, kas īpaši izstrādāti LLM, izstrādāti, ņemot vērā testa kopas piesārņojumu un objektīvu novērtējumu.



SuperCLUEKopējais līderu saraksts:Hipersaites pieteikšanās ir redzama.

CLUE pozicionēšana: Lai labāk kalpotu ķīniešu valodas izpratnei, uzdevumiem un nozarei, kā papildinājumu vispārējai valodas modeļa novērtēšanai, uzlabot infrastruktūru, apkopojot, šķirojot un publicējot ķīniešu uzdevumus un standartizētus novērtējumus, un galu galā veicināt ķīniešu NLP attīstību.



Atvērt LLM līderu sarakstuHipersaites pieteikšanās ir redzama.

Salīdziniet lielus valodu modeļus atklātā un atkārtojamā veidā



Lielo modeļu novērtēšanas kritēriju un veiktspējas salīdzinājumsHipersaites pieteikšanās ir redzama.

Šajā lapā ir parādīta vairāku galveno lielo modeļu veiktspēja dažādos novērtēšanas etalonos, tostarp MMLU, GSM8K, HumanEval un citās standarta datu kopās. Mēs palīdzam izstrādātājiem un pētniekiem izprast dažādu lielu modeļu veiktspēju dažādos uzdevumos, izmantojot reāllaika atjauninātus novērtēšanas rezultātus. Lietotāji var izvēlēties salīdzināt pielāgotus modeļus ar novērtēšanas etaloniem, lai ātri iegūtu dažādu modeļu priekšrocības un trūkumus praktiskos pielietojumos.





Iepriekšējo:BLOB attēla kopēšana starpliktuvē
Nākamo:Leņķa noņemšana Zone.js Izpētiet jaunus bezzonu risinājumus
 Saimnieks| Publicēts 2024-12-28 10:20:27 |
Qwen ir lielu valodu modeļu un lielu multimodālu modeļu sērija, ko izstrādājusi Alibaba Group Qwen komanda.
Qwen2.5Hipersaites pieteikšanās ir redzama.

DeepSeek-V3 ir pašizstrādāts MoE modelis ar 671B parametriem, 37B aktivizēts un iepriekš apmācīts uz 14.8T žetoniem.
DeepSeek-V3Hipersaites pieteikšanās ir redzama.

Zhipu ir uzņēmums, kas pārveidots no Tsinghua universitātes Datorzinātņu katedras tehnoloģiskajiem sasniegumiem
GLM-4-9BHipersaites pieteikšanās ir redzama.

Atruna:
Visa programmatūra, programmēšanas materiāli vai raksti, ko publicē Code Farmer Network, ir paredzēti tikai mācību un pētniecības mērķiem; Iepriekš minēto saturu nedrīkst izmantot komerciāliem vai nelikumīgiem mērķiem, pretējā gadījumā lietotājiem ir jāuzņemas visas sekas. Informācija šajā vietnē nāk no interneta, un autortiesību strīdiem nav nekāda sakara ar šo vietni. Iepriekš minētais saturs ir pilnībā jāizdzēš no datora 24 stundu laikā pēc lejupielādes. Ja jums patīk programma, lūdzu, atbalstiet oriģinālu programmatūru, iegādājieties reģistrāciju un iegūstiet labākus oriģinālus pakalpojumus. Ja ir kādi pārkāpumi, lūdzu, sazinieties ar mums pa e-pastu.

Mail To:help@itsvse.com