Šis straipsnis yra veidrodinis mašininio vertimo straipsnis, spauskite čia norėdami pereiti prie originalaus straipsnio.

Rodinys: 1600|Atsakyti: 1

[AI] (1) Atvirojo kodo didelių modelių reitingai

[Kopijuoti nuorodą]
Publikuota: 2024-12-28 10:03:05 | | | |
Chatbot Arena LLMSąrašas:Hipersaito prisijungimas matomas.

"Chatbot Arena" yra atvira sutelktinės dirbtinio intelekto lyginamosios analizės platforma, kurią sukūrė Kalifornijos universiteto Berklyje "SkyLab" ir "LMArena" tyrėjai. Turėdama daugiau nei 1 000 000 vartotojų balsų, platforma naudoja Bradley-Terry modelį, kad realiuoju laiku generuotų lyderių lenteles, kuriose reitinguojami geriausi LLM ir AI pokalbių robotai. Techninės informacijos rasite mūsų dokumente.



LiveBenchHipersaito prisijungimas matomas.

Etalonai, sukurti specialiai LLM, sukurti atsižvelgiant į bandymų rinkinio užterštumą ir objektyvų vertinimą.



SuperCLUEBendra lyderių lentelė:Hipersaito prisijungimas matomas.

CLUE pozicionavimas: Siekiant geriau aptarnauti kinų kalbos supratimą, užduotis ir pramonę, kaip bendro kalbos modelio vertinimo papildymą, pagerinti infrastruktūrą renkant, rūšiuojant ir skelbiant kinų užduotis ir standartizuotus vertinimus ir galiausiai skatinti kinų NLP plėtrą.



Atidarykite LLM lyderių lentelęHipersaito prisijungimas matomas.

Palyginkite didelius kalbos modelius atviru ir pakartojamu būdu



Didelių modelių vertinimo etalonų ir našumo palyginimasHipersaito prisijungimas matomas.

Šiame puslapyje rodomas kelių pagrindinių didelių modelių našumas įvairiuose vertinimo etalonuose, įskaitant MMLU, GSM8K, HumanEval ir kitus standartinius duomenų rinkinius. Mes padedame kūrėjams ir tyrėjams suprasti skirtingų didelių modelių našumą atliekant įvairias užduotis, realiuoju laiku atnaujindami vertinimo rezultatus. Vartotojai gali pasirinkti palyginti pasirinktinius modelius su vertinimo etalonais, kad greitai gautų skirtingų modelių privalumus ir trūkumus praktiniame taikyme.





Ankstesnis:BLOB vaizdo kopijavimas į mainų sritį
Kitą:Kampinis pašalinimas Zone.js Susipažinkite su naujais bezoniais sprendimais
 Savininkas| Publikuota: 2024-12-28 10:20:27 |
Qwen yra didelių kalbos modelių ir didelių multimodalinių modelių serija, kurią sukūrė "Alibaba Group" Qwen komanda.
Qwen2.5Hipersaito prisijungimas matomas.

DeepSeek-V3 yra savarankiškai sukurtas MoE modelis su 671B parametrais, 37B aktyvuotas ir iš anksto apmokytas 14.8T žetonais.
DeepSeek-V3Hipersaito prisijungimas matomas.

"Zhipu" yra įmonė, transformuota iš Tsinghua universiteto Informatikos katedros technologinių pasiekimų
GLM-4-9BHipersaito prisijungimas matomas.

Atsakomybės apribojimas:
Visa programinė įranga, programavimo medžiaga ar straipsniai, kuriuos skelbia Code Farmer Network, yra skirti tik mokymosi ir mokslinių tyrimų tikslams; Aukščiau nurodytas turinys negali būti naudojamas komerciniais ar neteisėtais tikslais, priešingu atveju vartotojai prisiima visas pasekmes. Šioje svetainėje pateikiama informacija gaunama iš interneto, o ginčai dėl autorių teisių neturi nieko bendra su šia svetaine. Turite visiškai ištrinti aukščiau pateiktą turinį iš savo kompiuterio per 24 valandas nuo atsisiuntimo. Jei jums patinka programa, palaikykite autentišką programinę įrangą, įsigykite registraciją ir gaukite geresnes autentiškas paslaugas. Jei yra kokių nors pažeidimų, susisiekite su mumis el. paštu.

Mail To:help@itsvse.com