Ez a cikk egy tükör gépi fordítás, kérjük, kattintson ide, hogy ugorjon az eredeti cikkre.

Nézet: 1600|Válasz: 1

[AI] (1) Nyílt forráskódú nagy modellrangok

[Linket másol]
Közzétéve: 2024-12-28, 10:03:05 | | | |
Chatbot Arena LLMLista:A hiperlink bejelentkezés látható.

A Chatbot Arena egy nyílt platform az AI benchmarking közösségi megkeresésére, amelyet a Kaliforniai Egyetem Berkeley SkyLab és LMArena kutatói fejlesztettek ki. Több mint 1 000 000 felhasználói szavazattal a platform a Bradley-Terry modellt használja valós idejű ranglisták generálására, amelyek a legjobb LLM-eket és AI chatbotokat sorolják. A technikai részletekért olvasd a tanulmányunkat.



LiveBenchA hiperlink bejelentkezés látható.

Kifejezetten LLM-ek számára tervezett benchmarkok, a tesztkészlet szennyeződését és objektív értékelést szem előtt tartva.



SuperCLUEÁltalános ranglistá:A hiperlink bejelentkezés látható.

TIPP pozicionálás: A kínai nyelv megértésének jobb kiszolgálása érdekében feladatok és az ipar számára, mint az általános nyelvi modell értékelésének kiegészítése, javítsuk az infrastruktúrát a kínai feladatok és szabványosított értékelések gyűjtésével, válogatásával és publikálásával, és végső soron elősegítsék a kínai NLP fejlesztését.



Open LLM ranglistaA hiperlink bejelentkezés látható.

Hasonlítsuk össze a nagy nyelvi modelleket nyíltan és ismételhető módon



A nagy modell értékelési benchmarkok és teljesítmény összehasonlításaA hiperlink bejelentkezés látható.

Ez az oldal több mainstream nagy modell teljesítményét mutatja be különböző értékelési benchmarkokon, beleértve az MMLU-t, GSM8K-t, HumanEval-t és más szabványos adathalmazokat. Segítünk fejlesztőknek és kutatóknak megérteni a különböző nagy modellek teljesítményét különböző feladatokban valós időben, frissített értékelési eredmények révén. A felhasználók választhatják, hogy egyedi modelleket hasonlítanak össze értékelési benchmarkokkal, hogy gyorsan megkapják a különböző modellek előnyeit és hátrányait gyakorlati alkalmazásokban.





Előző:Másold le a folb képet a clipboardra
Következő:Szögeltávolítás Zone.js Fedezze fel az új zóna nélküli megoldásokat
 Háziúr| Közzétéve: 2024-12-28 10:20:27 |
A Qwen egy sor nagy nyelvi és nagy multimodális modellekből, amelyeket az Alibaba Group Qwen csapata fejlesztett ki.
Qwen2.5A hiperlink bejelentkezés látható.

A DeepSeek-V3 egy saját fejlesztésű MoE modell, amely 671B paraméterekkel rendelkezik, 37B aktiválva, és előre betanítva 14,8T tokenekre.
DeepSeek-V3A hiperlink bejelentkezés látható.

A Zhipu egy olyan vállalat, amely a Tsinghua Egyetem Számítástechnikai Tanszékének technológiai eredményeiből alakult ki
GLM-4-9BA hiperlink bejelentkezés látható.

Lemondás:
A Code Farmer Network által közzétett összes szoftver, programozási anyag vagy cikk kizárólag tanulási és kutatási célokra szolgál; A fenti tartalmat nem szabad kereskedelmi vagy illegális célokra használni, különben a felhasználók viselik az összes következményet. Az oldalon található információk az internetről származnak, és a szerzői jogi vitáknak semmi köze ehhez az oldalhoz. A fenti tartalmat a letöltés után 24 órán belül teljesen törölni kell a számítógépéről. Ha tetszik a program, kérjük, támogassa a valódi szoftvert, vásároljon regisztrációt, és szerezzen jobb hiteles szolgáltatásokat. Ha bármilyen jogsértés történik, kérjük, vegye fel velünk a kapcsolatot e-mailben.

Mail To:help@itsvse.com