Bu makale makine çevirisi ayna makalesidir, orijinal makaleye geçmek için lütfen buraya tıklayın.

Görünüm: 1600|Yanıt: 1

[AI] (1) Açık kaynak büyük model sıralamaları

[Bağlantıyı kopyala]
2024-12-28 10:03:05 tarihinde yayınlandı | | | |
Chatbot Arena LLMListe:Bağlantı girişi görünür.

Chatbot Arena, Kaliforniya Üniversitesi, Berkeley'deki SkyLab ve LMArena araştırmacıları tarafından geliştirilen, kitlesel kaynak yoluyla yapay zeka kıyaslama için açık bir platformdur. 1.000.000'den fazla kullanıcı oyuyla platform, Bradley-Terry modelini kullanarak en iyi LLM'leri ve yapay zeka sohbet botlarını sıralayan gerçek zamanlı liderlik tabloları oluşturuyor. Teknik detaylar için makalemize göz atın.



LiveBenchBağlantı girişi görünür.

LLM'ler için özel olarak tasarlanmış, test seti kirlenme ve nesnel değerlendirme göz önünde bulundurularak hazırlanmış kıyaslamalar.



Süper İLANGenel Liderlik Tablosu:Bağlantı girişi görünür.

İP Pozisyonları: Çince dili anlayışına, görevlere ve sektöre daha iyi hizmet vermek için, genel dil modeli değerlendirmesine ek olarak, Çince görevleri ve standartlaştırılmış değerlendirmeleri toplayarak ve sıralayıp yayımlayarak altyapıyı geliştirin ve nihayetinde Çin NLP'sinin gelişimini teşvik edin.



Açık LLM Liderlik TablosuBağlantı girişi görünür.

Büyük dil modellerini açık ve tekrarlanabilir şekilde karşılaştırın



Büyük model değerlendirme kıyaslamaları ve performansının karşılaştırılmasıBağlantı girişi görünür.

Bu sayfa, MMLU, GSM8K, HumanEval ve diğer standart veri setleri dahil olmak üzere çeşitli değerlendirme ölçütlerinde birden fazla ana akım büyük modelin performansını göstermektedir. Geliştiricilere ve araştırmacılara, farklı büyük modellerin çeşitli görevlerdeki performansını gerçek zamanlı güncellenmiş değerlendirme sonuçları aracılığıyla anlamalarına yardımcı oluyoruz. Kullanıcılar, farklı modellerin pratik uygulamalardaki avantaj ve dezavantajlarını hızlıca elde etmek için özel modelleri değerlendirme kıyaslamalarıyla karşılaştırmayı seçebilirler.





Önceki:Blob görselini panoya kopyala
Önümüzdeki:Açısal Kaldırma Zone.js Yeni Bölgesiz çözümleri keşfedin
 Ev sahibi| 2024-12-28 10:20:27 tarihinde yayınlandı |
Qwen, Alibaba Grubu'nun Qwen ekibi tarafından geliştirilen büyük dil modelleri ve büyük multimodal modeller serisidir.
Qwen2.5Bağlantı girişi görünür.

DeepSeek-V3, 671B parametreli, 37B aktif ve 14.8T tokenlar üzerinde önceden eğitilen kendi geliştirdiği bir MoE modelidir.
DeepSeek-V3Bağlantı girişi görünür.

Zhipu, Tsinghua Üniversitesi Bilgisayar Bilimleri Bölümü'nün teknolojik başarılarından dönüşen bir şirkettir.
GLM-4-9BBağlantı girişi görünür.

Feragatname:
Code Farmer Network tarafından yayımlanan tüm yazılım, programlama materyalleri veya makaleler yalnızca öğrenme ve araştırma amaçları içindir; Yukarıdaki içerik ticari veya yasa dışı amaçlarla kullanılamaz, aksi takdirde kullanıcılar tüm sonuçları ödemelidir. Bu sitedeki bilgiler internetten alınmakta olup, telif hakkı anlaşmazlıklarının bu siteyle hiçbir ilgisi yoktur. Yukarıdaki içeriği indirmeden sonraki 24 saat içinde bilgisayarınızdan tamamen silmelisiniz. Programı beğendiyseniz, lütfen orijinal yazılımı destekleyin, kayıt satın alın ve daha iyi orijinal hizmetler alın. Herhangi bir ihlal olursa, lütfen bizimle e-posta yoluyla iletişime geçin.

Mail To:help@itsvse.com