Cet article est un article miroir de traduction automatique, veuillez cliquer ici pour accéder à l’article original.

Vue: 2066|Répondre: 2

[IA] (2) La différence entre les versions DeepSeek-V3 et R1

[Copié le lien]
Publié le 05-02-2025 à 08:46:09 | | | |
DeepSeek-R1

Sortie : 20/01/2025
Fonctionnalités : Conçu pour la génération de code et les problèmes mathématiques, il est extrêmement rapide et précis, ce qui le rend idéal pour les scénarios nécessitant une mise en œuvre rapide des exigences techniques. Le benchmark OpenAI o1, qui est désormais la direction la plus en vogue dans le domaine des grands modèles d’IA, représente les réserves de recherche les plus avancées.
Personnes concernées : programmeurs, développeurs, étudiants en sciences et en ingénierie.
Scénarios d’application : Écrire du code, résoudre des problèmes mathématiques et optimiser des algorithmes.

Référence:La connexion hyperlientérée est visible.

DeepSeek-V3

Heure de publication : 2024/12/26
Fonctionnalités : Adapté aux quiz de culture générale, à la création de texte et aux aides à l’apprentissage, avec une large couverture mais un professionnalisme légèrement moindre. La référence est GPT4o, qui représente l’intelligence générale la plus fondamentale des grands modèles.
Personnes concernées : étudiants, créateurs, questions quotidiennes de connaissances.
Scénarios d’application : Rédigez des articles, trouvez des documents, apprenez de nouveaux concepts.

Référence:La connexion hyperlientérée est visible.

résumé

fonctionnalités
DeepSeek-V3
DeepSeek-R1
Méthode d’entraînement :
En utilisant des méthodes d’entraînement traditionnelles, il repose principalement sur de grandes quantités de données pour apprendre.
Adopter une approche d’apprentissage par renforcement qui permet au modèle d’améliorer ses capacités grâce à une expérimentation et une amélioration continues.
Capacité de raisonnement
Soyez performant sur des tâches générales mais pouvez être limité dans les questions nécessitant une réflexion approfondie.
Excelle dans les tâches qui demandent une réflexion approfondie, comme les mathématiques, le code et le raisonnement logique.
Situation open source
Il peut y avoir certaines limitations.
Entièrement open source, tout le monde peut l’utiliser et l’améliorer gratuitement.
performance
Il a bien réussi certaines tâches.
Dans les tests mathématiques, le taux de précision a atteint 77,5 %, ce qui est comparable à celui d’autres modèles de premier plan.
lisibilité
Le contenu généré est généralement facile à lire et à comprendre.
Les premières versions pouvaient mélanger plusieurs langues, mais avec des améliorations, le contenu généré est devenu plus lisible.

  • Méthode d’entraînement :Imaginez que vous apprenez à faire du vélo. DeepSeek-V3, c’est comme apprendre en lisant beaucoup de livres sur la moto, tandis que DeepSeek-R1, c’est apprendre à faire du vélo en s’entraînant, en tombant et en se relevant constamment.
  • Capacité de raisonnement :Si on vous donne un problème mathématique complexe, DeepSeek-R1 est comme un camarade de classe doué pour la pensée profonde, capable de dériver les réponses étape par étape, tandis que DeepSeek-V3 peut être meilleur pour des problèmes de calcul simples.
  • Libre:DeepSeek-R1 est comme un livre de cuisine public que chacun peut consulter, utiliser et améliorer selon ses goûts, tandis que les recettes de DeepSeek-V3 ne sont visibles que pour certaines personnes.
  • Performance:Lors d’un examen de mathématiques, DeepSeek-R1 a obtenu 77,5 points, ce qui est comparable à celui des autres meilleurs élèves.
  • Lisibilité:Au départ, DeepSeek-R1 pouvait écrire des articles dans un mélange de plusieurs langues, mais il a été amélioré pour qu’il rédige désormais des articles plus faciles à lire et à comprendre.

La différence entre Deepseek V3 et Deepseek R1 est qu’un R1 mènera un raisonnement et une réflexion sur soi-même et vous donnera une réponse après longuement réflexion, tandis que Deepseek V3 peut vous donner une réponse rapidement et ne réfléchira pas longtemps. Actuellement, la plupart des expériences montrent que le résultat du modèle après une longue réflexion est meilleur, mais aussi plus chronophage, et parfois une réflexion excessive est réalisée.




Précédent:Modèles courants pour l’apprentissage profond (.pt, . onnx)
Prochain:【AI】(3) Tencent Cloud déploie DeepSeek-R1 avec un tutoriel HAI
 Propriétaire| Publié le 05-2-2025 à 09:47:07 |
[IA] (1) Classements open source de grands modèles
https://www.itsvse.com/thread-10909-1-1.html
 Propriétaire| Publié le 05-02-2025 à 16:26:32 |
Exigences système GPU pour faire tourner DeepSeek-R1 :https://apxml.com/posts/gpu-requirements-deepseek-r1
Démenti:
Tous les logiciels, supports de programmation ou articles publiés par Code Farmer Network sont uniquement destinés à l’apprentissage et à la recherche ; Le contenu ci-dessus ne doit pas être utilisé à des fins commerciales ou illégales, sinon les utilisateurs assumeront toutes les conséquences. Les informations sur ce site proviennent d’Internet, et les litiges de droits d’auteur n’ont rien à voir avec ce site. Vous devez supprimer complètement le contenu ci-dessus de votre ordinateur dans les 24 heures suivant le téléchargement. Si vous aimez le programme, merci de soutenir un logiciel authentique, d’acheter l’immatriculation et d’obtenir de meilleurs services authentiques. En cas d’infraction, veuillez nous contacter par e-mail.

Mail To:help@itsvse.com