Тази статия е огледална статия за машинен превод, моля, кликнете тук, за да преминете към оригиналната статия.

Изглед: 2066|Отговор: 2

[AI] (2) Разликата между версиите на DeepSeek-V3 и R1

[Копирай линк]
Публикувано на 2025-2-5 08:46:09 | | | |
DeepSeek-R1

Време на излизане: 2025/01/20
Характеристики: Проектиран за генериране на код и математически задачи, той е изключително бърз и точен, което го прави идеален за сценарии, изискващи бързо изпълнение на технически изисквания. Benchmark OpenAI o1, който сега е най-горещата посока в областта на големите AI модели, представлява най-иновативните изследователски резерви.
Подходящи хора: програмисти, разработчици, студенти по наука и инженерство.
Сценарии за приложение: Писане на код, решаване на математически задачи и оптимизиране на алгоритми.

Препратка:Входът към хиперлинк е видим.

DeepSeek-V3

Време на публикация: 2024/12/26
Характеристики: Подходящи за общи тестове, създаване на текстове и учебни помощни средства, с широко покритие, но малко по-слаб професионализъм. Бенчмаркът е GPT4o, който представлява най-фундаменталната обща интелигентност на големите модели.
Подходящи хора: студенти, създатели, ежедневни въпроси за знания.
Сценарии за приложение: Пишете статии, намирайте материали, научавайте нови концепции.

Препратка:Входът към хиперлинк е видим.

резюме

Функции
DeepSeek-V3
DeepSeek-R1
Метод на обучение:
Използвайки традиционни методи за обучение, основно разчита на големи обеми данни за учене.
Използвайте подход с подсилване на обучение, който позволява на модела да подобрява възможностите си чрез непрекъснато експериментиране и усъвършенстване.
Способност за разсъждение
Свършете се добре с общи задачи, но може да бъдете ограничени в задачи, които изискват дълбоко мислене.
Бъдете отлични в задачи, които изискват дълбоко мислене, като математика, код и логическо мислене.
Ситуация с отворен код
Може да има някои ограничения.
Напълно отворен код, всеки може да го използва и подобрява безплатно.
изпълнение
Справих се добре с някои задачи.
В математическите тестове точността достигна 77,5%, което е сравнимо с други водещи модели.
Четливост
Генерираното съдържание обикновено е лесно за четене и разбиране.
Ранните версии може да са смесвали няколко езика, но по-късно, с подобрения, генерираното съдържание стана по-четливо.

  • Метод на обучение:Представи си, че се учиш да караш колело. DeepSeek-V3 е като да учиш чрез четене на много книги за каране на колело, докато DeepSeek-R1 е да се учиш да караш колело, като постоянно тренираш, падеш и ставаш.
  • Способност за разсъждение:Ако ви бъде дадена сложна математическа задача, DeepSeek-R1 е като съученик, който е добър в дълбокото мислене и може да извежда отговори стъпка по стъпка, докато DeepSeek-V3 може да е по-добър при прости изчислителни задачи.
  • Отворен код:DeepSeek-R1 е като публична готварска книга, която всеки може да гледа, използва и подобрява според вкуса си, докато рецептите на DeepSeek-V3 може да са видими само за някои хора.
  • Изпълнение:На изпит по математика DeepSeek-R1 получи 77.5 точки, което е наравно с другите топ ученици.
  • Четливост:Първоначално DeepSeek-R1 може да е писал статии на смес от няколко езика, но сега е подобрен така, че сега пише статии, които са по-лесни за четене и разбиране.

Разликата между Deepseek V3 и Deepseek R1 е, че R1 провежда саморазсъждение и размисъл и ще ви даде отговор след дълга мисъл, докато Deepseek V3 може да ви даде отговор бързо и няма да мисли дълго време. В момента повечето експерименти показват, че резултатът на модела след дълго мислене е по-добър, но също така отнема повече време, а понякога се извършва и прекомерно мислене.




Предишен:Често срещани модели за дълбоко обучение (.pt, . onnx) файлов формат
Следващ:【AI】(3) Tencent Cloud внедрява DeepSeek-R1 с HAI tutorial
 Хазяин| Публикувано на 2025-2-5 09:47:07 |
[AI] (1) Open Source класации на големи модели
https://www.itsvse.com/thread-10909-1-1.html
 Хазяин| Публикувано на 2025-2-5 16:26:32 |
Изисквания към GPU системите за изпълнение на DeepSeek-R1:https://apxml.com/posts/gpu-requirements-deepseek-r1
Отричане:
Целият софтуер, програмни материали или статии, публикувани от Code Farmer Network, са само за учебни и изследователски цели; Горното съдържание не трябва да се използва за търговски или незаконни цели, в противен случай потребителите ще понесат всички последствия. Информацията на този сайт идва от интернет, а споровете за авторски права нямат нищо общо с този сайт. Трябва напълно да изтриете горното съдържание от компютъра си в рамките на 24 часа след изтеглянето. Ако ви харесва програмата, моля, подкрепете оригинален софтуер, купете регистрация и получете по-добри услуги. Ако има нарушение, моля, свържете се с нас по имейл.

Mail To:help@itsvse.com