[AI] (2) Разликата между версиите на DeepSeek-V3 и R1

Малък боклук · Публикувано в 5.02.2025 г. 8:46:09 ч.

DeepSeek-R1

Време на излизане: 2025/01/20
Характеристики: Проектиран за генериране на код и математически задачи, той е изключително бърз и точен, което го прави идеален за сценарии, изискващи бързо изпълнение на технически изисквания. Benchmark OpenAI o1, който сега е най-горещата посока в областта на големите AI модели, представлява най-иновативните изследователски резерви.
Подходящи хора: програмисти, разработчици, студенти по наука и инженерство.
Сценарии за приложение: Писане на код, решаване на математически задачи и оптимизиране на алгоритми.

Препратка:Входът към хиперлинк е видим.

DeepSeek-V3

Време на публикация: 2024/12/26
Характеристики: Подходящи за общи тестове, създаване на текстове и учебни помощни средства, с широко покритие, но малко по-слаб професионализъм. Бенчмаркът е GPT4o, който представлява най-фундаменталната обща интелигентност на големите модели.
Подходящи хора: студенти, създатели, ежедневни въпроси за знания.
Сценарии за приложение: Пишете статии, намирайте материали, научавайте нови концепции.

Препратка:Входът към хиперлинк е видим.

резюме

Функции	DeepSeek-V3	DeepSeek-R1
Метод на обучение:	Използвайки традиционни методи за обучение, основно разчита на големи обеми данни за учене.	Използвайте подход с подсилване на обучение, който позволява на модела да подобрява възможностите си чрез непрекъснато експериментиране и усъвършенстване.
Способност за разсъждение	Свършете се добре с общи задачи, но може да бъдете ограничени в задачи, които изискват дълбоко мислене.	Бъдете отлични в задачи, които изискват дълбоко мислене, като математика, код и логическо мислене.
Ситуация с отворен код	Може да има някои ограничения.	Напълно отворен код, всеки може да го използва и подобрява безплатно.
изпълнение	Справих се добре с някои задачи.	В математическите тестове точността достигна 77,5%, което е сравнимо с други водещи модели.
Четливост	Генерираното съдържание обикновено е лесно за четене и разбиране.	Ранните версии може да са смесвали няколко езика, но по-късно, с подобрения, генерираното съдържание стана по-четливо.

Метод на обучение:Представи си, че се учиш да караш колело. DeepSeek-V3 е като да учиш чрез четене на много книги за каране на колело, докато DeepSeek-R1 е да се учиш да караш колело, като постоянно тренираш, падеш и ставаш.
Способност за разсъждение:Ако ви бъде дадена сложна математическа задача, DeepSeek-R1 е като съученик, който е добър в дълбокото мислене и може да извежда отговори стъпка по стъпка, докато DeepSeek-V3 може да е по-добър при прости изчислителни задачи.
Отворен код:DeepSeek-R1 е като публична готварска книга, която всеки може да гледа, използва и подобрява според вкуса си, докато рецептите на DeepSeek-V3 може да са видими само за някои хора.
Изпълнение:На изпит по математика DeepSeek-R1 получи 77.5 точки, което е наравно с другите топ ученици.
Четливост:Първоначално DeepSeek-R1 може да е писал статии на смес от няколко езика, но сега е подобрен така, че сега пише статии, които са по-лесни за четене и разбиране.

Разликата между Deepseek V3 и Deepseek R1 е, че R1 провежда саморазсъждение и размисъл и ще ви даде отговор след дълга мисъл, докато Deepseek V3 може да ви даде отговор бързо и няма да мисли дълго време. В момента повечето експерименти показват, че резултатът на модела след дълго мислене е по-добър, но също така отнема повече време, а понякога се извършва и прекомерно мислене.

Малък боклук · Публикувано в 5.02.2025 г. 9:47:07 ч.

[AI] (1) Open Source класации на големи модели
https://www.itsvse.com/thread-10909-1-1.html

Малък боклук · Публикувано в 5.02.2025 г. 16:26:32 ч.

Изисквания към GPU системите за изпълнение на DeepSeek-R1:https://apxml.com/posts/gpu-requirements-deepseek-r1

[AI] (2) Разликата между версиите на DeepSeek-V3 и R1

Свързани публикации