[AI] (2) Rozdiel medzi verziami DeepSeek-V3 a R1

Malý · Zverejnené 5. 2. 2025 8:46:09

DeepSeek-R1

Čas vydania: 2025/01/2025
Funkcie: Navrhnutý na generovanie kódu a matematické úlohy, je mimoriadne rýchly a presný, čo ho robí ideálnym pre situácie vyžadujúce rýchlu implementáciu technických požiadaviek. Benchmark OpenAI o1, ktorý je teraz najhorúcejším smerom v oblasti veľkých AI modelov, predstavuje najmodernejšie výskumné rezervy.
Relevantní ľudia: programátori, vývojári, študenti prírodných vied a inžinierstva.
Aplikačné scenáre: Písanie kódu, riešenie matematických problémov a optimalizácia algoritmov.

Referencia:Prihlásenie na hypertextový odkaz je viditeľné.

DeepSeek-V3

Čas zverejnenia: 2024/12/26
Vlastnosti: Vhodné na všeobecné vedomostné kvízy, tvorbu textov a učebné pomôcky, s širokým pokrytím, ale o niečo slabšou profesionalitou. Benchmarkom je GPT4o, ktorý predstavuje najzákladnejšiu všeobecnú inteligenciu veľkých modelov.
Relevantní ľudia: študenti, tvorcovia, každodenné otázky o vedomostiach.
Aplikačné scenáre: Píšte články, hľadajte materiály, učte sa nové koncepty.

Referencia:Prihlásenie na hypertextový odkaz je viditeľné.

súhrn

Funkcie	DeepSeek-V3	DeepSeek-R1
Metóda tréningu:	Pri tradičných trénovacích metódach sa hlavne spolieha na veľké množstvo dát na učenie.	Použite prístup posilňovacieho učenia, ktorý umožňuje modelu zlepšovať svoje schopnosti prostredníctvom neustáleho experimentovania a zlepšovania.
Schopnosť uvažovať	Dobre zvládajte všeobecné úlohy, ale môžete byť obmedzení v otázkach, ktoré vyžadujú hlboké premýšľanie.	Vynikaj v úlohách, ktoré vyžadujú hlboké myslenie, ako sú matematika, kódovanie a logické uvažovanie.
Situácia s otvoreným zdrojovým kódom	Môžu existovať určité obmedzenia.	Úplne open source, každý ho môže používať a vylepšovať zadarmo.
výkon	Niektoré úlohy zvládol dobre.	V matematických testoch dosiahla presnosť 77,5 %, čo je porovnateľné s inými vedúcimi modelmi.
čitateľnosť	Generovaný obsah je zvyčajne ľahko čitateľný a pochopiteľný.	Skoré verzie mohli miešať viaceré jazyky, no neskôr s vylepšeniami sa generovaný obsah stal čitateľnejším.

Metóda tréningu:Predstavte si, že sa učíte jazdiť na bicykli. DeepSeek-V3 je ako učenie sa čítaním množstva kníh o jazde na bicykli, zatiaľ čo DeepSeek-R1 je učenie sa jazdiť na bicykli neustálym cvičením, padaním a vstávaním.
Schopnosť uvažovať:Ak dostanete zložitý matematický problém, DeepSeek-R1 je ako spolužiak, ktorý je dobrý v hlbokom myslení, dokáže postupne odvodiť odpovede, zatiaľ čo DeepSeek-V3 môže byť lepší v jednoduchých výpočtových úlohách.
Open Source:DeepSeek-R1 je ako verejná kuchárska kniha, ktorú si môže každý prezerať, používať a vylepšovať podľa vlastného vkusu, zatiaľ čo recepty DeepSeek-V3 môžu byť viditeľné len pre niektorých ľudí.
Výkon:V matematickej skúške získal DeepSeek-R1 77,5 bodu, čo je porovnateľné s ostatnými najlepšími študentmi.
Čitateľnosť:Spočiatku mohol DeepSeek-R1 písať články v kombinácii viacerých jazykov, ale bol vylepšený tak, že teraz píše články, ktoré sa ľahšie čítajú a chápu.

Rozdiel medzi Deepseek V3 a Deepseek R1 je v tom, že R1 vykonáva sebauvažovanie a reflexiu a dá vám odpoveď po dlhom premýšľaní, zatiaľ čo Deepseek V3 vám dá odpoveď rýchlo a dlho nepremýšľa. V súčasnosti väčšina experimentov ukazuje, že výstup modelu po dlhom premýšľaní je lepší, ale zároveň je časovo náročnejší a niekedy sa vykonáva aj nadmerné premýšľanie.

Malý · Zverejnené 5. 2. 2025 9:47:07

[AI] (1) Open source rebríčky veľkých modelov
https://www.itsvse.com/thread-10909-1-1.html

Malý · Zverejnené 5. 2. 2025 16:26:32

Systémové požiadavky GPU na spustenie DeepSeek-R1:https://apxml.com/posts/gpu-requirements-deepseek-r1

[AI] (2) Rozdiel medzi verziami DeepSeek-V3 a R1

Súvisiace príspevky