Tento článok je zrkadlovým článkom o strojovom preklade, kliknite sem pre prechod na pôvodný článok.

Pohľad: 2066|Odpoveď: 2

[AI] (2) Rozdiel medzi verziami DeepSeek-V3 a R1

[Kopírovať odkaz]
Zverejnené 5.2.2025 08:46:09 | | | |
DeepSeek-R1

Čas vydania: 2025/01/2025
Funkcie: Navrhnutý na generovanie kódu a matematické úlohy, je mimoriadne rýchly a presný, čo ho robí ideálnym pre situácie vyžadujúce rýchlu implementáciu technických požiadaviek. Benchmark OpenAI o1, ktorý je teraz najhorúcejším smerom v oblasti veľkých AI modelov, predstavuje najmodernejšie výskumné rezervy.
Relevantní ľudia: programátori, vývojári, študenti prírodných vied a inžinierstva.
Aplikačné scenáre: Písanie kódu, riešenie matematických problémov a optimalizácia algoritmov.

Referencia:Prihlásenie na hypertextový odkaz je viditeľné.

DeepSeek-V3

Čas zverejnenia: 2024/12/26
Vlastnosti: Vhodné na všeobecné vedomostné kvízy, tvorbu textov a učebné pomôcky, s širokým pokrytím, ale o niečo slabšou profesionalitou. Benchmarkom je GPT4o, ktorý predstavuje najzákladnejšiu všeobecnú inteligenciu veľkých modelov.
Relevantní ľudia: študenti, tvorcovia, každodenné otázky o vedomostiach.
Aplikačné scenáre: Píšte články, hľadajte materiály, učte sa nové koncepty.

Referencia:Prihlásenie na hypertextový odkaz je viditeľné.

súhrn

Funkcie
DeepSeek-V3
DeepSeek-R1
Metóda tréningu:
Pri tradičných trénovacích metódach sa hlavne spolieha na veľké množstvo dát na učenie.
Použite prístup posilňovacieho učenia, ktorý umožňuje modelu zlepšovať svoje schopnosti prostredníctvom neustáleho experimentovania a zlepšovania.
Schopnosť uvažovať
Dobre zvládajte všeobecné úlohy, ale môžete byť obmedzení v otázkach, ktoré vyžadujú hlboké premýšľanie.
Vynikaj v úlohách, ktoré vyžadujú hlboké myslenie, ako sú matematika, kódovanie a logické uvažovanie.
Situácia s otvoreným zdrojovým kódom
Môžu existovať určité obmedzenia.
Úplne open source, každý ho môže používať a vylepšovať zadarmo.
výkon
Niektoré úlohy zvládol dobre.
V matematických testoch dosiahla presnosť 77,5 %, čo je porovnateľné s inými vedúcimi modelmi.
čitateľnosť
Generovaný obsah je zvyčajne ľahko čitateľný a pochopiteľný.
Skoré verzie mohli miešať viaceré jazyky, no neskôr s vylepšeniami sa generovaný obsah stal čitateľnejším.

  • Metóda tréningu:Predstavte si, že sa učíte jazdiť na bicykli. DeepSeek-V3 je ako učenie sa čítaním množstva kníh o jazde na bicykli, zatiaľ čo DeepSeek-R1 je učenie sa jazdiť na bicykli neustálym cvičením, padaním a vstávaním.
  • Schopnosť uvažovať:Ak dostanete zložitý matematický problém, DeepSeek-R1 je ako spolužiak, ktorý je dobrý v hlbokom myslení, dokáže postupne odvodiť odpovede, zatiaľ čo DeepSeek-V3 môže byť lepší v jednoduchých výpočtových úlohách.
  • Open Source:DeepSeek-R1 je ako verejná kuchárska kniha, ktorú si môže každý prezerať, používať a vylepšovať podľa vlastného vkusu, zatiaľ čo recepty DeepSeek-V3 môžu byť viditeľné len pre niektorých ľudí.
  • Výkon:V matematickej skúške získal DeepSeek-R1 77,5 bodu, čo je porovnateľné s ostatnými najlepšími študentmi.
  • Čitateľnosť:Spočiatku mohol DeepSeek-R1 písať články v kombinácii viacerých jazykov, ale bol vylepšený tak, že teraz píše články, ktoré sa ľahšie čítajú a chápu.

Rozdiel medzi Deepseek V3 a Deepseek R1 je v tom, že R1 vykonáva sebauvažovanie a reflexiu a dá vám odpoveď po dlhom premýšľaní, zatiaľ čo Deepseek V3 vám dá odpoveď rýchlo a dlho nepremýšľa. V súčasnosti väčšina experimentov ukazuje, že výstup modelu po dlhom premýšľaní je lepší, ale zároveň je časovo náročnejší a niekedy sa vykonáva aj nadmerné premýšľanie.




Predchádzajúci:Bežné modely hlbokého učenia (.pt, . ONNX)
Budúci:【AI】(3) Tencent Cloud nasadzuje DeepSeek-R1 s tutoriálom HAI
 Prenajímateľ| Zverejnené 5.2.2025 09:47:07 |
[AI] (1) Open source rebríčky veľkých modelov
https://www.itsvse.com/thread-10909-1-1.html
 Prenajímateľ| Zverejnené 5.2.2025 o 16:26:32 |
Systémové požiadavky GPU na spustenie DeepSeek-R1:https://apxml.com/posts/gpu-requirements-deepseek-r1
Vyhlásenie:
Všetok softvér, programovacie materiály alebo články publikované spoločnosťou Code Farmer Network slúžia len na vzdelávacie a výskumné účely; Vyššie uvedený obsah nesmie byť použitý na komerčné alebo nezákonné účely, inak nesú všetky následky používateľmi. Informácie na tejto stránke pochádzajú z internetu a spory o autorské práva s touto stránkou nesúvisia. Musíte úplne vymazať vyššie uvedený obsah zo svojho počítača do 24 hodín od stiahnutia. Ak sa vám program páči, podporte originálny softvér, zakúpte si registráciu a získajte lepšie originálne služby. Ak dôjde k akémukoľvek porušeniu, kontaktujte nás prosím e-mailom.

Mail To:help@itsvse.com