[AI] (2) Rozdíl mezi verzemi DeepSeek-V3 a R1

Malý hajzl · Zveřejněno 05.02.2025 8:46:09

DeepSeek-R1

Doba vydání: 2025/01/2020
Funkce: Navržen pro generování kódu a matematické úlohy, je extrémně rychlý a přesný, což z něj činí ideální pro scénáře vyžadující rychlou implementaci technických požadavků. Benchmark OpenAI o1, který je nyní nejžhavějším směrem v oblasti velkých AI modelů, představuje nejmodernější výzkumné rezervy.
Relevantní osoby: programátoři, vývojáři, studenti vědy a inženýrství.
Scénáře aplikace: Psaní kódu, řešení matematických problémů a optimalizace algoritmů.

Odkaz:Přihlášení k hypertextovému odkazu je viditelné.

DeepSeek-V3

Čas zveřejnění: 2024/12/26
Funkce: Vhodné pro kvízy obecných znalostí, tvorbu textů a učební pomůcky, s širokým pokrytím, ale o něco slabší profesionalitou. Benchmarkem je GPT4o, který představuje nejzákladnější obecnou inteligenci velkých modelů.
Relevantní lidé: studenti, tvůrci, denní dotazy na znalosti.
Scénáře přihlášek: Piš články, najdi materiály, uč se nové koncepty.

Odkaz:Přihlášení k hypertextovému odkazu je viditelné.

shrnutí

rysy	DeepSeek-V3	DeepSeek-R1
Metoda tréninku:	Při tradičních tréninkových metodách se hlavně spoléhá na velké množství dat k učení.	Použijte přístup posilovaného učení, který umožňuje modelu zlepšovat své schopnosti prostřednictvím neustálého experimentování a zlepšování.
Schopnost uvažování	Dobře zvládejte obecné úkoly, ale můžete být omezeni v otázkách vyžadujících hluboké přemýšlení.	Vyniká v úkolech vyžadujících hluboké přemýšlení, jako je matematika, kódování a logické uvažování.
Situace s otevřeným zdrojovým kódem	Mohou existovat určitá omezení.	Zcela open source, kdokoli ho může používat a vylepšovat zdarma.
představení	Některé úkoly jsem zvládl dobře.	V matematických testech dosáhla přesnost 77,5 %, což je srovnatelné s jinými předními modely.
čitelnost	Generovaný obsah je obvykle snadno čitelný a srozumitelný.	Ranější verze mohly kombinovat více jazyků, ale později s vylepšeními se generovaný obsah stal čitelnějším.

Metoda tréninku:Představte si, že se učíte jezdit na kole. DeepSeek-V3 je jako učení se čtením spousty knih o jízdě na kole, zatímco DeepSeek-R1 je učení se jezdit na kole neustálým cvičením, pádem a vstáváním.
Schopnost uvažování:Pokud dostanete složitý matematický problém, DeepSeek-R1 je jako spolužák, který umí hluboce přemýšlet a dokáže odvozovat odpovědi krok za krokem, zatímco DeepSeek-V3 může být lepší v jednoduchých výpočetních úlohách.
Open Source:DeepSeek-R1 je jako veřejná kuchařka, kterou si může kdokoli prohlížet, používat a vylepšovat podle svého vkusu, zatímco recepty DeepSeek-V3 mohou být viditelné jen pro některé lidi.
Představení:V matematické zkoušce získal DeepSeek-R1 77,5 bodu, což je srovnatelné s ostatními nejlepšími studenty.
Čitelnost:Zpočátku mohl DeepSeek-R1 psát články v kombinaci více jazyků, ale byl vylepšen tak, že nyní píše články, které jsou snáze čitelné a srozumitelné.

Rozdíl mezi Deepseek V3 a Deepseek R1 je v tom, že R1 provádí sebereflexi a reflexi a dá vám odpověď po dlouhém přemýšlení, zatímco Deepseek V3 vám dá odpověď rychle a dlouho nepřemýšlí. V současnosti většina experimentů ukazuje, že výstup modelu po dlouhém přemýšlení je lepší, ale zároveň je časově náročnější a někdy dochází i k nadměrnému přemýšlení.

Malý hajzl · Zveřejněno 05.02.2025 9:47:07

[AI] (1) Open source žebříčky velkých modelů
https://www.itsvse.com/thread-10909-1-1.html

Malý hajzl · Zveřejněno 05.02.2025 16:26:32

Požadavky na systém GPU pro spuštění DeepSeek-R1:https://apxml.com/posts/gpu-requirements-deepseek-r1

[AI] (2) Rozdíl mezi verzemi DeepSeek-V3 a R1

Související příspěvky