[AI] (2) Razlika med različicami DeepSeek-V3 in R1

Mala drhal · Objavljeno na 5. 02. 2025 08:46:09

DeepSeek-R1

Čas izida: 2025/01/2020
Lastnosti: Zasnovan je za generiranje kode in matematične probleme, izjemno hiter in natančen, kar ga naredi idealnega za scenarije, ki zahtevajo hitro izvajanje tehničnih zahtev. Benchmark OpenAI o1, ki je zdaj najbolj vroča smer na področju velikih AI modelov, predstavlja najsodobnejše raziskovalne rezerve.
Primerni ljudje: programerji, razvijalci, študenti naravoslovja in inženirstva.
Scenariji uporabe: pisanje kode, reševanje matematičnih problemov in optimizacija algoritmov.

Referenčni:Prijava do hiperpovezave je vidna.

DeepSeek-V3

Čas objave: 2024/12/26
Značilnosti: Primerno za kvize splošnega znanja, ustvarjanje besedil in učne pripomočke, z obsežnim pokritjem, a nekoliko šibkejšo profesionalnostjo. Referenčna vrednost je GPT4o, ki predstavlja najbolj temeljno splošno inteligenco velikih modelov.
Relevantni ljudje: študenti, ustvarjalci, vsakodnevna vprašanja o znanju.
Scenariji prijave: Pišite članke, poiščite gradivo, spoznajte nove koncepte.

Referenčni:Prijava do hiperpovezave je vidna.

Povzetek

Funkcije	DeepSeek-V3	DeepSeek-R1
Metoda treninga:	S tradicionalnimi metodami učenja se večinoma zanaša na velike količine podatkov za učenje.	Uporabite pristop okrepljenega učenja, ki modelu omogoča izboljšanje zmogljivosti z nenehnim eksperimentiranjem in izboljšanjem.
Sposobnost razmišljanja	Dobro opravljajte splošne naloge, vendar ste lahko omejeni pri vprašanjih, ki zahtevajo globoko razmišljanje.	Odlično opravljajo naloge, ki zahtevajo globoko razmišljanje, kot so matematika, koda in logično sklepanje.
Situacija odprte kode	Morda obstajajo nekatere omejitve.	Popolnoma odprtokoden, kdorkoli ga lahko uporablja in izboljšuje brezplačno.
predstava	Pri nekaterih nalogah sem se dobro odrezal.	V matematičnih testih je stopnja natančnosti dosegla 77,5 %, kar je primerljivo z drugimi vodilnimi modeli.
Berljivost	Ustvarjena vsebina je običajno enostavna za branje in razumevanje.	Zgodnje različice so morda mešale več jezikov, kasneje pa je z izboljšavami nastala vsebina postala bolj berljiva.

Metoda treninga:Predstavljaj si, da se učiš voziti kolo. DeepSeek-V3 je kot učenje z branjem številnih knjig o vožnji kolesa, medtem ko je DeepSeek-R1 učenje vožnje kolesa z nenehnim vajenjem, padanjem in vstajanjem.
Sposobnost razmišljanja:Če dobiš kompleksen matematični problem, je DeepSeek-R1 kot sošolec, ki je dober v globokem razmišljanju in zna postopoma izpeljati odgovore, medtem ko je DeepSeek-V3 morda boljši pri preprostih računskih problemih.
Odprta koda:DeepSeek-R1 je kot javna kuharska knjiga, ki si jo lahko kdorkoli ogleda, uporablja in izboljšuje po svojem okusu, medtem ko so recepti DeepSeek-V3 morda vidni le nekaterim ljudem.
Predstava:Na matematičnem izpitu je DeepSeek-R1 dosegel 77,5 točke, kar je primerljivo z drugimi najboljšimi učenci.
Berljivost:Sprva je DeepSeek-R1 morda pisal članke v mešanici več jezikov, vendar je bil izboljšan tako, da zdaj piše članke, ki so lažji za branje in razumevanje.

Razlika med Deepseek V3 in Deepseek R1 je v tem, da R1 izvaja samorazmišljanje in refleksijo ter ti po dolgem premisleku da odgovor, medtem ko ti Deepseek V3 lahko hitro odgovori in dolgo ne razmišlja. Trenutno večina eksperimentov kaže, da je izhod modela po dolgem razmišljanju boljši, vendar je tudi bolj zamuden, včasih pa se izvaja tudi pretirano razmišljanje.

Mala drhal · Objavljeno na 5. 02. 2025 09:47:07

[AI] (1) Odprtokodne lestvice velikih modelov
https://www.itsvse.com/thread-10909-1-1.html

Mala drhal · Objavljeno na 5. 02. 2025 16:26:32

Sistemske zahteve GPU za zagon DeepSeek-R1:https://apxml.com/posts/gpu-requirements-deepseek-r1

[AI] (2) Razlika med različicami DeepSeek-V3 in R1

Sorodne objave