Šis straipsnis yra veidrodinis mašininio vertimo straipsnis, spauskite čia norėdami pereiti prie originalaus straipsnio.

Rodinys: 2273|Atsakyti: 0

[AI] (6) Trumpas įvadas į didelio modelio failo formatą GGUF

[Kopijuoti nuorodą]
Publikuota: 2025-2-7 10:51:47 | | | |
Įvadas į GGUF didelio modelio failo formatą

Tokios sistemos kaip PyTorch paprastai naudojamos dideliems kalbos modeliams kurti, o jų išankstinio mokymo rezultatai paprastai išsaugomi atitinkamu dvejetainiu formatu, pvz., pt priesagos failas paprastai yra dvejetainis išankstinio mokymo rezultatas, išsaugotas PyTorch sistemoje.

Tačiau labai svarbi didelių modelių saugojimo problema yra ta, kad jų modelio failai yra didžiuliai, o modelio struktūra, parametrai ir kt. taip pat turės įtakos modelio samprotavimo efektui ir veikimui. Kad dideli modeliai būtų efektyvesni saugojant ir keičiantis, yra didelių skirtingų formatų modelių failų. Tarp jų GGUF yra labai svarbus didelio modelio failo formatas.

GGUF failas reiškia GPT generuotą vieningą formatą, kuris yra didelis modelio failo formatas, kurį apibrėžė ir išleido Georgijus Gerganovas. Georgijus Gerganovas yra garsaus atvirojo kodo projekto "llama.cpp" įkūrėjas.

GGUF yra dvejetainio formato failų specifikacija, o originalūs didelio modelio išankstinio mokymo rezultatai konvertuojami į GGUF formatą ir gali būti įkelti bei naudoti greičiau ir sunaudoti mažiau išteklių. Priežastis ta, kad GGUF naudoja įvairias technologijas, kad išsaugotų didelių modelių išankstinio mokymo rezultatus, įskaitant kompaktiškų dvejetainių kodavimo formatų naudojimą, optimizuotas duomenų struktūras, atminties atvaizdavimą ir kt.



GGUF, GGML, GGMF ir GGJT skirtumai

GGUF yra dvejetainis formatas, skirtas greitai įkelti ir išsaugoti modelius. Tai GGML, GGMF ir GGJT failo formatas, užtikrinantis aiškumą, įtraukiant visą informaciją, reikalingą modeliui įkelti. Jis taip pat sukurtas taip, kad būtų keičiamo dydžio, kad į modelį būtų galima įtraukti naujos informacijos nepažeidžiant suderinamumo.

  • GGML (be versijos): bazinis formatas be versijų kūrimo ar lygiavimo.
  • GGMF (versija): tas pats kaip GGML, bet su versijomis.
  • GGJT: Sulygiuokite tenzorius, kad būtų galima naudoti su mmaps, kuriuos reikia suderinti. v1, v2 ir v3 yra vienodi, tačiau vėlesnėse versijose naudojamos skirtingos kvantavimo schemos, kurios nesuderinamos su ankstesnėmis versijomis.


Kodėl GGUF formato didelių modelių failai veikia gerai

GGUF failo formatas gali greičiau įkelti modelius dėl kelių pagrindinių funkcijų:

Dvejetainis formatas: GGUF, kaip dvejetainį formatą, galima skaityti ir analizuoti greičiau nei tekstinius failus. Dvejetainiai failai paprastai yra kompaktiškesni, todėl sutrumpėja įvesties / išvesties operacijos ir apdorojimo laikas, reikalingas skaitymui ir analizei.

Optimizuotos duomenų struktūros: GGUF gali naudoti specialiai optimizuotas duomenų struktūras, palaikančias greitą prieigą prie modelio duomenų ir jų įkėlimą. Pavyzdžiui, duomenys gali būti tvarkomi pagal poreikį atminties apkrovai, kad būtų sumažintas apdorojimas apkrovos metu.

Atminties atvaizdavimo (mmap) suderinamumas: Jei GGUF palaiko atminties atvaizdavimą (mmap), tai leidžia susieti duomenis tiesiai iš disko į atminties adresų erdvę, todėl duomenys įkeliami greičiau. Tokiu būdu duomenis galima pasiekti neįkeliant viso failo, o tai ypač efektyvu dideliems modeliams.

Efektyvus serializavimas ir deserializavimas: GGUF gali naudoti efektyvius serializavimo ir deserializavimo metodus, o tai reiškia, kad modelio duomenis galima greitai konvertuoti į tinkamus formatus.

Keletas priklausomybių ir išorinių nuorodų: Jei GGUF formatas sukurtas taip, kad būtų savarankiškas, t. y. visa reikalinga informacija saugoma viename faile, tai sumažins išorinio failo paieškos ir skaitymo operacijas, reikalingas analizuojant ir įkeliant modelį.

Duomenų glaudinimas: GGUF formate gali būti naudojami veiksmingi duomenų glaudinimo metodai, sumažinant failų dydį ir taip pagreitinant skaitymo procesą.

Optimizuoti indeksavimo ir prieigos mechanizmai: failų duomenų indeksavimo ir prieigos mechanizmai gali būti optimizuoti, kad būtų galima greičiau rasti ir įkelti konkrečius duomenų fragmentus.

Apibendrinant galima pasakyti, kad GGUF pasiekia greitą modelio įkėlimą įvairiais optimizavimo metodais, o tai ypač svarbu scenarijams, kuriems reikia dažnai įkelti skirtingus modelius.

Įprasti gilaus mokymosi modeliai (.pt, . onnx) failo formatas
https://www.itsvse.com/thread-10929-1-1.html

GGUF failo pavyzdys:Hipersaito prisijungimas matomas.
llama.cpp projekto adresas:Hipersaito prisijungimas matomas.




Ankstesnis:[AI] (5) Atsispausdinkite "Ollama" užklausos informaciją
Kitą:Sąsaja sugeneruoja .d.ts failą iš .js failo
Atsakomybės apribojimas:
Visa programinė įranga, programavimo medžiaga ar straipsniai, kuriuos skelbia Code Farmer Network, yra skirti tik mokymosi ir mokslinių tyrimų tikslams; Aukščiau nurodytas turinys negali būti naudojamas komerciniais ar neteisėtais tikslais, priešingu atveju vartotojai prisiima visas pasekmes. Šioje svetainėje pateikiama informacija gaunama iš interneto, o ginčai dėl autorių teisių neturi nieko bendra su šia svetaine. Turite visiškai ištrinti aukščiau pateiktą turinį iš savo kompiuterio per 24 valandas nuo atsisiuntimo. Jei jums patinka programa, palaikykite autentišką programinę įrangą, įsigykite registraciją ir gaukite geresnes autentiškas paslaugas. Jei yra kokių nors pažeidimų, susisiekite su mumis el. paštu.

Mail To:help@itsvse.com