| Spremenljivka | Privzeta vrednost | Opis + Učinek + Scenarij |
| OLLAMA_HOST | "[color=var(--fgColor-accent, var(--color-accent-fg))]Prijava do hiperpovezave je vidna." | Konfigurira gostitelja in shemo za strežnik Ollama. Učinek: Določi URL, ki se uporablja za povezavo s strežnikom Ollama. Scenarij: Uporabno pri nameščanju Ollame v distribuiranem okolju ali ko morate storitev izpostaviti na določenem omrežnem vmesniku. |
| OLLAMA_ORIGINS | [localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri:// | Konfigurira dovoljene izvore za CORS. Učinek: Nadzoruje, kateri izvori lahko pošiljajo zahteve strežniku Ollama. Scenarij: Ključno pri integraciji Ollame s spletnimi aplikacijami, da se prepreči nepooblaščen dostop iz različnih domen. |
| OLLAMA_MODELS | $HOME/.ollama/models | Nastavi pot do mape modelov. Učinek: Določa, kje so datoteke modelov shranjene in nalagane. Scenarij: Uporabno za upravljanje prostora na disku na različnih pogonih ali vzpostavitev skupnih modelnih repozitorijev v večuporabniških okoljih. |
| OLLAMA_KEEP_ALIVE | 5 minut | Določi, kako dolgo so modeli naloženi v pomnilniku. Učinek: Nadzoruje, da modeli trajanja ostanejo v spominu po uporabi. Scenarij: Daljše trajanje izboljša odzivne čase na pogoste poizvedbe, a poveča porabo pomnilnika. Krajše trajanje sprosti vire, vendar lahko podaljša začetni odzivni čas. |
| OLLAMA_DEBUG | false | Omogoča dodatne informacije za razhroščevanje. Učinek: Poveča obsežnost zapisovanja in razhroščevanja. Scenarij: Neprecenljiv za odpravljanje težav ali razumevanje vedenja sistema med razvojem ali uvajanjem. |
| OLLAMA_FLASH_ATTENTION | false | Omogoča eksperimentalno funkcijo bliskavice pozornosti. Učinek: Aktivira eksperimentalno optimizacijo za mehanizme pozornosti. Scenarij: Lahko potencialno izboljša zmogljivost na združljivi strojni opremi, vendar lahko povzroči nestabilnost. |
| OLLAMA_NOHISTORY | false | Onemogoči zgodovino readline. Učinek: Prepreči shranjevanje zgodovine ukazov. Scenarij: Uporabno v varnostno občutljivih okoljih, kjer zgodovine ukazov ne bi smeli ohranjati. |
| OLLAMA_NOPRUNE | false | Onemogoči obrezovanje modelnih blobov ob zagonu. Učinek: Ohrani vse modelne blobove, kar lahko poveča uporabo diska. Scenarij: Koristno, ko morate vzdrževati vse različice modelov zaradi združljivosti ali povračila. |
| OLLAMA_SCHED_SPREAD | false | Omogoča razporejanje modelov na vseh grafičnih karticah. Učinek: Omogoča uporabo več GPU-jev za modelno inferenco. Scenarij: Koristno v visokozmogljivih računalniških okoljih z več GPU-ji za maksimalno izkoriščenost strojne opreme. |
| OLLAMA_INTEL_GPU | false | Omogoča eksperimentalno zaznavanje Intel GPU. Učinek: Omogoča uporabo Intel GPU-jev za sklepanje o modelih. Scenarij: Uporabno za organizacije, ki uporabljajo Intelovo GPU strojno opremo za AI naloge. |
| OLLAMA_LLM_LIBRARY | "" (samodejno zaznavanje) | Nastavi uporabo knjižnice LLM. Učinek: Preglasi samodejno zaznavanje knjižnice LLM. Scenarij: Uporabno, ko morate prisiliti določeno različico knjižnice ali implementacijo zaradi združljivosti ali zmogljivosti. |
| OLLAMA_TMPDIR | Privzeta začasna imenik sistema | Nastavi lokacijo za začasne datoteke. Učinek: Določa, kje so shranjene začasne datoteke. Scenarij: Pomembno za upravljanje I/O zmogljivosti ali kadar ima sistemski začasni imenik omejen prostor. |
| CUDA_VISIBLE_DEVICES | Vse je na voljo | Določi, katere NVIDIA naprave so vidne. Učinek: Nadzoruje, katere NVIDIA grafične kartice je mogoče uporabiti. Scenarij: Ključno za upravljanje dodeljevanja GPU v večuporabniških ali večprocesnih okoljih. |
| HIP_VISIBLE_DEVICES | Vse je na voljo | Določi, katere AMD naprave so vidne. Učinek: Nadzoruje, katere AMD grafične kartice je mogoče uporabiti. Scenarij: Podoben CUDA_VISIBLE_DEVICES, vendar za AMD strojno opremo. |
| OLLAMA_RUNNERS_DIR | Sistemsko odvisno | Določi lokacijo za tekače. Učinek: Določa, kje se nahajajo izvršljive datoteke runnerja. Scenarij: Pomembno za prilagojene namestitve ali kadar je treba izvajalce izolirati od glavne aplikacije. |
| OLLAMA_NUM_PARALLEL | 0 (neomejeno) | Določa število zahtev za vzporedni model. Učinek: Nadzoruje sočasnost sklepanja modela. Scenarij: Ključno za upravljanje obremenitve sistema in zagotavljanje odzivnosti v okoljih z velikim prometom. |
| OLLAMA_MAX_LOADED_MODELS | 0 (neomejeno) | Določa največje število naloženih modelov. Učinek: Omeji število modelov, ki jih je mogoče naložiti hkrati. Scenarij: Pomaga upravljati porabo pomnilnika v okoljih z omejenimi viri ali različnimi modeli. |
| OLLAMA_MAX_QUEUE | 512 | Določi največje število zahtevkov v vrsti. Učinek: Omeji velikost vrste zahtevkov. Scenarij: Preprečuje preobremenjenost sistema med prometnimi sunki in zagotavlja pravočasno obdelavo zahtevkov. |
| OLLAMA_MAX_VRAM | 0 (neomejeno) | Nastavi največjo preglasitev VRAM v bajtih. Učinek: Omeji količino VRAM-a, ki ga je mogoče uporabiti. Scenarij: Uporabno v skupnih GPU okoljih, da prepreči, da bi en sam proces monopoliziral GPU pomnilnik. |