| Mainīgo | Noklusējuma vērtība | Apraksts + Efekts + Scenārijs |
| OLLAMA_HOST | "[color=var(--fgColor-accent, var(--color-accent-fg))]Hipersaites pieteikšanās ir redzama." | Konfigurē resursdatoru un shēmu Ollama serverim. Efekts: nosaka URL, kas tiek izmantots, lai izveidotu savienojumu ar Ollama serveri. Scenārijs: noderīgs, izvietojot Ollama izkliedētā vidē vai ja pakalpojums ir jāatklāj noteiktā tīkla interfeisā. |
| OLLAMA_ORIGINS | [localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri:// | Konfigurē atļauto izcelsmi CORS. Efekts: kontrolē, kurai izcelsmei ir atļauts veikt pieprasījumus Ollama serverim. Scenārijs: kritisks, integrējot Ollama ar tīmekļa lietojumprogrammām, lai novērstu nesankcionētu piekļuvi no dažādiem domēniem. |
| OLLAMA_MODELS | $HOME/.ollama/models | Iestata ceļu uz modeļu direktoriju. Efekts: nosaka, no kurienes tiek glabāti un ielādēti modeļa faili. Scenārijs: noderīgs, lai pārvaldītu diska vietu dažādos diskos vai iestatītu koplietojamu modeļu krātuves vairāku lietotāju vidē. |
| OLLAMA_KEEP_ALIVE | 5 minūtes | Iestata, cik ilgi modeļi paliek ielādēti atmiņā. Efekts: kontrolē, cik ilgi modeļi paliek atmiņā pēc lietošanas. Scenārijs: ilgāks ilgums uzlabo atbildes laiku uz biežiem vaicājumiem, bet palielina atmiņas lietojumu. Īsāks ilgums atbrīvo resursus, bet var palielināt sākotnējo atbildes laiku. |
| OLLAMA_DEBUG | false | Iespējo papildu atkļūdošanas informāciju. Efekts: palielina reģistrēšanas un atkļūdošanas izvades izvērstumu. Scenārijs: nenovērtējams problēmu novēršanai vai sistēmas darbības izpratnei izstrādes vai izvietošanas laikā. |
| OLLAMA_FLASH_ATTENTION | false | Iespējo eksperimentālo zibspuldzes uzmanības funkciju. Efekts: aktivizē eksperimentālu optimizāciju uzmanības mehānismiem. Scenārijs: var uzlabot saderīgas aparatūras veiktspēju, bet var radīt nestabilitāti. |
| OLLAMA_NOHISTORY | false | Atspējo lasīšanas rindu vēsturi. Efekts: neļauj saglabāt komandu vēsturi. Scenārijs: noderīgs drošības jutīgas vidēs, kur komandu vēsture nedrīkst būt saglabāta. |
| OLLAMA_NOPRUNE | false | Atspējo modeļa blobu atzarošanu startēšanas laikā. Efekts: saglabā visus modeļa blobus, potenciāli palielinot diska lietojumu. Scenārijs: noderīgs, ja ir jāuztur visas modeļa versijas saderības vai atcelšanas nolūkos. |
| OLLAMA_SCHED_SPREAD | false | Ļauj plānot modeļus visos GPU. Efekts: iespējo vairāku GPU izmantošanu modeļa secinājumiem. Scenārijs: Izdevīgi augstas veiktspējas skaitļošanas vidē ar vairākiem GPU, lai maksimāli palielinātu aparatūras izmantošanu. |
| OLLAMA_INTEL_GPU | false | Iespējo eksperimentālu Intel GPU noteikšanu. Efekts: ļauj izmantot Intel GPU modeļa secinājumiem. Scenārijs: noderīgs organizācijām, kas izmanto Intel GPU aparatūru AI darba slodzēm. |
| OLLAMA_LLM_LIBRARY | "" (automātiskā noteikšana) | Iestata izmantojamo LLM bibliotēku. Efekts: ignorē automātisko LLM bibliotēkas noteikšanu. Scenārijs: noderīgs, ja saderības vai veiktspējas apsvērumu dēļ ir nepieciešams piespiest noteiktu bibliotēkas versiju vai ieviešanu. |
| OLLAMA_TMPDIR | Sistēmas noklusējuma pagaidu direktorijs | Iestata pagaidu failu atrašanās vietu. Efekts: nosaka, kur tiek glabāti pagaidu faili. Scenārijs: Svarīgi, lai pārvaldītu I/O veiktspēju vai ja sistēmas pagaidu direktorijā ir ierobežota vieta. |
| CUDA_VISIBLE_DEVICES | Visi pieejami | Iestata, kuras NVIDIA ierīces ir redzamas. Efekts: kontrolē, kurus NVIDIA GPU var izmantot. Scenārijs: kritiski svarīgs GPU sadalījuma pārvaldībai vairāku lietotāju vai vairāku procesu vidēs. |
| HIP_VISIBLE_DEVICES | Visi pieejami | Iestata, kuras AMD ierīces ir redzamas. Efekts: kontrolē, kurus AMD GPU var izmantot. Scenārijs: Līdzīgs CUDA_VISIBLE_DEVICES, bet AMD aparatūrai. |
| OLLAMA_RUNNERS_DIR | Atkarīgs no sistēmas | Nosaka skrējēju atrašanās vietu. Efekts: nosaka, kur atrodas skrējēju izpildāmie faili. Scenārijs: Svarīgi pielāgotiem izvietojumiem vai gadījumos, kad skrējēji ir jāizolē no galvenās lietojumprogrammas. |
| OLLAMA_NUM_PARALLEL | 0 (neierobežots) | Iestata paralēlo modeļu pieprasījumu skaitu. Efekts: kontrolē modeļa secinājumu vienlaicīgumu. Scenārijs: kritiski svarīgs, lai pārvaldītu sistēmas slodzi un nodrošinātu reaģētspēju vidē ar lielu trafiku. |
| OLLAMA_MAX_LOADED_MODELS | 0 (neierobežots) | Iestata maksimālo ielādēto modeļu skaitu. Efekts: ierobežo vienlaicīgi ielādējamo modeļu skaitu. Scenārijs: palīdz pārvaldīt atmiņas lietojumu vidē ar ierobežotiem resursiem vai daudziem dažādiem modeļiem. |
| OLLAMA_MAX_QUEUE | 512 | Iestata maksimālo rindā esošo pieprasījumu skaitu. Efekts: ierobežo pieprasījumu rindas lielumu. Scenārijs: novērš sistēmas pārslodzi trafika pieauguma laikā un nodrošina savlaicīgu pieprasījumu apstrādi. |
| OLLAMA_MAX_VRAM | 0 (neierobežots) | Iestata maksimālo VRAM ignorēšanu baitos. Efekts: ierobežo izmantojamo VRAM daudzumu. Scenārijs: noderīgs koplietojamās GPU vidēs, lai nepieļautu, ka viens process monopolizē GPU atmiņu. |