| Kintamojo | Numatytoji reikšmė | Aprašymas + Poveikis + Scenarijus |
| OLLAMA_HOST | "[color=var(--fgColor-accent, var(--color-accent-fg))]Hipersaito prisijungimas matomas." | Konfigūruoja pagrindinį kompiuterį ir schemą Ollama serveriui. Efektas: nustato URL, naudojamą prisijungiant prie "Ollama" serverio. Scenarijus: naudinga diegiant "Ollama" paskirstytoje aplinkoje arba kai reikia atskleisti paslaugą konkrečioje tinklo sąsajoje. |
| OLLAMA_ORIGINS | [localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri:// | Konfigūruoja leistiną CORS kilmę. Poveikis: kontroliuoja, kurioms kilmėms leidžiama teikti užklausas į Ollama serverį. Scenarijus: Labai svarbu integruojant "Ollama" su žiniatinklio programomis, kad būtų išvengta neteisėtos prieigos iš skirtingų domenų. |
| OLLAMA_MODELS | $HOME/.ollama/models | Nustato kelią į modelių katalogą. Efektas: nustato, kur saugomi ir įkeliami modelio failai. Scenarijus: naudinga valdant disko vietą skirtinguose diskuose arba nustatant bendrai naudojamų modelių saugyklas kelių vartotojų aplinkoje. |
| OLLAMA_KEEP_ALIVE | 5 minutės | Nustatoma, kiek laiko modeliai bus įkelti į atmintį. Efektas: valdo trukmę, kurią modeliai išlieka atmintyje po naudojimo. Scenarijus: ilgesnė trukmė pagerina atsakymo į dažnas užklausas laiką, bet padidina atminties naudojimą. Trumpesnė trukmė atlaisvina išteklius, bet gali pailginti pradinio atsakymo laiką. |
| OLLAMA_DEBUG | false | Įgalina papildomą derinimo informaciją. Efektas: padidina registravimo ir derinimo išvesties išsamumą. Scenarijus: neįkainojamas šalinant problemas arba suprantant sistemos veikimą kuriant ar diegiant sistemą. |
| OLLAMA_FLASH_ATTENTION | false | Įjungia eksperimentinę blykstės dėmesio funkciją. Efektas: suaktyvina eksperimentinį dėmesio mechanizmų optimizavimą. Scenarijus: gali pagerinti suderinamos aparatinės įrangos našumą, bet gali sukelti nestabilumą. |
| OLLAMA_NOHISTORY | false | Išjungia skaitymo eilučių retrospektyvą. Poveikis: neleidžia išsaugoti komandų istorijos. Scenarijus: naudinga saugumui jautrioje aplinkoje, kur komandų istorija neturėtų būti išsaugota. |
| OLLAMA_NOPRUNE | false | Išjungia modelio dėmių genėjimą paleidžiant. Efektas: išlaiko visus modelio blobus, todėl gali padidėti disko naudojimas. Scenarijus: naudinga, kai reikia tvarkyti visas modelio versijas suderinamumo ar atšaukimo tikslais. |
| OLLAMA_SCHED_SPREAD | false | Leidžia planuoti modelius visuose GPU. Efektas: įgalina kelių GPU naudojimą modelio išvadoms. Scenarijus: naudinga didelio našumo skaičiavimo aplinkoje su keliais GPU, siekiant maksimaliai išnaudoti aparatinę įrangą. |
| OLLAMA_INTEL_GPU | false | Įgalina eksperimentinį "Intel" GPU aptikimą. Efektas: leidžia naudoti "Intel" GPU modelio išvadoms. Scenarijus: naudinga organizacijoms, naudojančioms "Intel" GPU aparatinę įrangą dirbtinio intelekto darbo krūviams. |
| OLLAMA_LLM_LIBRARY | "" (automatinis aptikimas) | Nustato naudoti LLM biblioteką. Efektas: nepaisoma automatinio LLM bibliotekos aptikimo. Scenarijus: naudinga, kai reikia priversti konkrečią bibliotekos versiją arba diegimą dėl suderinamumo ar našumo priežasčių. |
| OLLAMA_TMPDIR | Sistemos numatytasis laikinasis katalogas | Nustato laikinųjų failų vietą. Efektas: nustato, kur saugomi laikinieji failai. Scenarijus: svarbu valdant įvesties / išvesties našumą arba kai sistemos laikinajame kataloge yra mažai vietos. |
| CUDA_VISIBLE_DEVICES | Visi galimi | Nustatoma, kurie NVIDIA įrenginiai yra matomi. Efektas: kontroliuoja, kuriuos NVIDIA GPU galima naudoti. Scenarijus: labai svarbus valdant GPU paskirstymą kelių vartotojų arba kelių procesų aplinkoje. |
| HIP_VISIBLE_DEVICES | Visi galimi | Nustato, kurie AMD įrenginiai yra matomi. Efektas: kontroliuoja, kuriuos AMD GPU galima naudoti. Scenarijus: Panašus į CUDA_VISIBLE_DEVICES, bet skirtas AMD aparatinei įrangai. |
| OLLAMA_RUNNERS_DIR | Priklauso nuo sistemos | Nustato bėgikų vietą. Efektas: nustato, kur yra bėgikų vykdomieji failai. Scenarijus: svarbu pasirinktiniams diegimams arba kai bėgikus reikia izoliuoti nuo pagrindinės programos. |
| OLLAMA_NUM_PARALLEL | 0 (neribotas) | Nustato lygiagrečių modelių užklausų skaičių. Poveikis: valdo modelio išvadų sutapimą. Scenarijus: labai svarbus norint valdyti sistemos apkrovą ir užtikrinti reagavimą didelio srauto aplinkoje. |
| OLLAMA_MAX_LOADED_MODELS | 0 (neribotas) | Nustatomas maksimalus pakrautų modelių skaičius. Poveikis: Ribojamas modelių, kuriuos galima įkelti vienu metu, skaičius. Scenarijus: padeda valdyti atminties naudojimą aplinkoje, kurioje yra riboti ištekliai arba daug skirtingų modelių. |
| OLLAMA_MAX_QUEUE | 512 | Nustato maksimalų eilėje esančių užklausų skaičių. Efektas: riboja užklausų eilės dydį. Scenarijus: apsaugo nuo sistemos perkrovos srauto šuolių metu ir užtikrina savalaikį užklausų apdorojimą. |
| OLLAMA_MAX_VRAM | 0 (neribotas) | Nustato maksimalų VRAM nepaisymą baitais. Efektas: Riboja VRAM kiekį, kurį galima naudoti. Scenarijus: naudinga bendrose GPU aplinkose, kad vienas procesas nemonopolizuotų GPU atminties. |