| Muutuja | Vaikeväärtus | Kirjeldus + Efekt + Stsenaarium |
| OLLAMA_HOST | "[color=var(--fgColor-aktsent, var(--color-aktsent-fg))]Hüperlingi sisselogimine on nähtav." | Konfigureerib hosti ja skeemi Ollama serveri jaoks. Efekt: Määrab URL-i, mida kasutatakse Ollama serveriga ühendamiseks. Stsenaarium: Kasulik Ollama juurutamisel hajutatud keskkonnas või kui on vaja teenust konkreetsel võrguliidesel avada. |
| OLLAMA_ORIGINS | [localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri:// | Konfiguratsioonid võimaldasid CORS-i alguspunkte. Mõju: Kontrollib, millistel alguspunktidel on lubatud Ollama serverile päringuid teha. Stsenaarium: Oluline Ollama integreerimisel veebirakendustega, et takistada volitamata ligipääsu erinevatest domeenidest. |
| OLLAMA_MODELS | $HOME/.ollama/models | Määrab tee mudelite katalooni. Efekt: Määrab, kuhu mudelifailid salvestatakse ja kust need laaditakse. Stsenaarium: Kasulik kettaruumi haldamiseks erinevatel ketastel või jagatud mudelihoidlate seadistamiseks mitme kasutajaga keskkondades. |
| OLLAMA_KEEP_ALIVE | 5 minutit | Määrab, kui kaua mudelid mälus laetud püsivad. Efekt: Kontrollid, kestvuse mudelid jäävad pärast kasutamist mällu. Stsenaarium: Pikemad kestused parandavad sagedaste päringute reageerimisaega, kuid suurendavad mälukasutust. Lühemad kestused vabastavad ressursse, kuid võivad kiirendada esialgseid reageerimisaegu. |
| OLLAMA_DEBUG | false | Võimaldab täiendavat silumisinfot. Mõju: Suurendab logimise ja silumise väljundi sõnakasutust. Stsenaarium: Hindamatu probleemide lahendamiseks või süsteemi käitumise mõistmiseks arenduse või juurutamise ajal. |
| OLLAMA_FLASH_ATTENTION | false | Võimaldab eksperimentaalset flash-tähelepanu funktsiooni. Efekt: Aktiveerib eksperimentaalse optimeerimise tähelepanumehhanismide jaoks. Stsenaarium: Võib potentsiaalselt parandada jõudlust ühilduval riistvaral, kuid võib tekitada ebastabiilsust. |
| OLLAMA_NOHISTORY | false | Keelab readline'i ajaloo. Efekt: Takistab käsuajaloo salvestamist. Stsenaarium: Kasulik turvatundlikes keskkondades, kus käskude ajalugu ei tohiks säilitada. |
| OLLAMA_NOPRUNE | false | Keelab mudeli blobide kärpimise käivitamisel. Efekt: Säilitab kõik mudeli blobid, mis võib suurendada ketta kasutust. Stsenaarium: Kasulik, kui on vaja kõiki mudeliversioone hooldada ühilduvuse või tagasikerimise eesmärgil. |
| OLLAMA_SCHED_SPREAD | false | Võimaldab mudeleid ajastada kõigi GPU-de vahel. Efekt: Võimaldab mitme GPU kasutamist mudeli järeldamiseks. Stsenaarium: Kasulik kõrge jõudlusega arvutuskeskkondades, kus on mitu GPU-d, et maksimeerida riistvara kasutust. |
| OLLAMA_INTEL_GPU | false | Võimaldab eksperimentaalset Intel GPU tuvastust. Efekt: Võimaldab kasutada Intel GPU-sid mudeli järeldamiseks. Stsenaarium: Kasulik organisatsioonidele, kes kasutavad Intel GPU riistvara tehisintellekti töökoormuste jaoks. |
| OLLAMA_LLM_LIBRARY | "" (automaatne tuvastamine) | Seadistab LLM-i teegi kasutamiseks. Efekt: Tühistab LLM-i teegi automaatse tuvastuse. Stsenaarium: Kasulik, kui on vaja sundida konkreetset teegi versiooni või rakendust ühilduvuse või jõudluse huvides. |
| OLLAMA_TMPDIR | Süsteemi vaikimisi ajutine kataloog | Määrab ajutiste failide asukoha. Efekt: Määrab, kus ajutised failid asuvad. Stsenaarium: Oluline I/O jõudluse haldamiseks või siis, kui süsteemi ajutisel kataloogil on piiratud ruum. |
| CUDA_VISIBLE_DEVICES | Kõik saadaval | Määrab, millised NVIDIA seadmed on nähtavad. Efekt: Kontrollib, milliseid NVIDIA GPU-sid saab kasutada. Stsenaarium: Kriitiline GPU jaotuse haldamiseks mitme kasutaja või mitme protsessi keskkondades. |
| HIP_VISIBLE_DEVICES | Kõik saadaval | Komplektid, millised AMD seadmed on nähtavad. Efekt: Kontrollib, milliseid AMD GPU-sid saab kasutada. Stsenaarium: Sarnane CUDA_VISIBLE_DEVICES-le, aga AMD riistvarale. |
| OLLAMA_RUNNERS_DIR | Süsteemist sõltuv | Määrab jooksjate asukoha. Mõju: Määrab, kus jooksja täidetavad failid asuvad. Stsenaarium: Oluline kohandatud juurutuste puhul või siis, kui jooksutajad peavad olema põhirakendusest eraldatud. |
| OLLAMA_NUM_PARALLEL | 0 (piiramatu) | Määrab paralleelsete mudelipäringute arvu. Efekt: Kontrollib mudeli järeldamise samaaegsust. Stsenaarium: Kriitiline süsteemi koormuse haldamiseks ja reageerimisvõime tagamiseks suure liiklusega keskkondades. |
| OLLAMA_MAX_LOADED_MODELS | 0 (piiramatu) | Määrab maksimaalse laetud mudelite arvu. Mõju: Piirab samaaegselt laaditavate mudelite arvu. Stsenaarium: Aitab hallata mälukasutust piiratud ressursside või paljude erinevate mudelitega keskkondades. |
| OLLAMA_MAX_QUEUE | 512 | Määrab maksimaalse järjekorras olevate päringute arvu. Mõju: Piirab päringujärjekorra suurust. Stsenaarium: Takistab süsteemi ülekoormust liiklushüppe ajal ja tagab päringute õigeaegse töötlemise. |
| OLLAMA_MAX_VRAM | 0 (piiramatu) | Määrab maksimaalse VRAM-i ülekirjutuse baitides. Efekt: Piirab kasutatava VRAM-i hulka. Stsenaarium: Kasulik jagatud GPU keskkondades, et takistada ühel protsessil GPU mälu monopoliseerida. |