| Променлив | Стандартна стойност | Описание + Ефект + Сценарий |
| OLLAMA_HOST | "[color=var(--fgЦвят-акцент, var(--цвят-акцент-fg))]Входът към хиперлинк е видим." | Конфигурира хоста и схемата за сървъра на Ollama. Ефект: Определя URL адреса, използван за свързване към сървъра Ollama. Сценарий: Полезен при внедряване на Ollama в разпределена среда или когато трябва да експонирате услугата на конкретен мрежов интерфейс. |
| OLLAMA_ORIGINS | [localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri:// | Конфигурациите позволяват произход на CORS. Ефект: Контролира кои origins имат право да правят заявки към сървъра на Ollama. Сценарий: Критичен при интегриране на Ollama с уеб приложения за предотвратяване на неоторизиран достъп от различни домейни. |
| OLLAMA_MODELS | $HOME/.ollama/models | Задава пътя към директорията с модели. Ефект: Определя къде се съхраняват и зареждат моделните файлове. Сценарий: Полезен за управление на дисково пространство на различни устройства или за настройване на споделени хранилища за модели в многопотребителски среди. |
| OLLAMA_KEEP_ALIVE | 5 минути | Определя колко дълго моделите остават заредени в паметта. Ефект: Контролира моделите за продължителност, които остават в паметта след употреба. Сценарий: По-дългите периоди подобряват времето за отговор при чести заявки, но увеличават използването на памет. По-кратките периоди освобождават ресурси, но могат да удължат началните времена за реакция. |
| OLLAMA_DEBUG | false | Активира допълнителна информация за отстраняване на грешки. Ефект: Увеличава многословността при логване и отстраняване на грешки. Сценарий: Безценен за отстраняване на проблеми или разбиране на поведението на системата по време на разработка или внедряване. |
| OLLAMA_FLASH_ATTENTION | false | Активира експерименталната функция за внимание на светкавицата. Ефект: Активира експериментална оптимизация за механизмите на вниманието. Сценарий: Може потенциално да подобри производителността на съвместим хардуер, но може да доведе до нестабилност. |
| OLLAMA_NOHISTORY | false | Деактивира историята на линиите на четене. Ефект: Предотвратява запазването на историята на командите. Сценарий: Полезно в среди, чувствителни към сигурността, където историята на командите не трябва да се запазва. |
| OLLAMA_NOPRUNE | false | Изключва подрязването на blob-овете на модела при стартиране. Ефект: Запазва всички модели blob-ове, потенциално увеличавайки използването на диска. Сценарий: Полезен, когато трябва да поддържате всички версии на модела за съвместимост или връщане назад. |
| OLLAMA_SCHED_SPREAD | false | Позволява планиране на модели за всички GPU-та. Ефект: Позволява използването на мулти-GPU за извеждане на модели. Сценарий: Полезно в високопроизводителни изчислителни среди с множество графични процесори за максимално използване на хардуера. |
| OLLAMA_INTEL_GPU | false | Позволява експериментално откриване на Intel GPU. Ефект: Позволява използването на Intel GPU за извеждане на модели. Сценарий: Полезен за организации, които използват Intel GPU хардуер за AI задачи. |
| OLLAMA_LLM_LIBRARY | "" (автоматично откриване) | Настройва LLM библиотеката да използва. Ефект: Отменя автоматичното откриване на библиотеката на LLM. Сценарий: Полезен, когато трябва да наложиш определена библиотечна версия или имплементация поради съвместимост или производителност. |
| OLLAMA_TMPDIR | Системна временна директория по подразбиране | Задава местоположението за временни файлове. Ефект: Определя къде се съхраняват временните файлове. Сценарий: Важен за управление на производителността на I/O или когато временната директория на системата има ограничено място. |
| CUDA_VISIBLE_DEVICES | Всички са налични | Определя кои NVIDIA устройства са видими. Ефект: Контролира кои NVIDIA GPU могат да се използват. Сценарий: Критичен за управление на разпределението на GPU в многопотребителски или многопроцесни среди. |
| HIP_VISIBLE_DEVICES | Всички са налични | Комплекти кои AMD устройства са видими. Ефект: Контролира кои AMD GPU могат да се използват. Сценарий: Подобно на CUDA_VISIBLE_DEVICES, но за хардуера на AMD. |
| OLLAMA_RUNNERS_DIR | Зависим от системата | Определя местоположението за бегачите. Ефект: Определя къде се намират изпълнимите файлове на runner. Сценарий: Важен за персонализирани внедрявания или когато рънърите трябва да бъдат изолирани от основното приложение. |
| OLLAMA_NUM_PARALLEL | 0 (неограничен) | Задава броя на заявките за паралелни модели. Ефект: Контролира съвместимостта на изводите на модела. Сценарий: Критично за управление на натоварването на системата и осигуряване на отзивчивост в среди с интензивен трафик. |
| OLLAMA_MAX_LOADED_MODELS | 0 (неограничен) | Определя максималния брой заредени модели. Ефект: Ограничава броя на моделите, които могат да се зареждат едновременно. Сценарий: Помага за управление на използването на памет в среди с ограничени ресурси или с много различни модели. |
| OLLAMA_MAX_QUEUE | 512 | Задава максимален брой опашени заявки. Ефект: Ограничава размера на опашката за заявки. Сценарий: Предотвратява претоварване на системата по време на пикове в трафика и осигурява навременна обработка на заявките. |
| OLLAMA_MAX_VRAM | 0 (неограничен) | Задава максимален VRAM override в байтове. Ефект: Ограничава количеството VRAM, което може да се използва. Сценарий: Полезно в споделени GPU среди, за да се предотврати монополизиране на GPU паметта от един процес. |