| Variabel | Nilai Default | Deskripsi + Efek + Skenario |
| OLLAMA_HOST | "[color=var(--fgColor-accent, var(--color-accent-fg))]Login hyperlink terlihat." | Mengonfigurasi host dan skema untuk server Ollama. Efek: Menentukan URL yang digunakan untuk terhubung ke server Ollama. Skenario: Berguna saat menyebarkan Ollama di lingkungan terdistribusi atau saat Anda perlu mengekspos layanan pada antarmuka jaringan tertentu. |
| OLLAMA_ORIGINS | [localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri:// | Mengonfigurasi asal yang diizinkan untuk CORS. Efek: Mengontrol asal mana yang diizinkan untuk membuat permintaan ke server Ollama. Skenario: Penting saat mengintegrasikan Ollama dengan aplikasi web untuk mencegah akses tidak sah dari domain yang berbeda. |
| OLLAMA_MODELS | $HOME/.ollama/model | Mengatur jalur ke direktori model. Efek: Menentukan dari mana file model disimpan dan dimuat. Skenario: Berguna untuk mengelola ruang disk pada drive yang berbeda atau menyiapkan repositori model bersama di lingkungan multi-pengguna. |
| OLLAMA_KEEP_ALIVE | 5 menit | Mengatur berapa lama model tetap dimuat dalam memori. Efek: Mengontrol durasi model yang tetap ada di memori setelah digunakan. Skenario: Durasi yang lebih lama meningkatkan waktu respons untuk kueri yang sering tetapi meningkatkan penggunaan memori. Durasi yang lebih pendek membebaskan sumber daya tetapi dapat meningkatkan waktu respons awal. |
| OLLAMA_DEBUG | false | Mengaktifkan informasi debug tambahan. Efek: Meningkatkan verbositas output pengelogan dan penelusuran kesalahan. Skenario: Sangat berharga untuk memecahkan masalah atau memahami perilaku sistem selama pengembangan atau penerapan. |
| OLLAMA_FLASH_ATTENTION | false | Mengaktifkan fitur perhatian lampu kilat eksperimental. Efek: Mengaktifkan pengoptimalan eksperimental untuk mekanisme perhatian. Skenario: Berpotensi meningkatkan performa pada perangkat keras yang kompatibel tetapi dapat menimbulkan ketidakstabilan. |
| OLLAMA_NOHISTORY | false | Menonaktifkan riwayat garis bacaan. Efek: Mencegah riwayat perintah disimpan. Skenario: Berguna di lingkungan yang sensitif terhadap keamanan di mana riwayat perintah tidak boleh dipertahankan. |
| OLLAMA_NOPRUNE | false | Menonaktifkan pemangkasan blob model saat startup. Efek: Mempertahankan semua blob model, yang berpotensi meningkatkan penggunaan disk. Skenario: Berguna saat Anda perlu mempertahankan semua versi model untuk tujuan kompatibilitas atau pengembalian. |
| OLLAMA_SCHED_SPREAD | false | Memungkinkan penjadwalan model di semua GPU. Efek: Mengaktifkan penggunaan multi-GPU untuk inferensi model. Skenario: Bermanfaat di lingkungan komputasi berperforma tinggi dengan beberapa GPU untuk memaksimalkan pemanfaatan perangkat keras. |
| OLLAMA_INTEL_GPU | false | Mengaktifkan deteksi GPU Intel eksperimental. Efek: Mengizinkan penggunaan GPU Intel untuk inferensi model. Skenario: Berguna untuk organisasi yang memanfaatkan perangkat keras GPU Intel untuk beban kerja AI. |
| OLLAMA_LLM_LIBRARY | "" (deteksi otomatis) | Mengatur pustaka LLM untuk digunakan. Efek: Mengesampingkan deteksi otomatis pustaka LLM. Skenario: Berguna saat Anda perlu memaksa versi atau implementasi pustaka tertentu karena alasan kompatibilitas atau performa. |
| OLLAMA_TMPDIR | Direktori temp default sistem | Mengatur lokasi untuk file sementara. Efek: Menentukan tempat file sementara disimpan. Skenario: Penting untuk mengelola performa I/O atau ketika direktori suhu sistem memiliki ruang terbatas. |
| CUDA_VISIBLE_DEVICES | Semua tersedia | Mengatur perangkat NVIDIA mana yang terlihat. Efek: Mengontrol GPU NVIDIA mana yang dapat digunakan. Skenario: Penting untuk mengelola alokasi GPU di lingkungan multi-pengguna atau multi-proses. |
| HIP_VISIBLE_DEVICES | Semua tersedia | Mengatur perangkat AMD mana yang terlihat. Efek: Mengontrol GPU AMD mana yang dapat digunakan. Skenario: Mirip dengan CUDA_VISIBLE_DEVICES tetapi untuk perangkat keras AMD. |
| OLLAMA_RUNNERS_DIR | Bergantung pada sistem | Mengatur lokasi untuk pelari. Efek: Menentukan di mana file executable runner berada. Skenario: Penting untuk penyebaran kustom atau saat pelari perlu diisolasi dari aplikasi utama. |
| OLLAMA_NUM_PARALLEL | 0 (tidak terbatas) | Mengatur jumlah permintaan model paralel. Efek: Mengontrol konkurensi inferensi model. Skenario: Penting untuk mengelola beban sistem dan memastikan responsivitas di lingkungan dengan lalu lintas tinggi. |
| OLLAMA_MAX_LOADED_MODELS | 0 (tidak terbatas) | Mengatur jumlah maksimum model yang dimuat. Efek: Membatasi jumlah model yang dapat dimuat secara bersamaan. Skenario: Membantu mengelola penggunaan memori di lingkungan dengan sumber daya terbatas atau banyak model berbeda. |
| OLLAMA_MAX_QUEUE | 512 | Mengatur jumlah maksimum permintaan antrean. Efek: Membatasi ukuran antrean permintaan. Skenario: Mencegah kelebihan beban sistem selama lonjakan lalu lintas dan memastikan pemrosesan permintaan tepat waktu. |
| OLLAMA_MAX_VRAM | 0 (tidak terbatas) | Mengatur penggantian VRAM maksimum dalam byte. Efek: Membatasi jumlah VRAM yang dapat digunakan. Skenario: Berguna di lingkungan GPU bersama untuk mencegah satu proses memonopoli memori GPU. |