| Μεταβλητός | Προεπιλεγμένη τιμή | Περιγραφή + Εφέ + Σενάριο |
| OLLAMA_HOST | "[color=var(--fgColor-accent, var(--color-accent-fg))]Η σύνδεση με υπερσύνδεσμο είναι ορατή." | Ρυθμίζει τις παραμέτρους του κεντρικού υπολογιστή και του σχήματος για τον διακομιστή Ollama. Εφέ: Καθορίζει τη διεύθυνση URL που χρησιμοποιείται για τη σύνδεση με τον διακομιστή Ollama. Σενάριο: Χρήσιμο κατά την ανάπτυξη του Ollama σε ένα κατανεμημένο περιβάλλον ή όταν πρέπει να εκθέσετε την υπηρεσία σε μια συγκεκριμένη διεπαφή δικτύου. |
| OLLAMA_ORIGINS | [localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri:// | Οι διαμορφώσεις επέτρεψαν την προέλευση του CORS. Effect: Ελέγχει ποιες προελεύσεις επιτρέπεται να κάνουν αιτήματα στον διακομιστή Ollama. Σενάριο: Κρίσιμο κατά την ενσωμάτωση του Ollama με εφαρμογές Ιστού για την αποτροπή μη εξουσιοδοτημένης πρόσβασης από διαφορετικούς τομείς. |
| OLLAMA_MODELS | $HOME/.ollama/μοντέλα | Ορίζει τη διαδρομή προς τον κατάλογο μοντέλων. Εφέ: Καθορίζει από πού αποθηκεύονται και φορτώνονται τα αρχεία μοντέλου. Σενάριο: Χρήσιμο για τη διαχείριση χώρου στο δίσκο σε διαφορετικές μονάδες δίσκου ή τη ρύθμιση κοινόχρηστων αποθετηρίων μοντέλων σε περιβάλλοντα πολλών χρηστών. |
| OLLAMA_KEEP_ALIVE | 5 λεπτά | Ρυθμίζει το χρονικό διάστημα για το οποίο τα μοντέλα παραμένουν φορτωμένα στη μνήμη. Εφέ: Ελέγχει τη διάρκεια παραμονής των μοντέλων στη μνήμη μετά τη χρήση. Σενάριο: Οι μεγαλύτερες διάρκειες βελτιώνουν τους χρόνους απόκρισης για συχνά ερωτήματα, αλλά αυξάνουν τη χρήση της μνήμης. Οι μικρότερες διάρκειες απελευθερώνουν πόρους, αλλά μπορεί να αυξήσουν τους αρχικούς χρόνους απόκρισης. |
| OLLAMA_DEBUG | false | Ενεργοποιεί πρόσθετες πληροφορίες εντοπισμού σφαλμάτων. Αποτέλεσμα: Αυξάνει την πολυγλωσσία της καταγραφής και του εντοπισμού σφαλμάτων. Σενάριο: Ανεκτίμητο για την αντιμετώπιση προβλημάτων ή την κατανόηση της συμπεριφοράς του συστήματος κατά την ανάπτυξη ή την ανάπτυξη. |
| OLLAMA_FLASH_ATTENTION | false | Ενεργοποιεί τη δυνατότητα πειραματικής προσοχής φλας. Επίδραση: Ενεργοποιεί μια πειραματική βελτιστοποίηση για μηχανισμούς προσοχής. Σενάριο: Μπορεί ενδεχομένως να βελτιώσει την απόδοση σε συμβατό υλικό, αλλά μπορεί να προκαλέσει αστάθεια. |
| OLLAMA_NOHISTORY | false | Απενεργοποιεί το ιστορικό γραμμής ανάγνωσης. Εφέ: Αποτρέπει την αποθήκευση του ιστορικού εντολών. Σενάριο: Χρήσιμο σε περιβάλλοντα ευαίσθητα στην ασφάλεια όπου το ιστορικό εντολών δεν πρέπει να διατηρείται. |
| OLLAMA_NOPRUNE | false | Απενεργοποιεί το κλάδεμα των blob του μοντέλου κατά την εκκίνηση. Εφέ: Διατηρεί όλα τα blob του μοντέλου, αυξάνοντας ενδεχομένως τη χρήση του δίσκου. Σενάριο: Χρήσιμο όταν χρειάζεται να διατηρήσετε όλες τις εκδόσεις του μοντέλου για λόγους συμβατότητας ή επαναφοράς. |
| OLLAMA_SCHED_SPREAD | false | Επιτρέπει τον προγραμματισμό μοντέλων σε όλες τις GPU. Εφέ: Ενεργοποιεί τη χρήση πολλαπλών GPU για εξαγωγή συμπερασμάτων μοντέλου. Σενάριο: Ευεργετικό σε υπολογιστικά περιβάλλοντα υψηλής απόδοσης με πολλαπλές GPU για μεγιστοποίηση της χρήσης υλικού. |
| OLLAMA_INTEL_GPU | false | Επιτρέπει την πειραματική ανίχνευση GPU της Intel. Αποτέλεσμα: Επιτρέπει τη χρήση GPU της Intel για εξαγωγή συμπερασμάτων μοντέλου. Σενάριο: Χρήσιμο για οργανισμούς που αξιοποιούν το υλικό Intel GPU για φόρτους εργασίας AI. |
| OLLAMA_LLM_LIBRARY | "" (αυτόματος εντοπισμός) | Ρυθμίζει τη βιβλιοθήκη LLM που θα χρησιμοποιηθεί. Εφέ: Παρακάμπτει τον αυτόματο εντοπισμό της βιβλιοθήκης LLM. Σενάριο: Χρήσιμο όταν πρέπει να επιβάλετε μια συγκεκριμένη έκδοση ή υλοποίηση βιβλιοθήκης για λόγους συμβατότητας ή απόδοσης. |
| OLLAMA_TMPDIR | Προεπιλεγμένος προσωρινός κατάλογος συστήματος | Ορίζει τη θέση για τα προσωρινά αρχεία. Εφέ: Καθορίζει πού αποθηκεύονται τα προσωρινά αρχεία. Σενάριο: Σημαντικό για τη διαχείριση της απόδοσης I/O ή όταν ο κατάλογος θερμοκρασίας συστήματος έχει περιορισμένο χώρο. |
| CUDA_VISIBLE_DEVICES | Όλα διαθέσιμα | Ορίζει ποιες συσκευές NVIDIA είναι ορατές. Εφέ: Ελέγχει ποιες GPU NVIDIA μπορούν να χρησιμοποιηθούν. Σενάριο: Κρίσιμο για τη διαχείριση της κατανομής GPU σε περιβάλλοντα πολλών χρηστών ή πολλαπλών διεργασιών. |
| HIP_VISIBLE_DEVICES | Όλα διαθέσιμα | Ορίζει ποιες συσκευές AMD είναι ορατές. Αποτέλεσμα: Ελέγχει ποιες GPU της AMD μπορούν να χρησιμοποιηθούν. Σενάριο: Παρόμοιο με CUDA_VISIBLE_DEVICES αλλά για υλικό AMD. |
| OLLAMA_RUNNERS_DIR | Εξαρτάται από το σύστημα | Ορίζει τη θέση για τους δρομείς. Εφέ: Καθορίζει πού βρίσκονται τα εκτελέσιμα αρχεία δρομέων. Σενάριο: Σημαντικό για προσαρμοσμένες αναπτύξεις ή όταν οι δρομείς πρέπει να απομονωθούν από την κύρια εφαρμογή. |
| OLLAMA_NUM_PARALLEL | 0 (απεριόριστο) | Ορίζει τον αριθμό των αιτήσεων παράλληλου μοντέλου. Εφέ: Ελέγχει την ταυτόχρονη εξαγωγή συμπερασμάτων μοντέλου. Σενάριο: Κρίσιμο για τη διαχείριση του φόρτου του συστήματος και τη διασφάλιση της ανταπόκρισης σε περιβάλλοντα υψηλής επισκεψιμότητας. |
| OLLAMA_MAX_LOADED_MODELS | 0 (απεριόριστο) | Ορίζει τον μέγιστο αριθμό φορτωμένων μοντέλων. Εφέ: Περιορίζει τον αριθμό των μοντέλων που μπορούν να φορτωθούν ταυτόχρονα. Σενάριο: Βοηθά στη διαχείριση της χρήσης μνήμης σε περιβάλλοντα με περιορισμένους πόρους ή πολλά διαφορετικά μοντέλα. |
| OLLAMA_MAX_QUEUE | 512 | Ορίζει τον μέγιστο αριθμό αιτήσεων σε ουρά. Αποτέλεσμα: Περιορίζει το μέγεθος της ουράς αιτημάτων. Σενάριο: Αποτρέπει την υπερφόρτωση του συστήματος κατά τη διάρκεια αιχμών της κυκλοφορίας και διασφαλίζει την έγκαιρη επεξεργασία των αιτημάτων. |
| OLLAMA_MAX_VRAM | 0 (απεριόριστο) | Ορίζει μια μέγιστη παράκαμψη VRAM σε byte. Επίδραση: Περιορίζει την ποσότητα της VRAM που μπορεί να χρησιμοποιηθεί. Σενάριο: Χρήσιμο σε κοινόχρηστα περιβάλλοντα GPU για να αποτρέψετε τη μονοπώληση της μνήμης GPU από μία μόνο διαδικασία. |