Persyaratan: Saya menerapkan model DeepSeek-R1 menggunakan Ollama dan ingin melihat informasi permintaan dari beberapa plugin untuk memahami detailnya. Misalnya: Buka WebUI, lanjutkan, cline, Roo Code, dll.
Resensi:
Untuk mencetak permintaan input di sisi server, Anda perlu mengaktifkan mode Debug. mengedit/etc/systemd/system/ollama.service.d/override.conf, tambahkan konfigurasi berikut:
Muat ulang dan mulai layanan ollama dengan perintah berikut:
Gunakan journalctl untuk melihat log output layanan dengan perintah berikut:
Gunakan Open WebUI untuk memanggil ollama untuk pengujian, seperti yang ditunjukkan pada gambar di bawah ini:
Lognya adalah sebagai berikut:
Feb 06 21:25:48 VM-0-8-ubuntu ollama[13503]: [GIN] 2025/02/06 - 21:25:48 | 200 | 6.186257471 | 172.18.0.2 | POSTING "/api/obrolan" Feb 06 21:25:48 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:25:48.411+08:00 level=DEBUG source=sched.go:407 msg="context for request finished" Feb 06 21:25:48 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:25:48.411+08:00 level=DEBUG source=sched.go:339 msg="runner dengan durasi bukan nol telah menganggur, menambahkan timer" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 durasi=2562047h47m16.854775807s Feb 06 21:25:48 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:25:48.411+08:00 level=DEBUG source=sched.go:357 msg="setelah memproses permintaan selesai peristiwa" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 refCount=0 Feb 06 21:25:54 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:25:54.834+08:00 level=DEBUG source=sched.go:575 msg="mengevaluasi sudah dimuat" model = / data / ollama / model / gumpalan / sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 Feb 06 21:25:54 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:25:54.835+08:00 level=DEBUG source=routes.go:1470 msg="chat request" images=0 prompt=<|User|>Nama saya Xiao Zha, siapa Anda? <|Asisten|> Feb 06 21:25:54 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:25:54.836+08:00 level=DEBUG source=cache.go:104 msg="loading cache slot" id=0 cache=728 prompt=13 used=2 remaining=11 Feb 06 21:26:02 VM-0-8-ubuntu ollama[13503]: [GIN] 2025/02/06 - 21:26:02 | 200 | 7.642182053 | 172.18.0.2 | POSTING "/api/obrolan" Feb 06 21:26:02 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:02.454+08:00 level=DEBUG source=sched.go:407 msg="context for request finished" Feb 06 21:26:02 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:02.454+08:00 level=DEBUG source=sched.go:339 msg="runner dengan durasi bukan nol telah menganggur, menambahkan timer" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 durasi=2562047h47m16.854775807s Feb 06 21:26:02 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:02.454+08:00 level=DEBUG source=sched.go:357 msg="setelah memproses permintaan selesai peristiwa" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 refCount=0 Feb 06 21:26:02 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:02.491+08:00 level=DEBUG source=sched.go:575 msg="mengevaluasi sudah dimuat" model = / data / ollama / model / gumpalan / sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 Feb 06 21:26:02 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:02.491+08:00 level=DEBUG source=routes.go:1470 msg="chat request" images=0 prompt="<|User|>### Tugas:\nBuat judul ringkas 3-5 kata dengan emoji yang merangkum riwayat obrolan.\n### Pedoman:\n- Judul harus dengan jelas mewakili tema utama atau subjek percakapan.\ n- Gunakan emoji yang meningkatkan pemahaman tentang topik, tetapi hindari tanda kutip atau pemformatan khusus.\n- Tulis judul dalam bahasa utama obrolan; default ke bahasa Inggris jika multibahasa.\n- Prioritaskan akurasi daripada kreativitas yang berlebihan; tetap jelas dan sederhana.\n### Output:\nJSON format: { \"title\": \"judul ringkas Anda di sini\" }\n### Contoh:\n- { \"title\": \" Tren Pasar Saham\" },\n- { \"title\": \" Cokelat Sempurna Resep Chip\" },\n- { \"title\": \"Evolusi Streaming Musik\" },\n- { \"title\": \"Tips Produktivitas Kerja Jarak Jauh\" },\n- { \"title\": \"Kecerdasan Buatan dalam Perawatan Kesehatan\" },\n- { \" title\": \" Wawasan Pengembangan Video Game\" }\n### Riwayat Obrolan:\n<chat_history>\nPENGGUNA: Nama saya Xiao Zha, siapa Anda? \nASISTEN: Halo, kecil! Saya DeepSeek-R1-Lite-Preview, asisten cerdas yang dikembangkan oleh DeepSeek, dan saya akan melakukan yang terbaik untuk membantu Anda. Apakah ada yang bisa saya lakukan untuk Anda? \n</chat_history><|Asisten|>" Feb 06 21:26:02 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:02.495+08:00 level=DEBUG source=cache.go:104 msg="loading cache slot" id=1 cache=567 prompt=312 used=6 remaining= 306 Feb 06 21:26:14 VM-0-8-ubuntu ollama[13503]: [GIN] 2025/02/06 - 21:26:14 | 200 | 12.263297485 | 172.18.0.2 | POSTING "/api/obrolan" Feb 06 21:26:14 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:14.731+08:00 level=DEBUG source=sched.go:407 msg="context for request finished" Feb 06 21:26:14 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:14.731+08:00 level=DEBUG source=sched.go:339 msg="runner dengan durasi bukan nol telah menganggur, menambahkan timer" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 durasi=2562047h47m16.854775807s Feb 06 21:26:14 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:14.731+08:00 level=DEBUG source=sched.go:357 msg="setelah memproses permintaan selesai peristiwa" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 refCount=0 Feb 06 21:26:14 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:14.769+08:00 level=DEBUG source=sched.go:575 msg="mengevaluasi sudah dimuat" model = / data / ollama / model / gumpalan / sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 Feb 06 21:26:14 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:14.769+08:00 level=DEBUG source=routes.go:1470 msg="chat request" images=0 prompt="<|User|>### Tugas:\nHasilkan 1-3 tag luas yang mengkategorikan tema utama riwayat obrolan, bersama dengan 1-3 tag subtopik yang lebih spesifik.\n\n### Pedoman:\n- Mulailah dengan domain tingkat tinggi (mis. Sains, Teknologi, Filsafat, Seni, Politik, Bisnis, Kesehatan, Olahraga, Hiburan, Pendidikan)\n- Pertimbangkan untuk memasukkan subbidang/subdomain yang relevan jika sangat diwakili sepanjang percakapan\n- Jika konten terlalu pendek (kurang dari 3 pesan) atau terlalu beragam, gunakan hanya [\"General\"]\n- Gunakan bahasa utama obrolan; default ke bahasa Inggris jika multibahasa\n- Prioritaskan akurasi daripada kekhususan\n\n### Output:\nFormat JSON: { \"tags\": [\"tag1\", \"tag2\", \"tag3\"] }\n\n### Riwayat Obrolan:\n<chat_history>\nPENGGUNA: Nama saya Xiao Zha, siapa Anda? \nASISTEN: Halo, kecil! Saya DeepSeek-R1-Lite-Preview, asisten cerdas yang dikembangkan oleh DeepSeek, dan saya akan melakukan yang terbaik untuk membantu Anda. Apakah ada yang bisa saya lakukan untuk Anda? \n</chat_history><|Asisten|>" Feb 06 21:26:14 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:14.773+08:00 level=DEBUG source=cache.go:104 msg="loading cache slot" id=1 cache=637 prompt=249 used=7 remaining= 242 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:17.717+08:00 level=DEBUG source=sched.go:575 msg="mengevaluasi sudah dimuat" model = / data / ollama / model / gumpalan / sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:17.718+08:00 level=DEBUG source=server.go:966 msg="pelari baru terdeteksi, memuat model untuk tokenisasi cgo" Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: memuat data meta dengan 26 pasangan nilai kunci dan 771 tensor dari /data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 (versi GGUF V3 (terbaru)) Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: Membuang kunci/nilai metadata. Catatan: Penggantian KV tidak berlaku dalam output ini. Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 0: general.architecture str = qwen2 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 1: general.type str = model Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 2: general.name str = DeepSeek R1 Distill Qwen 32B Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 3: general.basename str = DeepSeek-R1-Distill-Qwen Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 4: general.size_label str = 32B Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 5: qwen2.block_count u32 = 64 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 6: qwen2.context_length u32 = 131072 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 7: qwen2.embedding_length u32 = 5120 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 8: qwen2.feed_forward_length u32 = 27648 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 9: qwen2.attention.head_count u32 = 40 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 10: qwen2.attention.head_count_kv u32 = 8 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 11: qwen2.rope.freq_base f32 = 1000000.000000 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 12: qwen2.attention.layer_norm_rms_epsilon f32 = 0.000010 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 13: general.file_type u32 = 15 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 14: tokenizer.ggml.model str = gpt2 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 15: tokenizer.ggml.pre str = deepseek-r1-qwen Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 16: tokenizer.ggml.tokens arr[str,152064] = ["!", "\"", "#", "$", "%", "&", "'", ... Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 17: tokenizer.ggml.token_type arr[i32,152064] = [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ... Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 18: tokenizer.ggml.merges arr[str,151387] = ["Ġ Ġ", "ĠĠ ĠĠ", "i n", "Ġ t",... Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 19: tokenizer.ggml.bos_token_id u32 = 151646 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 20: tokenizer.ggml.eos_token_id u32 = 151643 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 21: tokenizer.ggml.padding_token_id u32 = 151643 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 22: tokenizer.ggml.add_bos_token bool = true Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 23: tokenizer.ggml.add_eos_token bool = false Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 24: tokenizer.chat_template str = {% jika tidak add_generation_prompt adalah de... Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - kv 25: general.quantization_version u32 = 2 Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - tipe f32: 321 tensor Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - tipe q4_K: 385 tensor Feb 06 21:26:17 VM-0-8-ubuntu ollama[13503]: llama_model_loader: - ketik q6_K: 65 tensor Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_vocab: jenis pra-tokenizer yang hilang atau tidak dikenali, menggunakan: 'default' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_vocab: special_eos_id tidak ada di special_eog_ids - konfigurasi tokenizer mungkin salah Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_vocab: ukuran cache token khusus = 22 Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_vocab: token ke ukuran cache bagian = 0.9310 MB Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: format = GGUF V3 (terbaru) Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: lengkungan = qwen2 Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: kosakata tipe = BPE Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: n_vocab = 152064 Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: n_merges = 151387 Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: vocab_only = 1 Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: jenis model = ? B Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: model ftype = semua F32 Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: parameter model = 32.76 B Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: ukuran model = 18.48 GiB (4.85 BPW) Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: general.name = DeepSeek R1 Distill Qwen 32B Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token BOS = 151646 '<|awal kalimat|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: EOS token = 151643 '<|akhir kalimat|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: EOT token = 151643 '<|akhir kalimat|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token PAD = 151643 '<|akhir kalimat|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: LF token = 148848 'ÄĬ' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token FIM PRE = 151659 '<|fim_prefix|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token FIM SUF = 151661 '<|fim_suffix|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token FIM MID = 151660 '<|fim_middle|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token FIM PAD = 151662 '<|fim_pad|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token FIM REP = 151663 '<|repo_name|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: FIM SEP token = 151664 '<|file_sep|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: token EOG = 151643 '<|akhir kalimat|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token EOG = 151662 '<|fim_pad|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: EOG token = 151663 '<|repo_name|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: Token EOG = 151664 '<|file_sep|>' Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llm_load_print_meta: panjang token maks = 256 Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: llama_model_load: kosakata saja - melewatkan tensor Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:18.440+08:00 level=DEBUG source=routes.go:1470 msg="chat request" images=0 prompt="<|User|>Nama saya Xiao Zha, siapa Anda? <|Asisten|>\nHalo, kecil! Saya DeepSeek-R1-Lite-Preview, asisten cerdas yang dikembangkan oleh DeepSeek, dan saya akan melakukan yang terbaik untuk membantu Anda. Apakah ada yang bisa saya lakukan untuk Anda? <|akhir kalimat|><|Pengguna|>Halo DeepSeek-R1<|Asisten|>" Feb 06 21:26:18 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:18.491+08:00 level=DEBUG source=cache.go:104 msg="loading cache slot" id=0 cache=223 prompt=64 used=13 remaining= 51 Feb 06 21:26:24 VM-0-8-ubuntu ollama[13503]: [GIN] 2025/02/06 - 21:26:24 | 200 | 6.737131375 | 172.18.0.2 | POSTING "/api/obrolan" Feb 06 21:26:24 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:24.426+08:00 level=DEBUG source=sched.go:407 msg="context for request finished" Feb 06 21:26:24 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:24.426+08:00 level=DEBUG source=sched.go:357 msg="setelah memproses permintaan selesai peristiwa" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 refCount=1 Feb 06 21:26:24 VM-0-8-ubuntu ollama[13503]: [GIN] 2025/02/06 - 21:26:24 | 200 | 10.172441322 | 172.18.0.2 | POSTING "/api/obrolan" Feb 06 21:26:24 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:24.918+08:00 level=DEBUG source=sched.go:407 msg="context for request finished" Feb 06 21:26:24 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:24.918+08:00 level=DEBUG source=sched.go:339 msg="runner dengan durasi bukan nol telah idle, menambahkan timer" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 durasi=2562047h47m16.854775807s Feb 06 21:26:24 VM-0-8-ubuntu ollama[13503]: time=2025-02-06T21:26:24.918+08:00 level=DEBUG source=sched.go:357 msg="setelah memproses permintaan selesai peristiwa" modelPath=/data/ollama/models/blobs/sha256-6150cb382311b69f09cc0f9a1b69fc029cbd742b66bb8ec531aa5ecf5c613e93 refCount=0 Referensi:
Login hyperlink terlihat.
Login hyperlink terlihat. |