Bu makale makine çevirisi ayna makalesidir, orijinal makaleye geçmek için lütfen buraya tıklayın.

Görünüm: 2394|Yanıt: 10

【AI】(3) Tencent Cloud DeepSeek-R1'i HAI eğitimi ile dağıtıyor

[Bağlantıyı kopyala]
2025-2-5 tarihinde yayınlandı 21:14:04 | | | |
Hyper Application Inventor (HAI), yapay zeka ve bilimsel bilişim için bir GPU uygulama hizmet ürünüdür ve küçük ve orta ölçekli işletmelerin ve geliştiricilerin LLM'leri hızla dağıtmasına yardımcı olmak için plug-and-play hesaplama gücü ve ortak ortamlar sunar.

Adres:Bağlantı girişi görünür.

HAI vs GPU sunucuları

GPU bulut sunucusu kullanımı eşiğini büyük ölçüde azaltın, ürün deneyimini birden fazla açıdan optimize edin ve kutudan çıktığı gibi kullanın, aşağıdaki şekilde gösterildiği gibi:



HAI hesaplama gücünü satın alın

Satın alma sayfasına gidin, temel ortam "Ubuntu 20.04" imajını seçin ve ortamı yapılandırmak:Ubuntu 20.04, Driver 525.105.17, Python 3.8, CUDA 12.0, cuDNN 8Görüntü sürücüsü bizim için zaten yükledi ve aşağıdaki şekilde gösterildiği gibi ödeme yapmayı seçiyoruz:



Video belleği: 32GB+
Hashrate: 15+TFlops SP
CPU: 8~10 çekirdek
RAM: 40GB

Birkaç dakika bekledikten sonra örnek başarıyla oluşturulur ve Akademik Hızlandırma açılır, aşağıdaki şekilde gösterilmiştir:



İlk kullandığınızda şifrenizi sıfırlamanız gerekir ve giriş kullanıcı adı şöyledir:Ubuntu。 Sunucuya giriş yapıp NVIDIA GPU sürücü bilgilerini aşağıdaki komutla kontrol etmeyi deneyin:


Aşağıda gösterildiği gibi:


Ollama'yı Takla

Ollama Resmi Web Sitesi:Bağlantı girişi görünür.

Macun aracı ile sunucuya giriş yapın ve aşağıdaki komutla Ollama aracını yüklemeye başlayın:


Kurulum tamamlandı ve çıktı şu şekildedir:
>>> /usr/local olarak ollama yüklemesi
>>> Linux amd64 paketinin indirilmesi
######################################################################## 100.0%
>>> Ollama kullanıcısı yaratmak...
>>> Render grubuna ollama kullanıcısı ekleniyor...
>>> Video grubuna ollama kullanıcısı ekleniyor...
>>> Mevcut kullanıcı Ollama grubuna ekleniyor...
>>> Ollama systemd hizmeti oluşturmak...
>>> Ollama hizmetini etkinleştirip başlatmak...
/etc/systemd/system/default.target.wants/ollama.service → simlinki oluşturuldu.

Versiyon komutuna bak: ollama -v
Şu anda belleğe yüklenen modele bakınız: ollama ps

Aşağıdaki komutla özel bir model depolama klasörü oluşturun:

Varsayılan dinleme adresini ve model depolama yolunu değiştirin (varsayılan portu değiştiremezsiniz, aksi takdirde komut başarısız olur) ve aşağıdaki komutları kullanın:


Deepseek-r1 modelini dağıtın

Deepseek-r1:8b modelini aşağıdaki komutla çalıştırın:


Aşağıda gösterildiği gibi:



Diyaloğu aşağıda gösterildiği gibi test edin:



Güvenlik duvarı, aşağıdaki şekilde gösterildiği gibi TCP portu 11434'ü serbest bırakır ve HTTP arayüzünü çağırır:



{
  "modeller": [
    {
      "Name": "Deepseek-R1:8B",
      "model": "deepseek-r1:8b",
      "Size": 6930032640,
      "Digest": "28f8fd6cdc677661426adab9338ce3c013d7e69a5bea9e704b364171a5d61a10",
      "detaylar": {
        "parent_model": "",
        "format": "gguf",
        "aile": "lama",
        "aileler": [
          "Llama"
        ],
        "parameter_size": "8.0B",
        "quantization_level": "Q4_K_M"
      },
      "expires_at": "2025-02-05T21:14:50.715753614+08:00",
      "size_vram": 6930032640
    }
  ]
}

Referans:
Bağlantı girişi görünür.
Bağlantı girişi görünür.
Bağlantı girişi görünür.




Önceki:[AI] (2) DeepSeek-V3 ile R1 versiyonları arasındaki fark
Önümüzdeki:[AI] (4) Open WebUI kullanarak DeepSeek-R1 modelini çağırmak
 Ev sahibi| 2025-2-5 tarihinde 21:22:49 tarihinde yayınlandı |
Model bir süre boyunca istek veya girdi almazsa, Ollama kaynakları korumak için bulut merkezindeki modeli otomatik olarak sonlandırır.
 Ev sahibi| 2025-2-6 09:03:57 tarihinde yayınlandı |
Ollama Environment Variable Configuration Item

DeğişkenVarsayılan DeğerAçıklama + Etki + Senaryo
OLLAMA_HOST"[color=var(--fgColor-accent, var(--color-accent-fg))]Bağlantı girişi görünür."Ollama sunucusu için host ve şemayı yapılandırır. Etki: Ollama sunucusuna bağlanmak için kullanılan URL'yi belirler. Senaryo: Ollama'yı dağıtık bir ortamda dağıtırken veya hizmeti belirli bir ağ arayüzünde açmanız gerektiğinde faydalıdır.
OLLAMA_ORIGINS[localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri://Yapılandırmalar, CORS'un kökenlerini sağladı. Etkisi: Ollama sunucusuna hangi kökenlerin istekte bulunmasına izin verildiğini kontrol eder. Senaryo: Ollama'yı web uygulamalarıyla entegre ederken farklı alan bölgelerinden yetkisiz erişimi önlemek için kritiktir.
OLLAMA_MODELS$HOME/.ollama/modelsModeller dizinine giden yolu ayarlar. Etki: Model dosyalarının nereden saklandığını ve nereden yüklendiğini belirler. Senaryo: Farklı sürücülerde disk alanını yönetmek veya çok kullanıcılı ortamlarda paylaşılan model depoları kurmak için faydalıdır.
OLLAMA_KEEP_ALIVE5 dakikaModellerin bellekte ne kadar süre yüklü kalacağını ayarlar. Etki: Kontroller, modeller kullanıldıktan sonra hafızada kalan süre. Senaryo: Daha uzun süreler, sık sorgular için yanıt sürelerini artırır ancak bellek kullanımını artırır. Daha kısa süreler kaynakları boşaltır ama ilk yanıt sürelerini artırabilir.
OLLAMA_DEBUGfalseEk hata ayıklama bilgisi etkinleştirir. Etki: Kaydetme ve hata ayıklama çıktısının ayrıntısını artırır. Senaryo: Sorunların giderilmesi veya geliştirme veya dağıtım sırasında sistemin davranışını anlamak için paha biçilmezdir.
OLLAMA_FLASH_ATTENTIONfalseDeneysel flaş dikkat özelliğini etkinleştirir. Etki: Dikkat mekanizmaları için deneysel bir optimizasyonu etkinleştirir. Senaryo: Uyumlu donanımda performansı artırabilir ancak istikrarsızlık yaratabilir.
OLLAMA_NOHISTORYfalseOkuma hattı geçmişini devre dışı bırakır. Etkisi: Komut geçmişinin kaydedilmesini engeller. Senaryo: Komut geçmişinin saklanmaması gereken güvenlik açısından hassas ortamlarda faydalıdır.
OLLAMA_NOPRUNEfalseBaşlangıçta model bloblarının budama edilmesini devre dışı bırakır. Etki: Tüm model blob'larını korur, disk kullanımını artırabilir. Senaryo: Tüm model sürümlerini uyumluluk veya geri alma amacıyla korumanız gerektiğinde faydalıdır.
OLLAMA_SCHED_SPREADfalseTüm GPU'lar arasında modelleri zamanlamaya izin verir. Etki: Model çıkarımı için çoklu GPU kullanımını mümkün kılar. Senaryo: Donanım kullanımını maksimize etmek için birden fazla GPU'lu yüksek performanslı hesaplama ortamlarında faydalıdır.
OLLAMA_INTEL_GPUfalseDeneysel Intel GPU algılamasını etkinleştirir. Etkisi: Model çıkarımı için Intel GPU'larının kullanılmasına izin verir. Senaryo: Yapay zeka iş yükleri için Intel GPU donanımı kullanan kuruluşlar için faydalı.
OLLAMA_LLM_LIBRARY"" (otomatik algılama)LLM kütüphanesini kullanmak üzere ayarlar. Etki: LLM kütüphanesinin otomatik algılanmasını geçersiz kılar. Senaryo: Uyumluluk veya performans nedenleriyle belirli bir kütüphane sürümünü veya uygulamasını zorlamanız gerektiğinde faydalıdır.
OLLAMA_TMPDIRSistem varsayılan geçici diziniGeçici dosyaların konumunu ayarlar. Etki: Geçici dosyaların nerede saklandığını belirler. Senaryo: Giriş/Çıkış performansını yönetmek veya sistem geçici dizininde sınırlı alan olduğunda önemlidir.
CUDA_VISIBLE_DEVICESHepsi mevcutHangi NVIDIA cihazlarının görünür olduğunu ayarlar. Etki: Hangi NVIDIA GPU'larının kullanılabileceğini kontrol eder. Senaryo: Çok kullanıcılı veya çok işlemli ortamlarda GPU tahsisi yönetimi için kritik.
HIP_VISIBLE_DEVICESHepsi mevcutAMD cihazlarının görünebileceği setler. Etki: Hangi AMD GPU'larının kullanılabileceğini kontrol eder. Senaryo: CUDA_VISIBLE_DEVICES'a benzer ama AMD donanımı için.
OLLAMA_RUNNERS_DIRSisteme bağlıKoşucular için konumu belirler. Etki: Runner yürütülebilir dosyalarının nerede olduğunu belirler. Senaryo: Özel dağıtımlar veya çalıştırıcıların ana uygulamadan izole edilmesi gerektiğinde önemlidir.
OLLAMA_NUM_PARALLEL0 (sınırsız)Paralel model isteği sayısını ayarlar. Etki: Model çıkarımının eşzamanlılığını kontrol eder. Senaryo: Sistem yükünü yönetmek ve yüksek trafikli ortamlarda yanıt verme sağlamak için kritik.
OLLAMA_MAX_LOADED_MODELS0 (sınırsız)Yüklü modellerin maksimum sayısını belirler. Etki: Aynı anda yüklenebilecek model sayısını sınırlar. Senaryo: Sınırlı kaynaklara veya birçok farklı modele sahip ortamlarda bellek kullanımını yönetmeye yardımcı olur.
OLLAMA_MAX_QUEUE512Kuyrağa giren isteklerin maksimum sayısını belirler. Etki: İstek kuyruğunun boyutunu sınırlar. Senaryo: Trafik sıçramaları sırasında sistem aşırı yüklenmesini önler ve taleplerin zamanında işlenmesini sağlar.
OLLAMA_MAX_VRAM0 (sınırsız)Maksimum VRAM geçersiz kalmayı bayt cinsinden ayarlar. Etki: Kullanılabilecek VRAM miktarını sınırlar. Senaryo: Paylaşılan GPU ortamlarında tek bir sürecin GPU belleğini tekelleştirmesini önlemek için faydalıdır.


Kaynak:Bağlantı girişi görünür.

$ ollama yardım et servis.
Başla ollama

Usage:
  Ollama servisi [bayraklar]

Aliases:
  Servis, Başlat

Flags:
  -h, --yardım yardım hizmet için

Çevre Değişkenleri:
      OLLAMA_DEBUG Ek hata ayıklama bilgisini göster (örneğin OLLAMA_DEBUG=1)
      OLLAMA_HOST Ollama sunucusu için IP Adresi (varsayılan 127.0.0.1:11434)
      OLLAMA_KEEP_ALIVE Modellerin bellekte yüklü kaldığı süre (varsayılan "5m")
      OLLAMA_MAX_LOADED_MODELS GPU başına maksimum yüklü model sayısı
      OLLAMA_MAX_QUEUE Kuyrağa giren istek sayısı
      OLLAMA_MODELS Modeller dizinine giden yol
      OLLAMA_NUM_PARALLEL Paralel isteğin maksimum sayısı
      OLLAMA_NOPRUNE Model bloblarını başlatırken budama
      OLLAMA_ORIGINS İzin verilen kökenlerin virgülle ayrılmış listesi
      OLLAMA_SCHED_SPREAD Her zaman tüm GPU'larda modeli planlayın
      OLLAMA_TMPDIR Geçici dosyaların konumu
      OLLAMA_FLASH_ATTENTION Açık flaş dikkati
      OLLAMA_LLM_LIBRARY LLM kütüphanesini otomatik algılamayı atlayacak şekilde ayarla
      OLLAMA_GPU_OVERHEAD GPU (bayt) başına VRAM'ın bir kısmını ayırt edin
      OLLAMA_LOAD_TIMEOUT Model yüklemelerinin ne kadar süre süre durmasına izin verilmeli (varsayılan "5m")


Referans:Bağlantı girişi görünür.
 Ev sahibi| 2025-2-6 09:19:49 tarihinde yayınlandı |
Ollama Komutanlığı

ollama listesi: Model listesini gösterir
Ollama gösterisi: Model hakkında bilgi sunar
Ollama Çekişi: Çekme Modeli
ollama push: İtme modeli
Ollama CP: Bir Model Kopyalaması
ollama rm: Bir modeli sil
ollama koşusu: Bir model çalıştır
 Ev sahibi| 2025-2-6 09:33:17 tarihinde yayınlandı |
Model optimizasyonu, düzenleme/etc/systemd/system/ollama.service.d/override.confyapılandırma, aşağıdakileri ekleyin:


Tam yapılandırma şu şekildedir:



 Ev sahibi| 2025-2-6 09:35:26 tarihinde yayınlandı |
--AyrıntılıParametre, çıkarım hızını (token / saniye) göstermek için kullanılır. Mesela:

>>> Merhaba, sen kimsin?
<think>

</think>

Merhaba! Ben Çin'de DeepSeek tarafından bağımsız olarak geliştirilmiş bir yapay zeka asistanıyım ve size hizmet etmekten mutluyum!

Toplam süre: 489.831897ms
Yükleme süresi: 24.116423ms
İstem Değerlendirme Sayı: 10 Jeton
İstem Değerlendirme Süresi: 4ms
Hızlı değerlendirme oranı: 2500.00 token/s
Değerlendirme sayısı: 36 jeton
Değerlendirme süresi: 460ms
Değerlendirme oranı: 78.26 jeton
>>> Ben küçük bir pislikim, adım ne?
<think>
Peki, küçük benim adım mı? Dikkatlice düşüneyim. Çocukken ailem bana "Küçük" dediğini hatırlıyorum çünkü ailem büyük kulaklarım olduğunu düşünüyordu ama aslında hepsi bu
Gerçek sebep değil. Belki de çocukken parmağımı hep ağzıma çöp gibi koyduğum için bana "küçük" deniyordu.

Ancak bu isim şimdi biraz garip geliyor ve günümüz toplumunun adlandırma tarzına tam olarak uymuyor. Adını bana daha uygun bir isimle değiştirmeyi düşünmeliyim. Öncelikle, kendimi anlamam gerekiyor
Kişilik özellikleriniz ve ilgi alanlarınız var, böylece hem anlamlı hem de benzersiz bir isim seçebilirsiniz.

Başkalarına yardım etmeyi seviyorum ve dinlemede, iletişim kurmada iyiyim, bu yüzden belki "bilgelik", "sıcak" veya "dost canlı" bir isim seçebilirim. Aynı zamanda, kişiliğimi de yansıtmak istiyorum, örneğin
Kitapları, müziği veya sporu seviyorsanız, bu unsurları adınıza dahil edebilirsiniz.

Ayrıca, yeni ismin yanlış hatırlanmadığından veya yanlış anlaşılmadığından emin olmam gerekiyor. Bu, ismin benzersiz ve tanınabilir olması gerektiği, çok karmaşık veya sıradan olmaması gerektiği anlamına gelir. Yapabilirim
Hangi kişilerin hem kültürel mirasa hem de modernliğe sahip olduğunu görmek için bazı tanınmış kişilerin isimlerine bakabilirsiniz.

Ayrıca, telaffuzun düzgün olup olmadığını, olumlu bir anlamı olup olmadığını ve farklı bağlamlarda nasıl ifade edildiğini düşünmem gerekiyor. Bu, bir isim seçerken sadece iyi ses çıkarmakla kalmıyor, aynı zamanda
Bunun arkasında bir anlam ve değer olmalı.

Son olarak, ailem ve arkadaşlarımla iletişim kurmam gerekiyor ki yeni isimden memnun olduklarını ve ismin hayatımın bir parçası olmasını sağlasınlar. Sonuçta, isim sadece
tanımlayıcı, kendini ifade etmenin bir parçasıdır.

Kısacası, Xiao Zhao benim gerçek adım değil ve bana daha uygun bir ismi seçme hakkım var. Zaman ve düşünme gerektirir, ama kişiliğinizi, ilgi alanlarınızı dikkatlice analiz edersiniz
İsmin anlamı ile birlikte, kendime en uygun ismi bulabileceğime inanıyorum.
</think>

Yukarıdaki düşünce sürecine dayanarak, kendime "Bilgelik Yıldızı" adını vermeye karar verdim. İsim, hem zekâmı, hem sıcaklığımı ve umudumu yansıtıyor ve kişisel cinselliğime mükemmel bir uyum sağlıyor
Özellik -lerini. Aynı zamanda "yıldız" ışığı ve sonsuz olasılıkları simgeler, sürekli ilerleme ve büyüme peşinde koşmam için ilham verir.

**Kesin İsim: Bilgelik Yıldızı**

Bu isim sadece kişiliğime uymakla kalmıyor, aynı zamanda beni çok gururlandıran ve tatmin edici hissettiren olumlu enerjiyle dolu.

Toplam süre: 7.600299527s
Yükleme süresi: 24.37534ms
Hızlı değerlendirme sayı: 59 jeton(lar)
İstem değerlendirme süresi: 10ms
Hızlı değerlendirme oranı: 5900.00 token/s
Değerlendirme sayısı: 557 jeton
Değerlendirme süresi: 6.618s
Değerlendirme oranı: 84.16 jeton

 Ev sahibi| 2025-2-6 10:22:02 tarihinde yayınlandı |
AMD GPU'lu ollama modellerini dağıtın
Ollama-for-AMD:Bağlantı girişi görünür.

Referans:Bağlantı girişi görünür.
 Ev sahibi| 2025-2-6 13:26:17 tarihinde yayınlandı |
Deepseek-r1:32b modelini çalıştırın




root@VM-0-8-ubuntu:~# nvidia-smi
Per 6 Şubat 13:25:04 2025
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.105.17 Sürücü Sürümü: 525.105.17 CUDA Sürüm: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU Adı Persistence-M| Bus-id Disp.A | Volatile Uncorr. ECC |
| Fan Sıcaklığı Performansı Pwr:Kullanım/Sınır|         Bellek Kullanımı | GPU-Util Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0 Tesla V100-SXM2...  | 00000000:00:08.0 Kapalı |                  Off |
| N/A 65C P0 205W / 300W |  21822MiB / 32768MiB |     %89 Varsayılan |
|                               |                      |                  Kayıt |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Süreçler: |
|  GPU GI CI PID Tip Süreç adı GPU Bellek |
|        ID ID Kullanımı |
|=============================================================================|
|    0 N/A N/A 91457 C ... 1_avx/ollama_llama_server 21820MiB |
+-----------------------------------------------------------------------------+
root@VM-0-8-ubuntu:~# ollama show deepseek-r1:32b
  Model
    Mimari qwen2
    parametreler 32.8B
    Bağlam uzunluğu 131072
    gömü uzunluğu 5120
    Kuantizasyon Q4_K_M

  Parametre
    "<|cümlenin başını|>" durdur
    "<|cümlenin sonu|>" durdur
    "<|Kullanıcı|>" durdur
    "<|Asistan|>" durdur

  Lisans
    MIT Lisansı
    Telif Hakkı (c) 2023 DeepSeek

root@VM-0-8-ubuntu:~# ollama ps
AD ID BOYUTU IŞLEMCISI
deepseek-r1:32b    38056bbcbb2d    23 GB    100% GPU     Forever


 Ev sahibi| 2025-2-8 08:34:18 tarihinde yayınlandı |
Ollama modeli çekme problemi nasıl çözülür
https://www.itsvse.com/thread-10939-1-1.html
 Ev sahibi| 2025-2-13 09:25:04 tarihinde yayınlandı |
DeepSeek R1 32b modelini Jetson AGX Orin (32G) ile deneyimleyin:Bağlantı girişi görünür.
Jetson büyük dil modelleri çalıştırır:https://www.jetson-ai-lab.com/models.html

Feragatname:
Code Farmer Network tarafından yayımlanan tüm yazılım, programlama materyalleri veya makaleler yalnızca öğrenme ve araştırma amaçları içindir; Yukarıdaki içerik ticari veya yasa dışı amaçlarla kullanılamaz, aksi takdirde kullanıcılar tüm sonuçları ödemelidir. Bu sitedeki bilgiler internetten alınmakta olup, telif hakkı anlaşmazlıklarının bu siteyle hiçbir ilgisi yoktur. Yukarıdaki içeriği indirmeden sonraki 24 saat içinde bilgisayarınızdan tamamen silmelisiniz. Programı beğendiyseniz, lütfen orijinal yazılımı destekleyin, kayıt satın alın ve daha iyi orijinal hizmetler alın. Herhangi bir ihlal olursa, lütfen bizimle e-posta yoluyla iletişime geçin.

Mail To:help@itsvse.com