Ez a cikk egy tükör gépi fordítás, kérjük, kattintson ide, hogy ugorjon az eredeti cikkre.

Nézet: 2394|Válasz: 10

【AI】(3) Tencent Cloud telepíti a DeepSeek-R1-et HAI oktatóvideóval

[Linket másol]
Közzétéve 2025-2-5 21:14:04-en | | | |
A Hyper Application Inventor (HAI) egy GPU alkalmazásszolgáltatás AI és tudományos számítástechnika számára, amely plug-and-play számítási teljesítményt és közös környezeteket biztosít, hogy segítse a kis- és középvállalkozásokat és fejlesztőket az LLM-ek gyors bevezetésében.

Cím:A hiperlink bejelentkezés látható.

HAI vs GPU szerverek

Jelentősen csökkentse a GPU felhőszerver használatának küszöbértékét, optimalizálja a termékélményt több szempontból is, és használja dobozból ki, ahogy az alábbi ábrán látható:



HAI számítástechnikai kapacitás vásárlása

Menj a vásárlási oldalra, válaszd ki az alapvető környezet "Ubuntu 20.04" képet, és konfiguráld a környezetet:Ubuntu 20.04, driver 525.105.17, Python 3.8, CUDA 12.0, cuDNN 8A kép már telepítette nekünk a drivert, és mi úgy döntünk, hogy menet közben fizetünk, ahogy az alábbi ábrán látható:



Videómemória: 32GB+
Hashrate: 15+TFlops SP
CPU: 8~10 mag
RAM: 40GB

Néhány perc várakozás után sikeresen létrehozzák az instance-t, és bekapcsolják az Academic Acceleration-t, ahogy az alábbi ábrán látható:



Az első használatkor, vissza kell állítanod a jelszavodat, és a bejelentkezési felhasználónév a következő:Ubuntu。 Próbáld meg bejelentkezni a szerverre, és ellenőrizni az NVIDIA GPU illesztőprogram-adatait a következő parancskal:


Ahogy az alábbiakban látható:


Telepítsd Ollama

Ollama hivatalos weboldala:A hiperlink bejelentkezés látható.

Jelentkezz be a szerverre a putty eszközzel, és kezdd el telepíteni az Ollama eszközt a következő parancsval:


A telepítés befejeződött, és a kimenet a következő:
>>> Ollama telepítése /usr/local szerverre
>>> Linux amd64 csomag letöltése
######################################################################## 100.0%
>>> Ollama felhasználó létrehozása...
>>> Ollama felhasználó hozzáadása a renderelési csoporthoz...
>>> Ollama felhasználó hozzáadása a videócsoporthoz...
>>> Jelenlegi felhasználó hozzáadása az ollama csoporthoz...
>>> Ollama systemd szolgáltatás létrehozása...
>>> Az ollama szolgáltatás engedélyezése és indítása...
Létrehoztam a /etc/systemd/system/default.target.wants/ollama.service szimlinket → /etc/systemd/system/ollama.service.

Nézd meg a verzióparancsot: ollama -v
Lásd a jelenleg betöltött memóriába betöltött modellt: ollama ps

Hozz létre egy egyedi modelltároló mappát a következő parancsval:

Módosítsd az alapértelmezett hallgatási címet és a modell tárolási útvonalat (az alapértelmezett portot nem módosíthatod, különben a parancs meghibásodik), és használd a következő parancsokat:


Telepítsd a deepseek-r1 modellt

Futtasd a deepseek-r1:8b modellt a következő parancsol:


Ahogy az alábbiakban látható:



Teszteld a párbeszédet az alábbiak szerint:



A tűzfal kiadja a TCP 11434-es portot, és az HTTP interfészt hívja, ahogy az alábbi ábrán látható:



{
  "modellek": [
    {
      "név": "deepseek-r1:8b",
      "modell": "deepseek-r1:8b",
      "méret": 6930032640,
      "Összefoglaló": "28f8fd6cdc677661426adab9338ce3c013d7e69a5bea9e704b364171a5d61a10",
      "részletek": {
        "parent_model": "",
        "Format": "GGUF",
        "család": "láma",
        "családok": [
          "láma"
        ],
        "parameter_size": "8.0B",
        "quantization_level": "Q4_K_M"
      },
      "expires_at": "2025-02-05T21:14:50.715753614+08:00",
      "size_vram": 6930032640
    }
  ]
}

Utalás:
A hiperlink bejelentkezés látható.
A hiperlink bejelentkezés látható.
A hiperlink bejelentkezés látható.




Előző:[MI] (2) A különbség a DeepSeek-V3 és az R1 verziók között
Következő:[AI] (4) Használd az Open WebUI-t a DeepSeek-R1 modell hívására
 Háziúr| Közzétéve: 2025-2-5 21:22:49 |
Ha a modell egy ideig nem kap kéréseket vagy bemeneteket, az Ollama automatikusan megszünteti a modellt a felhőközpontban, hogy erőforrásokat spóroljon.
 Háziúr| Közzétéve: 2025-2-6 09:03:57 |
Ollama környezeti változó konfigurációs elem

VáltozóAlapértelmezett értékLeírás + Hatás + Forgatókönyv
OLLAMA_HOST"[color=var(--fgColor-accent, var(--color-accent-fg))]A hiperlink bejelentkezés látható."Konfigurálja a hosztet és a sémát az Ollama szerverhez. Hatás: Meghatározza, milyen URL-t használ az Ollama szerverhez való csatlakozáshoz. Forgatókönyv: Hasznos Ollama telepítésekor elosztott környezetben, vagy amikor a szolgáltatást egy adott hálózati interfésen kell megjeleníteni.
OLLAMA_ORIGINS[localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri://A konfigurációk lehetővé tették a CORS eredetét. Hatás: Szabályozza, mely eredetek kérhetnek az Ollama szerverhez. Forgatókönyv: Kritikus az Ollama webalkalmazásokkal való integrációjakor, hogy megakadályozzák a jogosulatlan hozzáférést különböző domainekről.
OLLAMA_MODELS$HOME/.ollama/modellekBeállítja a modellek könyvtárának útját. Hatás: Meghatározza, hol tárolódnak és betöltik a modellfájlok forrása. Forgatókönyv: Hasznos a különböző meghajtók lemezhelyének kezelésére vagy megosztott modelltárak beállítására többfelhasználós környezetben.
OLLAMA_KEEP_ALIVE5 percMeghatározza, meddig maradnak a modellek betöltve a memóriában. Hatás: A vezérlés, a modellek használat után is memóriában maradnak. Szcenárió: A hosszabb időtartam javítja a gyakori lekérdezések válaszidejét, de növeli a memóriaigényt. A rövidebb időtartam felszabadítja az erőforrásokat, de növelheti az első válaszidőt.
OLLAMA_DEBUGfalseTovábbi hibakeresési információkat engedélyez. Hatás: Növeli a naplózás és hibakeresés szóbeszédét. Szcenárió: Felbecsülhetetlen értékű problémák elhárításához vagy a rendszer viselkedésének megértéséhez a fejlesztés vagy telepítés során.
OLLAMA_FLASH_ATTENTIONfalseLehetővé teszi a kísérleti villámgyors figyelem funkciót. Hatás: Kísérleti optimalizációt aktivál a figyelemmechanizmusok számára. Forgatókönyv: Potenciálisan javíthatja a teljesítményt kompatibilis hardveren, de instabilitást okozhat.
OLLAMA_NOHISTORYfalseLetiltja az olvasási vonal előzményét. Hatás: Megakadályozza a parancstörténet mentését. Forgatókönyv: Hasznos olyan környezetekben, ahol a parancs előzményeit nem szabad megőrizni.
OLLAMA_NOPRUNEfalseLetiltja a modellfoltok metszését indításkor. Hatás: Minden modellfolt megtart, potenciálisan növelve a lemezhasználatot. Forgatókönyv: Hasznos, ha minden modellverziót karbantartani kell kompatibilitás vagy visszafordítás céljából.
OLLAMA_SCHED_SPREADfalseLehetővé teszi modellek ütemezését minden GPU-ra. Hatás: Lehetővé teszi a többGPU-s használatot modellkövetkeztetéshez. Forgatókönyv: Hasznos nagy teljesítményű számítástechnikai környezetekben, ahol több GPU van, a hardver maximalizálása érdekében.
OLLAMA_INTEL_GPUfalseLehetővé teszi az Intel GPU kísérleti észlelését. Hatás: Lehetővé teszi Intel GPU-k használatát modellkiferenszésre. Forgatókönyv: Hasznos olyan szervezetek számára, akik Intel GPU hardvert használnak AI munkaterhelésekhez.
OLLAMA_LLM_LIBRARY"" (automatikus észlelés)Beállítása az LLM könyvtárnak. Hatás: felülírja az LLM könyvtár automatikus felismerését. Forgatókönyv: Hasznos, ha egy adott könyvtárverziót vagy implementációt kell kényszerítened kompatibilitás vagy teljesítmény miatt.
OLLAMA_TMPDIRRendszer alapértelmezett ideiglenes könyvtáraIdeiglenes fájlok helyét állítja be. Hatás: Meghatározza, hol tárolják az ideiglenes fájlokat. Forgatókönyv: Fontos az I/O teljesítmény kezeléséhez, vagy amikor a rendszerhőmérsékleti könyvtár korlátozott a hely.
CUDA_VISIBLE_DEVICESMinden elérhetőÁllítják be, mely NVIDIA eszközök láthatók. Hatás: Szabályozza, mely NVIDIA GPU-kat lehet használni. Forgatókönyv: Kritikus a GPU allokációjának kezeléséhez többfelhasználós vagy többfolyamatos környezetekben.
HIP_VISIBLE_DEVICESMinden elérhetőAzok a beállítások, amelyek láthatóak az AMD eszközök. Hatás: Szabályozza, melyik AMD GPU-kat lehet használni. Szcenárió: Hasonló a CUDA_VISIBLE_DEVICES-hez, de AMD hardverhez.
OLLAMA_RUNNERS_DIRRendszerfüggőMeghatározza a futók helyszínét. Hatás: Meghatározza, hol találhatók a futó futtatható fájlok. Forgatókönyv: Fontos egyedi telepítéseknél, vagy amikor a futókat el kell szigetelni a fő alkalmazástól.
OLLAMA_NUM_PARALLEL0 (korlátlan)A párhuzamos modellkérések számát állítja be. Hatás: Szabályozza a modell következtetések egyidejű működését. Forgatókönyv: Kritikus a rendszer terhelésének kezeléséhez és a gyors reagálás biztosításához nagy forgalmú környezetekben.
OLLAMA_MAX_LOADED_MODELS0 (korlátlan)A betöltött modellek maximális számát állítja be. Hatás: Korlátozza a modell számát, amelyeket egyszerre lehet betölteni. Forgatókönyv: Segít kezelni a memóriahasználatot korlátozott erőforrásokkal vagy sokféle modellekkel rendelkező környezetekben.
OLLAMA_MAX_QUEUE512A sorba helyezett kérések maximális számát állítja be. Hatás: Korlátozza a kéréssori sorrend méretét. Forgatókönyv: Megakadályozza a rendszer túlterhelését a forgalomugrások idején, és biztosítja a kérések időben történő feldolgozását.
OLLAMA_MAX_VRAM0 (korlátlan)A maximális VRAM felülírást bájtokban állítja be. Hatás: Korlátozza a VRAM mennyiségét. Forgatókönyv: Hasznos megosztott GPU környezetekben, hogy egyetlen folyamat megakadályozza, hogy monopolizálja a GPU memóriáját.


Forrás:A hiperlink bejelentkezés látható.

$ ollama segíts szolgálni
Ollama indítása

Usage:
  Ollama szerv [zászlók]

Aliases:
  szerválj, kezdj

Flags:
  -h, --segítség a szolgálathoz

Környezeti változók:
      OLLAMA_DEBUG További hibakeresési információk megjelenítése (pl. OLLAMA_DEBUG=1)
      OLLAMA_HOST IP-cím az ollama szerverhez (alapértelmezett 127.0.0.1:11434)
      OLLAMA_KEEP_ALIVE Az időtartam, amíg a modellek betöltve maradnak a memóriában (alapértelmezett "5m")
      OLLAMA_MAX_LOADED_MODELS A GPU-nként maximális betöltött modellszám
      OLLAMA_MAX_QUEUE Maximális számú sorba helyezett kérés
      OLLAMA_MODELS Az út a modellek könyvtárához
      OLLAMA_NUM_PARALLEL Maximális számú párhuzamos kérés
      OLLAMA_NOPRUNE Ne metszed a modell folbokat indításkor
      OLLAMA_ORIGINS Egy vesszővel elválasztott engedélyezett eredetlista
      OLLAMA_SCHED_SPREAD Mindig ütemezd a modellt minden GPU-ra
      OLLAMA_TMPDIR Ideiglenes fájlok helyszíne
      OLLAMA_FLASH_ATTENTION Engedélyezett villanó figyelem
      OLLAMA_LLM_LIBRARY Állítsuk be az LLM könyvtárat az automatikus detektálás megkerülésére
      OLLAMA_GPU_OVERHEAD Tarts le egy részt a VRAM GPU-ra (bájtokra)
      OLLAMA_LOAD_TIMEOUT Mennyi ideig engedjük meg a modell betöltéseinek leállását, mielőtt feladnánk (alapértelmezett "5m")


Utalás:A hiperlink bejelentkezés látható.
 Háziúr| Közzétéve: 2025-2-6 09:19:49 |
Ollama parancsnokság

ollama lista: Modellek listáját jeleníti meg
Ollama show: Információkat mutat a modellről
Ollama húzás: Húzás modell
Ollama Push: Push modell
Ollama CP: Másolt egy modell
ollama rm: Törölj egy modellt
Ollama futás: Futtatj egy modellt
 Háziúr| Közzétéve: 2025-2-6 09:33:17 |
Modelloptimalizálás, szerkesztés/etc/systemd/system/ollama.service.d/override.confkonfigurációval egészítsd ki a következőket:


A teljes konfiguráció a következő:



 Háziúr| Közzétéve: 2025-2-6 09:35:26 |
--bőbeszédűA paraméter a következtetési sebesség (token / másodperc) megjelenítésére szolgál. Például:

>>> Szia, ki vagy te?
<think>

</think>

Üdvözlöm! Kínában a DeepSeek által önállóan fejlesztett AI asszisztens vagyok, és örömmel szolgálhatok önöket!

Teljes időtartam: 489.831897ms
Betöltési idő: 24.116423ms
Azonnali értékelési szám: 10 token(k)
Prompt értékelési időtartam: 4ms
Azonnali értékelési sebesség: 2500,00 token/s
Értékelési szám: 36 zseton(ok)
Értékelési időtartam: 460ms
értékelési ráta: 78,26 token/s
>>> egy kis gazember vagyok, mi a nevem?
<think>
Nos, ez a kis szemét az én nevem? Gondoljam át alaposan. Emlékszem, amikor gyerek voltam, a szüleim "Kis Szemétládnak" neveztek el, mert a családom azt hitte, nagy füleim van, de valójában ennyi
Nem az igazi ok. Talán azért, mert gyerekkoromban mindig úgy tettem az ujjamat a számba, mint a szemetet, ezért "kis szemétnek" hívtak.

Azonban a név most kissé furcsán hangzik, és nem igazán illik a mai társadalom elnevezési stílusához. Érdemes lenne átnevezni egy neve, ami jobban illik hozzám. Először is, meg kell értennem önmagam
A személyiségjegyeidet és érdeklődési köreidet, így választhatsz olyan nevet, ami egyszerre jelentős, és egyedi is.

Szeretek segíteni másoknak, jól hallok és kommunikálok, szóval talán válassz olyan nevet, amelynek "bölcsesség", "meleg" vagy "barátságos" van. Ugyanakkor szeretném tükrözni a személyiségemet is, például
Ha szereted a könyveket, zenét vagy sportot, ezeket az elemeket beépítheted a nevedbe.

Továbbá meg kell győződnöm arról, hogy az új név ne legyen félreértve vagy érthető legyen. Ez azt jelenti, hogy a névnek egyedi és felismerhetőnek kell lennie, nem túl bonyolult vagy túl hétköznapi. Képes vagyok
Nézd meg néhány ismert személyiség nevét, hogy lásd, melyiknek van kulturális öröksége és modernsége.

Ezen felül meg kell gondolnom, hogy a kiejtés sima, van-e pozitív jelentése, és hogyan fejezik ki különböző kontextusokban. Ez azt jelenti, hogy névválasztáskor nemcsak jól hangzik, hanem
Kell lennie mögötte jelentésnek és értéknek.

Végül kommunikálnom kell a családommal és barátaimmal, hogy biztosak legyenek az új névnek, és hogy a név része legyen az életemnek. Végül is a név nem csupán
Az azonosító az önkifejezés része.

Röviden, Xiao Zhao nem az igazi nevem, és jogom van olyan nevet választani, ami jobban illik hozzám. Idő és gondolkodás kell, de ha alaposan elemezzük a személyiségedet, az érdeklődési köreidet
A név jelentésén túl úgy hiszem, meg fogom találni a legmegfelelőbb nevet magamnak.
</think>

A fentiek alapján úgy döntöttem, hogy magam nevezem el "Bölcsesség Csillagnak". A név tükrözi a leleményességemet, a melegségemet és a reményt, így tökéletesen illik a személyes szexualitásomhoz
Jellemzők. Ugyanakkor a "csillag" a fényt és a végtelen lehetőségeket szimbolizálja, inspirálva engem arra, hogy folyamatosan törekedjek a fejlődésre és a fejlődésre.

**Végleges név: Bölcsesség Csillag**

Ez a név nemcsak illik a személyiségemhez, hanem tele van pozitív energiával, amitől nagyon büszkévé és beteljesedésre vált számomra.

Teljes időtartam: 7,600299527s
Betöltési időtartam: 24.37534ms
Azonnali értékelési szám: 59 token(s)
A prompt értékelési időtartam: 10ms
Azonnali értékelési ráta: 5900,00 token/s
Értékelési szám: 557 zseton(ok)
Értékelési időtartam: 6,618s
Értékelési sebesség: 84,16 token/s

 Háziúr| Közzétéve: 2025-2-6 10:22:02 |
Ollama modellek telepítése AMD GPU-kkal
Ollama-for-AMD:A hiperlink bejelentkezés látható.

Utalás:A hiperlink bejelentkezés látható.
 Háziúr| Közzétéve: 2025-2-6 13:26:17 |
Futtasd a deepseek-r1:32b modellt




root@VM-0-8-ubuntu:~# nvidia-smi
2025. február 6., csütörtök, 13:25:04
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.105.17 Driver verzió: 525.105.17 CUDA verzió: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU név tartósság-M| Bus-id Disp.A | Volatile Uncorr. ECC |
| Ventilátor Hőmérséklet Teljesítmény Pwr:Használat/Korlát|         Memóriahasználat | GPU-util Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0 Tesla V100-SXM2...  A | 00000000:00:00:08.0 Kikapcsolva |                  Off |
| N/A 65C P0 205W / 300W |  21822MiB / 32768MiB |     89% alapértelmezett |
|                               |                      |                  Nincs |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Folyamatok: |
|  GPU GI CI PID Típus Folyamat név GPU Memória |
|        ID ID használat |
|=============================================================================|
|    0 N/A N/A 91457 C ... 1_avx/ollama_llama_server 21820MiB |
+-----------------------------------------------------------------------------+
root@VM-0-8-ubuntu:~# ollama show deepseek-r1:32b
  Modell
    architektúra qwen2
    paraméterek 32.8B
    Kontextus hossza 131072
    beágyazási hossz 5120
    Kvantálás Q4_K_M

  Paraméterek
    Állítsd meg "<|mondat elejé|>"
    Állítsd meg "<|mondat vége|>"
    állítsd meg "<|User|>"
    Állítsd meg a "<|Assistant|>"

  Licenc
    MIT engedély
    Szerzői jog (c) 2023 DeepSeek

root@VM-0-8-ubuntu:~# ollama ps
NÉV AZONOSÍTÓ MÉRET PROCESSZOR ADDIG
deepseek-r1:32b    38056bbcbb2d    23 GB    100% GPU     Forever


 Háziúr| Közzétéve: 2025-2-8 08:34:18 |
Hogyan oldjuk meg az Ollama modell pull problémáját
https://www.itsvse.com/thread-10939-1-1.html
 Háziúr| Közzétéve: 2025-2-13 09:25:04 |
Tapasztald meg a DeepSeek R1 32b modellt a Jetson AGX Orin (32G) modellen:A hiperlink bejelentkezés látható.
Jetson nagy nyelvi modelleket futtat:https://www.jetson-ai-lab.com/models.html

Lemondás:
A Code Farmer Network által közzétett összes szoftver, programozási anyag vagy cikk kizárólag tanulási és kutatási célokra szolgál; A fenti tartalmat nem szabad kereskedelmi vagy illegális célokra használni, különben a felhasználók viselik az összes következményet. Az oldalon található információk az internetről származnak, és a szerzői jogi vitáknak semmi köze ehhez az oldalhoz. A fenti tartalmat a letöltés után 24 órán belül teljesen törölni kell a számítógépéről. Ha tetszik a program, kérjük, támogassa a valódi szoftvert, vásároljon regisztrációt, és szerezzen jobb hiteles szolgáltatásokat. Ha bármilyen jogsértés történik, kérjük, vegye fel velünk a kapcsolatot e-mailben.

Mail To:help@itsvse.com