【AI】(3) Tencent Cloud telepíti a DeepSeek-R1-et HAI oktatóvideóval

Kis szemét · Közzétéve 2025. 02. 05. 21:14:04

A Hyper Application Inventor (HAI) egy GPU alkalmazásszolgáltatás AI és tudományos számítástechnika számára, amely plug-and-play számítási teljesítményt és közös környezeteket biztosít, hogy segítse a kis- és középvállalkozásokat és fejlesztőket az LLM-ek gyors bevezetésében.

Cím:A hiperlink bejelentkezés látható.

HAI vs GPU szerverek

Jelentősen csökkentse a GPU felhőszerver használatának küszöbértékét, optimalizálja a termékélményt több szempontból is, és használja dobozból ki, ahogy az alábbi ábrán látható:

HAI számítástechnikai kapacitás vásárlása

Menj a vásárlási oldalra, válaszd ki az alapvető környezet "Ubuntu 20.04" képet, és konfiguráld a környezetet:Ubuntu 20.04, driver 525.105.17, Python 3.8, CUDA 12.0, cuDNN 8A kép már telepítette nekünk a drivert, és mi úgy döntünk, hogy menet közben fizetünk, ahogy az alábbi ábrán látható:

Videómemória: 32GB+
Hashrate: 15+TFlops SP
CPU: 8~10 mag
RAM: 40GB

Néhány perc várakozás után sikeresen létrehozzák az instance-t, és bekapcsolják az Academic Acceleration-t, ahogy az alábbi ábrán látható:

Az első használatkor, vissza kell állítanod a jelszavodat, és a bejelentkezési felhasználónév a következő:Ubuntu。 Próbáld meg bejelentkezni a szerverre, és ellenőrizni az NVIDIA GPU illesztőprogram-adatait a következő parancskal:

A bejelentkezés látható.

Ahogy az alábbiakban látható:

Telepítsd Ollama

Ollama hivatalos weboldala:A hiperlink bejelentkezés látható.

Jelentkezz be a szerverre a putty eszközzel, és kezdd el telepíteni az Ollama eszközt a következő parancsval:

A bejelentkezés látható.

A telepítés befejeződött, és a kimenet a következő:

>>> Ollama telepítése /usr/local szerverre
>>> Linux amd64 csomag letöltése
######################################################################## 100.0%
>>> Ollama felhasználó létrehozása...
>>> Ollama felhasználó hozzáadása a renderelési csoporthoz...
>>> Ollama felhasználó hozzáadása a videócsoporthoz...
>>> Jelenlegi felhasználó hozzáadása az ollama csoporthoz...
>>> Ollama systemd szolgáltatás létrehozása...
>>> Az ollama szolgáltatás engedélyezése és indítása...
Létrehoztam a /etc/systemd/system/default.target.wants/ollama.service szimlinket → /etc/systemd/system/ollama.service.

Nézd meg a verzióparancsot: ollama -v
Lásd a jelenleg betöltött memóriába betöltött modellt: ollama ps

Hozz létre egy egyedi modelltároló mappát a következő parancsval:

A bejelentkezés látható.

Módosítsd az alapértelmezett hallgatási címet és a modell tárolási útvonalat (az alapértelmezett portot nem módosíthatod, különben a parancs meghibásodik), és használd a következő parancsokat:

A bejelentkezés látható.

Telepítsd a deepseek-r1 modellt

Futtasd a deepseek-r1:8b modellt a következő parancsol:

A bejelentkezés látható.

Ahogy az alábbiakban látható:

Teszteld a párbeszédet az alábbiak szerint:

A tűzfal kiadja a TCP 11434-es portot, és az HTTP interfészt hívja, ahogy az alábbi ábrán látható:

{
  "modellek": [
{
   "név": "deepseek-r1:8b",
   "modell": "deepseek-r1:8b",
   "méret": 6930032640,
   "Összefoglaló": "28f8fd6cdc677661426adab9338ce3c013d7e69a5bea9e704b364171a5d61a10",
   "részletek": {
      "parent_model": "",
      "Format": "GGUF",
      "család": "láma",
      "családok": [
      "láma"
      ],
      "parameter_size": "8.0B",
      "quantization_level": "Q4_K_M"
   },
   "expires_at": "2025-02-05T21:14:50.715753614+08:00",
   "size_vram": 6930032640
}
  ]
}

Utalás:
A hiperlink bejelentkezés látható.
A hiperlink bejelentkezés látható.
A hiperlink bejelentkezés látható.

Kis szemét · Közzétéve 2025. 02. 05. 21:22:49

Ha a modell egy ideig nem kap kéréseket vagy bemeneteket, az Ollama automatikusan megszünteti a modellt a felhőközpontban, hogy erőforrásokat spóroljon.

Kis szemét · Közzétéve 2025. 02. 06. 9:03:57

Ollama környezeti változó konfigurációs elem

Változó	Alapértelmezett érték	Leírás + Hatás + Forgatókönyv
OLLAMA_HOST	"[color=var(--fgColor-accent, var(--color-accent-fg))]A hiperlink bejelentkezés látható."	Konfigurálja a hosztet és a sémát az Ollama szerverhez. Hatás: Meghatározza, milyen URL-t használ az Ollama szerverhez való csatlakozáshoz. Forgatókönyv: Hasznos Ollama telepítésekor elosztott környezetben, vagy amikor a szolgáltatást egy adott hálózati interfésen kell megjeleníteni.
OLLAMA_ORIGINS	[localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri://	A konfigurációk lehetővé tették a CORS eredetét. Hatás: Szabályozza, mely eredetek kérhetnek az Ollama szerverhez. Forgatókönyv: Kritikus az Ollama webalkalmazásokkal való integrációjakor, hogy megakadályozzák a jogosulatlan hozzáférést különböző domainekről.
OLLAMA_MODELS	$HOME/.ollama/modellek	Beállítja a modellek könyvtárának útját. Hatás: Meghatározza, hol tárolódnak és betöltik a modellfájlok forrása. Forgatókönyv: Hasznos a különböző meghajtók lemezhelyének kezelésére vagy megosztott modelltárak beállítására többfelhasználós környezetben.
OLLAMA_KEEP_ALIVE	5 perc	Meghatározza, meddig maradnak a modellek betöltve a memóriában. Hatás: A vezérlés, a modellek használat után is memóriában maradnak. Szcenárió: A hosszabb időtartam javítja a gyakori lekérdezések válaszidejét, de növeli a memóriaigényt. A rövidebb időtartam felszabadítja az erőforrásokat, de növelheti az első válaszidőt.
OLLAMA_DEBUG	false	További hibakeresési információkat engedélyez. Hatás: Növeli a naplózás és hibakeresés szóbeszédét. Szcenárió: Felbecsülhetetlen értékű problémák elhárításához vagy a rendszer viselkedésének megértéséhez a fejlesztés vagy telepítés során.
OLLAMA_FLASH_ATTENTION	false	Lehetővé teszi a kísérleti villámgyors figyelem funkciót. Hatás: Kísérleti optimalizációt aktivál a figyelemmechanizmusok számára. Forgatókönyv: Potenciálisan javíthatja a teljesítményt kompatibilis hardveren, de instabilitást okozhat.
OLLAMA_NOHISTORY	false	Letiltja az olvasási vonal előzményét. Hatás: Megakadályozza a parancstörténet mentését. Forgatókönyv: Hasznos olyan környezetekben, ahol a parancs előzményeit nem szabad megőrizni.
OLLAMA_NOPRUNE	false	Letiltja a modellfoltok metszését indításkor. Hatás: Minden modellfolt megtart, potenciálisan növelve a lemezhasználatot. Forgatókönyv: Hasznos, ha minden modellverziót karbantartani kell kompatibilitás vagy visszafordítás céljából.
OLLAMA_SCHED_SPREAD	false	Lehetővé teszi modellek ütemezését minden GPU-ra. Hatás: Lehetővé teszi a többGPU-s használatot modellkövetkeztetéshez. Forgatókönyv: Hasznos nagy teljesítményű számítástechnikai környezetekben, ahol több GPU van, a hardver maximalizálása érdekében.
OLLAMA_INTEL_GPU	false	Lehetővé teszi az Intel GPU kísérleti észlelését. Hatás: Lehetővé teszi Intel GPU-k használatát modellkiferenszésre. Forgatókönyv: Hasznos olyan szervezetek számára, akik Intel GPU hardvert használnak AI munkaterhelésekhez.
OLLAMA_LLM_LIBRARY	"" (automatikus észlelés)	Beállítása az LLM könyvtárnak. Hatás: felülírja az LLM könyvtár automatikus felismerését. Forgatókönyv: Hasznos, ha egy adott könyvtárverziót vagy implementációt kell kényszerítened kompatibilitás vagy teljesítmény miatt.
OLLAMA_TMPDIR	Rendszer alapértelmezett ideiglenes könyvtára	Ideiglenes fájlok helyét állítja be. Hatás: Meghatározza, hol tárolják az ideiglenes fájlokat. Forgatókönyv: Fontos az I/O teljesítmény kezeléséhez, vagy amikor a rendszerhőmérsékleti könyvtár korlátozott a hely.
CUDA_VISIBLE_DEVICES	Minden elérhető	Állítják be, mely NVIDIA eszközök láthatók. Hatás: Szabályozza, mely NVIDIA GPU-kat lehet használni. Forgatókönyv: Kritikus a GPU allokációjának kezeléséhez többfelhasználós vagy többfolyamatos környezetekben.
HIP_VISIBLE_DEVICES	Minden elérhető	Azok a beállítások, amelyek láthatóak az AMD eszközök. Hatás: Szabályozza, melyik AMD GPU-kat lehet használni. Szcenárió: Hasonló a CUDA_VISIBLE_DEVICES-hez, de AMD hardverhez.
OLLAMA_RUNNERS_DIR	Rendszerfüggő	Meghatározza a futók helyszínét. Hatás: Meghatározza, hol találhatók a futó futtatható fájlok. Forgatókönyv: Fontos egyedi telepítéseknél, vagy amikor a futókat el kell szigetelni a fő alkalmazástól.
OLLAMA_NUM_PARALLEL	0 (korlátlan)	A párhuzamos modellkérések számát állítja be. Hatás: Szabályozza a modell következtetések egyidejű működését. Forgatókönyv: Kritikus a rendszer terhelésének kezeléséhez és a gyors reagálás biztosításához nagy forgalmú környezetekben.
OLLAMA_MAX_LOADED_MODELS	0 (korlátlan)	A betöltött modellek maximális számát állítja be. Hatás: Korlátozza a modell számát, amelyeket egyszerre lehet betölteni. Forgatókönyv: Segít kezelni a memóriahasználatot korlátozott erőforrásokkal vagy sokféle modellekkel rendelkező környezetekben.
OLLAMA_MAX_QUEUE	512	A sorba helyezett kérések maximális számát állítja be. Hatás: Korlátozza a kéréssori sorrend méretét. Forgatókönyv: Megakadályozza a rendszer túlterhelését a forgalomugrások idején, és biztosítja a kérések időben történő feldolgozását.
OLLAMA_MAX_VRAM	0 (korlátlan)	A maximális VRAM felülírást bájtokban állítja be. Hatás: Korlátozza a VRAM mennyiségét. Forgatókönyv: Hasznos megosztott GPU környezetekben, hogy egyetlen folyamat megakadályozza, hogy monopolizálja a GPU memóriáját.

Forrás:A hiperlink bejelentkezés látható.

$ ollama segíts szolgálni
Ollama indítása

Usage:
  Ollama szerv [zászlók]

Aliases:
  szerválj, kezdj

Flags:
  -h, --segítség a szolgálathoz

Környezeti változók:
   OLLAMA_DEBUG További hibakeresési információk megjelenítése (pl. OLLAMA_DEBUG=1)
   OLLAMA_HOST IP-cím az ollama szerverhez (alapértelmezett 127.0.0.1:11434)
   OLLAMA_KEEP_ALIVE Az időtartam, amíg a modellek betöltve maradnak a memóriában (alapértelmezett "5m")
   OLLAMA_MAX_LOADED_MODELS A GPU-nként maximális betöltött modellszám
   OLLAMA_MAX_QUEUE Maximális számú sorba helyezett kérés
   OLLAMA_MODELS Az út a modellek könyvtárához
   OLLAMA_NUM_PARALLEL Maximális számú párhuzamos kérés
   OLLAMA_NOPRUNE Ne metszed a modell folbokat indításkor
   OLLAMA_ORIGINS Egy vesszővel elválasztott engedélyezett eredetlista
   OLLAMA_SCHED_SPREAD Mindig ütemezd a modellt minden GPU-ra
   OLLAMA_TMPDIR Ideiglenes fájlok helyszíne
   OLLAMA_FLASH_ATTENTION Engedélyezett villanó figyelem
   OLLAMA_LLM_LIBRARY Állítsuk be az LLM könyvtárat az automatikus detektálás megkerülésére
   OLLAMA_GPU_OVERHEAD Tarts le egy részt a VRAM GPU-ra (bájtokra)
   OLLAMA_LOAD_TIMEOUT Mennyi ideig engedjük meg a modell betöltéseinek leállását, mielőtt feladnánk (alapértelmezett "5m")

Utalás:A hiperlink bejelentkezés látható.

Kis szemét · Közzétéve 2025. 02. 06. 9:19:49

Ollama parancsnokság

ollama lista: Modellek listáját jeleníti meg
Ollama show: Információkat mutat a modellről
Ollama húzás: Húzás modell
Ollama Push: Push modell
Ollama CP: Másolt egy modell
ollama rm: Törölj egy modellt
Ollama futás: Futtatj egy modellt

Kis szemét · Közzétéve 2025. 02. 06. 9:33:17

Modelloptimalizálás, szerkesztés/etc/systemd/system/ollama.service.d/override.confkonfigurációval egészítsd ki a következőket:

A bejelentkezés látható.

A teljes konfiguráció a következő:

A bejelentkezés látható.

Kis szemét · Közzétéve 2025. 02. 06. 9:35:26

--bőbeszédűA paraméter a következtetési sebesség (token / másodperc) megjelenítésére szolgál. Például:

A bejelentkezés látható.

>>> Szia, ki vagy te?
<think>

</think>

Üdvözlöm! Kínában a DeepSeek által önállóan fejlesztett AI asszisztens vagyok, és örömmel szolgálhatok önöket!

Teljes időtartam: 489.831897ms
Betöltési idő: 24.116423ms
Azonnali értékelési szám: 10 token(k)
Prompt értékelési időtartam: 4ms
Azonnali értékelési sebesség: 2500,00 token/s
Értékelési szám: 36 zseton(ok)
Értékelési időtartam: 460ms
értékelési ráta: 78,26 token/s
>>> egy kis gazember vagyok, mi a nevem?
<think>
Nos, ez a kis szemét az én nevem? Gondoljam át alaposan. Emlékszem, amikor gyerek voltam, a szüleim "Kis Szemétládnak" neveztek el, mert a családom azt hitte, nagy füleim van, de valójában ennyi
Nem az igazi ok. Talán azért, mert gyerekkoromban mindig úgy tettem az ujjamat a számba, mint a szemetet, ezért "kis szemétnek" hívtak.

Azonban a név most kissé furcsán hangzik, és nem igazán illik a mai társadalom elnevezési stílusához. Érdemes lenne átnevezni egy neve, ami jobban illik hozzám. Először is, meg kell értennem önmagam
A személyiségjegyeidet és érdeklődési köreidet, így választhatsz olyan nevet, ami egyszerre jelentős, és egyedi is.

Szeretek segíteni másoknak, jól hallok és kommunikálok, szóval talán válassz olyan nevet, amelynek "bölcsesség", "meleg" vagy "barátságos" van. Ugyanakkor szeretném tükrözni a személyiségemet is, például
Ha szereted a könyveket, zenét vagy sportot, ezeket az elemeket beépítheted a nevedbe.

Továbbá meg kell győződnöm arról, hogy az új név ne legyen félreértve vagy érthető legyen. Ez azt jelenti, hogy a névnek egyedi és felismerhetőnek kell lennie, nem túl bonyolult vagy túl hétköznapi. Képes vagyok
Nézd meg néhány ismert személyiség nevét, hogy lásd, melyiknek van kulturális öröksége és modernsége.

Ezen felül meg kell gondolnom, hogy a kiejtés sima, van-e pozitív jelentése, és hogyan fejezik ki különböző kontextusokban. Ez azt jelenti, hogy névválasztáskor nemcsak jól hangzik, hanem
Kell lennie mögötte jelentésnek és értéknek.

Végül kommunikálnom kell a családommal és barátaimmal, hogy biztosak legyenek az új névnek, és hogy a név része legyen az életemnek. Végül is a név nem csupán
Az azonosító az önkifejezés része.

Röviden, Xiao Zhao nem az igazi nevem, és jogom van olyan nevet választani, ami jobban illik hozzám. Idő és gondolkodás kell, de ha alaposan elemezzük a személyiségedet, az érdeklődési köreidet
A név jelentésén túl úgy hiszem, meg fogom találni a legmegfelelőbb nevet magamnak.
</think>

A fentiek alapján úgy döntöttem, hogy magam nevezem el "Bölcsesség Csillagnak". A név tükrözi a leleményességemet, a melegségemet és a reményt, így tökéletesen illik a személyes szexualitásomhoz
Jellemzők. Ugyanakkor a "csillag" a fényt és a végtelen lehetőségeket szimbolizálja, inspirálva engem arra, hogy folyamatosan törekedjek a fejlődésre és a fejlődésre.

**Végleges név: Bölcsesség Csillag**

Ez a név nemcsak illik a személyiségemhez, hanem tele van pozitív energiával, amitől nagyon büszkévé és beteljesedésre vált számomra.

Teljes időtartam: 7,600299527s
Betöltési időtartam: 24.37534ms
Azonnali értékelési szám: 59 token(s)
A prompt értékelési időtartam: 10ms
Azonnali értékelési ráta: 5900,00 token/s
Értékelési szám: 557 zseton(ok)
Értékelési időtartam: 6,618s
Értékelési sebesség: 84,16 token/s

Kis szemét · Közzétéve 2025. 02. 06. 10:22:02

Ollama modellek telepítése AMD GPU-kkal
Ollama-for-AMD:A hiperlink bejelentkezés látható.

Utalás:A hiperlink bejelentkezés látható.

Kis szemét · Közzétéve 2025. 02. 06. 13:26:17

Futtasd a deepseek-r1:32b modellt

root@VM-0-8-ubuntu:~# nvidia-smi
2025. február 6., csütörtök, 13:25:04
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.105.17 Driver verzió: 525.105.17 CUDA verzió: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU név tartósság-M| Bus-id Disp.A | Volatile Uncorr. ECC |
| Ventilátor Hőmérséklet Teljesítmény Pwr:Használat/Korlát|       Memóriahasználat | GPU-util Compute M. |
|                            |                   |             MIG M. |
|===============================+======================+======================|
| 0 Tesla V100-SXM2...  A | 00000000:00:00:08.0 Kikapcsolva |                Off |
| N/A 65C P0 205W / 300W |  21822MiB / 32768MiB |    89% alapértelmezett |
|                            |                   |                Nincs |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Folyamatok: |
|  GPU GI CI PID Típus Folyamat név GPU Memória |
|       ID ID használat |
|=============================================================================|
| 0 N/A N/A 91457 C ... 1_avx/ollama_llama_server 21820MiB |
+-----------------------------------------------------------------------------+
root@VM-0-8-ubuntu:~# ollama show deepseek-r1:32b
  Modell
architektúra qwen2
paraméterek 32.8B
Kontextus hossza 131072
beágyazási hossz 5120
Kvantálás Q4_K_M

  Paraméterek
Állítsd meg "<|mondat elejé|>"
Állítsd meg "<|mondat vége|>"
állítsd meg "<|User|>"
Állítsd meg a "<|Assistant|>"

  Licenc
MIT engedély
Szerzői jog (c) 2023 DeepSeek

root@VM-0-8-ubuntu:~# ollama ps
NÉV AZONOSÍTÓ MÉRET PROCESSZOR ADDIG
deepseek-r1:32b 38056bbcbb2d 23 GB 100% GPU    Forever

Kis szemét · Közzétéve 2025. 02. 08. 8:34:18

Hogyan oldjuk meg az Ollama modell pull problémáját
https://www.itsvse.com/thread-10939-1-1.html

Kis szemét · Közzétéve 2025. 02. 13. 9:25:04

Tapasztald meg a DeepSeek R1 32b modellt a Jetson AGX Orin (32G) modellen:A hiperlink bejelentkezés látható.
Jetson nagy nyelvi modelleket futtat:https://www.jetson-ai-lab.com/models.html

【AI】(3) Tencent Cloud telepíti a DeepSeek-R1-et HAI oktatóvideóval

Kapcsolódó bejegyzések