Tämä artikkeli on konekäännöksen peiliartikkeli, klikkaa tästä siirtyäksesi alkuperäiseen artikkeliin.

Näkymä: 2394|Vastaus: 10

【AI】(3) Tencent Cloud ottaa käyttöön DeepSeek-R1:n HAI-tutoriaalilla

[Kopioi linkki]
Julkaistu 2025-2-5 21:14:04 | | | |
Hyper Application Inventor (HAI) on GPU-sovelluspalvelutuote tekoälylle ja tieteelliselle laskennalle, joka tarjoaa plug-and-play-laskentatehoa ja yhteisiä ympäristöjä auttaakseen pieniä ja keskisuuria yrityksiä sekä kehittäjiä ottamaan LLM:t nopeasti käyttöön.

Osoite:Hyperlinkin kirjautuminen on näkyvissä.

HAI vs GPU-palvelimet

Vähennä merkittävästi GPU:n pilvipalvelimen kynnysarvoa, optimoi tuotekokemus monesta näkökulmasta ja käytä sitä suoraan laatikosta, kuten alla olevassa kuvassa näkyy:



Osta HAI-laskentatehoa

Mene ostosivulle, valitse perusympäristökuva "Ubuntu 20.04" ja määritä ympäristö:Ubuntu 20.04, ajuri 525.105.17, Python 3.8, CUDA 12.0, cuDNN 8Kuva on jo asentanut ajurin meille, ja päätämme maksaa sitä mukaa kun kulutamme, kuten alla olevassa kuvassa näkyy:



Videomuisti: 32GB+
Hashrate: 15+TFlops SP
CPU: 8~10 ydintä
RAM-muisti: 40GB

Muutaman minuutin odotuksen jälkeen instanssi luodaan onnistuneesti ja Academic Acceleration kytketään päälle, kuten seuraavassa kuvassa näkyy:



Ensimmäisellä käyttökerralla sinun täytyy nollata salasanasi, ja kirjautumisnimi on:Ubuntu。 Kokeile kirjautua palvelimelle ja tarkistaa NVIDIA-näytönohjaimen ajuritiedot seuraavalla komennolla:


Kuten alla on esitetty:


Asenna Ollama

Ollaman virallinen verkkosivusto:Hyperlinkin kirjautuminen on näkyvissä.

Kirjaudu palvelimelle pusty-työkalulla ja ala asentaa Ollama-työkalua seuraavalla komennolla:


Asennus on valmis, ja lähtö on seuraava:
>>> Ollaman asentaminen /usr/localiin
>>> Linux amd64 -paketin lataaminen
######################################################################## 100.0%
>>> Luomassa ollama-käyttäjää...
>>> Lisätään ollama-käyttäjä renderöintiryhmään...
>>> Lisään ollama-käyttäjää videoryhmään...
>>> Lisätään nykyinen käyttäjä Ollama-ryhmään...
>>> Ollama systemd -palvelun luominen...
>>> Ollama-palvelun käyttöönotto ja käynnistäminen...
Loin symlinkin /etc/systemd/system/default.target.wants/ollama.service → /etc/systemd/system/ollama.service.

Katso versiokomento: ollama -v
Katso malli, joka on tällä hetkellä ladattu muistiin: ollama ps

Luo mukautettu mallin tallennuskansio seuraavalla komennolla:

Muokkaa oletuskuunteluosoitetta ja mallin tallennuspolkua (et voi muuttaa oletusporttia, muuten komento epäonnistuu) ja käytä seuraavia komentoja:


Ota käyttöön deepseek-r1-malli

Suorita deepseek-r1:8b-malli seuraavalla komennolla:


Kuten alla on esitetty:



Testaa dialogia alla esitetyn mukaisesti:



Palomuuri vapauttaa TCP-portin 11434 ja kutsuu HTTP-rajapintaa, kuten seuraavassa kuvassa näkyy:



{
  "mallit": [
    {
      "nimi": "deepseek-r1:8b",
      "malli": "deepseek-r1:8b",
      "koko": 6930032640,
      "tiivistelmä": "28f8fd6cdc677661426adab9338ce3c013d7e69a5bea9e704b364171a5d61a10",
      "yksityiskohdat": {
        "parent_model": "",
        "Formaatti": "GGUF",
        "perhe": "llama",
        "perheet": [
          "Llama"
        ],
        "parameter_size": "8.0B",
        "quantization_level": "Q4_K_M"
      },
      "expires_at": "2025-02-05T21:14:50.715753614+08:00",
      "size_vram": 6930032640
    }
  ]
}

Viittaus:
Hyperlinkin kirjautuminen on näkyvissä.
Hyperlinkin kirjautuminen on näkyvissä.
Hyperlinkin kirjautuminen on näkyvissä.




Edellinen:[AI] (2) Ero DeepSeek-V3:n ja R1-versioiden välillä
Seuraava:[AI] (4) Käytä Open WebUI:tä kutsumaan DeepSeek-R1-mallia
 Vuokraisäntä| Julkaistu 2025-2-5 21:22:49 |
Jos malli ei saa pyyntöjä tai syötteitä tietyn ajan, Ollama lopettaa mallin automaattisesti pilvikeskuksessa resurssien säästämiseksi.
 Vuokraisäntä| Julkaistu 2025-2-6 09:03:57 |
Ollama-ympäristömuuttujan konfiguraatiokohde

MuuttujaOletusarvoKuvaus + Vaikutus + Tilanne
OLLAMA_HOST"[color=var(--fgColor-accent, var(--color-accent-fg))]Hyperlinkin kirjautuminen on näkyvissä."Konfiguroi isännän ja järjestelmän Ollama-palvelimelle. Vaikutus: Määrittää URL-osoitteen, jota käytetään Ollama-palvelimeen yhdistämiseen. Skenaario: Hyödyllinen, kun Ollamaa otetaan käyttöön hajautetussa ympäristössä tai kun palvelu täytyy avata tietylle verkkorajapinnalle.
OLLAMA_ORIGINS[localhost, 127.0.0.1, 0.0.0.0] + app://, file://, tauri://Konfiguraatiot mahdollistivat CORS:n alkuperät. Vaikutus: Hallitsee, mitkä alkuperät saavat tehdä pyyntöjä Ollama-palvelimelle. Skenaario: Kriittistä, kun integroidaan Ollama web-sovelluksiin, jotta estetään luvattomat pääsyt eri verkkotunnuksilta.
OLLAMA_MODELS$HOME/.ollama/modelsAsettaa polun models-hakemistoon. Vaikutus: Määrittää, mistä mallitiedostot tallennetaan ja mistä ne ladataan. Skenaario: Hyödyllinen levytilan hallintaan eri levyillä tai jaettujen mallivarastojen perustamiseen monikäyttäjäympäristöissä.
OLLAMA_KEEP_ALIVE5 minuuttiaMäärittää, kuinka kauan mallit pysyvät ladattuina muistissa. Vaikutus: Säätimet, kestomallit pysyvät muistissa käytön jälkeen. Skenaario: Pidemmät kestot parantavat vastausaikoja toistuville kyselyille, mutta lisäävät muistin käyttöä. Lyhyemmät ajat vapauttavat resursseja, mutta voivat pidentää alkuvaiheen vasteaikoja.
OLLAMA_DEBUGfalseMahdollistaa lisävirheenkorjaustiedot. Vaikutus: Lisää lokituksen ja virheenkorjauksen sanallisuutta. Skenaario: Korvaamaton ongelmien selvittämisessä tai järjestelmän käyttäytymisen ymmärtämisessä kehityksen tai käyttöönoton aikana.
OLLAMA_FLASH_ATTENTIONfalseMahdollistaa kokeellisen välähdyksen tarkkaavaisuusominaisuuden. Vaikutus: Aktivoi kokeellisen optimoinnin tarkkaavaisuusmekanismeille. Skenaario: Voi parantaa suorituskykyä yhteensopivalla laitteistolla, mutta voi aiheuttaa epävakautta.
OLLAMA_NOHISTORYfalseEstää lukulinjan historian. Vaikutus: Estää komentohistorian tallentamisen. Skenaario: Hyödyllinen turvallisuusherkissä ympäristöissä, joissa komentohistoriaa ei tulisi säilyttää.
OLLAMA_NOPRUNEfalsePoistaa malliläiskien karsimisen käytöstä käynnistyksen yhteydessä. Vaikutus: Säilyttää kaikki malliläiskät, mikä voi lisätä levyn käyttöä. Skenaario: Hyödyllinen, kun sinun täytyy ylläpitää kaikkia malliversioita yhteensopivuuden tai palautuksen vuoksi.
OLLAMA_SCHED_SPREADfalseMahdollistaa mallien ajoittamisen kaikille näytönohjaimille. Vaikutus: Mahdollistaa moninäytönohjaimen käytön mallipäättelyyn. Skenaario: Hyödyllinen suorituskykyisissä laskentaympäristöissä, joissa on useita GPU:ita, laitteiston käytön maksimoimiseksi.
OLLAMA_INTEL_GPUfalseMahdollistaa kokeellisen Intel-näytönohjaimen tunnistuksen. Vaikutus: Mahdollistaa Intel-näytönohjainten käytön mallipäättelyyn. Skenaario: Hyödyllinen organisaatioille, jotka hyödyntävät Intelin GPU-laitteistoa tekoälytyökuormissa.
OLLAMA_LLM_LIBRARY"" (automaattinen tunnistus)Asettaa LLM-kirjaston käytettäväksi. Vaikutus: Ohittaa LLM-kirjaston automaattisen tunnistuksen. Skenaario: Hyödyllinen, kun sinun täytyy pakottaa tietty kirjastoversio tai toteutus yhteensopivuuden tai suorituskyvyn vuoksi.
OLLAMA_TMPDIRJärjestelmän oletusväliaikainen hakemistoMäärittää väliaikaisten tiedostojen sijainnin. Vaikutus: Määrittää, missä väliaikaiset tiedostot säilytetään. Skenaario: Tärkeä I/O-suorituskyvyn hallinnassa tai kun järjestelmän väliaikakansiossa on rajallinen tila.
CUDA_VISIBLE_DEVICESKaikki saatavillaMäärittää, mitkä NVIDIA-laitteet näkyvät. Vaikutus: Säätelee, mitä NVIDIA-näytönohjaimia voi käyttää. Skenaario: Kriittinen GPU:n allokoinnin hallinnassa monikäyttäjä- tai moniprosessiympäristöissä.
HIP_VISIBLE_DEVICESKaikki saatavillaSetit, jotka AMD-laitteet näkyvät. Vaikutus: Säätelee, mitä AMD-näytönohjaimia voi käyttää. Skenaario: Samanlainen kuin CUDA_VISIBLE_DEVICES, mutta AMD-laitteistolle.
OLLAMA_RUNNERS_DIRJärjestelmäriippuvainenMäärittää juoksijoiden sijainnin. Vaikutus: Määrittää, missä juoksijan suoritettavat tiedostot sijaitsevat. Skenaario: Tärkeä mukautetuissa käyttöönotoissa tai silloin, kun juoksijat täytyy eristää pääsovelluksesta.
OLLAMA_NUM_PARALLEL0 (rajoittamaton)Määrittää rinnakkaisten mallipyyntöjen määrän. Vaikutus: Hallitsee mallipäättelyn samanaikaisuutta. Skenaario: Kriittinen järjestelmän kuormituksen hallinnassa ja reagoivuuden varmistamiseksi vilkkaissa ympäristöissä.
OLLAMA_MAX_LOADED_MODELS0 (rajoittamaton)Määrittää ladattujen mallien enimmäismäärän. Vaikutus: Rajoittaa samanaikaisesti ladattujen mallien määrää. Skenaario: Auttaa hallitsemaan muistin käyttöä ympäristöissä, joissa resurssit ovat rajalliset, tai monenlaisia malleja.
OLLAMA_MAX_QUEUE512Asettaa jonottavien pyyntöjen maksimimäärän. Vaikutus: Rajoittaa pyyntöjonon kokoa. Skenaario: Estää järjestelmän ylikuormituksen liikennepiikkien aikana ja varmistaa pyyntöjen oikea-aikaisen käsittelyn.
OLLAMA_MAX_VRAM0 (rajoittamaton)Asettaa maksimi-VRAM-ohituksen tavuina. Vaikutus: Rajoittaa käytettävän VRAMin määrää. Skenaario: Hyödyllinen jaetuissa GPU-ympäristöissä estämään yhtä prosessia hallitsemasta GPU-muistia.


Lähde:Hyperlinkin kirjautuminen on näkyvissä.

$ Ollama auta palvelemaan
Aloita ollama

Usage:
  Ollama serve [liput]

Aliases:
  Tarjoa, aloita

Flags:
  -h, --apua palveluun

Ympäristömuuttujat:
      OLLAMA_DEBUG Näytä lisävirhetietoja (esim. OLLAMA_DEBUG=1)
      OLLAMA_HOST Ollama-palvelimen IP-osoite (oletus 127.0.0.1:11434)
      OLLAMA_KEEP_ALIVE Mallien latausaika muistissa (oletus "5m")
      OLLAMA_MAX_LOADED_MODELS Suurin määrä ladattuja malleja GPU:ta kohden
      OLLAMA_MAX_QUEUE Jonotettujen pyyntöjen maksimimäärä
      OLLAMA_MODELS Polu mallihakemistoon
      OLLAMA_NUM_PARALLEL Suurin määrä rinnakkaisia pyyntöjä
      OLLAMA_NOPRUNE Älä leikkaa malliläiskiä käynnistyksen yhteydessä
      OLLAMA_ORIGINS Pilkulla erotettu lista sallituista alkumuodoista
      OLLAMA_SCHED_SPREAD Aikatauluta malli aina kaikille näytönohjaimille
      OLLAMA_TMPDIR Väliaikaisten tiedostojen sijainti
      OLLAMA_FLASH_ATTENTION Välähdyksen huomio päällä
      OLLAMA_LLM_LIBRARY Aseta LLM-kirjasto ohittamaan automaattinen tunnistus
      OLLAMA_GPU_OVERHEAD Varaa osa VRAMista per GPU (tavut)
      OLLAMA_LOAD_TIMEOUT Kuinka kauan mallilatausten pysähtyminen ennen luovuttamista (oletus "5m")


Viittaus:Hyperlinkin kirjautuminen on näkyvissä.
 Vuokraisäntä| Julkaistu 2025-2-6 09:19:49 |
Ollama-komento

ollama-lista: Näyttää mallilistan
Ollama-show: Näyttää tietoa mallista
Ollama Pull: Pull-malli
ollama push: Push-malli
Ollama CP: kopioi malli
ollama rm: Poista malli
Ollama run: Käytä mallia
 Vuokraisäntä| Julkaistu 2025-2-6 09:33:17 |
Mallin optimointi, editointi/etc/systemd/system/ollama.service.d/override.confkonfiguraatio, lisää seuraavat:


Täydellinen kokoonpano on seuraava:



 Vuokraisäntä| Julkaistu 2025-2-6 09:35:26 |
--monisanainenParametria käytetään päättelynopeuden (token / sekunti) näyttämiseen. Esimerkiksi:

>>> Hei, kuka olet?
<think>

</think>

Hei! Olen tekoälyavustaja, jonka DeepSeek on itsenäisesti kehittänyt Kiinassa, ja olen iloinen voidessani palvella sinua!

Kokonaiskesto: 489,831897ms
Latausaika: 24.116423ms
Nopea arviointimäärä: 10 tokenia
Kehotteen arvioinnin kesto: 4ms
Nopea arviointinopeus: 2500,00 tokenia/s
Arviointimäärä: 36 merkkiä
Arvioinnin kesto: 460ms
Arviointinopeus: 78,26 tokenia/s
>>> olen pieni roisto, mikä nimeni on?
<think>
No, onko pikku roisto nimeni? Annanpa minun miettiä tarkkaan. Muistan, kun olin lapsi, vanhempani antoivat minulle nimen "Pikku roisto", koska perheeni luuli, että minulla on suuret korvat, mutta todellisuudessa siinä se
Ei oikea syy. Ehkä siksi, että lapsena laitoin aina sormeni suuhuni kuin roskaa, joten minua kutsuttiin "pikku roskaksi".

Nimi kuulostaa kuitenkin nyt hieman oudolta, eikä se aivan sovi nyky-yhteiskunnan nimeämistyyliin. Minun pitäisi harkita sen nimeämistä uudelleen, joka sopii minulle paremmin. Ensiksi minun täytyy ymmärtää itseäni
Persoonallisuuden piirteitäsi ja kiinnostuksen kohteitasi, joten voit valita nimen, joka on sekä merkityksellinen että ainutlaatuinen.

Pidän muiden auttamisesta ja olen hyvä kuuntelemaan ja kommunikoimaan, joten ehkä valitse nimi, jossa on "viisaus", "lämmin" tai "ystävällinen". Samaan aikaan haluan myös heijastaa persoonallisuuttani, kuten
Jos pidät kirjoista, musiikista tai urheilusta, voit sisällyttää nämä elementit nimeesi.

Lisäksi minun täytyy varmistaa, ettei uutta nimeä muisteta väärin tai ymmärretä. Tämä tarkoittaa, että nimen tulee olla ainutlaatuinen ja tunnistettava, ei liian monimutkainen tai liian tavallinen. Osaan
Katso joidenkin tunnettujen henkilöiden nimiä nähdäksesi, kenellä on sekä kulttuuriperintöä että nykyaikaa.

Lisäksi minun täytyy pohtia, onko ääntäminen sujuvaa, onko siinä myönteinen merkitys ja miten se ilmaistaan eri yhteyksissä. Tämä tarkoittaa, että nimen valinnassa se ei ainoastaan kuulosta hyvältä, vaan myös
Sen takana täytyy olla merkitystä ja arvoa.

Lopuksi minun täytyy kommunikoida perheeni ja ystävieni kanssa varmistaakseni, että he ovat tyytyväisiä uuteen nimeen ja että nimi voi olla osa elämääni. Loppujen lopuksi nimi ei ole vain
identifiointi on osa itseilmaisua.

Lyhyesti sanottuna, Xiao Zhao ei ole oikea nimeni, ja minulla on oikeus valita nimi, joka sopii minulle paremmin. Se vaatii aikaa ja ajattelua, mutta analysoimalla huolellisesti persoonallisuuttasi, kiinnostuksen kohteitasi
Nimen merkityksen lisäksi uskon, että löydän itselleni sopivimman nimen.
</think>

Edellä mainitun ajatteluprosessin perusteella päätin nimetä itseni "Viisauden tähdeksi". Nimi heijastaa sekä kekseliäisyyttäni, lämpöäni ja toivoa, tehden siitä täydellisen sopivan henkilökohtaiseen seksuaalisuuteeni
Ominaisuudet. Samaan aikaan "tähti" symboloi valoa ja äärettömiä mahdollisuuksia, inspiroiden minua jatkuvasti tavoittelemaan edistystä ja kasvua.

**Lopullinen nimi: Viisauden tähti**

Tämä nimi ei ainoastaan sovi persoonallisuuteeni, vaan on myös täynnä positiivista energiaa, joka saa minut tuntemaan suurta ylpeyttä ja täyttymystä.

Kokonaiskesto: 7,600299527s
Latausaika: 24.37534ms
Nopea arviointimäärä: 59 tokenia
Prompt-arvioinnin kesto: 10ms
Nopea arviointinopeus: 5900,00 tokenia/s
Arvostusmäärä: 557 merkkiä
Arviointikesto: 6,618s
Arviointinopeus: 84,16 tokenia/s

 Vuokraisäntä| Julkaistu 2025-2-6 10:22:02 |
Ota käyttöön ollama-mallit AMD-näytönohjaimilla
Ollama-for-AMD:Hyperlinkin kirjautuminen on näkyvissä.

Viittaus:Hyperlinkin kirjautuminen on näkyvissä.
 Vuokraisäntä| Julkaistu 2025-2-6 klo 13:26:17 |
Käytä deepseek-r1:32b -mallia




root@VM-0-8-ubuntu:~# nvidia-smi
To 6. helmikuuta 13:25:04 2025
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.105.17 Ajuriversio: 525.105.17 CUDA-versio: 12.0 |
|-------------------------------+----------------------+----------------------+
| GPU-nimen pysäytys-M| Bus-id Disp.A | Epävakaa korraatio. ECC |
| Tuulettimen lämpötila Pwr:Käyttö/katto|         Muistin käyttö | GPU-Util Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0 Tesla V100-SXM2...  On | 00000000:00:00:08.0 Pois päältä |                  Pois |
| Ei 65C P0 205W / 300W |  21822MiB / 32768MiB |     89 % Oletus |
|                               |                      |                  Ei saatavilla |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Prosessit: |
|  GPU GI CI PID Tyyppi Prosessinimi GPU Muisti |
|        ID ID Usage |
|=============================================================================|
|    0 N/A N/A 91457 C ... 1_avx/ollama_llama_server 21820MiB |
+-----------------------------------------------------------------------------+
root@VM-0-8-ubuntu:~# ollama show deepseek-r1:32b
  Malli
    Arkkitehtuuri QWEN2
    parametrit 32.8B
    Kontekstin pituus 131072
    upotuksen pituus 5120
    Kvantisointi Q4_K_M

  Parametrit
    pysäytä "<|lauseen alku|>"
    Pysäytä "<|lauseen loppu|>"
    pysäytä "<|Käyttäjä|>"
    lopeta "<|Assistentti|>"

  Lisenssi
    MIT-lisenssi
    Tekijänoikeus (c) 2023 DeepSeek

root@VM-0-8-ubuntu:~# ollama ps
NIMI ID -KOKOINEN PROSESSORI KUNNES
deepseek-r1:32b    38056bbcbb2d    23 GB    100% GPU     Forever


 Vuokraisäntä| Julkaistu 2025-2-8 08:34:18 |
Kuinka ratkaista Ollama-mallin vetoongelma
https://www.itsvse.com/thread-10939-1-1.html
 Vuokraisäntä| Julkaistu 2025-2-13 09:25:04 |
Koe DeepSeek R1 32b -malli Jetson AGX Orinilla (32G):Hyperlinkin kirjautuminen on näkyvissä.
Jetson ajaa suuria kielimalleja:https://www.jetson-ai-lab.com/models.html

Vastuuvapauslauseke:
Kaikki Code Farmer Networkin julkaisemat ohjelmistot, ohjelmamateriaalit tai artikkelit ovat tarkoitettu vain oppimis- ja tutkimustarkoituksiin; Yllä mainittua sisältöä ei saa käyttää kaupallisiin tai laittomiin tarkoituksiin, muuten käyttäjät joutuvat kantamaan kaikki seuraukset. Tämän sivuston tiedot ovat peräisin internetistä, eikä tekijänoikeuskiistat liity tähän sivustoon. Sinun tulee poistaa yllä oleva sisältö kokonaan tietokoneeltasi 24 tunnin kuluessa lataamisesta. Jos pidät ohjelmasta, tue aitoa ohjelmistoa, osta rekisteröityminen ja hanki parempia aitoja palveluita. Jos rikkomuksia ilmenee, ota meihin yhteyttä sähköpostitse.

Mail To:help@itsvse.com