Αυτό το άρθρο είναι ένα άρθρο καθρέφτη της αυτόματης μετάφρασης, κάντε κλικ εδώ για να μεταβείτε στο αρχικό άρθρο.

Άποψη: 1741|Απάντηση: 5

Προσωπικός υπερυπολογιστής τεχνητής νοημοσύνης NVIDIA Project DIGITS

[Αντιγραφή συνδέσμου]
Δημοσιεύτηκε στις 2025-2-13 09:43:00 | | | |
Το Project DIGITS τροφοδοτείται από το NVIDIA GB10 Grace Blackwell Superchip, παρέχοντας απόδοση τεχνητής νοημοσύνης κινητής υποδιαστολής exascale σε ενεργειακά αποδοτική, συμπαγή μορφή. Με μια προεγκατεστημένη στοίβα λογισμικού NVIDIA AI και 128 GB μνήμης, οι προγραμματιστές μπορούν τοπικά να πρωτοτυπήσουν, να τελειοποιήσουν και να αιτιολογήσουν μεγάλα μοντέλα τεχνητής νοημοσύνης με παραμέτρους έως και 200B και να τα αναπτύξουν απρόσκοπτα σε κέντρα δεδομένων ή στο cloud.



Επίσημη ιστοσελίδα:Η σύνδεση με υπερσύνδεσμο είναι ορατή.
Περισσότερη εισαγωγή:Η σύνδεση με υπερσύνδεσμο είναι ορατή.

Το superchip GB10 προσφέρει exabyte αποτελεσματικής απόδοσης AI

Το GB10 Superchip είναι ένα system-on-chip (SoC) που βασίζεται στην αρχιτεκτονική NVIDIA Grace Blackwell, παρέχοντας έως και 100 τρισεκατομμύρια απόδοση AI με ακρίβεια FP4.

Με την υποστήριξη των GPU NVIDIA Blackwell, το GB10 είναι εξοπλισμένο με πυρήνες CUDA® τελευταίας γενιάς και πυρήνες Tensor πέμπτης γενιάς, συνδεδεμένους με επεξεργαστές NVIDIA Grace™ υψηλής απόδοσης μέσω διασυνδέσεων NVLink-C2C ® chip-to-chip, συμπεριλαμβανομένων 20 ενεργειακά αποδοτικών πυρήνων κατασκευασμένων με αρχιτεκτονική Arm. Η MediaTek, ηγέτης της αγοράς στον σχεδιασμό SoC που βασίζεται σε Arm, συμμετείχε στο σχεδιασμό του GB10, συμβάλλοντας στην καλύτερη ενεργειακή απόδοση, απόδοση και συνδεσιμότητα στην κατηγορία του.

Το superchip GB10 επιτρέπει στο Project DIGITS να προσφέρει ισχυρή απόδοση χρησιμοποιώντας μόνο μια τυπική πρίζα. Κάθε Project DIGITS διαθέτει 128 GB ενοποιημένης, σταθερής μνήμης και έως 4 TB αποθηκευτικού χώρου NVMe. Με αυτόν τον υπερυπολογιστή, οι προγραμματιστές μπορούν να εκτελούν μεγάλα γλωσσικά μοντέλα με έως και 200 δισεκατομμύρια παραμέτρους, ενισχύοντας την καινοτομία της τεχνητής νοημοσύνης. Επιπλέον, χρησιμοποιώντας το δίκτυο NVIDIA ConnectX ®, δύο υπερυπολογιστές Project DIGITS AI μπορούν να συνδεθούν για να τρέξουν μοντέλα με έως και 405 δισεκατομμύρια παραμέτρους.

──────
1. Σύντομο ιστορικό
──────
Η κάρτα επιταχυντή AI από το "Project Digits" μπορεί να έχει τις ακόλουθες εκπληκτικές προδιαγραφές:
• Μνήμη βίντεο 128 GB
• Εύρος ζώνης περίπου 512 GB/s
• Περίπου 250 TFLOPS (fp16)
• Η τιμή πώλησης μπορεί να είναι περίπου $3000

Μερικοί άνθρωποι το συγκρίνουν με το M4 Pro/Max της Apple και τις mainstream GPU στην αγορά και αναφέρουν το ελαφρώς σλόγκαν μάρκετινγκ "1 PFLOPS", αλλά η πραγματική αποτελεσματική υπολογιστική ισχύς πρέπει να σταθμιστεί προσεκτικά.

─────────
2. Βασικές παράμετροι και σημασία
─────────
1. Υπολογιστική ισχύς κινητής υποδιαστολής (FLOPS)
• Τα 250 TFLOPS (fp16) ακούγονται δελεαστικά, αλλά το υλικό και το λογισμικό συνεργάζονται για να κάνουν πραγματικά τη διαφορά.
• Το "1 PFLOPS" αναφέρεται συνήθως στη θεωρητική κορυφή σε λειτουργία χαμηλότερης ακρίβειας ή μπορεί επίσης να είναι το συνηθισμένο "παιχνίδι αριθμών" στη διαφήμιση.
2. Μνήμη βίντεο/ενοποιημένη μνήμη (128 GB)
•Για διάφορα μοντέλα τεχνητής νοημοσύνης, η χωρητικότητα μνήμης βίντεο αποτελεί βασικό δείκτη της «ικανότητας προσαρμογής ενός μοντέλου»· Τα 128 GB είναι αρκετά για να υποστηρίξουν την εξαγωγή συμπερασμάτων και την εκπαίδευση μεσαίας κλίμακας.
• Όταν εκπαιδεύετε ένα μοντέλο παραμέτρων 10~20B (ή περισσότερα), χρησιμοποιήστε κατάλληλα τεχνικές ακρίβειας ανάμειξης ή λεπτομέρειας για να αξιοποιήσετε στο έπακρο αυτή τη μεγάλη μνήμη.
3. Εύρος ζώνης μνήμης (~512 GB/s)
• Το εύρος ζώνης καθορίζει εάν ο υπολογιστικός πυρήνας μπορεί να «φάει τα δεδομένα».
•Αν και δεν είναι τόσο καλό όσο το επίπεδο του κέντρου δεδομένων (1 TB/s~2 TB/s ή περισσότερο), είναι ήδη ένα υψηλό επίπεδο για μια πλατφόρμα σε επίπεδο προσωπικού/σταθμού εργασίας.
• Το αν η υπολογιστική ισχύς και το εύρος ζώνης είναι ισορροπημένα εξαρτάται επίσης από τη βελτιστοποίηση της κρυφής μνήμης/χειριστή στην αρχιτεκτονική. Μπορεί να μην είναι αρκετό να κοιτάξουμε τους αριθμούς, αλλά και να δούμε το πραγματικό σκορ.
4. Τιμή και οικολογία
• Μια κάρτα περίπου 3.000 $ (αν ισχύει) είναι ελκυστική για πολλούς προγραμματιστές ή μικρές ομάδες. Αυτό είναι ένα πιθανό σημείο ανταγωνισμού με GPU υψηλής τεχνολογίας καταναλωτικής ποιότητας, όπως η RTX 4090.
• Ωστόσο, εάν η στοίβα λογισμικού (προγράμματα οδήγησης, μεταγλωττιστές, πλαίσια βαθιάς μάθησης) δεν είναι τέλεια, η υψηλή υπολογιστική ισχύς μπορεί να εξακολουθεί να «ξαπλώνει και να τρώει στάχτη».

───────────
3. Επιπτώσεις σε μεγάλες εργασίες μοντέλου
───────────
1. Συλλογισμός μεγάλου μοντέλου
• Τα 128 GB μνήμης βίντεο είναι αρκετά για να υποστηρίξουν δισεκατομμύρια έως δεκάδες δισεκατομμύρια μοντέλα παραμέτρων που «φορτώνονται στη μνήμη ταυτόχρονα» σε λειτουργία μισής ακρίβειας ή κβαντισμού και η απόδοση συμπερασμάτων είναι πιθανό να είναι αρκετά υψηλή.
• Εάν το εύρος ζώνης και η κρυφή μνήμη μπορούν να χρησιμοποιηθούν σωστά, η καθυστέρηση και η απόδοση κατά την εξαγωγή συμπερασμάτων μπορεί να είναι ικανοποιητικές.
2. Εκπαίδευση μικρής και μεσαίας κλίμακας
• Για μοντέλα με εκατοντάδες εκατομμύρια έως δισεκατομμύρια παραμέτρους, είναι δυνατή η εκτέλεση ολόκληρης της διαδικασίας εκπαίδευσης με μικτή ακρίβεια σε αυτήν την κάρτα.
• Για μοντέλα 30B~70B, συνήθως απαιτούνται τεχνικές κβαντισμού ή παραλληλισμός πολλαπλών καρτών, αλλά για μικρές ομάδες, εξακολουθεί να είναι μια πιο προσιτή μέθοδος από τις ακριβές λύσεις κέντρων δεδομένων.
3. Σημεία συμφόρησης εύρους ζώνης και σπατάλη υπολογιστικής ισχύος
• Το 250 TFLOPS απαιτεί αποτελεσματική παροχή δεδομένων για να χρησιμοποιηθεί πλήρως.
• Τα 512 GB/s δεν είναι «μικρός αριθμός», αλλά το αν μπορεί πραγματικά να εκτελέσει την πλήρη υπολογιστική ισχύ εξαρτάται από τη μέτρηση και τον συντονισμό σε επίπεδο χειριστή.

────────────
4. Σύντομη σύγκριση με άλλες επιλογές
────────────
1. Σειρά Apple M4
• Το M4 Pro/Max είναι επίσης γνωστό για το υψηλό εύρος ζώνης και την υψηλή υπολογιστική του ισχύ. Ωστόσο, όσον αφορά την πραγματική συμβατότητα πλαισίου και τη βελτιστοποίηση της βαθιάς μάθησης, δεν είναι ακόμη στο ίδιο επίπεδο με τη NVIDIA.
• Εάν το "Project Digits" δεν έχει ώριμο οικοσύστημα, μπορεί επίσης να ακολουθήσει τα βήματα των GPU της Apple. Ανεξάρτητα από το πόσο καλό είναι το υλικό, είναι δύσκολο να ξεπεραστεί εάν δεν υπάρχει η προσαρμογή λογισμικού.
2. Κάρτα επιτραπέζιου υπολογιστή NVIDIA (όπως RTX 4090)
•Το RTX 4090 έχει ισχυρή υπολογιστική ισχύ και σημαντικό εύρος ζώνης, αλλά μόνο 24 GB θα «τεντωθούν» σε ορισμένα μεγάλα μοντέλα.
• Όταν απαιτούνται πολλές κάρτες παράλληλα, το κόστος και η κατανάλωση ενέργειας αυξάνονται απότομα και είναι προφανώς πιο βολικό για το "Project Digits" να παρέχει 128 GB σε μία μόνο κάρτα.
3. GPU Κέντρου Δεδομένων (A100/H100)
•Αυτές οι GPU σε επίπεδο μεγάλου αδελφού κοστίζουν δεκάδες χιλιάδες ή και δεκάδες χιλιάδες δολάρια και η απόδοση και η οικολογία είναι αδιαμφισβήτητες, αλλά δεν μπορούν όλοι να τις αντέξουν οικονομικά.
•Εάν τα "Ψηφία Έργου" μπορούν πραγματικά να επιτρέψουν σε μικρές ομάδες να έχουν μεγάλη μνήμη βίντεο και υψηλή υπολογιστική ισχύ με χαμηλότερο όριο, μπορεί να είναι σε θέση να πάρει ένα κομμάτι από την πίτα.

──────────
5. Πιθανές προκλήσεις και ανησυχίες
──────────
1. Οικολογία λογισμικού και ωριμότητα οδηγών
• Το CUDA είναι το μυστικό όπλο της NVIDIA. Χωρίς ένα παρόμοιο σταθερό οικοσύστημα, είναι δύσκολο για τα «Project Digits» να διαδοθούν σε μεγάλη κλίμακα.
2. Ο πραγματικός ρυθμός άφιξης της υπολογιστικής ισχύος/εύρους ζώνης
• Ο πραγματικός χειριστής που εκτελείται έχει πολλές λειτουργίες πρόσβασης στη μνήμη και εάν υπάρχει έλλειψη βελτιστοποίησης, η μέγιστη απόδοση μπορεί να παραμείνει μόνο στο διαφημιστικό υλικό.
3. Κατανάλωση ενέργειας, απαγωγή θερμότητας και περιβαλλοντική προσαρμογή
• Η μεγάλη μνήμη βίντεο και η υψηλή υπολογιστική ισχύς σημαίνουν συχνά υψηλή κατανάλωση ενέργειας. Εάν οι προσωπικοί ή μικροί σταθμοί εργασίας δεν είναι έτοιμοι για απαγωγή θερμότητας, μπορεί να αντιμετωπίσουν μια «μικρή σόμπα».
4. Αυθεντικότητα προμήθειας και τιμολόγησης
• Παρατηρήστε εάν υπάρχουν περισσότερες επίσημες πληροφορίες ή πραγματικές κριτικές προϊόντων στο μέλλον. Αν είναι απλώς ένα πρωτότυπο προϊόν, μπορεί επίσης να είναι «κενή χαρά».

─────
6. Σύνοψη
─────
Εάν το "Project Digits" μπορεί να προσφέρει 128 GB μνήμης βίντεο και 250 TFLOPS (fp16), συν μια φιλική τιμή περίπου 3,000 $, θα είναι πολύ ελκυστικό για προγραμματιστές που θέλουν να αναπτύξουν μοντέλα μεσαίου μεγέθους τοπικά ή σε μικρά εργαστήρια.
Ωστόσο, οι παράμετροι υλικού είναι τελικά μόνο μία πλευρά. Το κλειδί για την επιτυχία ή την αποτυχία είναι το πρόγραμμα οδήγησης, ο μεταγλωττιστής, το πλαίσιο βαθιάς μάθησης και άλλη υποστήριξη λογισμικού.
Προς το παρόν, αυτό το έργο βρίσκεται ακόμη στο στάδιο των «έκτακτων ειδήσεων» και της «δημοσιότητας» και το αν μπορεί να κλονίσει το υπάρχον πρότυπο της αγοράς εξαρτάται από την επακόλουθη διαδικασία παραγωγής και την πραγματική βαθμολογία απόδοσης.
 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 2025-2-21 14:16:38 |
HP Z2 Mini G1α

Ξεκλειδώστε ροές εργασίας που προηγουμένως δεν ήταν εφικτές σε μίνι σταθμούς εργασίας. Η μετασχηματιστική απόδοση είναι ενσωματωμένη σε έναν συμπαγή υπολογιστή τεχνητής νοημοσύνης για την ανάληψη σύνθετων έργων με επιτάχυνση τεχνητής νοημοσύνης όπως ποτέ άλλοτε - ταυτόχρονα σχεδιασμός 3D και απόδοση έργων έντασης γραφικών ή εγγενής συνεργασία με LLM.

https://www.hp.com/us-en/workstations/z2-mini-a.html
 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 2025-3-19 10:29:06 |
Ο NVIDIA DGX Spark, ο υπερυπολογιστής NVIDIA AI, δέχεται προπαραγγελίες
https://www.itsvse.com/thread-10974-1-1.html
 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 2025-3-19 10:50:41 |
Υπερυπολογιστής ASUS Ascent GX10 AI:https://www.asus.com/event/asus-ascent-gx10/
 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 2025-4-4 20:08:48 |
 Σπιτονοικοκύρης| Δημοσιεύτηκε στις 2025-8-10 21:49:59 |
Jetson (1) Jetson Orin Nano Super Developer Kit χωρίς συσκευασία
https://www.itsvse.com/thread-11050-1-1.html
Αποκήρυξη:
Όλο το λογισμικό, το υλικό προγραμματισμού ή τα άρθρα που δημοσιεύονται από το Code Farmer Network προορίζονται μόνο για μαθησιακούς και ερευνητικούς σκοπούς. Το παραπάνω περιεχόμενο δεν θα χρησιμοποιηθεί για εμπορικούς ή παράνομους σκοπούς, άλλως οι χρήστες θα υποστούν όλες τις συνέπειες. Οι πληροφορίες σε αυτόν τον ιστότοπο προέρχονται από το Διαδίκτυο και οι διαφορές πνευματικών δικαιωμάτων δεν έχουν καμία σχέση με αυτόν τον ιστότοπο. Πρέπει να διαγράψετε εντελώς το παραπάνω περιεχόμενο από τον υπολογιστή σας εντός 24 ωρών από τη λήψη. Εάν σας αρέσει το πρόγραμμα, υποστηρίξτε γνήσιο λογισμικό, αγοράστε εγγραφή και λάβετε καλύτερες γνήσιες υπηρεσίες. Εάν υπάρχει οποιαδήποτε παραβίαση, επικοινωνήστε μαζί μας μέσω email.

Mail To:help@itsvse.com