Generative Data Intelligence

Το τσιπ τεχνητής νοημοσύνης επόμενης γενιάς της Meta προβάλλει διαφημίσεις ενώ καταναλώνει ενέργεια

Ημερομηνία:

Μετά το πείραμα του επιταχυντή τεχνητής νοημοσύνης δεύτερης γενιάς τον Φεβρουάριο, η Meta είναι έτοιμη να χύσει τα φασόλια σε αυτό το εγχώριο πυρίτιο, το οποίο ήδη λέγεται ότι τροφοδοτεί τις συστάσεις διαφημίσεων σε 16 περιοχές.

Ο Goliath του Facebook έχει σχεδιάσει προσαρμοσμένους επιταχυντές για κάθε είδους φόρτους εργασίας, από ροή βίντεο έως μηχανική εκμάθηση για να οδηγήσει τα μοντέλα που προτείνουν πίσω από τη διαφημιστική του αυτοκρατορία.

Η τελευταία προσθήκη η οικογένεια Meta Training Inference Accelerator (MTIA) ισχυρίζεται ότι έχει 3 φορές υψηλότερη απόδοση και 1.5x πλεονέκτημα απόδοσης ισχύος σε σχέση με το τμήμα πρώτης γενιάς, το οποίο οι φίλοι μας στο The Next Platform αναλύθηκε πέρυσι.

Σύμφωνα με το Meta, το τσιπ δεύτερης γενιάς, το οποίο θα ονομάσουμε MTIA v2 για λόγους συνέπειας, σχεδιάστηκε για να εξισορροπεί τον υπολογισμό, τη χωρητικότητα μνήμης και το εύρος ζώνης για να έχει την καλύτερη δυνατή απόδοση για τα μοντέλα εσωτερικής κατάταξης και συστάσεων του υπερκλιμάκωσης .

Εξετάζοντας τη σχεδίαση, ο επιταχυντής διαθέτει ένα πλέγμα 8×8 στοιχείων επεξεργασίας (PEs) που μαζί προσφέρουν 3.5 φορές υψηλότερη πυκνή υπολογιστική απόδοση ή 7 φορές υψηλότερη απόδοση με ενεργοποιημένη την αραιότητα σε σύγκριση με το MTIA v1.

Οι επιταχυντές τεχνητής νοημοσύνης της Meta τροφοδοτούν ήδη τα μοντέλα κατάταξης και συστάσεων του υπερκλιμακωτή

Ο πιο πρόσφατος επιταχυντής τεχνητής νοημοσύνης της Meta, παραπάνω, τροφοδοτεί ήδη τα μοντέλα κατάταξης και συστάσεων του υπερκλιμακωτή – Κάντε κλικ για μεγέθυνση. Πηγή: Meta

Πέρα από τη χρήση ενός μικρότερου κόμβου διεργασίας 5nm TSMC και την ενίσχυση της ταχύτητας ρολογιού από 800 MHz σε 1.35 GHz, η Meta σημειώνει αρκετές αρχιτεκτονικές και σχεδιαστικές βελτιώσεις που συνέβαλαν στα κέρδη απόδοσης του τελευταίου εξαρτήματος. Αυτά περιλαμβάνουν υποστήριξη για αραιούς υπολογισμούς, περισσότερη μνήμη on-die και off-die και αναβαθμισμένο δίκτυο σε chip (NoC) με διπλάσιο εύρος ζώνης από το παλιό μοντέλο. Δείτε πώς συγκρίνονται η πρώτη και η δεύτερη γενιά:

  MTIA v1 MTIA v2
Τεχνολογία διαδικασίας 7nm TSMC 5nm TSMC
Περιοχή νεκρών 373mm2 421mm2
ΠΕ Πλέγμα 8 × 8 Πλέγμα 8 × 8
Ταχύτητα ρολογιού 800MHz 1.35GHz
INT8 perf 102 TOPS 354/708* ΤΟΠΣ
FP16/BF16 perf 51.2 TFLOPS 177/354* TFLOPS
μέλος ΠΕ 128 KB ανά PE 384 KB ανά PE
Μεμ σε τσιπ 300 ΜΒ 300 ΜΒ
Off-chip mem 64GB 128GB
Μέλος εκτός τσιπ BW 176GB / s 204GB / s
Συνδεσιμότητα 8x PCIe Gen 4.0 – 16GB/s 8x PCIe Gen 5.0 – 32GB/s
TDP 25W 90W

* Αραιή απόδοση. Μπορείτε να βρείτε μια πλήρη ανάλυση και των δύο τσιπ εδώ.

Θα πρέπει να σημειωθεί ότι το MTIA v2 δεν θα εξαλείψει την ανάγκη του web Goliath για GPU. Ο ανώτατος του Meta, Mark Zuckerberg, είχε δηλώσει προηγουμένως ότι είναι η mega-corporation του θα αναπτύξει 350,000 επιταχυντές Nvidia H100 και θα έχουν το ισοδύναμο με 600,000 H100 σε λειτουργία μέχρι το τέλος του έτους.

Αντίθετα, το MTIA ακολουθεί ένα ολοένα και πιο γνωστό μοτίβο για το Meta (και άλλους) ανάπτυξης προσαρμοσμένου πυριτίου προσαρμοσμένου σε συγκεκριμένες εργασίες. Η ιδέα είναι ότι, ενώ το κιτ μπορεί να μην είναι τόσο ευέλικτο όσο οι CPU και οι GPU, ένα ASIC όταν αναπτύσσεται σε κλίμακα μπορεί να είναι πιο αποτελεσματικό.

Ενώ το πιο πρόσφατο τσιπ καταναλώνει σχεδόν τέσσερις φορές την ισχύ του προκατόχου του, είναι ικανό να παράγει έως και 7 φορές την απόδοση κινητής υποδιαστολής. Σε αντίθεση με μια GPU, ο πιο πρόσφατος επιταχυντής της Meta διαχειρίζεται 7.8 TOPS ανά watt (TOPS/W), όπως συζήτηση στην κάλυψή μας στο Blackwell, ξεπερνά το H100 SXM της Nvidia στα 5.65 TOPS/W και είναι περισσότερο από διπλάσιο από το A100 SXM στα 3.12 TOPS/W.

Τούτου λεχθέντος, είναι σαφές ότι η Meta έχει καταβάλει κάθε δυνατή προσπάθεια για να διαστασιολογήσει το τσιπ στους εσωτερικούς φόρτους εργασίας της — δηλαδή να συνάγει συμπέρασμα σχετικά με μοντέλα που προτείνουν. Αυτά έχουν σχεδιαστεί για να αποδίδουν εξατομικευμένες προτάσεις, όπως άτομα που μπορεί να γνωρίζετε ή, το πιο σημαντικό για το επιχειρηματικό μοντέλο της Meta, ποιες διαφημίσεις είναι πιθανότατα σχετικές με εσάς.

Τα τσιπ είναι επίσης σχεδιασμένα για να κλιμακώνονται ανάλογα με τις ανάγκες και μπορούν να αναπτυχθούν σε ένα σύστημα βασισμένο σε rack που περιέχει συνολικά 72 επιταχυντές: Κάθε σύστημα συνδυάζει τρία σασί που το καθένα περιέχει 12 πλακέτες υπολογιστών με δύο τσιπ MTIA v2 ανά πλακέτα.

Κάθε πλαίσιο MTIA v2 περιέχει 12 πίνακες υπολογιστών που η καθεμία περιέχει ένα ζεύγος επιταχυντών

Κάθε πλαίσιο MTIA v2 περιέχει 12 πίνακες υπολογιστών ο καθένας με ένα ζευγάρι επιταχυντές… Κάντε κλικ για μεγέθυνση. Πηγή: Meta.

Όσον αφορά την ανάπτυξη φόρτου εργασίας, το Meta βασίζεται σε μεγάλο βαθμό στο πλαίσιο PyTorch και τον μεταγλωττιστή Triton. Έχουμε δει αυτόν τον συνδυασμό να χρησιμοποιείται για την εκτέλεση εργασιών σε διάφορες GPU και επιταχυντές, εν μέρει επειδή εξαλείφει σε μεγάλο βαθμό την ανάγκη ανάπτυξης κώδικα βελτιστοποιημένου για συγκεκριμένο υλικό.

Ο Μέτα, υπήρξε ταγματάρχης υποστηρικτής της PyTorch, την οποία ανέπτυξε πριν παραδώσει τα ηνία στο Linux Foundation, καθώς δίνει στους μηχανικούς την ευελιξία να αναπτύξουν εφαρμογές τεχνητής νοημοσύνης που μπορούν να τρέξουν σε μια ποικιλία υλικού GPU από την Nvidia και την AMD. Είναι λοιπόν λογικό η Meta να θέλει να χρησιμοποιήσει τις ίδιες τεχνολογίες με τα δικά της τσιπ.

Στην πραγματικότητα, η Meta ισχυρίζεται ότι με τη συν-ανάπτυξη του λογισμικού και του υλικού της μαζί μπόρεσε να επιτύχει μεγαλύτερη αποτελεσματικότητα σε σύγκριση με τις υπάρχουσες πλατφόρμες GPU και αναμένει να επιτύχει ακόμη μεγαλύτερη απόδοση μέσω μελλοντικών βελτιστοποιήσεων.

Το MTIA v2 σίγουρα δεν θα είναι το τελευταίο πυρίτιο που βλέπουμε από το Meta. Ο γίγαντας των μέσων κοινωνικής δικτύωσης λέει ότι έχει πολλά προγράμματα σχεδιασμού τσιπ σε εξέλιξη, συμπεριλαμβανομένου ενός που θα υποστηρίζει μελλοντικά συστήματα τεχνητής νοημοσύνης. ®

spot_img

Τελευταία Νοημοσύνη

spot_img