Μετά το πείραμα του επιταχυντή τεχνητής νοημοσύνης δεύτερης γενιάς τον Φεβρουάριο, η Meta είναι έτοιμη να χύσει τα φασόλια σε αυτό το εγχώριο πυρίτιο, το οποίο ήδη λέγεται ότι τροφοδοτεί τις συστάσεις διαφημίσεων σε 16 περιοχές.
Ο Goliath του Facebook έχει σχεδιάσει προσαρμοσμένους επιταχυντές για κάθε είδους φόρτους εργασίας, από ροή βίντεο έως μηχανική εκμάθηση για να οδηγήσει τα μοντέλα που προτείνουν πίσω από τη διαφημιστική του αυτοκρατορία.
Η τελευταία προσθήκη η οικογένεια Meta Training Inference Accelerator (MTIA) ισχυρίζεται ότι έχει 3 φορές υψηλότερη απόδοση και 1.5x πλεονέκτημα απόδοσης ισχύος σε σχέση με το τμήμα πρώτης γενιάς, το οποίο οι φίλοι μας στο The Next Platform αναλύθηκε πέρυσι.
Σύμφωνα με το Meta, το τσιπ δεύτερης γενιάς, το οποίο θα ονομάσουμε MTIA v2 για λόγους συνέπειας, σχεδιάστηκε για να εξισορροπεί τον υπολογισμό, τη χωρητικότητα μνήμης και το εύρος ζώνης για να έχει την καλύτερη δυνατή απόδοση για τα μοντέλα εσωτερικής κατάταξης και συστάσεων του υπερκλιμάκωσης .
Εξετάζοντας τη σχεδίαση, ο επιταχυντής διαθέτει ένα πλέγμα 8×8 στοιχείων επεξεργασίας (PEs) που μαζί προσφέρουν 3.5 φορές υψηλότερη πυκνή υπολογιστική απόδοση ή 7 φορές υψηλότερη απόδοση με ενεργοποιημένη την αραιότητα σε σύγκριση με το MTIA v1.
Ο πιο πρόσφατος επιταχυντής τεχνητής νοημοσύνης της Meta, παραπάνω, τροφοδοτεί ήδη τα μοντέλα κατάταξης και συστάσεων του υπερκλιμακωτή – Κάντε κλικ για μεγέθυνση. Πηγή: Meta
Πέρα από τη χρήση ενός μικρότερου κόμβου διεργασίας 5nm TSMC και την ενίσχυση της ταχύτητας ρολογιού από 800 MHz σε 1.35 GHz, η Meta σημειώνει αρκετές αρχιτεκτονικές και σχεδιαστικές βελτιώσεις που συνέβαλαν στα κέρδη απόδοσης του τελευταίου εξαρτήματος. Αυτά περιλαμβάνουν υποστήριξη για αραιούς υπολογισμούς, περισσότερη μνήμη on-die και off-die και αναβαθμισμένο δίκτυο σε chip (NoC) με διπλάσιο εύρος ζώνης από το παλιό μοντέλο. Δείτε πώς συγκρίνονται η πρώτη και η δεύτερη γενιά:
MTIA v1 | MTIA v2 | |
---|---|---|
Τεχνολογία διαδικασίας | 7nm TSMC | 5nm TSMC |
Περιοχή νεκρών | 373mm2 | 421mm2 |
ΠΕ | Πλέγμα 8 × 8 | Πλέγμα 8 × 8 |
Ταχύτητα ρολογιού | 800MHz | 1.35GHz |
INT8 perf | 102 TOPS | 354/708* ΤΟΠΣ |
FP16/BF16 perf | 51.2 TFLOPS | 177/354* TFLOPS |
μέλος ΠΕ | 128 KB ανά PE | 384 KB ανά PE |
Μεμ σε τσιπ | 300 ΜΒ | 300 ΜΒ |
Off-chip mem | 64GB | 128GB |
Μέλος εκτός τσιπ BW | 176GB / s | 204GB / s |
Συνδεσιμότητα | 8x PCIe Gen 4.0 – 16GB/s | 8x PCIe Gen 5.0 – 32GB/s |
TDP | 25W | 90W |
* Αραιή απόδοση. Μπορείτε να βρείτε μια πλήρη ανάλυση και των δύο τσιπ εδώ.
Θα πρέπει να σημειωθεί ότι το MTIA v2 δεν θα εξαλείψει την ανάγκη του web Goliath για GPU. Ο ανώτατος του Meta, Mark Zuckerberg, είχε δηλώσει προηγουμένως ότι είναι η mega-corporation του θα αναπτύξει 350,000 επιταχυντές Nvidia H100 και θα έχουν το ισοδύναμο με 600,000 H100 σε λειτουργία μέχρι το τέλος του έτους.
Αντίθετα, το MTIA ακολουθεί ένα ολοένα και πιο γνωστό μοτίβο για το Meta (και άλλους) ανάπτυξης προσαρμοσμένου πυριτίου προσαρμοσμένου σε συγκεκριμένες εργασίες. Η ιδέα είναι ότι, ενώ το κιτ μπορεί να μην είναι τόσο ευέλικτο όσο οι CPU και οι GPU, ένα ASIC όταν αναπτύσσεται σε κλίμακα μπορεί να είναι πιο αποτελεσματικό.
Ενώ το πιο πρόσφατο τσιπ καταναλώνει σχεδόν τέσσερις φορές την ισχύ του προκατόχου του, είναι ικανό να παράγει έως και 7 φορές την απόδοση κινητής υποδιαστολής. Σε αντίθεση με μια GPU, ο πιο πρόσφατος επιταχυντής της Meta διαχειρίζεται 7.8 TOPS ανά watt (TOPS/W), όπως συζήτηση στην κάλυψή μας στο Blackwell, ξεπερνά το H100 SXM της Nvidia στα 5.65 TOPS/W και είναι περισσότερο από διπλάσιο από το A100 SXM στα 3.12 TOPS/W.
Τούτου λεχθέντος, είναι σαφές ότι η Meta έχει καταβάλει κάθε δυνατή προσπάθεια για να διαστασιολογήσει το τσιπ στους εσωτερικούς φόρτους εργασίας της — δηλαδή να συνάγει συμπέρασμα σχετικά με μοντέλα που προτείνουν. Αυτά έχουν σχεδιαστεί για να αποδίδουν εξατομικευμένες προτάσεις, όπως άτομα που μπορεί να γνωρίζετε ή, το πιο σημαντικό για το επιχειρηματικό μοντέλο της Meta, ποιες διαφημίσεις είναι πιθανότατα σχετικές με εσάς.
Τα τσιπ είναι επίσης σχεδιασμένα για να κλιμακώνονται ανάλογα με τις ανάγκες και μπορούν να αναπτυχθούν σε ένα σύστημα βασισμένο σε rack που περιέχει συνολικά 72 επιταχυντές: Κάθε σύστημα συνδυάζει τρία σασί που το καθένα περιέχει 12 πλακέτες υπολογιστών με δύο τσιπ MTIA v2 ανά πλακέτα.
Κάθε πλαίσιο MTIA v2 περιέχει 12 πίνακες υπολογιστών ο καθένας με ένα ζευγάρι επιταχυντές… Κάντε κλικ για μεγέθυνση. Πηγή: Meta.
Όσον αφορά την ανάπτυξη φόρτου εργασίας, το Meta βασίζεται σε μεγάλο βαθμό στο πλαίσιο PyTorch και τον μεταγλωττιστή Triton. Έχουμε δει αυτόν τον συνδυασμό να χρησιμοποιείται για την εκτέλεση εργασιών σε διάφορες GPU και επιταχυντές, εν μέρει επειδή εξαλείφει σε μεγάλο βαθμό την ανάγκη ανάπτυξης κώδικα βελτιστοποιημένου για συγκεκριμένο υλικό.
Ο Μέτα, υπήρξε ταγματάρχης υποστηρικτής της PyTorch, την οποία ανέπτυξε πριν παραδώσει τα ηνία στο Linux Foundation, καθώς δίνει στους μηχανικούς την ευελιξία να αναπτύξουν εφαρμογές τεχνητής νοημοσύνης που μπορούν να τρέξουν σε μια ποικιλία υλικού GPU από την Nvidia και την AMD. Είναι λοιπόν λογικό η Meta να θέλει να χρησιμοποιήσει τις ίδιες τεχνολογίες με τα δικά της τσιπ.
Στην πραγματικότητα, η Meta ισχυρίζεται ότι με τη συν-ανάπτυξη του λογισμικού και του υλικού της μαζί μπόρεσε να επιτύχει μεγαλύτερη αποτελεσματικότητα σε σύγκριση με τις υπάρχουσες πλατφόρμες GPU και αναμένει να επιτύχει ακόμη μεγαλύτερη απόδοση μέσω μελλοντικών βελτιστοποιήσεων.
Το MTIA v2 σίγουρα δεν θα είναι το τελευταίο πυρίτιο που βλέπουμε από το Meta. Ο γίγαντας των μέσων κοινωνικής δικτύωσης λέει ότι έχει πολλά προγράμματα σχεδιασμού τσιπ σε εξέλιξη, συμπεριλαμβανομένου ενός που θα υποστηρίζει μελλοντικά συστήματα τεχνητής νοημοσύνης. ®
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://go.theregister.com/feed/www.theregister.com/2024/04/10/meta_mtia_chip/