Το τσιπ τεχνητής νοημοσύνης επόμενης γενιάς της Meta προβάλλει διαφημίσεις κατά τη διάρκεια της κατανάλωσης ενέργειας

Μετά το πείραμα του επιταχυντή τεχνητής νοημοσύνης δεύτερης γενιάς τον Φεβρουάριο, η Meta είναι έτοιμη να χύσει τα φασόλια σε αυτό το εγχώριο πυρίτιο, το οποίο ήδη λέγεται ότι τροφοδοτεί τις συστάσεις διαφημίσεων σε 16 περιοχές.

Ο Goliath του Facebook έχει σχεδιάσει προσαρμοσμένους επιταχυντές για κάθε είδους φόρτους εργασίας, από ροή βίντεο έως μηχανική εκμάθηση για να οδηγήσει τα μοντέλα που προτείνουν πίσω από τη διαφημιστική του αυτοκρατορία.

Η τελευταία προσθήκη η οικογένεια Meta Training Inference Accelerator (MTIA) ισχυρίζεται ότι έχει 3 φορές υψηλότερη απόδοση και 1.5x πλεονέκτημα απόδοσης ισχύος σε σχέση με το τμήμα πρώτης γενιάς, το οποίο οι φίλοι μας στο The Next Platform αναλύθηκε πέρυσι.

Σύμφωνα με το Meta, το τσιπ δεύτερης γενιάς, το οποίο θα ονομάσουμε MTIA v2 για λόγους συνέπειας, σχεδιάστηκε για να εξισορροπεί τον υπολογισμό, τη χωρητικότητα μνήμης και το εύρος ζώνης για να έχει την καλύτερη δυνατή απόδοση για τα μοντέλα εσωτερικής κατάταξης και συστάσεων του υπερκλιμάκωσης .

Εξετάζοντας τη σχεδίαση, ο επιταχυντής διαθέτει ένα πλέγμα 8×8 στοιχείων επεξεργασίας (PEs) που μαζί προσφέρουν 3.5 φορές υψηλότερη πυκνή υπολογιστική απόδοση ή 7 φορές υψηλότερη απόδοση με ενεργοποιημένη την αραιότητα σε σύγκριση με το MTIA v1.

Οι επιταχυντές τεχνητής νοημοσύνης της Meta τροφοδοτούν ήδη τα μοντέλα κατάταξης και συστάσεων του υπερκλιμακωτή

Ο πιο πρόσφατος επιταχυντής τεχνητής νοημοσύνης της Meta, παραπάνω, τροφοδοτεί ήδη τα μοντέλα κατάταξης και συστάσεων του υπερκλιμακωτή – Κάντε κλικ για μεγέθυνση. Πηγή: Meta

Πέρα από τη χρήση ενός μικρότερου κόμβου διεργασίας 5nm TSMC και την ενίσχυση της ταχύτητας ρολογιού από 800 MHz σε 1.35 GHz, η Meta σημειώνει αρκετές αρχιτεκτονικές και σχεδιαστικές βελτιώσεις που συνέβαλαν στα κέρδη απόδοσης του τελευταίου εξαρτήματος. Αυτά περιλαμβάνουν υποστήριξη για αραιούς υπολογισμούς, περισσότερη μνήμη on-die και off-die και αναβαθμισμένο δίκτυο σε chip (NoC) με διπλάσιο εύρος ζώνης από το παλιό μοντέλο. Δείτε πώς συγκρίνονται η πρώτη και η δεύτερη γενιά:

	MTIA v1	MTIA v2
Τεχνολογία διαδικασίας	7nm TSMC	5nm TSMC
Περιοχή νεκρών	373mm²	421mm²
ΠΕ	Πλέγμα 8 × 8	Πλέγμα 8 × 8
Ταχύτητα ρολογιού	800MHz	1.35GHz
INT8 perf	102 TOPS	354/708* ΤΟΠΣ
FP16/BF16 perf	51.2 TFLOPS	177/354* TFLOPS
μέλος ΠΕ	128 KB ανά PE	384 KB ανά PE
Μεμ σε τσιπ	300 ΜΒ	300 ΜΒ
Off-chip mem	64GB	128GB
Μέλος εκτός τσιπ BW	176GB / s	204GB / s
Συνδεσιμότητα	8x PCIe Gen 4.0 – 16GB/s	8x PCIe Gen 5.0 – 32GB/s
TDP	25W	90W

* Αραιή απόδοση. Μπορείτε να βρείτε μια πλήρη ανάλυση και των δύο τσιπ εδώ.

Θα πρέπει να σημειωθεί ότι το MTIA v2 δεν θα εξαλείψει την ανάγκη του web Goliath για GPU. Ο ανώτατος του Meta, Mark Zuckerberg, είχε δηλώσει προηγουμένως ότι είναι η mega-corporation του θα αναπτύξει 350,000 επιταχυντές Nvidia H100 και θα έχουν το ισοδύναμο με 600,000 H100 σε λειτουργία μέχρι το τέλος του έτους.

Αντίθετα, το MTIA ακολουθεί ένα ολοένα και πιο γνωστό μοτίβο για το Meta (και άλλους) ανάπτυξης προσαρμοσμένου πυριτίου προσαρμοσμένου σε συγκεκριμένες εργασίες. Η ιδέα είναι ότι, ενώ το κιτ μπορεί να μην είναι τόσο ευέλικτο όσο οι CPU και οι GPU, ένα ASIC όταν αναπτύσσεται σε κλίμακα μπορεί να είναι πιο αποτελεσματικό.

Ενώ το πιο πρόσφατο τσιπ καταναλώνει σχεδόν τέσσερις φορές την ισχύ του προκατόχου του, είναι ικανό να παράγει έως και 7 φορές την απόδοση κινητής υποδιαστολής. Σε αντίθεση με μια GPU, ο πιο πρόσφατος επιταχυντής της Meta διαχειρίζεται 7.8 TOPS ανά watt (TOPS/W), όπως συζήτηση στην κάλυψή μας στο Blackwell, ξεπερνά το H100 SXM της Nvidia στα 5.65 TOPS/W και είναι περισσότερο από διπλάσιο από το A100 SXM στα 3.12 TOPS/W.

Τούτου λεχθέντος, είναι σαφές ότι η Meta έχει καταβάλει κάθε δυνατή προσπάθεια για να διαστασιολογήσει το τσιπ στους εσωτερικούς φόρτους εργασίας της — δηλαδή να συνάγει συμπέρασμα σχετικά με μοντέλα που προτείνουν. Αυτά έχουν σχεδιαστεί για να αποδίδουν εξατομικευμένες προτάσεις, όπως άτομα που μπορεί να γνωρίζετε ή, το πιο σημαντικό για το επιχειρηματικό μοντέλο της Meta, ποιες διαφημίσεις είναι πιθανότατα σχετικές με εσάς.

Τα τσιπ είναι επίσης σχεδιασμένα για να κλιμακώνονται ανάλογα με τις ανάγκες και μπορούν να αναπτυχθούν σε ένα σύστημα βασισμένο σε rack που περιέχει συνολικά 72 επιταχυντές: Κάθε σύστημα συνδυάζει τρία σασί που το καθένα περιέχει 12 πλακέτες υπολογιστών με δύο τσιπ MTIA v2 ανά πλακέτα.

Κάθε πλαίσιο MTIA v2 περιέχει 12 πίνακες υπολογιστών που η καθεμία περιέχει ένα ζεύγος επιταχυντών

Κάθε πλαίσιο MTIA v2 περιέχει 12 πίνακες υπολογιστών ο καθένας με ένα ζευγάρι επιταχυντές… Κάντε κλικ για μεγέθυνση. Πηγή: Meta.

Όσον αφορά την ανάπτυξη φόρτου εργασίας, το Meta βασίζεται σε μεγάλο βαθμό στο πλαίσιο PyTorch και τον μεταγλωττιστή Triton. Έχουμε δει αυτόν τον συνδυασμό να χρησιμοποιείται για την εκτέλεση εργασιών σε διάφορες GPU και επιταχυντές, εν μέρει επειδή εξαλείφει σε μεγάλο βαθμό την ανάγκη ανάπτυξης κώδικα βελτιστοποιημένου για συγκεκριμένο υλικό.

Ο Μέτα, υπήρξε ταγματάρχης υποστηρικτής της PyTorch, την οποία ανέπτυξε πριν παραδώσει τα ηνία στο Linux Foundation, καθώς δίνει στους μηχανικούς την ευελιξία να αναπτύξουν εφαρμογές τεχνητής νοημοσύνης που μπορούν να τρέξουν σε μια ποικιλία υλικού GPU από την Nvidia και την AMD. Είναι λοιπόν λογικό η Meta να θέλει να χρησιμοποιήσει τις ίδιες τεχνολογίες με τα δικά της τσιπ.

Στην πραγματικότητα, η Meta ισχυρίζεται ότι με τη συν-ανάπτυξη του λογισμικού και του υλικού της μαζί μπόρεσε να επιτύχει μεγαλύτερη αποτελεσματικότητα σε σύγκριση με τις υπάρχουσες πλατφόρμες GPU και αναμένει να επιτύχει ακόμη μεγαλύτερη απόδοση μέσω μελλοντικών βελτιστοποιήσεων.

Το MTIA v2 σίγουρα δεν θα είναι το τελευταίο πυρίτιο που βλέπουμε από το Meta. Ο γίγαντας των μέσων κοινωνικής δικτύωσης λέει ότι έχει πολλά προγράμματα σχεδιασμού τσιπ σε εξέλιξη, συμπεριλαμβανομένου ενός που θα υποστηρίζει μελλοντικά συστήματα τεχνητής νοημοσύνης. ®

SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
πηγή: https://go.theregister.com/feed/www.theregister.com/2024/04/10/meta_mtia_chip/

Generative Data Intelligence

Το τσιπ τεχνητής νοημοσύνης επόμενης γενιάς της Meta προβάλλει διαφημίσεις ενώ καταναλώνει ενέργεια

Surging Ethereum Layer 2 Transactions Post-Dencun Upgrade, Memecoin Mania και Global Crypto Dynamics: An-Depth Analysis

Το Layer 2 του Ethereum βλέπει 200% αύξηση στις συναλλαγές μετά την αναβάθμιση του Dencun: Ένα σημάδι επιτυχίας επεκτασιμότητας

Τελευταία Νοημοσύνη

Οι συναλλαγές Layer 2 του Ethereum αυξάνονται κατά 200% μετά την αναβάθμιση του Dencun, την έγκριση Memecoin του Trump και το Dynamic Landscape του Crypto: Μια ολοκληρωμένη ανάλυση

Έκρηξη συναλλαγών στο επίπεδο 2 του Ethereum: Μια αναβάθμιση 200% μετά την αναβάθμιση του Dencun και ο αντίκτυπος σε επίπεδα στο μέλλον της Crypto

Οι συναλλαγές Layer 2 του Ethereum αυξάνονται κατά 200% μετά την αναβάθμιση του Dencun εν μέσω εξελίξεων της αγοράς κρυπτογράφησης

Το Layer 2 του Ethereum ενισχύει 200% τις συναλλαγές μετά την αναβάθμιση του Dencun εν μέσω αλλαγών στο τοπίο κρυπτογράφησης

Οι συναλλαγές Layer 2 του Ethereum εκτοξεύονται κατά 200% μετά την αναβάθμιση του Dencun εν μέσω των τελευταίων τάσεων και σοκ του Crypto Ecosystem