Τι είναι το AVX-512 και γιατί το σκοτώνει η Intel;

Τι είναι το AVX-512 και γιατί το σκοτώνει η Intel;

Η CPU στη συσκευή σας εκτελεί εκατομμύρια υπολογισμούς κάθε δευτερόλεπτο και είναι υπεύθυνη για τη λειτουργία του υπολογιστή σας. Η εργασία με την CPU είναι η Αριθμητική Μονάδα Επεξεργασίας (ALU), η οποία είναι υπεύθυνη για μαθηματικές εργασίες και καθοδηγείται από τον μικροκώδικα της CPU.





πώς να μεταφέρετε τον έναν υπολογιστή στον άλλο

Τώρα, αυτός ο μικροκώδικας CPU δεν είναι στατικός και μπορεί να βελτιωθεί, και μια τέτοια βελτίωση ήταν το σετ εντολών AVX-512 της Intel. Ωστόσο, η Intel είναι έτοιμη να σκοτώσει το AVX-512, αφαιρώντας οριστικά τη λειτουργικότητά του από τις CPU της. Μα γιατί? Γιατί η Intel σκοτώνει το AVX-512;





ΚΑΤΑΣΚΕΥΗ ΒΙΝΤΕΟ ΤΗΣ ΗΜΕΡΑΣ

Πώς λειτουργεί ένα ALU;

Πριν γνωρίσετε το σετ εντολών AVX-512, είναι απαραίτητο να κατανοήσετε πώς λειτουργεί μια ALU.





Όπως υποδηλώνει το όνομα, η Μονάδα Αριθμητικής Επεξεργασίας χρησιμοποιείται για την εκτέλεση μαθηματικών εργασιών. Αυτές οι εργασίες περιλαμβάνουν πράξεις όπως πρόσθεση, πολλαπλασιασμό και υπολογισμούς κινητής υποδιαστολής. Για να ολοκληρώσει αυτές τις εργασίες, η ALU χρησιμοποιεί ψηφιακό κύκλωμα ειδικής εφαρμογής, το οποίο οδηγείται από το σήμα ρολογιού της CPU.

Επομένως, η ταχύτητα ρολογιού μιας CPU καθορίζει τον ρυθμό με τον οποίο επεξεργάζονται οι εντολές στην ALU. Έτσι, εάν η CPU σας λειτουργεί με συχνότητα ρολογιού 5 GHz, η ALU μπορεί να επεξεργαστεί 5 δισεκατομμύρια οδηγίες σε ένα δευτερόλεπτο. Για αυτόν τον λόγο, η απόδοση της CPU βελτιώνεται καθώς αυξάνεται η ταχύτητα του ρολογιού.



  Chipset σε μητρική πλακέτα

Τούτου λεχθέντος, καθώς αυξάνεται η ταχύτητα του ρολογιού της CPU, η ποσότητα της θερμότητας που παράγεται από την CPU αυξάνεται. Για αυτόν τον λόγο, οι χρήστες ισχύος χρησιμοποιούν υγρό άζωτο κατά το overclocking των συστημάτων τους. Δυστυχώς, αυτή η αύξηση της θερμοκρασίας στις υψηλές συχνότητες εμποδίζει τους κατασκευαστές CPU να αυξήσουν τη συχνότητα ρολογιού πάνω από ένα συγκεκριμένο όριο.

Πώς λοιπόν ένας επεξεργαστής νέας γενιάς προσφέρει καλύτερη απόδοση σε σύγκριση με παλαιότερες επαναλήψεις; Λοιπόν, οι κατασκευαστές CPU χρησιμοποιούν την έννοια του παραλληλισμού για να ενισχύσουν την απόδοση. Αυτός ο παραλληλισμός μπορεί να επιτευχθεί χρησιμοποιώντας μια αρχιτεκτονική πολλαπλών πυρήνων όπου χρησιμοποιούνται πολλοί διαφορετικοί πυρήνες επεξεργασίας για τη βελτίωση της υπολογιστικής ισχύος της CPU.





Ένας άλλος τρόπος για να βελτιώσετε την απόδοση είναι χρησιμοποιώντας ένα σύνολο εντολών SIMD. Με απλά λόγια, μια εντολή Single Instruction Multiple Data επιτρέπει στην ALU να εκτελεί την ίδια εντολή σε διαφορετικά σημεία δεδομένων. Αυτός ο τύπος παραλληλισμού βελτιώνει την απόδοση μιας CPU και το AVX-512 είναι μια οδηγία SIMD που χρησιμοποιείται για την ενίσχυση της απόδοσης μιας CPU κατά την εκτέλεση συγκεκριμένων εργασιών.

Πώς φτάνουν τα δεδομένα στην ALU;

Τώρα που έχουμε μια βασική κατανόηση του τρόπου λειτουργίας μιας ALU, πρέπει να καταλάβουμε πώς τα δεδομένα φτάνουν στην ALU.





  σκληρό δίσκο με κενό φόντο

Για να φτάσετε στο ALU, τα δεδομένα πρέπει να μετακινηθούν μέσω διαφορετικών συστημάτων αποθήκευσης. Αυτό το ταξίδι δεδομένων βασίζεται στην ιεραρχία μνήμης ενός υπολογιστικού συστήματος. Μια σύντομη επισκόπηση αυτής της ιεραρχίας δίνεται παρακάτω:

  • Δευτερεύουσα μνήμη: Η δευτερεύουσα μνήμη σε μια υπολογιστική συσκευή αποτελείται από μια μόνιμη συσκευή αποθήκευσης. Αυτή η συσκευή μπορεί να αποθηκεύει δεδομένα μόνιμα, αλλά δεν είναι τόσο γρήγορη όσο η CPU. Εξαιτίας αυτού, η CPU δεν μπορεί να έχει πρόσβαση σε δεδομένα απευθείας από το δευτερεύον σύστημα αποθήκευσης.
  • Κύρια μνήμη: Το κύριο σύστημα αποθήκευσης αποτελείται από μνήμη τυχαίας πρόσβασης (RAM). Αυτό το σύστημα αποθήκευσης είναι ταχύτερο από το δευτερεύον σύστημα αποθήκευσης, αλλά δεν μπορεί να αποθηκεύσει μόνιμα δεδομένα. Επομένως, όταν ανοίγετε ένα αρχείο στο σύστημά σας, αυτό μετακινείται από τον σκληρό δίσκο στη μνήμη RAM. Τούτου λεχθέντος, ακόμη και η μνήμη RAM δεν είναι αρκετά γρήγορη για την CPU.
  • Προσωρινή μνήμη: Η κρυφή μνήμη είναι ενσωματωμένη στην CPU και είναι το ταχύτερο σύστημα μνήμης σε έναν υπολογιστή. Αυτό το σύστημα μνήμης χωρίζεται σε τρία μέρη, δηλαδή το L1, L2 και L3 cache . Οποιαδήποτε δεδομένα πρέπει να υποβληθούν σε επεξεργασία από την ALU μετακινούνται από τον σκληρό δίσκο στη μνήμη RAM και μετά στην κρυφή μνήμη. Τούτου λεχθέντος, η ALU δεν μπορεί να έχει πρόσβαση σε δεδομένα απευθείας από τη μνήμη cache.
  • Εγγραφές CPU: Ο καταχωρητής CPU σε μια υπολογιστική συσκευή είναι πολύ μικρός σε μέγεθος και με βάση την αρχιτεκτονική του υπολογιστή, αυτοί οι καταχωρητές μπορούν να χωρέσουν 32 ή 64 bit δεδομένων. Μόλις τα δεδομένα μετακινηθούν σε αυτούς τους καταχωρητές, η ALU μπορεί να έχει πρόσβαση σε αυτά και να εκτελέσει την εργασία.

Τι είναι το AVX-512 και πώς λειτουργεί;

Το σετ εντολών AVX 512 είναι η δεύτερη επανάληψη του AVX και έφτασε στους επεξεργαστές Intel το 2013. Σύντομο για Advanced Vector Extensions, το σύνολο εντολών AVX εισήχθη για πρώτη φορά στην αρχιτεκτονική Xeon Phi (Ιππότες) της Intel και αργότερα έφτασε στον διακομιστή της Intel επεξεργαστές στους επεξεργαστές Skylake-X.

Επιπλέον, το σετ εντολών AVX-512 έφτασε στα συστήματα που βασίζονται σε καταναλωτές με την αρχιτεκτονική Cannon Lake και αργότερα υποστηρίχθηκε από τις αρχιτεκτονικές Ice Lake και Tiger Lake.

Ο κύριος στόχος αυτού του συνόλου εντολών ήταν να επιταχύνει εργασίες που περιλαμβάνουν συμπίεση δεδομένων, επεξεργασία εικόνας και κρυπτογραφικούς υπολογισμούς. Προσφέροντας διπλάσια υπολογιστική ισχύ σε σύγκριση με παλαιότερες επαναλήψεις, το σετ εντολών AVX-512 προσφέρει σημαντικά κέρδη απόδοσης.

Λοιπόν, πώς η Intel διπλασίασε την απόδοση των CPU της χρησιμοποιώντας την αρχιτεκτονική AVX-512;

Λοιπόν, όπως εξηγήθηκε προηγουμένως, η ALU μπορεί να έχει πρόσβαση μόνο στα δεδομένα που υπάρχουν στο μητρώο ενός CPU. Το σύνολο εντολών Advanced Vector Extensions αυξάνει το μέγεθος αυτών των καταχωρητών.

Λόγω αυτής της αύξησης του μεγέθους, η ALU μπορεί να επεξεργαστεί πολλαπλά σημεία δεδομένων σε μία μόνο εντολή, αυξάνοντας την απόδοση του συστήματος.

Όσον αφορά το μέγεθος καταχωρητή, το σύνολο εντολών AVX-512 προσφέρει τριάντα δύο καταχωρητές 512-bit, το οποίο είναι διπλάσιο σε σύγκριση με το παλαιότερο σύνολο εντολών AVX.

Γιατί η Intel τελειώνει το AVX-512;

Όπως εξηγήθηκε προηγουμένως, το σετ εντολών AVX-512 προσφέρει αρκετά υπολογιστικά πλεονεκτήματα. Στην πραγματικότητα, δημοφιλείς βιβλιοθήκες όπως το TensorFlow χρησιμοποιούν το σύνολο εντολών για να παρέχουν ταχύτερους υπολογισμούς στις CPU που υποστηρίζουν το σύνολο εντολών.

Λοιπόν, γιατί η Intel απενεργοποιεί το AVX-512 στους πρόσφατους επεξεργαστές Alder Lake;

Λοιπόν, οι επεξεργαστές Alder Lake δεν μοιάζουν με τους παλαιότερους που κατασκευάζει η Intel. Ενώ τα παλαιότερα συστήματα χρησιμοποιούσαν πυρήνες που λειτουργούσαν με την ίδια αρχιτεκτονική, οι επεξεργαστές Alder Lake χρησιμοποιούν δύο διαφορετικούς πυρήνες. Αυτοί οι πυρήνες στις CPU της λίμνης Alder είναι γνωστοί ως P και E-cores και τροφοδοτούνται από διαφορετικές αρχιτεκτονικές.

Ενώ οι πυρήνες P χρησιμοποιούν τη μικροαρχιτεκτονική Golden Cove, οι πυρήνες E χρησιμοποιούν τη μικροαρχιτεκτονική Gracemont. Αυτή η διαφορά στις αρχιτεκτονικές εμποδίζει τον προγραμματιστή να λειτουργεί σωστά όταν συγκεκριμένες εντολές μπορούν να εκτελεστούν στη μία αρχιτεκτονική αλλά όχι στην άλλη.

Στην περίπτωση των επεξεργαστών Alder Lake, το σύνολο εντολών AVX-512 είναι ένα τέτοιο παράδειγμα, καθώς οι πυρήνες P έχουν το υλικό για την επεξεργασία της εντολής, αλλά οι πυρήνες E όχι.

Για αυτόν τον λόγο, οι επεξεργαστές Alder Lake δεν υποστηρίζουν το σετ εντολών AVX-512.

Τούτου λεχθέντος, η οδηγία AVX-512 μπορεί να εκτελεστεί σε ορισμένες CPU της Alder Lake όπου η Intel δεν τις έχει συγχωνεύσει φυσικά. Για να κάνουν το ίδιο, οι χρήστες πρέπει να απενεργοποιήσουν τους E-cores κατά τη διάρκεια του BIOS.

Χρειάζεται το AVX-512 σε Chipset καταναλωτών;

Το σετ εντολών AVX-512 αυξάνει το μέγεθος του καταχωρητή μιας CPU για να βελτιώσει την απόδοσή της. Αυτή η ώθηση στην απόδοση επιτρέπει στις CPU να συγκρατούν τους αριθμούς πιο γρήγορα, επιτρέποντας στους χρήστες να εκτελούν αλγόριθμους συμπίεσης βίντεο/ήχου σε μεγαλύτερες ταχύτητες.

Τούτου λεχθέντος, αυτή η ώθηση στην απόδοση μπορεί να παρατηρηθεί μόνο όταν η εντολή που ορίζεται σε ένα πρόγραμμα έχει βελτιστοποιηθεί ώστε να εκτελείται στο σύνολο εντολών AVX-512.

Για αυτόν τον λόγο, οι αρχιτεκτονικές συνόλων εντολών όπως το AVX-512 είναι πιο κατάλληλες για φόρτους εργασίας διακομιστή και τα chipset καταναλωτικής ποιότητας μπορούν να λειτουργήσουν χωρίς πολύπλοκα σύνολα εντολών όπως το AVX-512.