The Death of MP3: A Brief History of the World Favorite Audio Format

The Death of MP3: A Brief History of the World Favorite Audio Format

Το γερμανικό ίδρυμα που κατέχει το δίπλωμα ευρεσιτεχνίας σε σεβαστή «παλιά» μουσική μορφή MP3 ανακοίνωσε πρόσφατα ότι θα αφήσει την πατέντα τους να λήξει. Το MP3 επέκτεινε την κοινή χρήση αρχείων ήχου σε όλη τη δεκαετία του 1990 και στις αρχές του 2000. Ο συνδυασμός συμπίεσης δεδομένων, μεγέθους αρχείου και διατηρημένης ποιότητας ήχου εξασφάλισε τη διαμόρφωση του ήχου σε κακή φήμη και στις δύο πλευρές του επιχειρήματος πειρατείας.





Τα πρωτοσέλιδα γράφουν «Το MP3 είναι νεκρό», αλλά κάθε πραγματικός ηθοποιός γνωρίζει ότι ένας αληθινός θάνατος είναι πολύ απίθανο. Παρ 'όλα αυτά, είναι καιρός να δούμε την ιστορία ενός παγκοσμίου φήμης μορφής ήχου και τι μπορεί να έρθει στο εγγύς μέλλον.





Πώς ακριβώς λειτουργεί το MP3;

Ανάλογα με την ηλικία και την κατάχρηση που έχουν υποστεί τα αυτιά σας, το ακουστικό σας εύρος συχνοτήτων κυμαίνεται μεταξύ 20 Hz και 20.000 Hz. Επιπλέον, τα αυτιά μας είναι πιο ευαίσθητα σε συχνότητες ήχου μεταξύ 2 kHz και 5 kHz. Η ακοή μας περιορίζεται επίσης από την ικανότητά μας να φιλτράρουμε και να επεξεργαζόμαστε ηχητικά σήματα κατά την άφιξή τους.





Image Credit: flatvector μέσω του Shutterstock

Η κάλυψη συχνότητας - το κλειδί για τη συμπίεση MP3 - βασίζεται στην αδυναμία του εγκεφάλου να κάνει διάκριση μεταξύ ορισμένων σημάτων.



Φανταστείτε ότι έχουμε δύο ήχους. Έχουν πολύ παρόμοιες συχνότητες (π.χ. 200 Hz και 210 Hz) αλλά παίζονται σε διαφορετικούς τόμους. Ο ασθενέστερος ήχος ακούγεται από μόνος του, αλλά ο ισχυρότερος διακρίνεται μόνο εάν παίζονται ταυτόχρονα. Η διαδικασία κάλυψης μιας συχνότητας με μια άλλη στενή συχνότητα ονομάζεται «κάλυψη». Η κάλυψη συχνότητας λειτουργεί αποτελεσματικά στο πάνω και κάτω μέρος του φάσματος ήχου.

Αντιγραφή CD

Ας υποθέσουμε ότι αντιγράφουμε ένα CD στον υπολογιστή σας. Η μουσική στο CD λαμβάνεται δείγμα 44.100 φορές ανά δευτερόλεπτο (44,1 kHz). Τα δείγματα έχουν μήκος 2 byte (1 byte είναι 16 bit). Το MP3 υποστηρίζει αρκετούς ρυθμούς, αλλά συνήθως χρησιμοποιεί το πρότυπο CD 44,1 kHz.





τομέα και εύρος υπολογισμού συναρτήσεων

Ένα μεμονωμένο αρχείο MP3 αποτελείται από πλαίσια MP3, με κεφαλίδα και μπλοκ δεδομένων. Κάθε πλαίσιο περιέχει 1.152 δείγματα. Τεχνικά, πρόκειται για δύο «κόκκους» 576 δειγμάτων. Τα δείγματα περνούν μέσα από ένα φίλτρο που διαιρεί περαιτέρω τον ήχο σε ένα συγκεκριμένο σύνολο 32 εύρους συχνοτήτων. Ο αλγόριθμος MP3 διαιρεί περαιτέρω αυτές τις 32 ζώνες συχνοτήτων με συντελεστή 18, δημιουργώντας 576 ακόμη μικρότερες ζώνες. Κάθε ζώνη περιέχει το 1/576 της περιοχής συχνοτήτων του αρχικού δείγματος (όταν ξεκινήσαμε να αντιγράφουμε το CD στον υπολογιστή σας).

Πίστωση εικόνας: Κιμ Μέιρικ μέσω Wikimedia





Σε αυτό το στάδιο, δύο σύνθετοι μαθηματικοί αλγόριθμοι κάνουν τη δουλειά τους: το Τροποποιημένος διακριτός μετασχηματισμός συνημιτόνου (MDCT) και Fast Fourier Transforms (FFT). Το καθένα εκτελεί μια διαφορετική διαδικασία στο σπασμένο υλικό πηγής.

Τα FFT αναλύουν κάθε ζώνη συχνοτήτων για ήχους που μπορούν να καλυφθούν εύκολα, διασφαλίζοντας ότι η κάλυψη συχνότητας διατηρεί ζωτικούς ήχους στο κομμάτι.

Τα δείγματα στη συνέχεια ταξινομούνται και μεταφέρονται στο MDCT. Το MDCT μετατρέπει κάθε ζώνη σε ένα σύνολο φασματικών τιμών. Οι φασματικές τιμές αντιπροσωπεύουν με μεγαλύτερη ακρίβεια τον τρόπο με τον οποίο η ακοή μας ερμηνεύει τον ήχο. Επομένως, πολλοί συμπιεσμένοι κωδικοποιητές ήχου χρησιμοποιούν φασματικές τιμές για την αφαίρεση δεδομένων ήχου. Μόλις ολοκληρωθούν οι φασματικές πληροφορίες και η ανάλυση του κόκκου, ξεκινά η πραγματική διαδικασία συμπίεσης.

Μια σύντομη ιστορία του MP3

Θυμάστε το πρώτο σας MP3 player; Είχα την τύχη να έχω ένα πρωτότυπο iPod - μέχρι που ένας άντρας με ένα μαχαίρι το απελευθέρωσε από την κατοχή μου. MiniDiscs ήταν πολύ πιο δροσερά, ούτως ή άλλως.

Ανεξάρτητα από αυτό, τη στιγμή που το αυθεντικό iPod κλιμάκωσε γρήγορα την επιθυμία για MP3 (το 2001), η μορφή ήταν ήδη οκτώ ετών. Επιπλέον, το MP3 έκανε ήδη κύματα στο διαδίκτυο και σε άλλες φορητές ψηφιακές συσκευές μουσικής.

Από πού προήλθε το MP3;

Το MP3 ήταν ένα Μ ούβινγκ Π εικόνα ΚΑΙ xperts σολ roup (MPEG), ως μέρος του αρχικού προτύπου συμπίεσης ήχου και βίντεο MPEG-1. Το MP3 είναι συντομογραφία του MPEG-1 Audio Layer III, που εγκρίθηκε για χρήση το 1991 και τελικά δημοσιεύτηκε το 1993.

Η ιδέα πίσω από το MP3 είναι πολύ ωραία.

Ο αλγόριθμος MP3 εκμεταλλεύεται τους αντιληπτικούς περιορισμούς της ανθρώπινης ακοής, που αναφέρονται ως ακουστική κάλυψη. Η ακουστική κάλυψη συμβαίνει όταν η αντίληψη ενός ήχου επηρεάζεται από την παρουσία ενός άλλου. Επιπλέον, κάθε τραγούδι περιέχει ηχητικά στοιχεία ανεπαίσθητα για τη συνολική εμπειρία ακρόασης. Ο Manfred R. Schroeder πρότεινε για πρώτη φορά έναν ψυχοακουστικό κωδικοποιητή κάλυψης το 1979. Ωστόσο, μόλις το σχηματισμό του MPEG (ως υποεπιτροπή του ISO/IEC) το 1988 ξεκίνησε μια συντονισμένη πρωτοβουλία για ένα παγκόσμιο πρότυπο.

Υπάρχει ένα άλλο σημαντικό όνομα στην ιστορία του MP3: Karlheinz Brandenburg. Ο Βρανδεμβούργος άρχισε να εργάζεται για τη συμπίεση ψηφιακής μουσικής τη δεκαετία του 1980, ολοκληρώνοντας τη διδακτορική του διατριβή το 1989. Το διάφορους τρόπους συμπίεσης που είχε δουλέψει βρήκαν περιορισμούς τόσο στις διαθέσιμες τεχνολογίες εκείνη τη στιγμή, όσο και στο σχεδιασμό πρώιμων διαδικασιών κωδικοποίησης. Αυτός, μαζί με άλλα ιδρυτικά μέλη MPEG, συνειδητοποίησαν ότι μόνο ένα νέο σύστημα θα αρκούσε.

Το Ινστιτούτο Fraunhofer

Το 1990, το Βρανδεμβούργο έγινε επίκουρος καθηγητής στο Πανεπιστήμιο του Erlangen-Nuremberg. Συνέχισε το έργο του στη συμπίεση με την Fraunhofer Society (τελικά θα ενταχθεί στο Fraunhofer 1993).

«Είχαμε την υποομάδα ήχου μέσα στην ομάδα κινηματογραφικών ταινιών [MPEG]», εξήγησε ο Βρανδεμβούργος σε ένα Συνέντευξη NPR Το «Τελικά όλοι μαζί καταλήξαμε σε έναν συμβιβασμό ο οποίος είχε διαφορετικούς τρόπους, τα λεγόμενα Layer I, Layer II, Layer III. Το Το Και οι περισσότερες από τις ιδέες μας μπήκαν στους τρόπους συμπίεσης στον ήχο MPEG. Το Το το οποίο ήταν το πιο περίπλοκο και αυτό που έδινε την καλύτερη ποιότητα σε χαμηλά bitrates - αυτό ονομαζόταν Layer III ».

Ο Μπράντενμπουργκ χρησιμοποίησε το τραγούδι 'Tom's Diner' της Suzanne Vega για να βελτιώσει τον αλγόριθμο συμπίεσης, ακούγοντάς τον ξανά και ξανά, για να διασφαλίσει ότι το tinkering του δεν επηρεάζει αρνητικά την εγγραφή της φωνής του Vega.

MP3 εκρήγνυται

Το MP3 έμεινε στα αδιέξοδα για μερικά χρόνια μετά την επίσημη κυκλοφορία του, ο κωδικοποιητής θεωρήθηκε «πολύ περίπλοκος» για ευρεία χρήση.

Ωστόσο, το 1997, τα πράγματα άλλαξαν - γρήγορα.

Πρώτον, ένας «Αυστραλός φοιτητής» αγόρασε επαγγελματικό λογισμικό κωδικοποίησης l3enc από γερμανική εταιρεία. Αντίστροφα σχεδίασε το λογισμικό, το συνέταξε και το ανέβασε σε πανεπιστήμιο FTP των ΗΠΑ με ένα ΕΤΟΙΜΟ αρχείο που λέει, 'Αυτό είναι δωρεάν χάρη στο Fraunhofer.' Αυτή η μικρή πράξη άλλαξε αμέσως την πρόσβαση στην κωδικοποίηση και αποκωδικοποίηση MP3. Ξαφνικά, το να κολλήσετε ένα CD στον υπολογιστή σας απέδωσε ήχο υψηλής ποιότητας σε μικροσκοπικά μεγέθη αρχείων.

Δεύτερον, η Nullsoft κυκλοφόρησε το σεβαστό πρόγραμμα αναπαραγωγής ήχου Winamp. Τα MP3 που σκίζονται από ένα CD μπορούν εύκολα να αναπαραχθούν σε έναν υπολογιστή.

Ταυτόχρονα, το διαδίκτυο είχε εξαπλωθεί σε εκατομμύρια σπίτια σε όλο τον κόσμο. Εκατομμύρια σκληροί δίσκοι γέμιζαν MP3 , και η μορφή έγινε η προτιμώμενη μορφή κοινής χρήσης αρχείων ήχου για υπηρεσίες κοινής χρήσης αρχείων peer-to-peer, όπως Napster, Gnutella και eDonkey (το Gnutella ήταν ένα άλλο έργο της Nullsoft). Η μουσική πειρατεία ήταν ζωντανή και ανεξέλεγκτη και δεν βοηθούσε καθόλου την άνοδο του MP3.

MP3 συσκευές αναπαραγωγής

Σε μια ακόμη ευλογία για την καθιερωμένη βιομηχανία ήχου, εμφανίστηκαν φορητές συσκευές αναπαραγωγής MP3. Στις αρχές της δεκαετίας του 1990, το Ινστιτούτο Fraunhofer είχε προσπαθήσει και απέτυχε να δημιουργήσει ένα εμπορεύσιμο MP3 player. Simplyταν πολύ νωρίς για ευρεία υιοθέτηση. Χρειαζόταν τον προαναφερθέντα συνδυασμό κοινής χρήσης αρχείων, πολλαπλασιασμού Διαδικτύου και λογισμικού για να δώσει ώθηση στα φορητά MP3 players.

Η εταιρεία της Νότιας Κορέας, Elger Labs, παρουσίασε το MPMAN F10 αξίας 250 δολαρίων, με πλήρη μνήμη 32 MB. Δεν ήταν η αναζωογονητική σπίθα για τη βιομηχανία όπως τη γνωρίζουμε. Αυτό το βραβείο ανήκει στο Diamond Rio PMP300, με επίσης 32 MB.

Η επιτυχία του Diamond Rio τράβηξε ανεπιθύμητη προσοχή. Η Ένωση Καταστημάτων Καταγραφής της Αμερικής (RIAA) μήνυσε τα Diamond Multimedia Systems (ο κατασκευαστής) - και έχασε. Ωστόσο, η RIAA υπέθεσε σωστά ότι αυτή ήταν η αρχή της ενδημικής μουσικής πειρατείας, που συνεχίζεται μέχρι σήμερα.

Τι συνέβη στη συνέχεια, ρωτάτε;

Λοιπόν, μια ελάχιστα γνωστή συσκευή που ονομάζεται iPod βγήκε στις αγορές, νομιμοποιώντας πλήρως το MP3 ως de facto μορφή ήχου της εποχής και η RIAA ξεκίνησε τη (συνεχιζόμενη) σταυροφορία της εναντίον πειρατών σε όλο τον κόσμο.

Τα υπόλοιπα, όπως λέμε, είναι ιστορία.

Γιατί το MP3 πεθαίνει τότε;

Το Ινστιτούτο Fraunhofer κατείχε το δίπλωμα ευρεσιτεχνίας MP3. Στις 23 Απριλίου 2017, τα υπόλοιπα διπλώματα ευρεσιτεχνίας τους έληξαν. Επομένως, η Fraunhofer δεν μπορεί πλέον να εκδίδει νέες άδειες MP3. Εξηγήσαμε ακριβώς τι συμβαίνει με αυτούς τους «αποκαλυπτικούς» τίτλους, καθώς και πώς θα σας επηρεάσει.

Θέλετε το TL; DR; Το MP3 δεν είναι νεκρό και δεν πάει πουθενά.

Ένας από τους κύριους λόγους που έδωσε ο Fraunhofer για να αφήσει το MP3 ήταν η ηλικία. Δεν μπορεί πλέον να ανταγωνιστεί τα νεότερα και λαμπρότερα ξαδέλφια του. Η πρότασή τους; Αντ 'αυτού, χρησιμοποιήστε την προηγμένη κωδικοποίηση ήχου (AAC). Κατά σύμπτωση, ο Fraunhofer κατέχει επίσης το (τρέχον) δίπλωμα ευρεσιτεχνίας για το AAC, οπότε έχουμε μερικές εναλλακτικές λύσεις MP3 από τις οποίες μπορείτε να επιλέξετε, παρακάτω.

Εναλλακτικές λύσεις MP3

Η συλλογή MP3 σας δεν θα καίει ξαφνικά, όπως οι υπάρχοντες κωδικοποιητές και αποκωδικοποιητές θα συνεχίσουν να παράγουν αρχεία MP3. Τούτου λεχθέντος, το MP3 είναι λίγο παλιό τώρα. Υπάρχουν αρκετές δωρεάν εναλλακτικές μορφές ήχου μπορείτε να χρησιμοποιήσετε για την αποθήκευση της ψηφιακής μουσικής σας τώρα.

  • AAC - Η προηγμένη κωδικοποίηση ήχου, όπως αναφέρθηκε παραπάνω, είναι ο διάδοχος του MP3. Το μόνο πρόβλημα είναι ότι η μορφή από μόνη της φαίνεται τώρα λίγο ξεπερασμένη. Παρ 'όλα αυτά, το AAC επιτυγχάνει γενικά καλύτερη πιστότητα ήχου από το MP3, με παρόμοιους ρυθμούς bit και μεγέθη αρχείων. Το AAC είναι επίσης μια μορφή με απώλεια.
  • Ogg Vorbis - Μορφή Vorbis, που χρησιμοποιείται συνήθως σε συνδυασμό με τη μορφή δοχείου Ogg. Είναι ο καλύτερος, ελαφρώς νεότερος, ξάδελφος ανοιχτού κώδικα στο MP3. Παρά το γεγονός ότι το Ogg διαθέτει καλύτερη συμπίεση, υψηλότερα ποσοστά bit και γενικά καλύτερη ποιότητα ήχου, το Ogg δεν απογειώθηκε ποτέ με τον ίδιο τρόπο όπως το MP3 λόγω έλλειψης υποστηριζόμενων συσκευών. Το Ogg είναι επίσης μια μορφή με απώλεια.
  • FLAC - Ο δωρεάν κωδικοποιητής ήχου χωρίς απώλειες είναι η πιο δημοφιλής μορφή κωδικοποιητή ήχου χωρίς απώλειες. Γιατί; Το FLAC προσφέρει ένα ακριβές αντίγραφο ήχου του υλικού προέλευσης, στο μισό μέγεθος ενός παραδοσιακού CD. Οι ήχοι που επηρεάζονται περισσότερο από το MP3 (π.χ. κιθάρες, κύμβαλα, αντήχηση κ.λπ.) παραμένουν καθαροί παρά το γεγονός ότι έχουν συμπιεστεί σημαντικά. Το FLAC είναι μια μορφή χωρίς απώλειες.

Το MP3 δεν είναι νεκρό

Δεν έχεις τίποτα να ανησυχείς. Μπορείτε να συνεχίσετε την αντιγραφή σε MP3 και οι συσκευές σας θα συνεχίσουν να παίζουν τη μουσική σας. Μακροπρόθεσμα, αξίζει τουλάχιστον να ερευνήσετε μια νεότερη μορφή ήχου για τη συλλογή σας. Οι τεχνικές συμπίεσης θα προχωρήσουν και τα μεγέθη αρχείων των ακριβών αντιγράφων θα μειωθούν.

Επιπλέον, αξίζει να εξεταστεί η χωρητικότητα αποθήκευσης. Όταν έφτασαν οι πρώτες φορητές συσκευές αναπαραγωγής MP3 με αποθηκευτικό χώρο 32 MB δροσερός , αλλά προφανώς δεν είναι αρκετό. Ο μεγαλύτερος αποθηκευτικός χώρος για ένα iPod Classic ήταν 160 GB. Οτι θα μπορούσε να αντιμετωπίσει μια προσαρμοσμένη αναβάθμιση χώρου αποθήκευσης σε τεράστια 240 GB - πολύ πάνω από 1.000.000 μεμονωμένα κομμάτια MP3. Το θέμα είναι ότι καθώς το μέγεθος αποθήκευσης αυξάνεται και το φυσικό μέγεθος μειώνεται, μπορούμε να κάνουμε περισσότερα με λιγότερα.

Τέλος, το διαδίκτυο συνεχίζει να αλλάζει τον τρόπο που ακούμε μουσική. Συνήθιζα να πειρατώ μουσική γιατί δεν μπορούσα να πληρώσω $ 12-20 για κάθε νέο άλμπουμ που βγήκε. Τώρα έχω έναν λογαριασμό οικογενειακού σχεδίου Spotify με πρόσβαση σε εκατομμύρια κομμάτια και έναν λογαριασμό Amazon Prime με εκατομμύρια ακόμη. Το μόνο που με περιορίζει είναι η σύνδεσή μου στο διαδίκτυο και ακόμη και τότε, και οι δύο έχουν επιλογές για λήψεις εκτός σύνδεσης σε μορφές υψηλής ποιότητας.

Δεν είναι τόσο σημαντικό όσο κάποτε, αλλά το MP3 δεν έχει πεθάνει.

Ποια είναι η μορφή ήχου που προτιμάτε; Χρειάζεστε την καθαρή πραγματικότητα του χωρίς απώλειες; Extreme ακραία συμπίεση μιας μορφής με απώλεια; Έχει αλλάξει η χρήση της μουσικής σας από τη στιγμή που οι υπηρεσίες ροής έχουν διαδοθεί; Αφήστε μου μια γραμμή στα σχόλια και θα επανέλθω.

Πιστωτική εικόνα: Ti Santi μέσω του Shutterstock.com

Μερίδιο Μερίδιο Τιτίβισμα ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ Ένας αρχάριος οδηγός για την εμψύχωση του λόγου

Η εμψύχωση του λόγου μπορεί να είναι μια πρόκληση. Εάν είστε έτοιμοι να αρχίσετε να προσθέτετε διάλογο στο έργο σας, θα αναλύσουμε τη διαδικασία για εσάς.

Διαβάστε Επόμενο
Σχετικά θέματα
  • Η τεχνολογία εξηγείται
  • Ψυχαγωγία
  • MP3
  • Συμπίεση αρχείων
  • Μετατροπέας ήχου
Σχετικά με τον Συγγραφέα Γκάβιν Φίλιπς(Δημοσιεύθηκαν 945 άρθρα)

Ο Gavin είναι ο Junior Editor για Windows and Technology Explained, τακτικός συνεργάτης του Really Useful Podcast και τακτικός αναθεωρητής προϊόντων. Έχει BA (Hons) Σύγχρονη Γραφή με Πρακτικές Artηφιακής Τέχνης που λεηλατήθηκαν από τους λόφους του Ντέβον, καθώς και πάνω από μια δεκαετία επαγγελματικής εμπειρίας συγγραφής. Απολαμβάνει άφθονο τσάι, επιτραπέζια παιχνίδια και ποδόσφαιρο.

Περισσότερα από τον Gavin Phillips

Εγγραφείτε στο newsletter μας

Εγγραφείτε στο ενημερωτικό μας δελτίο για τεχνικές συμβουλές, κριτικές, δωρεάν ebooks και αποκλειστικές προσφορές!

Κάντε κλικ εδώ για εγγραφή