Πώς λειτουργούν οι εφαρμογές μετάφρασης ομιλίας Cat;

Πώς λειτουργούν οι εφαρμογές μετάφρασης ομιλίας Cat;

Πιθανότατα έχετε δει εφαρμογές που ισχυρίζονται ότι μεταφράζουν αυτό που λέει η γάτα σας. Μπορούν όμως πραγματικά να μεταφράσουν το νιαούρισμα της γάτας σας στα αγγλικά; Η σύντομη απάντηση είναι ναι, κάπως. Είναι δύσκολο λόγω του πόσο μοναδική είναι η «γλώσσα» κάθε γάτας, αλλά μπορούν να πλησιάσουν αρκετά με τη σύγχρονη τεχνολογία.





Οι εφαρμογές μετάφρασης γάτας όπως το MeowTalk χρησιμοποιούν μια μορφή αναγνώρισης ομιλίας που δίνει έμφαση στην μηχανική εκμάθηση. Ας δούμε πιο κοντά.





Αναγνώριση λόγου και μηχανική μάθηση

Mary Theresa McLean/ Pixabay





Η αναγνώριση ομιλίας λειτουργεί καταγράφοντας την ομιλία και μετατρέποντας τον ήχο σε ψηφιακό αρχείο δεδομένων. Κωδικοποιεί δεδομένα όπως το βήμα και τον όγκο ως σημεία δεδομένων που η εφαρμογή μπορεί να αναλύσει και να ταιριάξει με τις έννοιες. Μικρόφωνα DPA εξηγεί ότι αυτά τα σημεία δεδομένων μπορεί να φαίνονται πολύ διαφορετικά, ανάλογα με τους ήχους φόντου και τον τρόπο εκφώνησης μιας λέξης.

Μερικές φορές θεωρούμε δεδομένη τη φωνητική αναγνώριση, αλλά είναι ένα απίστευτο κατόρθωμα της τεχνολογίας. Ειδικά αν λάβουμε υπόψη πόσο περίπλοκη είναι η ανθρώπινη ομιλία. Οπως και Ο επιστήμονας εξηγεί, κάθε λέξη περιλαμβάνει ένα ευρύ φάσμα ήχων ή «φωνημάτων» που αναμιγνύονται μεταξύ τους. Το να καταλάβεις έναν υπολογιστή για να καταλάβει την ομιλία είναι πολύ δύσκολο. Τα νέα σύνορα των ήχων γάτας θα είναι ακόμη πιο δύσκολα.



Οι εφαρμογές που χρησιμοποιούν αναγνώριση ομιλίας προγραμματίζονται με ένα «λεξιλόγιο» λέξεων που ονομάζεται σύνολο δεδομένων. Στη συνέχεια, η εφαρμογή ταιριάζει την ομιλία σας με την πλησιέστερη επιλογή στο λεξιλόγιο δεδομένων της.

Όταν κάνει λάθος, το διορθώνετε και αποθηκεύει αυτά τα δεδομένα για την επόμενη φορά. Αυτό είναι μέρος της μηχανικής μάθησης. Είναι το πώς ένα πρόγραμμα μαθαίνει να αναγνωρίζει την ομιλία ακόμη και όταν δεν είναι πανομοιότυπο με το σύνολο δεδομένων με το οποίο ξεκίνησε.





Σχετικά: Τι είναι οι αλγόριθμοι μηχανικής εκμάθησης; Δείτε πώς λειτουργούν

Η αναγνώριση φωνής εξακολουθεί να έχει προβλήματα, ειδικά με τα εμπόδια και τις προφορές λόγου. Ωστόσο, ορισμένες εταιρείες βελτιώνουν τη μηχανική μάθηση για να ξεπεράσουν αυτά τα ζητήματα. Με την πάροδο του χρόνου, η μηχανική μάθηση μπορεί να μετατρέψει την αναγνώριση ομιλίας σε ένα ισχυρό εργαλείο.





τι κάνει η μορφοποίηση μιας μονάδας flash

Έτσι λειτουργεί η αναγνώριση ομιλίας για τους ανθρώπους. Λειτουργεί όμως για γάτες;

Αναγνώριση ομιλίας έναντι αναγνώρισης νιαού

Αριάνα Σουάρες / Ξεπλύνετε

Πρώτον, πρέπει να καταλάβουμε γιατί η μετάφραση ενός συγκεκριμένου είδους νιαουρίσματος ως «πεινάω» είναι διαφορετική από την ανάλυση του ανθρώπινου λόγου. Το πρόβλημα είναι κυρίως ότι η επικοινωνία με τις γάτες βασίζεται περισσότερο σε μη λεκτικές ενδείξεις όπως η στάση του σώματος. Ένα άλλο πρόβλημα είναι η απουσία μιας καθολικής «γλώσσας γάτας».

Σύμφωνα με την ASPCA , οι ενήλικες άγριες γάτες δεν νιαουρίζουν ποτέ η μία στην άλλη, μόνο στους ανθρώπους. Άλλη έρευνα από η Ανθρωπιστική Κοινωνία προσθέτει ότι αυτοί οι ήχοι «δεν εμφανίζονται στο κενό». Πρέπει να τα ερμηνεύσουμε παράλληλα με τη γλώσσα του σώματος και άλλα πλαίσια. Σε πολλές περιπτώσεις, αυτά τα σιωπηλά σήματα είναι η μόνη διαφορά μεταξύ ενός νιαουρίσματος που σημαίνει «πεινάω» και ενός που σημαίνει «θέλω να παίξω».

Προσθέτοντας σε αυτό το πρόβλημα, καμία γάτα δεν έχει την ίδια γλώσσα. Οι γάτες αναπτύσσουν εξατομικευμένες «γλώσσες» για τους ιδιοκτήτες τους. Αυτά βασίζονται εν μέρει στη μίμηση της φωνής του ιδιοκτήτη και εν μέρει στην προσωπικότητα της γάτας. Καμία δύο γάτα δεν ακούγεται το ίδιο, ακόμη και όταν μεταφέρουν την ίδια επιθυμία ή ανάγκη. Πώς μπορεί λοιπόν το λεξιλόγιο ομιλίας μιας εφαρμογής να μεταφραστεί για όλα αυτά;

Ευέλικτη μηχανική εκμάθηση για γάτες

Δωρεάν χρήση ήχων/ Ξεπλύνετε

Αν και μερικοί εικονικοί βοηθοί αρέσουν Αυτο προσπαθούν να κατανοήσουν τον τόνο και τα συναισθήματα, η αναγνώριση λόγου εξακολουθεί να είναι τρομερή σε μη λεκτικά σήματα. Αλλά αυτό δεν σημαίνει ότι είναι αδύνατο να τα ερμηνεύσουμε.

φορητός σκληρός δίσκος που δεν εμφανίζεται στα παράθυρα 10

Το MeowTalk χρησιμοποιεί ένα πιο ευέλικτο είδος μηχανικής μάθησης για να βοηθήσει να ξεπεραστούν αυτά τα ζητήματα.

Κατεβάστε: MeowTalk για Android | ios (Ελεύθερος)

Το Meowtalk δημιουργήθηκε από τον Javier Sanchez, ο οποίος επίσης εργάστηκε στην ομάδα Alexa. Φαντάστηκε την εφαρμογή ως ένα βήμα προς έξυπνους γιακάδες. Αυτά τα περιλαίμια θα μετέφραζαν τους ήχους της γάτας στον ανθρώπινο λόγο, αντλώντας από πολύπλοκες στρατηγικές μηχανικής μάθησης για να βοηθήσουν τους ανθρώπους να κατανοήσουν καλύτερα και να φροντίσουν τις γάτες τους.

Η ομάδα του MeowTalk αντιστάθμισε θέματα μοναδικότητας δημιουργώντας πιο συγκεκριμένα προφίλ για κάθε γάτα. Στην εφαρμογή, εγγράφετε κάθε γάτα ξεχωριστά. Επιστήμη Νορβηγία αναφέρει ότι τα γατάκια νιαουρίζουν διαφορετικά από τις ενήλικες γάτες, έτσι η εφαρμογή ζητά επίσης τα γενέθλια της γάτας. Κάθε προφίλ δημιουργεί ένα μοναδικό δίκτυο δεδομένων για τη γάτα, ενσωματώνοντας λίγη βαθιά μάθηση στη μηχανική μάθηση.

Σχετικά: Deep Learning έναντι Machine Learning έναντι AI: Πώς πάνε μαζί;

Για λεξιλόγιο, το MeowTalk ξεκινά με 10 προφίλ ήχου στο σύνολο δεδομένων του. Το καθένα έχει διαφορετική έννοια, όπως 'ευτυχισμένο' ή 'κυνήγι'. Όταν η εφαρμογή ακούει έναν ήχο και τον κάνει λάθος, μπορείτε είτε να τον διορθώσετε είτε να δημιουργήσετε μια νέα ερμηνεία.

Τα δεδομένα CATSOUNDS συλλέχθηκαν από Akvelon

Η διόρθωση λέει στην εφαρμογή να αντικαταστήσει το βασικό λεξιλόγιο με τον νέο ήχο.

Προσθήκη στο κουμπί λίστας επιθυμιών του Amazon chrome

Για παράδειγμα, μπορείτε να πείτε στην εφαρμογή να ταιριάζει με το 'Κυνήγι' σε κοντές κελαηδίες αντί για μια μακρά κουκουβάγια. Αυτό το είδος διόρθωσης είναι πιο χρήσιμο από την προσθήκη πολλαπλών ήχων για να ταιριάζει με μία έννοια με τον τρόπο με τον οποίο αναγνωρίζεται η ομιλία, κάτι που θα ήταν σαν να λέγαμε στην εφαρμογή ότι μια μακριά κουκουβάγια και μικρά κελαηδήματα και τα δυο σημαίνει «Μητέρα κλήση».

Η μηχανική εκμάθηση σε εφαρμογές αναγνώρισης ομιλίας συνήθως αντιστέκεται σε αυτόν τον τύπο αντικατάστασης. Θα ήταν σαν να προσπαθούσατε να μάθετε στη Siri ότι όταν λέτε «τεχνολογικό ιστολόγιο», εννοείτε πραγματικά «αχλάδι». Αλλά η πιο ευέλικτη μορφή μηχανικής μάθησης που χρησιμοποιεί το MeowTalk μπορεί να χειριστεί αυτήν τη διόρθωση πιο εύκολα.

Η δημιουργία μιας νέας ερμηνείας προσθέτει ένα νόημα που δεν είχε κωδικοποιηθεί προηγουμένως. Για παράδειγμα, εάν η γάτα σας έχει μια συγκεκριμένη κλήση όταν θέλει το αγαπημένο της παιχνίδι, μπορείτε να προσθέσετε το 'Θέλω το ποντίκι μου' ως επιλογή. Είναι παρόμοιο με την προσθήκη μιας λέξης στο λεξικό αυτόματης διόρθωσης.

Σχετίζεται με: Πώς να ορίσετε τις δικές σας λέξεις αυτόματης διόρθωσης στο Android

Με την πάροδο του χρόνου, μπορείτε να αναπτύξετε ένα εξαιρετικά εξατομικευμένο προφίλ ομιλίας για τη γάτα σας. Τελικά, μπορεί ακόμη και να είναι αρκετά εξελιγμένο για να είναι χρήσιμο σε κατοικίδια ζώα ή για την επίλυση προβλημάτων συμπεριφοράς. Αν μη τι άλλο, βοηθάει τους ιδιοκτήτες γατών να γίνουν πιο προσεκτικοί στα κατοικίδια ζώα τους.

Η ετυμηγορία: Λειτουργούν οι εφαρμογές μετάφρασης γάτας;

Τελικά, η «μετάφραση γάτας» εξακολουθεί να βασίζεται πολύ στον χρήστη που διδάσκει στην εφαρμογή πώς μιλάει η γάτα τους. Αυτό πιθανότατα θα συμβαίνει πάντα λόγω του πόσο μοναδική είναι η επικοινωνία κάθε γάτας.

Αλλά το γεγονός ότι η μηχανική μάθηση έχει φτάσει τόσο μακριά που οι προγραμματιστές μπορούν να επιτύχουν εν μέρει σε αυτό είναι απίστευτο. Η μηχανική μάθηση και η τεχνητή νοημοσύνη προχωρούν με ιλιγγιώδεις ταχύτητες και ανυπομονούμε να δούμε πού θα πάνε στη συνέχεια.

Μερίδιο Μερίδιο Τιτίβισμα ΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ Σχετικά θέματα
  • Η τεχνολογία εξηγείται
  • Εκμάθηση γλώσσας
  • Μηχανική εκμάθηση
Σχετικά με τον Συγγραφέα Νάταλι Στιούαρτ(Δημοσιεύθηκαν 47 άρθρα)

Η Νάταλι Στιούαρτ είναι συγγραφέας για το MakeUseOf. Αρχικά ενδιαφέρθηκε για την τεχνολογία στο κολέγιο και ανέπτυξε ένα πάθος για τη συγγραφή μέσων στο πανεπιστήμιο. Η Natalie επικεντρώνεται στην τεχνολογία που είναι προσβάσιμη και εύκολη στη χρήση και λατρεύει τις εφαρμογές και τις συσκευές που κάνουν τη ζωή απλούστερη για τους καθημερινούς ανθρώπους.

Περισσότερα από τη Natalie Stewart

Εγγραφείτε στο newsletter μας

Εγγραφείτε στο ενημερωτικό μας δελτίο για τεχνικές συμβουλές, κριτικές, δωρεάν ebooks και αποκλειστικές προσφορές!

Κάντε κλικ εδώ για εγγραφή