in

Ο νέος συνθέτης φωνής του OpenAI μπορεί να αντιγράψει τη φωνή σας από μόλις 15 δευτερόλεπτα ήχου

Το OpenAI ανέπτυξε με ταχείς ρυθμούς το chatbot τεχνητής νοημοσύνης του ChatGPT και τον δημιουργό βίντεο Sora AI τον τελευταίο χρόνο και τώρα έχει ένα νέο εργαλείο τεχνητής νοημοσύνης για να επιδείξει: το Voice Generation, το οποίο μπορεί να δημιουργήσει συνθετικές φωνές από μόλις 15 δευτερόλεπτα ήχου.
Σε μια ανάρτηση ιστολογίου (μέσω The Verge), το OpenAI λέει ότι εκτελούσε “μια μικρής κλίμακας προεπισκόπηση” του Voice Engine, το οποίο βρίσκεται σε ανάπτυξη από τα τέλη του 2022. Στην πραγματικότητα χρησιμοποιείται ήδη στη λειτουργία Read Aloud στην εφαρμογή ChatGPT. που (όπως υποδηλώνει το όνομα) σας διαβάζει απαντήσεις.
Αφού εκπαιδεύσετε τη φωνή από ένα δείγμα 15 δευτερολέπτων, μπορείτε στη συνέχεια να τη βάλετε να διαβάσει οποιοδήποτε κείμενο σας αρέσει, με «συναισθηματικό και ρεαλιστικό» τρόπο. Το OpenAI λέει ότι θα μπορούσε να χρησιμοποιηθεί για εκπαιδευτικούς σκοπούς, για μετάφραση podcast σε νέες γλώσσες, για προσέγγιση απομακρυσμένων κοινοτήτων και για υποστήριξη ατόμων που δεν είναι λεκτικά.
Αυτό δεν είναι κάτι που μπορούν να χρησιμοποιήσουν όλοι αυτήν τη στιγμή, αλλά μπορείτε να πάτε και να ακούσετε τα δείγματα που δημιουργήθηκαν από το Voice Engine. Τα κλιπ που έχει δημοσιεύσει το OpenAI ακούγονται αρκετά εντυπωσιακά, αν και υπάρχει μια ελαφριά ρομποτική και στιβαρή άκρη σε αυτά.
Οι ανησυχίες για την κακή χρήση είναι ο κύριος λόγος που το Voice Engine βρίσκεται σε περιορισμένη προεπισκόπηση προς το παρόν: Η OpenAI λέει ότι θέλει να κάνει περισσότερη έρευνα για το πώς μπορεί να προστατεύσει εργαλεία όπως αυτό από τη χρήση τους για τη διάδοση παραπληροφόρησης και την αντιγραφή φωνών χωρίς συναίνεση.
«Ελπίζουμε να ξεκινήσουμε έναν διάλογο σχετικά με την υπεύθυνη ανάπτυξη συνθετικών φωνών και πώς η κοινωνία μπορεί να προσαρμοστεί σε αυτές τις νέες δυνατότητες», λέει το OpenAI. “Με βάση αυτές τις συνομιλίες και τα αποτελέσματα αυτών των δοκιμών μικρής κλίμακας, θα λάβουμε μια πιο τεκμηριωμένη απόφαση σχετικά με το εάν και πώς θα αναπτύξουμε αυτήν την τεχνολογία σε κλίμακα.”
Με τις μεγάλες εκλογές να αναμένονται φέτος στις ΗΠΑ και το Ηνωμένο Βασίλειο και τα εργαλεία τεχνητής νοημοσύνης να εξελίσσονται συνεχώς, είναι ανησυχητικό για κάθε τύπο περιεχομένου τεχνητής νοημοσύνης – ήχο, κείμενο και βίντεο – και γίνεται όλο και πιο δύσκολο να το γνωρίζουμε τι να εμπιστευτείς.
Όπως επισημαίνει το ίδιο το OpenAI, αυτό μπορεί να προκαλέσει προβλήματα με τα μέτρα ελέγχου ταυτότητας φωνής και απάτες όπου μπορεί να μην γνωρίζετε με ποιον μιλάτε μέσω τηλεφώνου ή με ποιον σας έχει αφήσει φωνητικό μήνυμα. Αυτά τα ζητήματα δεν είναι εύκολα προς επίλυση – αλλά θα πρέπει να βρούμε τρόπους να τα αντιμετωπίσουμε.

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Google Photos: Ταχύτερος διαμοιρασμός φωτογραφιών με αυτό το νέο χαρακτηριστικό

Πώς να χρησιμοποιήσετε το Facebook Messenger στην επιφάνεια εργασίας