Το Roblox δημιούργησε ένα μοντέλο τεχνητής νοημοσύνης που, όπως λέει, μεταφράζει τις συνομιλίες κειμένου τόσο γρήγορα, ώστε οι χρήστες μπορεί να μην καταλάβουν ότι μεταφράζει τα μηνύματα άλλων παικτών στην αρχή. Λειτουργεί με 16 γλώσσες, όπως αγγλικά, γαλλικά, ιαπωνικά, ταϊλανδέζικα, πολωνικά και βιετναμέζικα.
Ο Dan Sturman, CTO του Roblox, δήλωσε σε συνέντευξή του στο The Verge ότι ο στόχος είναι να κάνει τους χρήστες του Roblox να αισθάνονται πιο άνετα να επικοινωνούν μεταξύ τους, αφήνοντάς τους να καταλαβαίνουν τι λένε. Ο μεταφραστής μεταφράζει αυτόματα τις συνομιλίες, αλλά οι χρήστες μπορούν να κάνουν κλικ σε ένα εικονίδιο για να δουν το αρχικό μήνυμα.
“Γνωρίζουμε ότι η δέσμευση αυξάνεται όταν οι χρήστες μιλούν ή αλληλεπιδρούν με άλλους στη γλώσσα τους”, δήλωσε ο Sturman. “Πήραμε αυτή την ιδέα και αφαιρέσαμε το γλωσσικό εμπόδιο με την αυτόματη μετάφραση”.
Το Roblox ξεκίνησε με τη δημιουργία ενός μεγάλου γλωσσικού μοντέλου (LLM) βασισμένου σε μετασχηματιστή, το οποίο εκπαιδεύτηκε σε δημόσια διαθέσιμα και εσωτερικά δεδομένα. Τοποθέτησε το LLM μέσα σε μια αρχιτεκτονική μίξης ειδικών (MoE), ένα περιβάλλον που έτρεχε πολλαπλές εφαρμογές μετάφρασης, με την καθεμία να είναι ειδικός σε μια γλώσσα. Αυτό επέτρεψε στην Roblox να εξοικονομήσει πόρους χωρίς να χρειάζεται να κατασκευάσει ένα ξεχωριστό LLM για κάθε γλώσσα. Ο Sturman δήλωσε ότι, λαμβάνοντας υπόψη την κλίμακα του έργου τους, η ομάδα του πίστευε ότι ήταν ευκολότερο να κατασκευάσει το δικό της μοντέλο από το να τροποποιήσει ένα έτοιμο LLM.
Ο Sturman δήλωσε ότι το Roblox παρακολουθεί τις συνομιλίες (το κάνει για λόγους εμπιστοσύνης και ασφάλειας) και μπορεί να λάβει ανατροφοδότηση εάν οι μεταφράσεις δεν είναι ακριβώς τέλειες. Πρόσθεσε ότι η προσθήκη της τεχνητής νοημοσύνης μετάφρασης συνομιλιών “δεν αλλάζει τίποτα στη διαδικασία προστασίας της ιδιωτικής ζωής και της ασφάλειας και οι απαγορευμένες λέξεις θα εξακολουθήσουν να μπλοκάρονται”.
Το Roblox, το οποίο τα τελευταία χρόνια προσπαθεί να προσελκύσει το κοινό μεγαλύτερης ηλικίας, εργάζεται με μοντέλα τεχνητής νοημοσύνης για να βελτιώσει την εμπειρία των χρηστών. Πέρυσι κυκλοφόρησε έναν βοηθό AI chatbot για προγραμματιστές. Επίσης, μεταφράζει αυτόματα περιουσιακά στοιχεία εικόνας, όπως λέξεις σε κτίρια, στην προεπιλεγμένη γλώσσα του χρήστη.
Ο Sturman δήλωσε ότι η ελπίδα είναι το μοντέλο του μεταφραστή να ξεπεράσει τελικά τη μετάφραση μόνο των συνομιλιών κειμένου. “Στο μέλλον, θα μπορούσαμε να χρησιμοποιήσουμε την τεχνητή νοημοσύνη για να μεταφράσουμε μη συμβατές [απαγορευμένες] λέξεις σε συμβατές λέξεις ή να την ρίξουμε σε φωνητικές συνομιλίες για φωνητική μετάφραση σε πραγματικό χρόνο. Υπάρχουν πολλές δυνατότητες”, δήλωσε ο Sturman.
Άλλες εταιρείες αναπτύσσουν επίσης μοντέλα μεταφραστών τεχνητής νοημοσύνης. Η Meta κυκλοφόρησε τον μεταφραστή ομιλίας σε κείμενο και κειμένου σε κείμενο, SeamlessM4T, ο οποίος χειρίζεται σχεδόν 100 γλώσσες. Το Universal Speech Model της Google μεταφράζει επίσης περίπου 100 γλώσσες και έχει ήδη αναπτυχθεί στο YouTube για να μεταφράζει λεζάντες.