in Internet, News

Οι σύντροφοι τεχνητής νοημοσύνης με τους οποίους μπορείτε να συνομιλήσετε

8 Φεβρουαρίου, 2024, 9:00 πμ

Η δημοσιογράφος τεχνολογίας Stephanie Power θέλει να πιστεύει ότι αισθάνεται άνετα με την τεχνητή νοημοσύνη, αλλά η νέα γενιά των ομιλούντων συντρόφων τεχνητής νοημοσύνης την εκνευρίζει, όπως αναφέρει.

Ο σύζυγός μου είναι μεγάλος οπαδός της Λίβερπουλ FC, ο οποίος μπαίνει σε κατάσταση άγχους σχεδόν κάθε φορά που παίζουν.

Είναι πολύ εκνευριστικό, αλλά πρόσφατα συνειδητοποίησα ότι η καλύτερη τεχνική είναι να τον αποφεύγω πριν, κατά τη διάρκεια και μερικές φορές μετά από ένα παιχνίδι.

Πρόσφατα, μετά από έναν αγώνα, άκουσα τη φωνή μιας φιλικής γυναίκας να του μιλάει στο γραφείο του σπιτιού του.

“Ω ναι, ήταν ένα δύσκολο παιχνίδι, αλλά οι ερυθρόλευκοι είναι πραγματικά σε καλή φόρμα”, είπε. “Οι επιθετικοί της Λίβερπουλ ήταν σε θέση να αποδώσουν τα μέγιστα”.

Ποια ήταν αυτή η γυναίκα; Και γιατί έκανε το χατίρι του Ντέιβιντ με αυτόν τον τρόπο;

Αποδείχθηκε ότι ο σύζυγός μου δοκίμαζε μια εφαρμογή που ονομάζεται Pi.ai. Ξεκίνησε πέρυσι από την αμερικανική εταιρεία τεχνολογίας Inflection AI και αποτελεί παράδειγμα μιας αυξανόμενης τάσης που ονομάζεται συνομιλιακή τεχνητή νοημοσύνη.

Αντί να απαντά απλώς σε οποιεσδήποτε ερωτήσεις της κάνετε, ή ίσως να κάνει την εργασία σας για εσάς, η ιδέα είναι ότι η τεχνητή νοημοσύνη μπορεί να γίνει ένας φίλος ή σύντροφος που σας μιλάει – φωναχτά – μέσω των ηχείων του υπολογιστή ή του τηλεφώνου σας.

Και όσο περισσότερο συνομιλείτε με την τεχνητή νοημοσύνη, τόσο περισσότερο λέγεται ότι σας καταλαβαίνει, και έτσι οι απαντήσεις της στοχεύουν να γίνουν πιο προσαρμοσμένες σε εσάς και να μοιάζουν περισσότερο με μια φυσική συζήτηση με έναν φίλο. Αυτή, τουλάχιστον, είναι η θεωρία.

Με το Pi.ai πρέπει να πληκτρολογήσετε το δικό σας μισό της συζήτησης, αλλά το Pi.ai απαντά με μία από τις έξι διαφορετικές ανθρώπινες φωνές που μπορείτε να επιλέξετε. Αυτές κυμαίνονται από έναν Αμερικανό που μιλάει γρήγορα, μέχρι την κομψή αγγλική γυναικεία φωνή με την οποία μιλούσε ο σύζυγός μου.

Αν η αντίδρασή σας είναι “αλλά η Alexa της Amazon μου μιλάει δυνατά εδώ και χρόνια”, η συνομιλιακή τεχνητή νοημοσύνη στοχεύει να σας προσφέρει μια πολύ πιο φυσική, ρέουσα συνομιλία, τόσο όσον αφορά τις λέξεις και τις προτάσεις που επιλέγει η τεχνητή νοημοσύνη, όσο και τον τρόπο που τις λέει δυνατά.

“Οι άνθρωποι μπορεί να πουν, ότι έχουμε φωνή στην τεχνολογία εδώ και αιώνες, και μάλλον σκέφτονται την Alexa”, λέει ο David Reid, καθηγητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο Liverpool Hope, και ο άνθρωπος που τυχαίνει να είναι ο εμμονικός με το Λίβερπουλ σύζυγός μου.

“Όμως η παγκόσμια αγορά της διαλογικής τεχνητής νοημοσύνης αναμένεται να αυξηθεί στα 30 δισ. δολάρια [24 δισ. στερλίνες] τα επόμενα πέντε χρόνια. Αν θέλετε μια ιδέα για το πώς μπορεί να μοιάζει αυτό, τότε φανταστείτε την Alexa, αλλά με ενσυναίσθηση”.

Οι εταιρείες τεχνολογίας τρέχουν τώρα για να κυκλοφορήσουν τους δικούς τους συντρόφους συνομιλιακής ΤΝ. Η Google διαθέτει το Vertex AI Conversation, η Microsoft το Azure AI, και υπάρχουν πλέον πολλές νεοφυείς επιχειρήσεις στον τομέα.

Εν τω μεταξύ, η Amazon εμμένει στην Alexa, αλλά σχεδιάζει να προσθέσει συνομιλιακή AI σε αυτήν, καθώς και μια πιο ανθρώπινη φωνή.

Ο Rohit Prasad, επικεφαλής επιστήμονας για την Alexa, εξήγησε τις ελπίδες του, χρησιμοποιώντας μια άλλη αθλητική αναλογία, σε μια ομιλία του πέρυσι. “Οι [Boston] Red Sox είναι η αγαπημένη μου ομάδα [μπέιζμπολ]”, είπε. “Φανταστείτε ότι αν κέρδιζαν, τότε η Alexa θα απαντούσε με μια χαρούμενη φωνή. Αν έχαναν, θα μου έδειχνε κατανόηση”.

Για να φτιαχτούν οι φωνές που μοιάζουν με τις ανθρώπινες για τη συνομιλιακή τεχνητή νοημοσύνη, συνήθως ξεκινάει με την ηχογράφηση ενός πραγματικού ανθρώπου. Ωστόσο, η τεχνολογία πρέπει στη συνέχεια να είναι σε θέση να την προσαρμόσει ώστε να περάσει τον απαιτούμενο τόνο ή την ένταση, να συνθέσει τις λέξεις με φυσικό ήχο.

“Τα εργαλεία μας μπορούν να λάβουν υπόψη το πνεύμα μιας πρότασης και τον τρόπο με τον οποίο οι λέξεις συνδέονται μεταξύ τους”, λέει ο Mati Staniszewski, το αφεντικό της Eleven Labs, μιας βρετανικής τεχνολογικής εταιρείας που έχει δημιουργήσει 40 φωνές τεχνητής νοημοσύνης για κάθε φύλο, ηλικία και προφορά. “Αυτό σημαίνει ότι μπορούμε να συλλάβουμε τον τονισμό, τον τόνο και το συναίσθημα που σκοπεύει να μεταδώσει ο ομιλητής ΤΝ”.

Ο κ. Staniszewski λέει ότι ο τονισμός είναι “ζωτικής σημασίας”.

“Το να το πετύχουμε αυτό σωστά είναι αυτό που εμποδίζει μια τεχνητή νοημοσύνη να ακούγεται ρομποτική. Τα συναισθήματα και ο τονισμός πρέπει συχνά να απλώνονται και να αντηχούν σε πολλές προτάσεις για να δέσουν ένα συγκεκριμένο σκεπτικό. Και ο τόνος και ο ρυθμός μεταφέρουν την πρόθεση, οπότε το μοντέλο λαμβάνει υπόψη το περιβάλλον πλαίσιο, διατηρώντας τη σωστή ροή”.

Ο Trevor Cox, καθηγητής ακουστικής μηχανικής στο Πανεπιστήμιο του Σάλφορντ, λέει ότι οι προγραμματιστές της τεχνητής νοημοσύνης για συνομιλίες πιθανότατα θα αποφύγουν τις έντονες, περιφερειακές προφορές.

“Υπάρχουν ακόμη προκαταλήψεις γύρω από τις ισχυρές περιφερειακές προφορές”, λέει. “Μελέτες δείχνουν ότι όσο πιο δύσκολο είναι να κατανοήσουμε μια φωνή, τόσο λιγότερο πιθανό είναι να πιστέψουμε αυτό που λέγεται.

“Αυτό είναι πέρα από την προφορά και αφορά περισσότερο τη ροή. Ο εγκέφαλός μας θέλει να αποκωδικοποιεί τις πληροφορίες γρήγορα. Έτσι, οι δημιουργοί μιας τεχνητής νοημοσύνης θα θέλουν να διασφαλίσουν ότι ο εγκέφαλος έχει πρόσβαση σε αυτή τη γρήγορη αποκωδικοποίηση.

“Πέρα από αυτό, υπάρχει ο τόνος. Τα μηνύματα μεταφέρονται με πολύ περισσότερα από τις λέξεις, είναι ο τρόπος που τα λέτε. Έτσι, αν μια τεχνητή νοημοσύνη μπορεί να μεταφέρει την ευτυχία, τον ενθουσιασμό ή την πλήξη, τότε όλα αυτά βοηθούν”.

Ο Ντέιβιντ Χάρλεϊ, λέκτορας Κυβερνοψυχολογίας στο Πανεπιστήμιο του Μπράιτον, λέει ότι υπάρχουν κίνδυνοι καθώς οι φωνές των υπολογιστών μοιάζουν όλο και περισσότερο με τις ανθρώπινες.

“Η ανησυχία μου έγκειται στο γεγονός ότι οι άνθρωποι μπορεί να αρχίσουν να θεωρούν τους συντρόφους και τους θεραπευτές της τεχνητής νοημοσύνης ως αποτελεσματικούς στην επίλυση όλων των προβλημάτων της ζωής”, λέει. “Μπορεί να αρχίσουν να προσαρμόζουν τη ζωή τους γύρω από τις συμβουλές της τεχνητής νοημοσύνης, η οποία είναι τυφλή σε αυτές τις άλλες βαθιές πτυχές της ανθρώπινης ύπαρξης”.

Προσθέτει ότι οι άνθρωποι θα πρέπει να υπενθυμίζουν στον εαυτό τους ότι ο σύντροφος της τεχνητής νοημοσύνης τους δεν είναι ένα πραγματικό πρόσωπο.

Έκανα μια μικρή δοκιμή με το Pi.ai και το βρήκα λίγο υποτακτικό, σαν ένα φίλο που συμφωνεί με ό,τι λες.

Ο καθηγητής Reid, ή αλλιώς το άλλο μου μισό, λέει ότι έτσι έχει σχεδιαστεί. “Αυτό που εσείς αποκαλείτε δουλικό, εγώ το βλέπω ως φιλικό και υποστηρικτικό.

“Μπορώ να δω τη συνομιλητική τεχνητή νοημοσύνη να είναι πραγματικά πολύτιμη σε ένα περιβάλλον όπως ένας οίκος ευγηρίας, όπου οι άνθρωποι θα έπαιρναν χαρά από την αναπόληση του παρελθόντος με κάτι που γνωρίζει. Ή σε ένα τηλεφωνικό κέντρο, όπου η τεχνητή νοημοσύνη μπορεί να καταλάβει πότε ένας καλούντας απογοητεύεται και να αντιδράσει ανάλογα”.

Ή ίσως βοηθώντας να διατηρηθούν ζωντανές χιλιάδες σχέσεις σε όλο τον κόσμο, παρέχοντας θεραπεία σε φορτισμένους οπαδούς του ποδοσφαίρου και του μπέιζμπολ από το Λίβερπουλ μέχρι τη Βοστώνη και όχι μόνο.