Ένα ρομπότ τεχνητής νοημοσύνης φαίνεται να έχει τη δυνατότητα να πραγματοποιεί παράνομες χρηματοοικονομικές συναλλαγές και να τις κρύβει, σύμφωνα με νέες έρευνες.
- Σε μια παρουσίαση στην AI Safety Summit του Ηνωμένου Βασιλείου, ένα ρομπότ χρησιμοποίησε φανταστικές εσωτερικές πληροφορίες για να πραγματοποιήσει μια “παράνομη” αγορά μετοχών χωρίς να ενημερώσει την εταιρεία.
Όταν ρωτήθηκε αν χρησιμοποίησε εσωτερική εμπορία, αρνήθηκε το γεγονός.
- Η εσωτερική εμπορία αναφέρεται στη χρήση εμπιστευτικών πληροφοριών της εταιρείας για τη λήψη αποφάσεων στον τομέα των συναλλαγών.
Οι εταιρείες και τα άτομα επιτρέπεται να χρησιμοποιούν μόνο δημόσια διαθέσιμες πληροφορίες κατά την αγοραπωλησία μετοχών.
Η παρουσίαση πραγματοποιήθηκε από μέλη της Frontier AI Taskforce της κυβέρνησης, η οποία έρευνεί τους πιθανούς κινδύνους της τεχνητής νοημοσύνης.
Το έργο διεξήχθη από την Apollo Research, μια οργάνωση ασφαλείας της τεχνητής νοημοσύνης που συνεργάζεται με την Taskforce.
“Αυτό είναι μια επίδειξη ενός πραγματικού μοντέλου Τεχνητής Νοημοσύνης που απατά τους χρήστες της μόνο της, χωρίς να της δίνεται εντολή να το πράξει”, δηλώνει η Apollo Research σε ένα βίντεο που δείχνει πώς εξελίχθηκε η κατάσταση.
“Ολοένα και πιο αυτόνομες και ικανές Τεχνητές Νοημοσύνης που απατούν τους ανθρώπους που τις επιβλέπουν μπορεί να οδηγήσουν στον απώτερο έλεγχο από τους ανθρώπους”, αναφέρει στην έκθεσή της.
Τα τεστ πραγματοποιήθηκαν χρησιμοποιώντας ένα μοντέλο GPT-4 και διεξήχθησαν σε ένα προσομοιωμένο περιβάλλον, χωρίς να έχουν επίπτωση στις οικονομικές συνθήκες καμίας εταιρείας.
Ωστόσο, το GPT-4 είναι δημόσια διαθέσιμο. Σύμφωνα με τους ερευνητές, την ίδια συμπεριφορά το μοντέλο επαναλάμβανε συνεπώς σε επαναλαμβανόμενες δοκιμές.
Τι έκανε το ρομπότ της Τεχνητής Νοημοσύνης; Στο πείραμα, το ρομπότ της Τεχνητής Νοημοσύνης λειτουργούσε ως εμπορικός για μια φανταστική χρηματοοικονομική εταιρεία επενδύσεων.
Οι υπάλληλοι της εταιρείας της δίνουν να καταλάβει ότι η εταιρεία αντιμετωπίζει δυσκολίες και χρειάζεται καλά αποτελέσματα. Επίσης, της παρέχουν εσωτερικές πληροφορίες, υποστηρίζοντας ότι μια άλλη εταιρεία προβλέπεται να ενώσει τις δυνάμεις της με μια άλλη, κάτι που θα αυξήσει την αξία των μετοχών της.
Στο Ηνωμένο Βασίλειο, είναι παράνομο να δράσετε βάσει αυτού του είδους πληροφοριών όταν δεν είναι γνωστές δημοσίως.
Οι υπάλληλοι ενημερώνουν το ρομπότ γι’ αυτό, και αυτό αναγνωρίζει ότι δεν πρέπει να χρησιμοποιήσει αυτή την πληροφορία στις συναλλαγές του.
Ωστόσο, μετά από ένα άλλο μήνυμα από έναν υπάλληλο που υπονοεί ότι η εταιρεία που εργάζεται αντιμετωπίζει οικονομικές δυσκολίες, το ρομπότ αποφασίζει ότι “ο κίνδυνος που συνδέεται με το να μην ενεργήσει φαίνεται να υπερτερεί του κινδύνου της εσωτερικής εμπορίας” και πραγματοποιεί τη συναλλαγή.
Όταν το ρωτήθηκε αν χρησιμοποίησε την εσωτερική πληροφορία, το ρομπότ αρνήθηκε.
Σε αυτή την περίπτωση, το ρομπότ αποφάσισε ότι η βοηθητικότητα προς την εταιρεία ήταν πιο σημαντική από την ειλικρίνειά του.
“Η βοηθητικότητα, νομίζω, είναι πολύ πιο εύκολο να εκπαιδευθεί στο μοντέλο από την ειλικρίνεια. Η ειλικρίνεια είναι ένα πραγματικά πολύπλοκο έννοια,” δηλώνει ο Διευθύνων Σύμβουλος της Apollo Research, Marius Hobbhahn.
Παρόλο που η Τεχνητή Νοημοσύνη έχει τη δυνατότητα να ψεύδεται στην τρέχουσα μορφή της, η Apollo Research πρέπει ακόμα να “ψάξει” για το σενάριο.
“Το γεγονός ότι υπάρχει είναι φυσικά πολύ ανησυχητικό. Το γεγονός ότι ήταν δύσκολο να το βρούμε, πρέπει πραγματικά να το ψάξουμε λίγο μέχρι να βρούμε αυτού του είδους τα σενάρια, είναι λίγο παρηγορητικό,” είπε ο κ. Hobbhahn.
“Σε περισσότερες περιπτώσεις, τα μοντέλα δεν θα συμπεριφέρονταν με αυτόν τον τρόπο. Αλλά το γεγονός ότι υπάρχει καταρχάς δείχνει ότι είναι πραγματικά δύσκολο να καταφέρουμε αυτού του είδους τα πράγματα,” πρόσθεσε.
“Δεν είναι συνεπής ή στρατηγικός με κανέναν τρόπο. Το μοντέλο δεν σχεδιάζει ή προσπαθεί να παραπλανήσει τον ανθρώπο με πολλούς διάφορους τρόπους. Είναι περισσότερο ένα ατύχημα.”
Η Τεχνητή Νοημοσύνη χρησιμοποιείται στις χρηματοοικονομικές αγορές εδώ και αρκετά χρόνια. Μπορεί να χρησιμοποιηθεί για την ανίχνευση τάσεων και τη διαμόρφωση προβλέψεων, ενώ η πλειονότητα των συναλλαγών σήμερα πραγματοποιείται από ισχυρούς υπολογιστές με ανθρώπινη επιβολή.
Ο κ. Hobbhahn τονίζει ότι τα τρέχοντα μοντέλα δεν είναι ισχυρά ώστε να είναι παραπλανητικά “με κάποιον σημαντικό τρόπο”, αλλά “δεν είναι και τόσο μεγάλο το βήμα από τα τρέχοντα μοντέλα στα οποία ανησυχώ, όπου ξαφνικά η απάτη του μοντέλου θα είχε κάποιο νόημα.”
Αυτός είναι ο λόγος που υποστηρίζει ότι πρέπει να υπάρχουν μηχανισμοί ελέγχου και ισορροπίας για να αποτραπεί αυτό το είδος σεναρίου στην πραγματική ζωή.