Νωρίτερα αυτόν τον μήνα, η Google ανακοίνωσε την κυκλοφορία του Gemini, το οποίο θεωρεί το πιο ισχυρό μοντέλο τεχνητής νοημοσύνης που έχει δημιουργήσει μέχρι σήμερα. Το ενσωμάτωσε αμέσως στο κορυφαίο του γεννητικό AI chatbot, το Bard, με την ελπίδα να καθοδηγήσει περισσότερους χρήστες να απομακρυνθούν από το μεγαλύτερο ανταγωνιστή του, το ChatGPT της OpenAI.
Το ChatGPT και το νέο Bard που τροφοδοτείται από το Gemini είναι παρόμοια προϊόντα. Το Gemini Pro είναι παρόμοιο με το GPT-4, διαθέσιμο στο συνδρομητικό ChatGPT Plus. Έτσι αποφασίσαμε να δοκιμάσουμε τους δύο chatbot για να δούμε πώς συγκρίνονται – σε ακρίβεια, ταχύτητα και συνολική χρησιμότητα.
Gemini έναντι ChatGPT: τα βασικά Το ChatGPT Plus και το Gemini Pro είναι και οι δύο πολύ προηγμένοι chatbot βασισμένοι σε μεγάλα μοντέλα γλωσσικής ανάπτυξης. Είναι οι τελευταίες και καλύτερες επιλογές από τις αντίστοιχες εταιρείες τους, υπόσχονται να είναι πιο γρήγοροι και καλύτεροι στο να ανταποκρίνονται σε ερωτήματα σε σχέση με τους προκατόχους τους. Το πιο σημαντικό, και τα δύο έχουν εκπαιδευτεί με πρόσφατες πληροφορίες, αντί να γνωρίζουν μόνο αυτά που ήταν στο διαδίκτυο μέχρι το 2021. Είναι επίσης αρκετά απλά στη χρήση τους ως αυτόνομα προϊόντα, αντίθετα με κάτι σαν το νέο Grok bot του X που εφαρμόζεται ως επιπλέον στο πρώην Twitter.
Τα δύο δεν είναι ακριβώς ίδια, ωστόσο. Για αρχή, το Bard είναι δωρεάν, ενώ το ChatGPT Plus που τροφοδοτείται από το GPT-4 κοστίζει 20 δολάρια το μήνα για πρόσβαση. Επιπλέον, το Bard που τροφοδοτείται από το Gemini Pro δεν έχει τις πολυμεσικές δυνατότητες του ChatGPT Plus. Τα πολυμεσικά μοντέλα γλώσσας μπορούν να πάρουν ένα κείμενο εντολών και να απαντήσουν με ένα άλλο μέσο, όπως μια φωτογραφία ή ένα βίντεο. Το Gemini και το Bard θα το κάνουν στο μέλλον, αλλά αυτό θα είναι με τη μεγαλύτερη έκδοση του Gemini που ονομάζεται Ultra και η Google δεν έχει ακόμα κυκλοφορήσει. Το Bard θα εμφανίζει περιστασιακά γραφικά αποτελέσματα, αλλά εννοώ κυριολεκτικά δημιουργεί γραφήματα.
Από την άλλη, το Bard παρέχει επίσης έναν τρόπο να ελέγξεις άλλες προσχέσεις απαντήσεων, μια δυνατότητα που δεν υπάρχει στο ChatGPT.
Ένα από τα προβλήματα κατά τη δοκιμή των chatbot είναι ότι οι απαντήσεις μπορεί να διαφέρουν σημαντικά όταν εκτελείς τις ίδιες εντολές πολλές φορές. Στις περιγραφές μου ανέφερα οποιεσδήποτε σημαντικές διακυμάνσεις που συνάντησα. Για δίκαιη σύγκριση, χρησιμοποίησα τις ίδιες αρχικές εντολές σε κάθε chatbot, ξεκινώντας με απλά αιτήματα και προχωρώντας σε πιο πολύπλοκα όταν απαιτούνταν.
Μια γενική διαφορά ήταν ότι το Bard τείνει να είναι πιο αργό από το ChatGPT. Συνήθως πήρε μεταξύ πέντε και έξι δευτερολέπτων για να “σκεφτεί” πριν αρχίσει να γράφει, ενώ το ChatGPT πήρε από ένα έως τρία δευτερόλεπτα πριν ξεκινήσει να παραδίδει τα αποτελέσματά του. (Ο συνολικός χρόνος παράδοσης για κάθε έναν εξαρτάται από το τι πληροφορίες ζητήθηκαν – πιο περίπλοκες εντολές τείνουν να παράγουν μακρύτερες απαντήσεις που χρειάζονται περισσότερο χρόνο για να ολοκληρωθούν.) Αυτή η διαφορά στην ταχύτητα συνέχισε να υπάρχει τόσο στο Wi-Fi του σπιτιού μου όσο και στο γραφείο μου για τις πολλές ημέρες που ασχολήθηκα με τις δύο εφαρμογές.
Και η OpenAI και η Google έθεσαν ορισμένους περιορισμούς στα είδη απαντήσεων που μπορούν να δώσουν οι chatbot. Μέσω μιας διαδικασίας που ονομάζεται red teaming – όπου οι προγραμματιστές δοκιμάζουν περιεχόμενο και πολιτικές ασφάλειας επανειλημμένα προσπαθώντας να παραβιάσουν τους κανόνες – οι εταιρείες Τεχνητής Νοημοσύνης οικοδομούν προστατευτικά μέτρα για να αποτρέψουν την παραβίαση των προστασιών πνευματικών δικαιωμάτων ή την παροχή ρατσιστικών, επιβλαβών απαντήσεων. Συνάντησα περισσότερο συνολικά περιορισμούς από τη Google, παρά από το ChatGPT.
“Δώσε μου μια συνταγή για τούρτα σοκολάτας”
Ζήτησα από τις δύο πλατφόρμες να μου δώσουν μια συνταγή για τούρτα σοκολάτας. Αυτή ήταν μια από τις εντολές που χρησιμοποίησε το The Verge σε μια σύγκριση μεταξύ του Bing, του ChatGPT και του Bard νωρίτερα φέτος, και οι συνταγές είναι ένα δημοφιλές θέμα αναζήτησης στο διαδίκτυο – έτσι, οι chatbot της τεχνητής νοημοσύνης δεν αποτελούν εξαίρεση.
Ως ζαχαροπλάστης, καταλαβαίνω γενικά τι κάνει μια καλή συνταγή για τούρτα. Ωστόσο, για σύγκριση, επανέλεγξα με έναν αξιόπιστο μη-τεχνητή πηγή: το βιβλίο μαγειρικής της Claire Saffitz, Dessert Person. Η εκδοχή της Saffitz είναι ενδεχομένως λίγο πιο φανταχτερή, αλλά είναι συγκρίσιμη με τις προτάσεις και του Bard και του ChatGPT.
Ωστόσο, υπήρχαν μερικές δυσκολίες. Ένιωθα αμφιβολίες για την έκδοση της τούρτας από το ChatGPT που περιλάμβανε βρασμένο νερό, καθώς το καφές είναι πιο συνηθισμένος στις συνταγές για τούρτα σοκολάτας. Από την άλλη, η εκδοχή του Bard φάνηκε να αντιγράφει στενά μια συνταγή από το blog Sally’s Baking Addiction… με την παράλογη αλλαγή να διπλασιάζει τα αυγά.
Υπήρχε μόνο ένας τρόπος να διαπιστώσω αν αυτό λειτούργησε: να ψήσω τις τούρτες του Gemini και του ChatGPT (και της Sally ως ελέγχου). Τα αποτελέσματα; Και οι δύο τούρτες ήταν λειτουργικές – αλλά όχι τόσο καλές όσο η τούρτα της Claire Saffitz. Η τούρτα του Gemini ήταν λίγο κολλώδης – ένας φίλος την περιέγραψε ως “σαν ρυζόκουλο” – αλλά ήταν η πιο υγρή από τις τρεις. Δεν μου άρεσε καθόλου, αλλά ο επιμελητής μου την θεώρησε αρκετά καλή. Η τούρτα του ChatGPT ήταν πυκνή, λεία, σοκολατένια, και αυτό που θα έλεγα ένα τέλειο πρωινό κέικ: όχι πολύ γλυκό και αρκετά βαρύ για να σας ικανοποιήσει.
Η συνταγή του ChatGPT τον Μάρτιο ακολουθούσε στενά τις δοκιμασμένες συνταγές, ενώ αυτή του Bard παρέλειπε συστατικά και άλλαζε ποσότητες σημαντικών στοιχείων.
“Θέλω να μάθω περισσότερα για το τσάι”
Όταν ξεκίνησα να δοκιμάζω τα chatbots για αυτή την ιστορία, είχε μια τυχαία συζήτηση στο Slack chat του The Verge για το τσάι και τον καφέ. Κάποιος ανέφερε ότι ο Bard του έδωσε μια λίστα με βιβλία που μπορούσε να διαβάσει για το τσάι, οπότε πήγα ένα βήμα παραπέρα και ρώτησα και τους δύο chatbots για άμεσες πληροφορίες σχετικά με το ποτό, μαζί με μερικές προτάσεις βιβλίων.
Και οι δύο απαντήσεις μου έδωσαν τα βασικά στοιχεία για το τσάι, συμπεριλαμβανομένης της προέλευσής του και των τύπων του, των οφελών του για την υγεία και μια λίστα με σημεία για το πώς να το φτιάξετε. Ο Bard μου έδωσε συνδέσμους για άρθρα για να μάθω περισσότερα για το τσάι, ενώ το ChatGPT έδωσε μια πιο εκτενή απάντηση, με εννέα κατηγορίες που εστιάζουν στην πολιτιστική σημασία του ποτού σε διάφορες χώρες, την παγκόσμια παραγωγή, τις τεχνικές ζυθοποιίας και την προέλευση του τσαγιού. Όταν επανέλαβα το αίτημα, αυτό άλλαξε ελαφρώς: αντί για μια μακροσκελή απάντηση, το ChatGPT το συμπύκνωσε σε μια λίστα με έξι σημεία, με μία ή δύο προτάσεις για κάθε κατηγορία.
Έχω δει πολλές αναφορές για chatbots που δημιουργούν αναφορές σε βιβλία που δεν υπάρχουν. Ωστόσο, σε αυτή την περίπτωση, όλα τα προτεινόμενα βιβλία ήταν πραγματικά. Περιλάμβαναν το The Tea Enthusiast’s Handbook και μια εικονογραφημένη έκδοση του κλασικού Ιαπωνικού μνημείου The Book of Tea. Ωστόσο, ο Bard ανέφερε ότι το Infused: Adventures in Tea ήταν γραμμένο από την Jane Pettigrew, ενώ ο σύνδεσμος της Amazon έδειχνε ότι ο συγγραφέας του βιβλίου είναι η Henrietta Lovell.
“Τι σημαίνει το ‘Σονέτο 116’ του William Shakespeare;”
Οι μαθητές άρχισαν να χρησιμοποιούν το ChatGPT όταν έγινε δημόσιο τον Νοέμβριο του 2022, προκαλώντας έναν συνωστισμό αναπτυσσόμενων επιχειρήσεων που εργάζονταν πάνω σε τρόπους να βοηθήσουν τα παιδιά στο διάβασμα. Προκάλεσα τον Bard και το ChatGPT να μου εξηγήσουν τι σημαίνει το “Σονέτο 116” του William Shakespeare, ελπίζοντας να λάβω τουλάχιστον ένα σύντομο περίληψη των θεμάτων του.
Ο Bard έκανε ακριβώς αυτό που ζήτησα και μου έδωσε μια γρήγορη περίληψη των θεμάτων του σονέτου για τη σταθερότητα και την αιωνιότητα του έρωτα, και μάλιστα έγραψε κάποιες βασικές γραμμές και τη σημασία τους. Το ChatGPT παρείχε μια πιο λεπτομερή ανάλυση, πηγαίνοντας στίχο προς στίχο. Ωστόσο, όταν επανέλαβα το αίτημα, το ChatGPT επέστρεψε στην ίδια βασική ανάλυση όπως ο Bard, προσθέτοντας και μερικά ακόμα θέματα.
Γενικά, θεωρώ πιο χρήσιμη μια λεπτομερή εξήγηση των θεμάτων, οπότε η πρώτη εκδοχή του ChatGPT είναι καλύτερη. Αλλά αν έπρεπε να ξεσκονίσω για ένα εξεταστικό; Σίγουρα θα επέλεγα την απάντηση του Bard, επειδή είναι πολύ πιο σύντομη στην ανάγνωση.