Μια λειτουργία που προστέθηκε στο AI Copilot της Microsoft στον περιηγητή Edge αυτή την εβδομάδα, είναι η δυνατότητα παραγωγής περιλήψεων κειμένου από βίντεο. Ωστόσο, η λειτουργία εξοικονόμησης χρόνου του Edge Copilot είναι ακόμα αρκετά περιορισμένη και λειτουργεί μόνο σε προ-επεξεργασμένα βίντεο ή αυτά με υπότιτλους, όπως εξήγησε ο Mikhail Parakhin, CEO της Microsoft για τη διαφήμιση και τις υπηρεσίες στο διαδίκτυο.
Όπως παρατηρήθηκε από το MSPowerUser, ο Parakhin γράφει: “Για να λειτουργήσει, χρειαζόμαστε να προ-επεξεργαστούμε το βίντεο. Αν το βίντεο έχει υπότιτλους – μπορούμε πάντα να βασιστούμε σε αυτούς, αλλά αν δεν έχει και δεν το έχουμε προεπεξεργαστεί ακόμα – τότε δεν θα λειτουργήσει”, απαντώντας σε μια ερώτηση.
Με άλλα λόγια, ο Edge Copilot δεν συνοψίζει τόσο τα βίντεο όσο τα κείμενα από τις μεταγραφές των βίντεο. Το Copilot μπορεί επίσης να εκτελέσει μια παρόμοια λειτουργία σε όλο το Microsoft 365, συμπεριλαμβανομένου του συνοψισμού των βίντεο σε συναντήσεις και κλήσεις Teams για πράκτορες εξυπηρέτησης πελατών – και σε και τα δύο περιστατικά, το ήχος πρέπει πρώτα να μεταγραφεί από τη Microsoft. Επίσης, το Copilot στο Microsoft Stream μπορεί να συνοψίσει οποιοδήποτε βίντεο, αλλά πάλι απαιτεί από τους χρήστες να δημιουργήσουν μια γραπτή μεταγραφή.
Η συζήτηση ξεκίνησε μετά τη δημοσίευση του σχεδιαστή Pietro Schirano ενός οθόνης με το Edge Copilot να συνοψίζει ένα βίντεο από το YouTube για το trailer του GTA VI. Σε αυτήν την περίπτωση, το Copilot φάνηκε να κάνει τη δουλειά του άψογα. Ο χρήστης στην εγγραφή πατάει το κουμπί “Δημιουργία περίληψης βίντεο” στο πλευρικό μενού του Copilot και μετά από λίγα δευτερόλεπτα, το Copilot παράγει μια περίληψη, πλήρη με σημεία κορυφής και χρονοσήμανση.
Φυσικά, πολλές πλατφόρμες, συμπεριλαμβανομένων του YouTube και του Vimeo, μπορούν αυτόματα να δημιουργήσουν μεταγραφές και υπότιτλους – αν οι χρήστες ενεργοποιήσουν τη λειτουργία. Όταν το The Verge ρώτησε τον Parakhin στο X αν θα μπορούσαμε να υποθέσουμε ότι τα περισσότερα δημόσια διαθέσιμα βίντεο (π.χ. YouTube) δεν είχαν προ-επεξεργαστεί, απάντησε: “Θα πρέπει να λειτουργήσει για τα περισσότερα βίντεο.”
Το Copilot είναι μόνο το πιο πρόσφατο παράδειγμα στον ανταγωνισμό της Microsoft στον χώρο της δημιουργικής τεχνητής νοημοσύνης με τη Google (και άλλους). Τον προηγούμενο μήνα, η Google αναβάθμισε την επέκταση του YouTube για το chatbot της, Bard, για να του επιτρέψει να συνοψίσει το περιεχόμενο ενός βίντεο και να αναδεικνύει συγκεκριμένες πληροφορίες από αυτό. Αυτή την εβδομάδα, η Google ανακοίνωσε μια μεγάλη αναβάθμιση στο Gemini που έχει τα δικά του θέματα – η επεξεργασία της εταιρείας μπορεί να παρερμηνεύσει κάποιες από τις ικανότητες της τεχνητής νοημοσύνης σε μια παρουσίαση και δεν έχει πάντα τα στοιχεία της σωστά.
Ο Parakhin ήταν ειλικρινής σχετικά με τα διάφορα στάδια εξέλιξης του Copilot στα μέσα κοινωνικής δικτύωσης. Ενώ ήταν σε πτήση την Τρίτη το πρωί, ο ειδικός σε μηχανική μάθηση ανέβασε στο X: “Προσθήκη δυνατότητας για το Edge Copilot να χρησιμοποιεί πληροφορίες από βίντεο – σε πτήση.”