in Innovation

Text-to-Video – Η τεχνητή νοημοσύνη της NVIDIA φέρνει την επανάσταση στο video

Παραγωγή video απλά με περιγραφή κειμένου

22 Απριλίου, 2023, 5:00 μμ

Η τεχνητή νοημοσύνη είναι πλέον mainstream, με εργαλεία όπως το ChatGPT και το Midjourney να είναι σε θέση να παράγουν κείμενο και εικόνες.

Η NVIDIA το πάει όμως στο επόμενο επίπεδο.

Το Toronto AI Lab της εταιρίας ανέπτυξε τα Latent Diffusion Models (LDMs) τα οποία είναι σε θέση να παράγουν videos χωρίς την ανάγκη μεγάλης υπολογιστικής δύναμης. Με λίγα λόγια, η τεχνολογία αυτή μπορεί να παράγει video αποτελέσματα από απλές εντολές κειμένου.

Για παράδειγμα, με την εντολή “ένας strormtrooper να σκουπίζει την παραλία με ηλεκτρική σκούπα” παρήγαγε το παρακάτω GIF.

Η παραγωγική τεχνητή νοημοσύνη της NVIDIA μπορεί να μετατρέψει ακίνητες εικόνες με έναν ρεαλιστικό τρόπο και να τις κάνει upscale με διάφορες τεχνικές.

Έτσι, μπορεί να παράγει ένα σύντομο βίντεο 4.7 δευτερολέπτων με ανάλυση 1280×2048. Αυτή η εξέλιξη βέβαια σημαίνει πως δε θα αργήσουμε να δούμε και ακόμα μεγαλύτερα σε διάρκεια videos.

Προς το παρόν μιλάμε απλά για δημιουργία GIF πρακτικά, αλλά πολύ σύντομα θα μιλάμε για εκδημοκρατισμό της δημιουργίας video από χρήστες που δεν έχουν τις τεχνικές γνώσεις ή ακόμα παραπέρα, θα μιλάμε σύντομα για αυτοματοποιημένες παραγωγές ταινιών…