Οι φωτογραφίες των σκύλων μπορούν να χρησιμοποιηθούν για την ακριβέστερη δημιουργία τρισδιάστατων μοντέλων, όπως αποκαλύπτει μελέτη.
Ερευνητές του Πανεπιστημίου του Surrey δίδαξαν ένα σύστημα τεχνητής νοημοσύνης (AI) να προβλέπει την τρισδιάστατη στάση από μια δισδιάστατη εικόνα ενός σκύλου.
Μια μυριάδα εικονικών σκύλων δημιουργήθηκε χρησιμοποιώντας το βιντεοπαιχνίδι Grand Theft Auto.
Η μεταπτυχιακή φοιτήτρια Moira Shooter δήλωσε: “Από την οικολογία έως την εμψύχωση, αυτή η κομψή λύση έχει τόσες πολλές πιθανές χρήσεις”.
Ένας τρόπος για να μάθει η τεχνητή νοημοσύνη να παίρνει τρισδιάστατες πληροφορίες από δισδιάστατες εικόνες είναι να της δείχνετε φωτογραφίες δίνοντάς της ταυτόχρονα πληροφορίες για την τρισδιάστατη “βασική αλήθεια” – πού βρίσκονται τα αντικείμενα στον τρισδιάστατο χώρο.
Για τους ανθρώπους, αυτό σημαίνει να φορούν στολές καταγραφής κίνησης.
Μη μπορώντας να αντιγράψουν το ίδιο με σκύλους, οι ερευνητές τροποποίησαν τον κώδικα του Grand Theft Auto V, αλλάζοντας τον κύριο χαρακτήρα με μία από τις οκτώ ράτσες σκύλων – μια διαδικασία γνωστή ως modding.
Δημιούργησαν 118 βίντεο με τα σκυλιά να κάθονται, να περπατούν, να γαβγίζουν και να τρέχουν σε διάφορες καιρικές συνθήκες και συνθήκες φωτισμού.
Η ομάδα ονόμασε τη νέα τους βάση δεδομένων DigiDogs, η οποία αποτελούνταν από 27.900 καρέ.
Τώρα σχεδιάζουν να τελειοποιήσουν το σύστημα χρησιμοποιώντας το μοντέλο DINOv2 της Meta για να βεβαιωθούν ότι μπορεί να προβλέψει μια τρισδιάστατη πόζα εξίσου καλά από πραγματικές φωτογραφίες σκύλων.
“Το μοντέλο μας εκπαιδεύτηκε σε σκύλους CGI, αλλά μπορέσαμε να το χρησιμοποιήσουμε για να φτιάξουμε τρισδιάστατα σκελετικά μοντέλα από φωτογραφίες πραγματικών ζώων”, δήλωσε η κ. Shooter.
“Αυτό θα μπορούσε να επιτρέψει στους συντηρητές να εντοπίσουν τραυματισμένα άγρια ζώα ή να βοηθήσει τους καλλιτέχνες να δημιουργήσουν πιο ρεαλιστικά ζώα στο metaverse.
Και πρόσθεσε: “Οι τρισδιάστατες πόζες περιέχουν πολύ περισσότερες πληροφορίες από ό,τι οι δισδιάστατες φωτογραφίες”.