Τον διάσημο πίνακα του Λεονάρντο ντα Βίντσι «Μόνα Λίζα» επέλεξε η Microsoft για να παρουσιάσει τις δυνατότητες του νέου εργαλείου τεχνητής νοημοσύνης, VASA-1.
Σύμφωνα με τους ερευνητές της Microsoft το νέο εργαλείο μπορεί να πάρει μια εικόνα ενός προσώπου και τον ήχο από κάποιο άλλο πρόσωπο για να δημιουργήσει ένα αληθοφανές βίντεο της ακίνητης εικόνας να μιλάει.
Ειδικά για το βίντεο με τη Μόνα Λίζα οι ερευνητές χρησιμοποίησαν τον κωμικό τρόπο με τον οποίο ερμήνευσε η Αν Χάθαγουεϊ το τραγούδι «Paparazzi». Για την ώρα η Microsoft λέει ότι δεν είναι στα άμεσα σχέδια της να κυκλοφορήσει στο κοινό το VASA-1.
Όπως εξήγησαν οι ερευνητές της εταιρείας το εργαλείο αυτό είναι σχεδιασμένο να αναγνωρίζει τις κινήσεις του κεφαλιού συμπεριλαμβανομένων, μεταξύ άλλων, της κίνησης των χειλιών, των εκφράσεων, του βλέμματος των ματιών, του ανοιγοκλεισίματος των ματιών.
Microsoft just dropped VASA-1.
— Min Choi (@minchoi) April 18, 2024
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
Το θες το φτιάξαμε! Με το ΝΕΟ APPLICATION του PAOPANTOU.GR σε Android και σε Iphone κρατάς στα χέρια σου τον πλανήτη Παναθηναϊκό! Follow το Paopantou.gr στο Google News. Θα μάθεις πρώτος τα πράσινα νέα στην Ελλάδα και τον υπόλοιπο κόσμο. Κάνε follow στο YOUTUBE του Paopantou, για να δεις on camera τους πρωταγωνιστές με το “τριφύλλι”. Δες απευθείας εκπομπές, κέρδισε καταπράσινα δώρα. Follow το paopantou στο Facebook, στο Twitter και στο Instagram για να μάθεις σε χρόνο dt όλα νέα