Η Microsoft, επέλεξε έναν εντυπωσιακό και οριακά τρομακτικό τρόπο για να παρουσιάσει τις δυνατότητες του νέου εργαλείου τεχνητής νοημοσύνης, VASA-1.
Έτσι, ο πασίγνωστος πίνακας του Λεονάρντο ντα Βίντσι «Μόνα Λίζα», «ζωντάνεψε» με τη βοήθεια των ερευνητών της Microsoft.
Το νέο εργαλείο μπορεί να πάρει την εικόνα ενός προσώπου καθώς και τον ήχο από κάποιο άλλο πρόσωπο, και να δημιουργήσει ένα αληθοφανές βίντεο μιας ακίνητης εικόνας να μιλάει.
Συγκεκριμένα για το βίντεο με τη Μόνα Λίζα, οι ερευνητές χρησιμοποίησαν τον κωμικό τρόπο με τον οποίο ερμήνευσε η Αν Χάθαγουεϊ το τραγούδι «Paparazzi».
Όπως εξήγησαν οι ερευνητές της εταιρείας το εργαλείο αυτό είναι σχεδιασμένο να αναγνωρίζει τις κινήσεις του κεφαλιού συμπεριλαμβανομένων, μεταξύ άλλων, τις κινήσεις των χειλιών, των εκφράσεων και του ανοιγοκλεισίματος των ματιών.
Το τραγούδι Paparazzi από την Αν Χάθαγουεϊ
Έτσι, ο πασίγνωστος πίνακας του Λεονάρντο ντα Βίντσι «Μόνα Λίζα», «ζωντάνεψε» με τη βοήθεια των ερευνητών της Microsoft.
Το νέο εργαλείο μπορεί να πάρει την εικόνα ενός προσώπου καθώς και τον ήχο από κάποιο άλλο πρόσωπο, και να δημιουργήσει ένα αληθοφανές βίντεο μιας ακίνητης εικόνας να μιλάει.
Microsoft just dropped VASA-1.
— Min Choi (@minchoi) April 18, 2024
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
Συγκεκριμένα για το βίντεο με τη Μόνα Λίζα, οι ερευνητές χρησιμοποίησαν τον κωμικό τρόπο με τον οποίο ερμήνευσε η Αν Χάθαγουεϊ το τραγούδι «Paparazzi».
Όπως εξήγησαν οι ερευνητές της εταιρείας το εργαλείο αυτό είναι σχεδιασμένο να αναγνωρίζει τις κινήσεις του κεφαλιού συμπεριλαμβανομένων, μεταξύ άλλων, τις κινήσεις των χειλιών, των εκφράσεων και του ανοιγοκλεισίματος των ματιών.
Το τραγούδι Paparazzi από την Αν Χάθαγουεϊ