Nvidia a fait un outil d'animation faciale basé sur le son open source

Nvidia a fait le véhicule Audio2Face, qui produit une animation faciale basée sur le son, Open -Source. Les développeurs seront désormais en mesure d'adapter facilement cette technologie à leurs propres projets. L'objectif de l'entreprise est que les animations faciales peuvent être utilisées dans une zone plus commune et l'accès est plus facile.

Audo2Face analyse les fonctionnalités acoustiques dans un enregistrement audio en profondeur. Sur la base de ces données, les expressions faciales sont compatibles avec les mouvements des lèvres. Ainsi, les avatars numériques capturent un flux naturel pendant le discours. De plus, le système peut être utilisé non seulement dans le contenu préparé, mais aussi dans les émissions en direct. Dans les deux scénarios, l'utilisateur offre une expérience plus réaliste.

https://www.youtube.com/watch?v=dm8-gnin76c

Certains studios de jeu ont déjà expérimenté Audo2face. Farm51, qui travaille sur la Chernobylite 2: Exclusion Zone, a renforcé les expressions faciales des personnages grâce à cette technologie. Alien: Rogue Incursion Evolved Edition, les développeurs ont également inclus des projets intermédiaires. En plus de tous ces éléments, des essais similaires devraient se faire dans différents types de jeux. Cela montre à quel point Audio2Face est applicable à grande échelle.

Nvidia Audio2Face donne aux développeurs la possibilité d'adapter leurs modèles

NVIDIA a présenté la flexibilité aux développeurs en partageant non seulement l'intermédiaire mais aussi le cadre de formation. Ainsi, les modèles existants peuvent être réduits en fonction de différentes langues et accents. Cela contribue à l'émergence d'avatars plus inclusifs et polyvalents. Cependant, les résultats peuvent être limités si ce processus n'est pas pris en charge par des ensembles de données corrects. En plus de tout cela, il existe une excellente opportunité pour les équipes qui souhaitent produire des solutions personnalisées.

Ces technologies ne se limitent pas au terrain de jeu. Les plateformes de formation, les réunions virtuelles et les applications de médias sociaux sont également des candidats solides à utiliser. Les utilisateurs peuvent interagir avec des caractères numériques qui réagissent avec des expressions faciales plus naturelles. De plus, des fonctionnalités telles que la synchronisation des lèvres dans l'apprentissage des langues créent un avantage supplémentaire. D'un autre côté, cette diversité augmente la valeur de la technologie.

Malgré tout, il semble inévitable que certains problèmes surviennent. L'utilisation non autorisée du son ou de la production d'ingrédients manipulateurs est un risque. Pour cette raison, les développeurs doivent agir avec la conscience de la responsabilité éthique. La confiance des utilisateurs est l'élément le plus critique pour la propagation de ces outils. En plus de tout cela, comment façonner les réglementations est une question de curiosité.

D'un autre côté, Audio2Face offre de sérieux avantages pour les développeurs indépendants. Il permet de produire une animation faciale au même niveau que les studios à budget élevé. Ainsi, les petites équipes peuvent augmenter leur compétitivité. Du côté de l'utilisateur, l'expérience de jeu devient plus immersive. Cela peut augmenter la barre de qualité dans l'industrie.

De plus, des scénarios d'utilisation importants dans le domaine de l'éducation se distinguent. Les avatars des enseignants virtuels peuvent contribuer au processus d'apprentissage en augmentant l'intérêt des élèves. L'accompagnement des mouvements des lèvres droits pendant la formation en langue étrangère peut aider à développer la prononciation. De cette façon, les élèves peuvent dépenser le processus d'apprentissage plus efficacement. En plus de tous ces éléments, les établissements d'enseignement ont des solutions efficaces à faible coût.

Mais le fait qu'AUDO2FACE soit devenu open source ouvre également la voie à ses collaborations. Les développeurs peuvent enrichir le véhicule en partageant leurs bibliothèques. Cette approche crée un écosystème basé sur la communauté. Chaque nouvelle contribution permet un peu plus de capacités d'Audio2Face. Ainsi, la technologie devient le produit de l'effort commun.

La décision de Nvidia permettra d'utiliser des animations faciales basées sur le son plus répandues à l'avenir. Les développeurs auront une infrastructure flexible en fonction de leurs besoins. Les utilisateurs seront confrontés à des caractères numériques plus naturels. Tous ces développements semblent candidats pour améliorer la qualité des expériences interactives.