Pourquoi les deepfakes autorisés sont une grosse affaire
Natalie Monbiot, responsable de la stratégie de la société de médias synthétiques Hour One, n’aime pas le mot « deepfakes ».
« Deepfake implique une utilisation non autorisée de médias synthétiques et d’intelligence artificielle générative – nous sommes autorisés dès le départ », a-t-elle déclaré à VentureBeat.
Elle a décrit Hour One, basée à Tel-Aviv et à New York, comme une entreprise d’intelligence artificielle qui a également « construit un cadre juridique et éthique sur la manière de dialoguer avec de vraies personnes pour générer leur ressemblance sous forme numérique ».
Autorisé contre non autorisé. C’est une délimitation importante à une époque où les deepfakes, ou médias synthétiques dans lesquels une personne dans une image ou une vidéo existante est remplacée par la ressemblance de quelqu’un d’autre, ont reçu une cargaison de mauvaise presse – sans surprise, étant donné le lien de longue date des deepfakes avec vengeance porno et fausses nouvelles. Le terme « deepfake » peut être attribué à un utilisateur de Reddit en 2017 nommé « deepfakes » qui, avec d’autres membres de la communauté, a partagé des vidéos, dont beaucoup impliquaient des visages de célébrités échangés sur le corps d’actrices dans des vidéos pornographiques.
Et des menaces profondes se profilent, selon un récent article de recherche d’Eric Horvitz, directeur scientifique de Microsoft. Ceux-ci incluent des deepfakes interactifs, qui offrent l’illusion de parler à une personne réelle, et des deepfakes compositionnels, avec de mauvais acteurs créant de nombreux deepfakes pour compiler une « histoire synthétique ».
Plus récemment, les informations sur les deepfakes de célébrités ont proliféré. Il y a le MurStreet Couverture du journal des deepfakes de Tom Cruise, Elon Musk et Leonardo DiCaprio apparaissant non autorisés dans les publicités, ainsi que des rumeurs sur BruceWillisrenonçant aux droits de sa ressemblance profonde (ce n’est pas vrai).
Le côté commercial de le débat sur le deepfake
Mais il y a un autre aspect au débat sur les deepfakes, affirment plusieurs fournisseurs spécialisés dans la technologie des médias synthétiques. Qu’en est-il des deepfakes autorisés utilisés pour la production de vidéos professionnelles ?
La plupart des cas d’utilisation de vidéos deepfake, affirment-ils, sont entièrement autorisés. Ils peuvent se trouver dans des environnements d’entreprise – pour la formation des employés, l’éducation et le commerce électronique, par exemple. Ou ils peuvent être créés par des utilisateurs tels que des célébrités et des chefs d’entreprise qui souhaitent profiter des médias synthétiques pour « sous-traiter » à un jumeau virtuel.
L’idée, dans ces cas, est d’utiliser des médias synthétiques (sous la forme d’humains virtuels) pour relever les défis coûteux, complexes et inévolutifs de la production vidéo traditionnelle, en particulier à une époque où la soif de contenu vidéo semble insatiable. Hour One, par exemple, affirme avoir réalisé 100 000 vidéos au cours des trois derniers ans et demi, avec des clients tels que le leader de l’apprentissage des langues Berlitz et des sociétés de médias telles que NBC Universal et DreamWorks.
À un moment où l’IA générative fait désormais partie de l’air du temps culturel, l’avenir s’annonce prometteur pour les cas d’utilisation de deepfakes en entreprise. Forrester a récemment publié ses meilleures prédictions d’IA pour 2023, dont l’une est que 10 % des entreprises du Fortune 500 généreront du contenu avec des outils d’IA. Le rapport mentionne des startups telles que Hour One et Synthesia qui « utilisent l’IA pour accélérer la génération de contenu vidéo ».
Un autre rapport prédit qu’au cours des cinq à sept prochaines années, beaucoup as90 % de numérique médias pourraient être générés synthétiquement.
« Cela semblait très optimiste… probablement même pour moi », a déclaré Monbiot. « Mais à mesure que la technologie mûrit et que des acteurs massifs pénètrent dans cet espace, nous assistons à des perturbations. »
Le côté commercial est une partie « extrêmement sous-estimée » du débat sur les deepfakes, insiste Victor Riparbelli, PDG de Synthesia, basée à Londres, qui se décrit comme une « société de création vidéo basée sur l’IA ». Fondée en 2017, elle compte plus de 15 000 clients, une équipe de 135 personnes et « croît à deux chiffres chaque mois ». Parmi ses clients figurent des géants de la restauration rapide, dont McDonald’s, la société de recherche Teleperformance et la holding mondiale de publicité WPP.
« Il est très intéressant de voir à quel point l’objectif a été très étroit sur toutes les mauvaises choses que vous pourriez faire avec cette technologie », a déclaré Riparbelli. « Je pense que ce que nous avons vu est juste de plus en plus d’intérêt pour cela et de plus en plus de cas d’utilisation. »
Une vidéo vivante qui vous pouvez toujours modifier
Il est difficile d’accéder à un contenu de qualité et la plupart des entreprises n’ont pas les compétences nécessaires pour permettre la création de contenu de haute qualité, a déclaré Monbiot.
« La plupart des entreprises n’ont pas de personnes possédant des compétences permettant la création de contenu, en particulier la création de contenu de haute qualité mettant en vedette de vrais talents, et elles n’ont pas non plus la capacité d’éditer des vidéos ou d’avoir ce type de ressources en- maison », a-t-elle expliqué. Hour One est une plate-forme sans code, de sorte que même les utilisateurs sans compétences préalables dans la création de contenu peuvent choisir parmi une gamme d’humains virtuels ou en devenir eux-mêmes.
Berlitz, l’une des premières entreprises clientes de Hour One, avait besoin de se transformer numériquement après 150 ans d’enseignement en classe. « Pour garder l’instructeur dans le contenu, ils font des vidéoconférences en direct, mais cela n’évolue pas vraiment », a déclaré Monbiot. « Même s’ils disposaient de toutes les ressources de production du monde, le coût, l’investissement et la gestion de tous ces fichiers sont tout simplement insensés. » Elle a ajouté qu’avec l’IA, le contenu peut être continuellement mis à jour et actualisé. Aujourd’hui, Berlitz compte plus de 20 000 vidéos dans différentes langues créées avec Hour One.
En attendant, Synthesia a déclaré que son IA est entraînée sur de vrais acteurs. Il offre les images et les voix des acteurs en tant que personnages virtuels parmi lesquels les clients peuvent choisir pour créer des vidéos de formation, d’apprentissage, de conformité et de marketing. Les acteurs sont payés par vidéo générée avec eux.
Pour les entreprises clientes, cela devient une « vidéo vivante » sur laquelle ils peuvent toujours revenir et éditer, a expliqué Riparbelli.
« Je pense que nous travaillons actuellement pour presque toutes les plus grandes chaînes de restauration rapide du monde », a-t-il déclaré. « Ils doivent former des centaines de milliers de personnes chaque année, sur tout… comment rester en sécurité au travail, comment traiter une plainte d’un client, comment faire fonctionner la friteuse. »
Avant, dit-il, une entreprise pouvait enregistrer quelques vidéos, mais elles étaient de très haut niveau et toujours d’actualité. Toutes les autres formations se feraient probablement via des diapositives PowerPoint ou des PDF. « Ce n’est pas une excellente façon de s’entraîner, surtout pas la jeune génération », a-t-il déclaré. Au lieu de cela, ils créent maintenant du contenu vidéo – pour remplacer non pas les tournages vidéo d’origine, mais les options de texte.
Les accords d’autorisation sont essentiels
Hour One guide les utilisateurs tout au long du processus pour obtenir la capture vidéo de la plus haute qualité devant un écran vert. Le métrage de base devient les données d’entraînement pour l’IA.
« Nous créons essentiellement un jumeau numérique de cette personne – par exemple, un PDG », a déclaré Monbiot. « Le PDG signerait un accord nous permettant de prendre les images et créer un jumeau virtuel. Une autre partie de l’accord préciserait qui est autorisé à créer du contenu avec le jumeau virtuel.
« Nous voulons que les gens aient une expérience très positive, confortable et agréable avec notre contenu humain virtuel », a-t-elle déclaré. « Si les gens se sentent un peu confus ou mal à l’aise, cela crée de la méfiance, et c’est très contraire à la raison pour laquelle nous faisons ce que nous faisons. »
Selon Synthesia, ce type d’autorisation est courant dans tous les types d’accords de licence qui existent déjà.
« Kim Kardashian a littéralement autorisé sa ressemblance avec les développeurs d’applications pour créer un jeu qui a rapporté des milliards de dollars », a déclaré Riparbelli. « Chaque acteur ou célébrité autorise leur ressemblance. »
Offrir aux influenceurs leurs images à grande échelle
Une société de médias synthétiques, Deepcake, se penche moins sur l’espace de l’entreprise et plus sur les affaires de deepfakes autorisés utilisés par les célébrités et les influenceurs pour les recommandations de marque. Par exemple, la société a créé un « jumeau numérique » de Bruce Willis à utiliser dans une publicité pour la société de télécommunications russe MegaFon. Cela a conduit à la rumeur selon laquelle Deepcake détient les droits sur le jumeau numérique de Willis (ce qu’ils ne font pas).
« Nous travaillons directement avec des stars avec des agences de gestion des talents, pour développer des jumeaux numériques prêts à être intégrés à tout type de contenu, comme des publicités pour TikTok », a déclaré la PDG Maria Chmir. « Il s’agit d’une nouvelle façon de produire le contenu sans ressources classiques telles que la recherche constante des lieux et un processus de post-production très long et coûteux. »
Il existe également des personnes entièrement synthétisées qui peuvent devenir des ambassadrices de la marque pour quelques dizaines de dollars, a-t-elle ajouté. Les utilisateurs saisissent simplement le texte que ces caractères doivent dire.
« Bien sûr, vous ne pouvez pas cloner le charisme et faire improviser une personne, mais nous y travaillons », a-t-elle déclaré.
L’avenir des deepfakes autorisés
Synthesia dit ajouter des émotions et des gestes dans ses vidéos au cours des prochains mois. Hour One a récemment publié des environnements 3D pour créer une expérience « vraiment immersive ».
Les cas d’utilisation en entreprise autour des « deepfakes » de médias synthétiques ne font que commencer, a déclaré Monbiot, qui a ajouté : « Mais cette économie a déjà commencé ».
La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur les technologies d’entreprise transformatrices et d’effectuer des transactions. Découvrez nos Briefings.