Chris Anderson : Tom, votre entreprise est devenue incontournable avec le lancement d’une vidéo d’un faux Tom Cruise, DeepTomCruise, qui a attiré des milliards de vues sur TikTok et Instagram. Ceci mène à ma première question, pourrions-nous, ici, à TED, avoir notre propre vidéo de Tom Cruise ? 
Tom Graham : Je savais que vous alliez me le demander. Alors, on en a fait une. Regardons cela ensemble. 
CA : Allons-y ! 
(Vidéo) DeepTomCruise : Salut l’Internet ! Je suis au nord de la frontière, 
(Rit) 
à la conférence TED. Ce n’est pas le surnom de Théodore, personne ne m’appelle Thomas, on est cool. C’est Tom à TED. Oui, au Canada. 
(Rit) 
Sans plaisanter, tout le monde est très très courtois ici. Surtout les baleines. 
(Rit) 
CA : Comment avez-vous fait ça ? 
TG : À Metaphysic, on crée du contenu généré artificiellement qui ressemble parfaitement à la réalité. On prend des données du vrai monde, on entraîne les réseaux neuronaux, qui peuvent, plus précisément que les effets spéciaux numériques, créer ce type de contenu qui semble si naturel. C’est un très bel exemple d’IA qui est comme inspirée par l’action naturelle d’une personne, et on met le visage par-dessus. 
CA : Cela aide aussi que votre co-fondateur soit un très bon imitateur de Tom Cruise. 
TG : Certes, Miles Fisher est presque Tom Cruise, mais pas Tom Cruise. 
CA : Vous avez un autre exemple, il me semble. Pouvons-nous le regarder ? 
TG : Avec plaisir. Au-delà des visages, il s’agit des voix. 
[Performance originale chantée en espagnol] 
[Synchronisation son-visage] 
[Performance générée par l’IA image et son] 
CA : Que se passe-t-il ici ? 
TG : Ici, on a une voix d’une femme qui chante en espagnol et Aloe Blacc, qui chante « Wake Me Up », une chanson écrite avec et pour Avicii. On a transféré la voix de la femme sur le visage d’Aloe, donc, il ne chante pas en espagnol. Et après on transfère à nouveau la voix féminine dans sa voix à lui. Donc, n’importe qui à l’avenir pourra parler n’importe quelle langue. Cela aura l’air parfaitement naturel. Il est de plus en plus aisé de créer ce genre de contenu et un jour, on atteindra un stade où nous serons tous l’acteur principal de notre propre contenu sur Internet. 
CA : D’accord. 
(Rires) 
Avant de creuser davantage, après tout, on vient de voir une vidéo préenregistrée. Mais on dit que c’est possible de faire ça en direct. Est-ce vrai ? 
TG : Oui, c’est possible en direct. C’est vraiment à la pointe de ce que nous pouvons accomplir actuellement en quittant le traitement hors-ligne, pour atteindre une vitesse de traitement si rapide que le direct est possible. 
CA : Je vous mets au défi alors de nous montrer cela. Voici une vidéo de vous sur l’écran. Surprenez-nous... 
(Rires) 
Oh, mon dieu... 
TG : Allons-y alors ! Voici un modèle de Chris en direct, superposé à moi, en temps réel. 
CA : Et après, vous allez me dire qu’il peut... 
(Rires) 
Oh, mon dieu. Cela me met vraiment mal à l’aise. 
(Rires) 
Je suis vraiment mal à l’aise. Il peut faire la voix aussi ? 
TG : Hum. 
(La voix de Chris Anderson générée par IA) Nous pensons pouvoir désormais repousser les limites de l’IA. Je parle exactement comme je le ferais en tant que Thomas Graham mais cela est produit comme le seul et unique Chris. 
CA : Je suis profondément navré de vous faire subir cela. Vous savez, il y a peut-être pire. Pour être transparent, on a pris quelques vidéos de moi il y a quelques semaines, sur lesquelles j’ai des expressions diverses, pour préparer le modèle. Et le fait est, je l’ai découvert cette semaine, qu’on peut appliquer ça sur tout le monde, par seulement Tom. 
Mon amie proche, Sunny Bates, est présente avec nous. Sunny, acceptes-tu de canaliser mon moi intérieur pour un instant ? Peut-on essayer ? Je suis très inquiet. 
(Rires) 
Sunny est-elle sur l’écran ? Ah, la voici. Oh non, oh non. 
(Rires) Oh non. 
(Rires) 
TG : Chris, tu as l’air fantastique. 
CA : C’est bon, ça suffit, arrêtez ça tout de suite. 
(Sunny Bates articulant) Plus, plus ! 
TG : Oui, oui. 
CA : Tom, Sunny Bates est la personne qui m’a présenté TED. Sans elle, personne ne serait ici aujourd’hui. Et c’est ainsi qu’on la remercie ? 
TG : Maintenant, vous êtes enfin devenu le maître, vous savez. 
CA : Oooh ! Écoutez... OK ! Incroyable ! On a tous manifestement remarqué que certaines choses pourraient horriblement mal tourner avec ça. 
(Rires) On en a déjà des exemples en ligne, des photos de Trump en cours d’arrestation qui n’étaient pas réelles, il y en a peut-être des vidéos. On pense à une pornographie utilisant les visages de célébrités. Toutes ces choses déjà vues, les deepfakes. Que pensez-vous de ce côté obscur de la technologie ? 
TG : Personnellement, on développe tout ça et ça m’inquiète. Être inquiet est le bon instinct à cultiver. Au-delà de ça, pensons à comment nous préparer. Comment pouvons-nous tenter d’influer sur un avenir lancé dans cette direction, où, en tant que personne, cela va devenir compliqué de distinguer ce qui est généré par un ordinateur et ce qui est réel. Il y a des choses que nous pouvons faire. Éveiller une conscience publique sur les médias manipulés. Voilà une action, et cette scène est appropriée à ça. 
CA : Êtes-vous en train de dire que si même si vous fermiez votre entreprise aujourd’hui, les deepfakes ne disparaîtraient pas, car la technologie existe et elle va se déployer quoi qu’il arrive, que vous ne contrôlez pas ça ? 
TG : En effet. Ce contenu est si attirant. Si on veut entrer dans le contenu - et ça pourrait être parler à des êtres chers ou parler à nos amis à la plage - et ce contenu a une apparence réaliste, cela devient si attirant que tout le monde essaie d’en créer. Tous les processeurs graphiques de l’univers cherchent à vouloir faire ça. C’est pour ça que ce que fait une personne n’a pas d’importance. Cela va arriver, et très très vite. 
CA : On parlera des aspects positifs dans une minute. Mais il semble que nous allons devoir nous habituer à un monde où nous et nos enfants ne pourront plus croire les preuves que l’on verra. 
TG : Je le crains. On va devoir comprendre de nouvelles institutions pour vérifier ce qui est un média authentique. Mais nous pouvons aussi aller dans le sens des choses créatives qui vont naître. Il y a aussi des avantages. Il y aura des adaptations. 
CA : Parlons des avantages. Sur le plan de l’amusement, le nombre de possibilités est incroyable. On a Tom Cruise et on pourrait avoir « Mission: Impossible 273 » en 2150. Il sera avec nous pour toujours. 
TG : On travaille sur l’épisode 75 001. 
CA : C’est vraiment incroyable. Il y a beaucoup personnes dans le monde, et avec leur permission, on pourra avoir la possibilité de faire davantage avec eux. Parlons donc des avantages possibles. 
TG : Notre constat, en développant ces contenus, et en observant les gens interagir avec, surtout quand ils interagissent avec eux-mêmes, cela peut-être leur version âgée de 20 ans, ou une interaction avec leur partenaire, mais la version jeune de leur partenaire, il y a une connexion émotionnelle intense issue du contenu super photoréaliste au-delà du surnaturel. Et si nous commençons à déployer ça parmi la population, si on passe à l’échelle pour que ça fonctionne avec tout le monde, alors on va obtenir des relations et des interactions humaines en ligne, plus intéressantes, plus pleines de sens. Or depuis la pandémie, on passe plus de temps en ligne. Mais c’est du chat et des courriels. Si on pouvait avoir plus d’émotions humaines, plus de sentiments, ne serait-ce pas mieux ? 
L’éducation est un bon exemple. On pourrait avoir un professeur inspirant dans des milliers de classes dans le monde, parlant toutes les langues du monde simultanément, et les étudiants pourraient interagir entre eux, d’une façon plus puissante que Zoom. Il pourrait y avoir de réels échanges culturels et une réelle sociabilisation. On peut faire mille fois mieux. 
CA : L’exemple du professeur est très puissant. Un seul professeur pourrait donc transformer une leçon écrite en vidéo dans n’importe quelle langue et ce, à l’infini. Cela semble être une véritable amplification potentielle des bonnes intentions de l’Homme. Cela m’enthousiasme ! Mais je ne comprends pas bien l’angle familial. Quand on veut avoir un lien humain avec un membre de sa famille, les gens ne vont-ils pas trouver ça glauque ? « Oh mon dieu, je regardais justement ton avatar et je pensais que c’était toi ! » Ne serait-ce pas glauque ? 
TG : Certes, il y a un élément glauque. Mais quand on va au-delà et que le côté étrange disparaît, que le médium disparaît, il reste le contenu et le lien. Imaginez à présent que, si je compile des données de mes grands-parents aujourd’hui, à l’avenir, je pourrais revivre le temps passé avec eux et communiquer avec eux. Cela ne leur apportera probablement rien de bon car ils seront alors dans l’au-delà. Mais moi, cela va m’aider à connaître mon identité et ma relation avec eux. L’idée de découpler, en quelque sorte, l’expérience humaine, à la fois du lieu où elle survient, et du moment où elle survient, nous permet, je pense, de créer ces expériences avec un média hyper réel et photo-réaliste nous donnant la possibilité de partager le meilleur de notre vécu et de nous. 
CA : Je suis curieux de savoir qui exactement ressent cela aujourd’hui. Je suppose qu’il y aura beaucoup d’expérimentations et de choses qui vont nous effrayer. Peut-être aussi trouverons-nous des choses absolument fabuleuses. J’ai une question importante : comment, diantre, puis-je me contrôler ? Je suis sur la vidéo. Qu’est-ce qui va empêcher quiconque d’abuser de moi sur Internet ? 
TG : Bonne question. Dès que nous autorisons les entreprises à créer des expériences réalistes, nous devons, en tant que personne, pouvoir posséder nos propres données, celles utilisées dans l’apprentissage des algorithmes et pouvoir contrôler comment nos avatars photo-réalistes sont créés et où ils sont utilisés. 
Dans cette optique, je recherchais des instances légales traditionnelles, existantes, pour déterminer comment créer de nouveaux droits. Alors, j’ai créé mon avatar photo-réaliste et je l’ai soumis à l’Agence de la propriété intellectuelle, pour voir s’il allait enregistrer mes droits d’auteur et voici la vidéo. 
(Vidéo) TG : Voici ma version réaliste générée par IA. Même si l’apparence de cette représentation de moi faite par une IA peut varier cosmétiquement parlant, ou si je change ma coupe de cheveux ou ajoute des éléments créatifs, mon intention est de créer une version IA de moi, qui incarne l’essence de qui je suis en tant que personne en toutes circonstances. 
CA : Waouh ! Vous venez de nous démontrer ce qui va être le thème récurrent de cette conférence : l’avenir va être en même temps bizarre et merveilleux. L’avenir nous le dira quel sera l’équilibre entre les deux. Mais c’est un monde où chacun d’entre nous devra penser autrement qui nous sommes et réclamer ces droits. Ce que vous dites, est-ce que si nous avons ce droit, on peut imaginer un monde où, par exemple, si une vidéo devient virale sur YouTube sans notre consentement, on pourra la retirer grâce à ces liens vers nos droits ? 
TG : Exactement, la chose la plus importante que nous puissions faire, quand il s’agit de données du monde réel capables de nourrir le virtuel, c’est posséder nos droits de propriété sur nos données. Il ne faut pas accepter les conditions d’utilisation et abandonner nos droits. Si on les possède, on peut les contrôler. Et on est ainsi au même niveau que la commercialisation et l’utilisation qui vont se déployer dans l’histoire. La route sera longue, mais on a déjà commencé. 
CA : Tom Graham, merci pour avoir partagé tant de choses avec nous à TED. Sunny Bates, excuse-moi. 
(Rires) 
(Applaudissements) 
