Tentative de réponses ci-dessous avec Damien Van Achter, consultant en médias et nouvelles technologies et professeur invité à l’IHECS.
Ce n’est plus de la science-fiction : il est désormais possible de générer du contenu vidéo grâce à l’IA. Et le résultat est tout simplement saisissant. Le 15 février, OpenAI a dévoilé Sora, son nouvel outil d’intelligence artificielle capable de transformer un texte en une vidéo réaliste.
En pratique, il est désormais possible en quelques clics de générer "des scènes complexes avec plusieurs personnages, des mouvements spécifiques et des détails précis" d’une durée maximum d’une minute indique le site internet d’OpenAI. Parmi les séquences dévoilées jeudi soir par OpenAI figurent notamment une bande-annonce photo-réaliste mettant en scène un homme marchant dans un vaste espace ou encore une animation en 3D d’une créature imaginaire qui semble sortir tout droit d’un film d’animation pour enfants.
Après avoir provoqué une première révolution avec ChatGPT, Open AI semble repousser une nouvelle fois les limites de l’intelligence artificielle. Si ces premiers essais sont bluffants, cette nouvelle prouesse technique suscite de nombreuses inquiétudes dans les domaines de la création artistiques et des médias. Certains crient au génie, d’autres se montrent inquiets. Faut-il craindre des répercussions sur l’emploi dans le secteur l’audiovisuel ? Ces images générées par intelligence artificielle vont-elles faire le jeu de la désinformation ?
Tentative de réponses ci-dessous avec Damien Van Achter, consultant en médias et nouvelles technologies et professeur invité à l’IHECS.
L’IA était déjà capable de générer des images fixes, elle est désormais en mesure de produire de la vidéo, une véritable prouesse ?
"Ce n’est pas vraiment une surprise. Comme toujours, on pensait qu’il faudrait encore attendre deux ou trois ans. Sauf que non, c’est pour demain. On savait qu’on était sur une courbe de développement exponentielle. Mais de là à voir une IA produire de la vidéo de cette qualité, c’est assez incroyable. Quand on en parle avec des experts des effets spéciaux au cinéma par exemple, notamment de ce qui est VFX, on se rend compte que ce que réalise OpenAI avec Sora est remarquable. Techniquement parlant, on ne pensait pas arriver à faire ça dès aujourd’hui. Mais ils l’ont fait."
Assiste-t-on aujourd’hui à un tournant dans le développement de l’intelligence artificielle ?
"Il s’agit en tout cas, d’une accélération exponentielle. Il faut bien se dire que la génération par intelligence artificielle, il y a deux ans, n’existait pas ou presque. Si tout cela se développe aussi rapidement aujourd’hui, c’est avant tout à cause de la course compétitive à laquelle se livrent Open AI et tous les autres. La concurrence est incroyablement rude, pour développer des solutions qui fonctionnent, mais aussi pour attirer certains talents. Il y a vraiment une guerre entre ces grosses boîtes qui travaillent sur l’IA pour attirer et garder ces talents qui sont capables de coder ces monstres de technologie que sont les IA. Et cela favorise cette croissance exponentielle et l’émergence de ces nouveaux outils."
Ces progrès technologiques sont presque vertigineux, est-ce que le grand public va y adhérer ?
"D’après les enquêtes qui sortent, et notamment en France récemment, il n’y a pas une appréhension particulière de la part du public vis-à-vis de l’IA. Qu’on le veuille ou non, on est déjà tous baignés en permanence dans des solutions, des produits et des contenus qui sont travaillés avec de l’intelligence artificielle. Dans le cas de Sora, on est sur un secteur qui est très spécifique, qui est la vidéo. Je pense que ces technologies ne sont pas en premier lieu destinées à être mises entre les mains du grand public. 'Monsieur et madame tout le monde' ne vont pas s’amuser à faire des prompts et à travailler de l’IA de cette façon-là. Ceux qui doivent réellement se préoccuper des répercussions, ce sont les professionnels de l’image."
Ces technologies génératives vont-elles avoir un réel impact sur l’industrie audiovisuelle ?
"C’est certain. Il va y avoir un changement de paradigme au niveau de l’emploi dans la création audiovisuelle. A priori, comme ça, la première industrie qui risque d’être impactée, c’est effectivement tout ce qui est industrie publicitaire, tous les shootings d’illustration où on filme du yogourt, des burgers, des voitures. Sans doute pas dès demain, mais à moyen terme, on va se retrouver avec de la vidéo entièrement produite par des IA. Pour les professionnels de la vidéo, l’IA va présenter des gains énormes de productivités. Le calcul est vite fait."
Est-ce que ces outils de génération de vidéo représentent une nouvelle menace pour l’information à l’heure où les deepfakes sévissent sur internet ?
"Je comprends évidemment les interrogations et les craintes qu’on peut avoir, que ce soit en termes d’emploi, de deepfakes, de cybersécurité ou encore d’éducation et de pédagogie vis-à-vis de ces nouveaux outils. Si le grand public n’est pas averti, il finira par consentir au fait de consommer des images générées par IA. Donc, oui cela pose beaucoup de questions. Plus que jamais, il faut faire en sorte que les médias, les journalistes et les institutions s’emparent de ces outils pour lutter à armes égales avec ceux qui voudraient en faire un usage à d’autres fins."
Capture d’écran d’une vidéo générée par Sora, mettant en scène des mammouths dans un paysage enneigé. © OpenAI
Il semble que la technologie ait toujours une longueur d’avance sur la société. Est-ce que ce décalage est inhérent au progrès ?
"Effectivement, le code informatique va toujours plus vite que le code législatif. Pour que structurellement, des institutions, des infrastructures bougent, ça prend du temps. Il y a un vrai enjeu de pédagogie et d’acculturation par rapport à ces questions-là, que l’on connaît déjà depuis quinze ans. Depuis qu’Internet existe, on sait qu’on est sur un changement de paradigme, ça prend du temps. Sauf que là, on n’a plus le temps. Il faut que les écoles s’en emparent, que les institutions s’en emparent. Il y a un vrai enjeu sociologique et de démocratie liée à l’usage des IA, et ça va bien au-delà de savoir si on est capable de générer des vidéos pour de la publicité pour des burgers ou des yogourts sans devoir payer des équipes entières de tournage."
Faut-il rester optimiste par rapport aux développements de l’IA ?
"Je reste assez convaincu qu’il vaut mieux voir le verre à moitié plein qu’à moitié vide. Parce que sinon, c’est abyssal. Si on ne se focalise que sur la destruction de valeurs, les enjeux de la perte de maîtrise ou de contrôle, on risque de tomber dans une forme de protectionnisme. Je ne suis pas convaincu que ce soit la meilleure façon de se projeter dans le siècle qui s’annonce. Il faut en être conscient et en tenir compte.
Mais il y a aussi une incroyable ouverture et libération de la créativité, de la capacité à s’emparer pour de bon de ces outils-là pour créer des nouveaux services, les mettre au service des utilisateurs, et peut-être faire en sorte qu’un certain nombre de tâches plus rébarbatif soient prises en charge par les machines et que l’humain continue à apporter sa plus-value. Ce sont des choses qui s’apprennent, se travaillent, s’encadrent et s’encouragent. Il est urgentissime que les hommes et les femmes politiques qui sont amenés à nous diriger demain à tous les échelons de pouvoir, prennent conscience à la fois du potentiel et des dangers de ces technologies afin d’offrir un cadre législatif qui permet à la fois de protéger mais aussi d’encourager l’initiative et l’entrepreneuriat."