Qu’ont ressenti les premiers spectateurs de l’Arrivée d’un train en gare de La Ciotat, projeté en 1896 ? La postérité a retenu que nombre d’entre eux, terrifiés, se sont enfuis, persuadés de se faire broyer par la locomotive qui fonçait sur eux s’ils restaient en place. Ce saisissement, qui peut attendrir nos cœurs d’humains de l’ère numérique, serait-il du même ordre que l’effet de sidération mêlé de crainte que soulèvent parfois les vidéos générées par l’IA ? C’est ce que suggère Bruno Ribeiro avec sa performance XXL baptisée Cellulo/d, bientôt présentée à la Fête des lumières de Lyon, sur les façades de la place des Terreaux. L’artiste y confronte les œuvres cinématographiques des frères Lumière aux visions «hallucinées» issues d’algorithmes. «Je crois que l’intelligence artificielle va changer la culture populaire, comme le cinéma en son temps.»
Après l’image statique (Midjourney, Dall-E…), la réalisation de vidéos via l’IA se démocratise à son tour, boostée par l’arrivée de programmes open source (jusqu’à quand ?) et commerciaux, qui la rend accessible à tous les non-codeurs pourvus d’un brin de patience, artistes compris. «Je ne pensais pas voir ça aussi vite», reconnaît Bruno Ribeiro. En quelques mois à peine, depuis ses premières recherches liées à Cellulo/d, de nouveaux logiciels et mises à jour sont sortis, qui permettent la création d’images animées sur la base de simples «prompts» (de courts textes décrivant la scène souhaitée, servant de commande écrite à l’IA), en puisant dans de nébuleuses bases de données. «C’est la jungle», glisse un acteur du secteur. «La possibilité, pour tous, de générer des vidéos à partir d’instructions écrites en est encore à ses débuts, mais cela se développe à vitesse grand V», confirme Eric Prigent, coordinateur pédagogique au Fresnoy, studio des arts contemporains de Tourcoing. Chez Vidéoformes, festival international d’arts hybrides et numériques, on confirme la tendance : en 2023, un tiers des 800 vidéos reçues par le jury faisaient appel à l’IA générative, alors que le phénomène restait négligeable les années précédentes.
Entrouvrir le capot d’intelligences artificielles aux allures de boîtes noires
Dans son atelier à la Ménagerie de verre, à Paris, Bruno Ribeiro partage des extraits de Cellulo/d, en amont de la projection lyonnaise. Les scènes en noir et blanc du cinéma muet mutent au fil du film, évoquant tantôt un univers de western, une cité contemporaine ou une colonie spatiale. Les silhouettes et les visages engendrés par l’IA vacillent dans une instabilité constante («on croirait un Golem tentant d’imiter un humain», sourit-il), et les manquements au réalisme sont nombreux. Surtout, il y a cette sensation d’image «clichée», créée à base de mots-clés éculés (des canyons et des blue-jeans pour figurer le Far West, des cosmonautes pour signaler l’espace, des couleurs froides pour dépeindre un environnement futuriste…).
Autant de faiblesses dont l’artiste ne se défausse pas : ce sont justement ces limites, ces erreurs qui l’intéressent, parce qu’elles dévoilent le fonctionnement de l’IA et donnent matière à penser. «Ce que je mets en scène, ce sont les balbutiements et les rouages de l’IA générative de vidéos. J’aime montrer les coulisses et les déraillements. Je préfère souvent les making-of aux films !» Ici, en fait de plateau de cinéma, ce sont les prompts qu’il choisit d’exposer aux yeux du public, bien visibles, au côté des images. Une manière d’entrouvrir le capot d’intelligences artificielles aux allures de boîtes noires. Tapez une succession de mots-clés (exemple : «cosmonautes attendant sur une plateforme, ville futuriste la nuit, un vaisseau spatial passe. Bâtiments en arrière-plan, particules de poussière, débris, 8K, éclairage cinématographique, nuit, HDR, lumières vives de profondeur de champ…») dans un programme d’IA générative tel que Stable Diffusion ou Warp Fusion, et hop, une vidéo apparaît. Difficile de rester de marbre devant la rapidité et la facilité de la manœuvre.
«J’adore cette part d’aléatoire, qui exige un lâcher-prise»
De quoi alimenter le fantasme d’un remplacement de l’artiste par l’IA, et une autonomie de la machine ? Cette vision agace Grégory Chatonsky, pionnier du «Net-art» : «Le fait que les images apparaissent, qu’elles bougent, génère quelque chose de l’ordre du délire, du fantasme d’une machine télépathe.» Plonger quelques lignes de prompt dans une IA ne suffit pas à devenir artiste, n’en déplaise aux stratégies de vente des Gafam («des superpouvoirs à la demande !»). «Si le propos et l’esthétique ne sont pas intéressants, singuliers, rigoureux, on tombe très vite dans l’anecdotique», tranche le directeur de Vidéoformes, Gabriel Soucheyre. C’est bien là l’intérêt d’une démarche artistique que de dépasser la fascination première pour aborder de manière critique les possibles de l’IA générative, les étirer, les débrider et les détourner à l’envi. Bref, de faire de l’intelligence artificielle davantage qu’un outil, un espace de recherche et de tentatives. Et même, plaide Grégory Chatonsky, «une manière d’aborder le monde et de naviguer dans la culture humaine, dont la quantité de datas après trente ans d’accumulation sur le Web est devenue inaccessible».
Les données : nerf de la guerre ! C’est bien là, dans les millions de visuels glanés sur le Web qui nourrissent les modèles d’apprentissage automatique, que réside la nouveauté de ces programmes d’IA génératives (plutôt que la question du prompt, dont l’équivalent existait déjà en code informatique). Certains artistes y trouvent leur compte, et jouent de l’incertitude qu’elle provoque. Bruno Ribeiro : «La plupart du temps, un prompt ne donne rien d’intéressant. Mais en modifiant une seule valeur, on peut obtenir quelque chose de très différent. J’adore cette part d’aléatoire, qui exige un lâcher-prise.» D’autres préfèrent s’en émanciper, et créent leur propre base de données, à la manière des premiers net-artistes. C’est le cas de Justine Emard, qui voit dans l’IA une machine à même d’aller au-delà «du réel tangible de l’être humain». Un révélateur de l’invisible. Pour son projet Hyperphantasia, qui propose de connecter le contemporain aux premières images de l’humanité («relier le pixel à la particule de charbon», dit-elle plus joliment), elle a fabriqué de nouvelles images semblant venir de la préhistoire, en entraînant «son» réseau de neurones synthétiques à partir d’un fond de milliers de visuels issus du Conservatoire de la grotte Chauvet-Pont-d’Arc. L’argument est à la fois éthique, écologique et esthétique : il s’agit de refuser d’utiliser le travail d’auteurs non rémunérés, tout comme les performances de compagnies de serveurs lointaines – l’artiste a opté pour un data center parisien. Mais aussi d’éviter les biais des images fournies par les programmes d’IA générative, reposant sur d’opaques bases de données, souvent américaines.
Absence de renouvellement des imaginaires
Au final, nombre de créateurs et d’acteurs du secteur s’accordent sur ce point : en l’absence de réel travail et de choix forts, les résultats de Stable Diffusion et autres programmes sont ultrastéréotypés. «Effrayants d’homogénéité», nous dit l’un, tandis qu’un autre y voit un effet «so what», une «absence de surprise», une sensation de «déjà-vu, comme au McDo». Ainsi, le futur n’est figuré que par une imagerie SF ou fantasy, la femme n’existe qu’à travers des canons de beauté occidentaux, la figure du médecin est toujours un homme… Une certitude, pour Justine Emard : l’absence de renouvellement des imaginaires. Qui nourrit les IA ? Vraie question, abonde Ethel Lilienfeld, autre artiste trouble-fête des Gafam. «Il faut être conscient que ces images renforcent les clichés existants, que ces IA ne sont pas neutres.»
Dans son court-métrage EMI, qui met en scène la gloire et la chute d’une influenceuse virtuelle, chevelure fluo sur teint blanc, elle a fait appel à Dall-E pour enrichir ses idées de cadre et de couleurs. Quand le rideau tombe à la fin du film, le masque virtuel se déchire, et le double de chair et d’os de la nymphette apparaît. Scoop : derrière les IA se cachent encore des humains.