mardi, 23 avril 2024

Processeurs texte-image IA : menace pour les créations ou nouvel outil dans la boîte à outils ?

Une image produite à partir de zéro par un concepteur de jeux vidéo à l’aide d’un outil d’intelligence artificielle a récemment remporté un concours d’art à la Colorado State Fair, comme cela a été couramment rapporté. Certains artistes s’alarment, mais devraient-ils l’être ?

L’œuvre générée par l’IA de Jason Allen « Théâtre D’opéra Spatial » a remporté la première place dans la catégorie numérique à la Colorado State Fair. https://t.co/6bFNFERCki

— VICE (@VICE) 2 septembre 2022

Depuis plusieurs années, l’IA a en fait été inclus dans les outils utilisés quotidiennement par les artistes, de la photographie informatique dans l’iPhone d’Apple aux outils d’amélioration d’image de Topaz Labs et Lightricks, et même des applications open source. En raison du fait qu’une image produite entièrement par un outil d’IA a remporté un concurrent, certains y voient un point de basculement – un signe d’un désastre de l’IA à venir qui conduira à un déplacement d’emploi répandu pour ceux qui travaillent dans des domaines imaginatifs consistant en style graphique et l’illustration, la photographie, le journalisme, l’écriture innovante et même l’avancement des logiciels.

Un tout nouveau générateur d’images IA semble être capable de créer de l’art qui semble 100 % humain. En tant qu’artiste, je suis exceptionnellement concerné. pic.twitter.com/JUSW0x8Woa

— RJ Palmer (@arvalis) 14 août 2022

Source : Twitter

L’image gagnante a été générée en utilisant Midjourney, un outil de synthèse texte-image basé sur le cloud créé par un petit laboratoire de recherche du même nom qui « vérifie de tout nouveaux médiums de pensée et élargit les pouvoirs créatifs des types humains ». Leur produit est un générateur de texte en image, le résultat de réseaux de neurones IA entraînés sur de vastes variétés d’images. L’entreprise n’a pas divulgué sa pile technologique, mais le PDG David Holz a déclaré qu’elle utilisait de grands modèles d’IA avec des milliards de paramètres. « Ils sont formés sur des milliards d’images. » Midjourney n’est sorti que récemment du mode furtif, actuellement des centaines de milliers de personnes utilisent le service.

Il y a tout d’un coup une prolifération d’outils comparables, y compris DALL-E d’OpenAI et Imagen de Google. Selon une histoire de Vanity Fair, Imagen fournit « des images photoréalistes [qui] sont beaucoup plus indiscernables de la chose authentique ». Stable Diffusion de Stability.ai est un autre nouvel outil de conversion de texte en image qui est open-source et peut fonctionner localement sur un PC avec une excellente carte graphique. Steady Diffusion peut également être utilisé via des services de génération d’art comprenant Artbreeder, Pixelz.ai et Lightricks.

Utiliser, c’est croire

En tant que photographe passionné et passionné qui expose son travail dans des galeries, j’ai mes propres problèmes que ces outils pourraient marquer l’achèvement de la photographie. J’ai décidé d’essayer moi-même Midjourney pour voir ce qu’il pourrait produire et pour bien mieux réfléchir aux ramifications possibles. L’image suivante a été produite en essayant des variations sur ces déclencheurs de texte : « Un lac vert émeraude soutenu par de hautes Rocheuses canadiennes Quelques plaques de neige sur les montagnes Des montagnes légères et douces tôt le matin avec une forêt de conifères verts Aube 4K UHD. »

Cela semble être un résultat fantastique pour un utilisateur débutant. Le temps total qu’il a fallu entre le moment où j’ai accédé initialement au système et la dernière image était inférieur à 30 minutes. Je dois avouer avoir vécu une merveille enfantine lorsque j’ai vu l’image émerger en quelques secondes à partir des invites que j’ai fournies. Cela a rappelé une citation vieille de 60 ans de l’écrivain de science-fiction et futuriste Arthur C. Clarke : « Toute technologie suffisamment innovante est indiscernable de la magie. » C’était comme de la magie.

Il y en a d’autres utilisant Midjourney qui montrent beaucoup plus de sophistication. Un utilisateur a produit une image « félin extraterrestre » à partir de plus de 30 invites de texte, dont : « extraterrestre félin avec des écailles scintillantes arc-en-ciel, rayonnant, hyper détaillé, micro-information, ultra grand angle, rendu octane, sensible… » Il semble que des invites plus complètes peuvent conduire à des images plus sophistiquées et de meilleure qualité.

Ces outils d’IA text-to-image sont déjà assez bons pour les entreprises. L’artiste imaginative Karen X. Cheng a été engagée pour développer une image de couverture produite par l’IA pour Cosmopolitan. Pour aider à créer des concepts et l’image finale, elle a utilisé DALL-E, ou plus particulièrement la version la plus récente, DALL-E 2. Cheng explique la procédure consistant à rechercher le bon ensemble d’invites, en gardant à l’esprit qu’elle a créé d’innombrables images, la personnalisation du texte se déclenche plusieurs fois pendant de nombreuses heures avant de trouver une image qui vous convient.

J’ai utilisé @OpenAI #dalle 2 pour produire la toute première couverture de publication générée par l’IA pour @Cosmopolitan !! Le moment que j’ai utilisé est à la fin de la vidéo #dalle pic.twitter.com/sbM2qbTAbq

— Karen X. Cheng (@karenxcheng) 27 juin 2022

Source : Twitter

Text-to-image : un tout nouvel outil ou un danger pour un mode de vie ?

Dans un post sur LinkedIn, Cheng a commenté : « Je pense que la réaction naturelle est de craindre que l’IA ne remplace les artistes humains. Certes, cette idée m’a traversé l’esprit, en particulier au début. Plus j’utilise DALL-E, moins Je vois cela comme un remplacement pour les humains, et plus je le vois comme un outil que les gens peuvent utiliser – un instrument à jouer. »

J’ai eu le même sentiment en utilisant Midjourney. J’ai publié l’image des Rocheuses canadiennes sur Flickr, un site Web de partage d’images pour les artistes – principalement des photographes professionnels et des artistes numériques – et j’ai demandé des avis. Plus précisément, je voulais savoir si les gens considéraient un générateur d’images IA comme une abomination et une menace ou juste un autre outil. Un professionnel a réagi : « J’ai aussi joué avec Midjourney. Je suis un créatif ! Comment ne pas jouer avec pour voir ce qu’il peut faire ? Je suis d’avis que les résultats sont de l’art, malgré le fait qu’il est généré par l’IA. Une créativité humaine produit le moment opportun, puis organise les résultats ou essaie d’amener une autre source du système. Je pense que c’est fantastique.

Un refrain typique dans le différend sur l’IA est que cela endommagera les tâches. La réaction à cette préoccupation est généralement double : dans un premier temps, de nombreux emplois existants seront améliorés par l’IA, de sorte que les humains et les fabricants qui collaborent produiront de bien meilleurs résultats en prolongeant l’imagination humaine, et non en la remplaçant ; 2ème, que l’IA créera également de nouveaux emplois, peut-être dans des domaines qui n’existaient pas dans le passé.

L’entrepreneur et influenceur Rob Lennon a prédit récemment que les générateurs de texte et d’images IA entraîneraient de toutes nouvelles opportunités de carrière, citant spécifiquement « l’ingénierie rapide ». Le prompt craft est l’art de savoir comment composer une invite pour obtenir des résultats idéaux d’une IA. Les meilleurs déclencheurs sont succincts tout en donnant le contexte de l’IA pour comprendre le résultat souhaité. Actuellement, PromptBase a commencé à commercialiser ce service. Sa plate-forme permet aux ingénieurs opportuns de « vendre des descriptions de texte qui produisent de manière fiable une conception artistique ou un sujet particulier sur une plate-forme d’IA spécifique ».

Megan Paetzhold, éditrice d’images à la publication new-yorkaise, a mis DALL-E à l’épreuve avec des missions qu’elle proposait généralement aux artistes de son équipe. En fin de compte, elle a appelé cela « un tirage au sort » et a gardé à l’esprit : « DALL-E ne m’a jamais offert une image gratifiante dès la première prise de vue – il y a toujours eu un processus d’atelier. » Elle a ajouté : « Au fur et à mesure que j’affinais mes stratégies, le processus commençait à devenir étonnamment collectif ; je travaillais DALL-E plutôt que lui. DALL-E me montrait son travail et je changeais mon temps jusqu’à ce que je sois heureux. »

N’y a-t-il pas un côté obscur ?

De toute évidence, ces outils peuvent être utilisés pour produire un contenu de haute qualité. Alors que de nombreux emplois imaginatifs pourraient finalement être menacés, en attendant, les générateurs de texte en image sont un exemple d’individus et de machines collaborant dans un tout nouveau domaine d’expédition créative. Moralement, la clé est de révéler qu’une image ou un texte a été créé à l’aide d’un générateur d’IA afin que les individus sachent que le matériel a réellement été produit par un appareil. Ils peuvent aimer le résultat ou non, et par conséquent, ce n’est pas différent de toute autre entreprise imaginative.

Ce point de vue ne plaira pas à tout le monde. De nombreux écrivains, photographes, illustrateurs et autres créatifs – même s’ils s’accordent à dire que les outils de génération d’IA n’ont pas de raffinement – pensent que ce n’est qu’une question de temps avant qu’eux, les spécialistes de l’innovation, ne soient changés par les makers. Le rédacteur en chef de la technologie Bloomberg, Vlad Savov, a résumé ces arguments, considérant ces outils à la fois comme une suppression et une arnaque des artistes. Il pourrait finalement avoir raison, bien que, comme l’a noté un répondant à ma question Flickr, « C’est un autre type d’art, qui n’est pas nécessairement mauvais et permet peut-être une imagination incroyable. » Un autre a écrit : « Je ne me sens pas menacé par l’IA. Peu importe ce qui change. » Cela fait. Je suppose que nous pensions simplement qu’il y aurait plus de temps.

Il est possible que ces outils ne soient qu’un de plus dans le kit de l’artiste. Ils serviront à produire des images et des textes qui seront appréciés et offerts. Comme l’écrit Jesus Diaz dans Quick Company : « Dès que vous tentez un programme de conversion de texte en image, la joie de l’intelligence artificielle apparaît indéniable malgré les nombreux dangers qui nous attendent. » Cela n’implique pas immédiatement que les poursuites imaginatives plus standard vont disparaître. Paradoxalement, il pourrait arriver un moment dans un avenir pas trop lointain où le « créé par l’homme » aura un prestige, et le travail produit sans image IA ou générateur de texte pourrait avoir une prime.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici