Actualités | News IA générative : l’IA vidéo Google Veo, un clip 100% Sora, maj Midjourney, Firefly 3, Premiere Pro, Stable Diff 3… [mai 2024]

News IA générative : l’IA vidéo Google Veo, un clip 100% Sora, maj Midjourney, Firefly 3, Premiere Pro, Stable Diff 3… [mai 2024]

Bienvenue sur notre page des news IA générative !

…une chronique tenue régulièrement, qui traite des nouveautés des outils d’intelligence artificielle dans nos métiers audiovisuels : graphisme, photographie, 3D, réalisation vidéo/film… Les outils IA génératifs évoluent très vite, et révolutionnent peu à peu nos pratiques !

Vous former à l’IA générative ?

Google présente sa nouvelle IA vidéo générative : Veo

Après Lumière (et ses prédécesseurs), voici Google Veo : donné comme très bon concurrent de Sora (toujours pas sorti), Veo s’appuie sur Gemini (pour analyser des films et produire des prompts) et produirait des séquences réalistes, avec une fine compréhension de termes cinéma… Les premières images ne font pas très envie, mais l’avenir le dira… Google affirme être prudent sur la fabrication d’images réalistes, dans un contexte de fake news, et chaque séquence générée serait « watermarkée ». Veo n’est pas du tout dispo mais Google a commencé à collaborer avec des artistes…

L’artiste vidéo Paul Trillo réalise le clip de Whashed Out, avec Sora

Composé de séquences en travelling « infini », Paul Trillo raconte un peu sa méthode et son expérience de Sora, l’IA générative vidéo d’OpenAI, pour le moment non publique, que quelques artistes ont pu tester… Manifestement il n’a pas souffert de la non cohérence des éléments générés, d’un plan à l’autre : il a réussi à produire des plans séquences longs, avec un couple référent dans sa « narration » : une jeune femme rousse et un jeune homme à l’épaisse tignasse brune… qui « mutent » à chaque plan séquence ! Mais cela forme malgré cela une cohérence, dans un clip de fuite en avant très rapide.

Midjourney évolue(ra) : versions 6.1 et 7, 3D, vidéo !

L’IA générative numéro 1 pour créer des images promet de nombreuses évolutions :

Personnalisation :

  • Personnalisation des modèles en fonction des préférences de l’utilisateur
  • Utilisation des appréciations et des classements par paires pour connaître les goûts de l’utilisateur
  • Personnalisation unique par utilisateur pour commencer, possibilité de partage
  • Résolution des instabilités numériques dans l’entraînement pour améliorer la cohérence

Version 6.1 :

  • Amélioration qualité : images, texte, vitesse, cohérence entre les mains et le corps
  • L’accent est mis sur l’élimination des artefacts et des imperfections.
  • Mise à jour importante, probablement la dernière version 6.x avant de se concentrer sur la v7
  • Améliorations potentielles de l’upscaler également

Version 7 :

  • Modèles plus intelligents avec une meilleure compréhension des prompts
  • Meilleure intégration des connaissances
  • Meilleur traitement des objets multiples sans mélanges

Midjourney 3D :

  • La 3D générée par l’IA devrait surpasser les graphiques informatiques conventionnels.
  • Pour maintenir la qualité, il faut que les données d’entraînement en 3D soient réelles plutôt que générées par ordinateur.
  • L’équipe chargée du matériel met au point un équipement de balayage 3D
  • Le lancement de la 3D a été retardé d’environ 6 mois afin de recueillir des données exclusives.

IA vidéo :

  • En retard par rapport à la 3D, mais en bonne voie
  • Les équipes 3D et vidéo se poussent mutuellement à aller de l’avant

Sora (un peu) dévoilée…

Vous connaissez ce film ? généré officiellement par IA, avec Sora, la brillante application de génération de films, préparée par OpenAI, mais encore très mystérieuse, et toujours pas dispo…

Et bien, la société qui a créé ce film, shy kids, dévoile légèrement les conditions de conception de ce film : environ 300 plans générés pour 1 utile, énormément de postproduction ensuite pour corriger les anomalies… Sora apparemment n’est pas (pour le moment) l’outil magique. Sans compter sa censure forte : il refuserait toute esthétique connue (Star Wars, Hitchcock…).

Adobe Firefly 3 et Photoshop Beta boostent l’IA générative !

Firefly 3 (web app) et Photoshop (beta) proposent un nouveau moteur de rendu génératif ia (plus belles images), associé à des fonctionnalités plus puissantes : image de référence, stucture de référence, référence de styles, génération d’arrière plan, pinceau ia, choix de variantes…

Etude du CNC sur l’IA et nos métiers…

Le CNC publie une étude sur l’IA et les métiers vidéo/film/jeu : une étude très intéressante, et assez bien informée ! On y découvrira les métiers plus ou moins menacés, impactés, en transformation potentielle (VFX, scénatio, storyboard…) et ceux a priori délaissés par l’IA (on n’est pas forcément d’accord avec cette étude)… Mais on comprend également qu’une énorme bulle spéculative d’investissements se forme depuis 2023, en mesurant l’écart gigantesque entre valorisation boursière (un acteur majeur valorisé à 90 Milliards) et revenus générés (CA 2 milliards…) : l’explosion inévitable de la bulle IA n’empêchera pas ces outils de devenir indispensables, précieux, ou dangereux (si on les subit). A lire urgemment !

Adobe Firefly fête sa première année…

En un an, l’outil IA en développement, Firefly, a progressé et a diffusé ses technologies dans Photoshop, Litghtroom, Stock, Substance, Illustrator…

Premiere Pro prochainement gonflé à l’IA générative

Adobe présente un aperçu des outils IA génératifs / transformatifs prochainement intégrés dans Premiere Pro : effacement ou transformation d’un objet (identifié par l’IA), allongement de la durée d’un plan, création d’un plan par prompt… Premiere Pro proposera son IA générative (Firefly) mais également accueillera des plugs ins : Sora, Pika,… On note la présence d’artefacts ou de défauts… temporaires ?

OpenAI et le clonage vocal…

OpenAI (ChatGPT, Dall-E…) a présenté Voice Engine, un outil IA capable de reproduire une voix, à partir d’un texte et d’un échantillon audio de 15 secondes… Voice Engine n’est pour le moment pas disponible… probablement par précaution « politique » (élections américaines). A déguster prochainement…

Adobe Music genAI : création musicale…

Adobe prépare donc un outil IA de création musicale par prompt (commandes de textes)… assez miraculeux…

Midjourney : des nouveautés de taille !

Le style ref : garder des styles persistants avec la commande –sref… Une nouveauté très attendue et importante. Plus d‘infos ici.

La personnalisation des modèles : très attendue par la communauté. Plus d’infos ici.

Character weight : pour garder plus ou moins les caractéristiques d’un personnage

Portrait Pro : une version 24 dopée à l’IA

La version 24 du célèbre outil de travail de photographies de portraits, PortraitPro améliore ses fonctions d’optimisation et correction avec IA : inpainting de bouche, remplacement de dents, retrait de reflets de lunettes, amélioration de la peau… Tarifs toujours assez bas : 55 à 175 USD.

Lancement de la formation IA vidéo générative, atelier de réalisation !

Cette formation de 2 semaines est un atelier exploratoire des outils d’intelligence artificielle et du pipeline pour réaliser des films : fiction, pub, corporate, expérimentations… aussi bien pour tester les possibilités et limites techniques / créatives des outils IA actuels (et en devenir), mais aussi créer tout ou partie d’un film, de manière professionnelle et aboutie. La formation est animée par Jérémy Gross, directeur artistique, réalisateur, spécialiste des outils IA.

Sora : premières impressions d’artistes…

OpenAI présente des vidéos réalisées par des artistes ayant eu accès à Sora (encore en développement). C’est impressionnant… Les sceptiques se demandent ce qui est censuré, car encore non fonctionnel. Les apocalyptiques ressentent la fin des tournages… Les euphoriques sont dithyrambiques… 😉

Un des films est celui-ci :

Stable Diffusion 3 arrive !

Tout en présentant Stable Cascade (un générateur texte > image plus efficace, assez fin en réglages), Stability AI a surtout annoncé Stable Diffusion 3… Stable Diffusion 3 n’est disponible qu’en preview (et encore sur liste d’attente) et promet des grandes améliorations sur les requêtes multi-sujets, la qualité du rendu… SD 3 utiliserait une architecture de transformateur de diffusion et un appariement de flux… les modèles disponibles iront de 800M à 8B de paramètres

Lancement (très attendu) de notre formation IA générative, image et animation, avec Stable Diffusion.

Cette formation de 5 jours est une initiation avancée et intensive à Stable Diffusion, outil IA génératif et correctif d’images et animations. Elle s’adresse à des personnes très à l’aise avec les outils informatiques, et ayant déjà des bases en IA (Midjourney par exemple). Elle est animée par Lionel Vicidomini, motion designer, graphiste 3D, enseignant et formateur, créateur bien connu de nombreux tutos de référence (sur Blender, Cinema 4D, Stable Diffusion…)

Google présente son outil IA vidéo : LUMIERE…

Après 2 précédents outils vidéo, Google présente son nouvel outil IA pour la vidéo : LUMIERE Nous ne disposons que des vidéos fabriquées (et sélectionnées) par Google et leurs affirmations pour juger, sans pouvoir tester pour le moment. LUMIERE propose de la vidéo générée par texte, de l’image transformée en vidéo, de la stylisation, l’animation de portions d’images, et le remplacement localisé dans une vidéo d’une partie des éléments : par exemple changer la robe d’une actrice… La grande nouveauté apportée par Google LUMIERE serait la consistance temporelle des vidéos générées, grande lacune des générateurs proposés jusqu’à maintenant.

Magnific AI : outil de « détail » de très haut niveau…

Magnific AI ne permet pas seulement d’agrandir la résolution / le détail d’une photo, mais d’en accroître et inventer des détails… avec de nombreux réglages pour doser les variations inventives.

Le seul hic est son coût : à partir de 39 USD par mois… à partir ! 🙁

VEA : amélioration audio automatique par IA…

Regardez la démo… 
VEA est une application payante : 29 USD. Mais dispo en essai gratuit 10 jours.

Lancement de notre première formation IA et graphisme, initiation aux outils génératifs.

Créée et animée par Mihai Grecu, Nanda Fernandez et James Verhille, cette formation de 5 jours est une initiation aux outils de création de l’image assistée par l’IA (intelligence artificielle) : génération d’images pour le graphisme, storyboards, moodboards, design, avec Midjourney, Photoshop et de nombreuses applications IA en ligne spécifiques.

Vous êtes arrivé.e.s à la fin de ce dossier IA, c’est-à-dire au début (chronologiquement) de notre chronique !

Si vous n’avez pas tout compris, essayez nos deux articles explicatifs sur les IA génératives :

Image créée dans Stable Diffusion, par Mihai Grecu.

les plus populaires

Mots-clés