🤖 L’IA génère des images 30 fois plus rapidement avec cette technique des chercheurs du MIT

5 avril 2024 BTS

Midjourney ou Stable Diffusion permettent de générer très rapidement une multitude d’images à partir de prompts. Si le résultat s’affiche en quelques secondes, il faut une centaine d’étapes pour y parvenir. Un outil comme DALL-E, par exemple, récupère dans sa base de données une image qui se rapproche de ce qui a été demandé par l’utilisateur. Elle est ensuite détruite, puis un champ de bruit aléatoire est créé. Plusieurs autres étapes sont nécessaires pour éliminer le bruit aléatoire et créer une image correspondant au prompt. ✍️

Mais les chercheurs du MIT ont réussi à réduire toutes ces étapes à une seule grâce à une technique appelée Distribution Matching Distillation (DMD). Cette méthode se divise en deux composants. Le premier se nomme “perte de régression” ; lors de cette étape, les images sont organisées selon leur similarité. Le second composant est la “perte de correspondance de distribution”. Il permet de faire en sorte que l’image reflète le plus possible ce qui existe dans notre monde. 🌍

Ainsi, les images sont générées 30 fois plus rapidement tout en réduisant le risque de rendus étranges. La puissance de calcul nécessaire diminue également grâce à la réduction du nombre d’étapes. 💻

➡️ Vu sur Les Numériques

Vous souhaitez rester au courant de l’actualité scientifique et technologique ? Inscrivez-vous à notre newsletter hebdomadaire Back To Science

Laisser un commentaire Annuler la réponse