LâIA gĂ©nĂšre des images 30 fois plus rapidement avec cette technique des chercheurs du MIT
Midjourney ou Stable Diffusion permettent de gĂ©nĂ©rer trĂšs rapidement une multitude dâimages Ă partir de prompts. Si le rĂ©sultat sâaffiche en quelques secondes, il faut une centaine dâĂ©tapes pour y parvenir. Un outil comme DALL-E, par exemple, rĂ©cupĂšre dans sa base de donnĂ©es une image qui se rapproche de ce qui a Ă©tĂ© demandĂ© par lâutilisateur. Elle est ensuite dĂ©truite, puis un champ de bruit alĂ©atoire est créé. Plusieurs autres Ă©tapes sont nĂ©cessaires pour Ă©liminer le bruit alĂ©atoire et crĂ©er une image correspondant au prompt.
Mais les chercheurs du MIT ont rĂ©ussi Ă rĂ©duire toutes ces Ă©tapes Ă une seule grĂące Ă une technique appelĂ©e Distribution Matching Distillation (DMD). Cette mĂ©thode se divise en deux composants. Le premier se nomme âperte de rĂ©gressionâ ; lors de cette Ă©tape, les images sont organisĂ©es selon leur similaritĂ©. Le second composant est la âperte de correspondance de distributionâ. Il permet de faire en sorte que lâimage reflĂšte le plus possible ce qui existe dans notre monde.
Ainsi, les images sont gĂ©nĂ©rĂ©es 30 fois plus rapidement tout en rĂ©duisant le risque de rendus Ă©tranges. La puissance de calcul nĂ©cessaire diminue Ă©galement grĂące Ă la rĂ©duction du nombre dâĂ©tapes.
Vous souhaitez rester au courant de lâactualitĂ© scientifique et technologique ? Inscrivez-vous Ă notre newsletter hebdomadaire Back To Science