Qu’est-ce que DALL-E et comment crée-t-il des images à partir de texte ?

Beaucoup d’entre nous ont entendu le nom DALL-E flotter, mais vous ne savez peut-être pas de quoi il s’agit. En bref, c’est un modèle d’IA génératif qui peut créer des images qui n’ont jamais existé auparavant, tout ce que vous avez à faire est de lui dire ce que vous voulez créer.


Lorsque la version de suivi, appelée DALL-E 2, est sortie, elle est vraiment devenue célèbre. Les images qu’il pouvait produire étaient d’une telle qualité et si bien générées qu’on pouvait à peine dire qu’une machine l’avait fait.

Voici ce que vous devez savoir sur DALL-E et son fonctionnement.


Qu’est-ce que DALL-E ?

DALL-E est un modèle d’IA génératif développé par Open AI qui peut générer des images et de l’art à partir d’une invite de texte. En d’autres termes, vous pouvez écrire une phrase décrivant exactement ce que vous voulez voir et DALL-E peut créer cette image pour vous en quelques secondes.

DALL-E a été lancé pour la première fois en janvier 2021 et a depuis été considérablement mis à niveau dans sa deuxième version appelée DALL-E 2. C’était l’un des quelques générateurs d’art AI différents qui est devenu extrêmement populaire pour sa capacité à créer de belles images et de l’art à partir de zéro .

Comme il suffit d’écrire quelques mots descriptifs pour générer une image, cela a attiré de nombreux non-artistes qui trouvent l’outil incroyablement amusant et facile à utiliser.

Les images produites par DALL-E sont si convaincantes qu’elles sont facilement confondues avec de l’art créé par un humain. En plus d’avoir la capacité de représenter des objets et des paysages du monde qui nous entoure, il peut rendre ces images dans un style spécifique, comme l’art numérique, l’aquarelle ou l’impressionnisme.

DALL-E tire son nom de l’artiste Salvador Dalí et d’un robot appelé WALL-E d’un film d’animation Pixar. Le nom de DALL-E nous donne certainement une idée de la façon dont l’entreprise visait à combiner l’art et la technologie de l’IA.

Vous pouvez découvrir comment utiliser Dall-E 2 pour créer des images AI dans notre guide détaillé, y compris comment y accéder et comment modifier des parties spécifiques de l’image.

Comment fonctionne DALL-E ?

Il existe plusieurs technologies différentes derrière DALL-E. Mais sans plonger dans les mathématiques complexes, commençons par la façon dont DALL-E a été formé sur des millions d’images provenant d’Internet.

Les images utilisées pour la formation proviennent d’ensembles de données contenant un nombre énorme d’images accompagnées d’une légende textuelle. Comme vous pouvez l’imaginer, avec suffisamment de données, le modèle d’IA peut apprendre à reconnaître ce qu’est un objet et à quoi il pourrait ressembler dans une image.

L’ensemble de données utilisé pour former DALL-E n’a pas été révélé, cependant, vous pouvez toujours savoir si vos images ont formé un modèle d’IA et vous désinscrire.

Billes de verre reliées par des brins fins dans une configuration en réseau

DALL-E a également été construit à l’aide d’un modèle de langage appelé GPT-3, ou Generative Pre-trained Transformer. Il a été largement popularisé lorsque Open AI a publié ChatGPT, un chatbot IA auquel vous pouvez facilement parler en langage humain naturel. Cette technologie comble le fossé entre le texte et l’image et aide à transformer les mots que vous tapez en une image à l’écran composée de pixels.

Un autre élément central de DALL-E est l’utilisation d’un modèle de diffusion. Ce modèle prend une image bruyante (pensez à une image très pixélisée qui n’est pas reconnaissable) et fonctionne à l’envers pour produire une image claire qui correspond à la description textuelle que vous avez saisie.

Que pouvez-vous faire avec DALL-E ?

Les gens utilisent DALL-E pour toutes sortes de choses. Vous pouvez essayer d’être un artiste IA, l’utiliser pour remixer une œuvre d’art célèbre ou prendre une œuvre d’art originale et l’étendre avec les fonctions d’édition de DALL-E.

Une peinture générée par IA d'une femme avec son chat au centre d'un paysage japonais, réalisée avec Dall-E

Outpainting est une fonctionnalité de DALL-E qui vous permet de créer des œuvres encore plus grandes en vous permettant d’attacher des panneaux d’image nouvellement générés à une œuvre existante. Apprenez à utiliser la surimpression dans Dall-E 2 pour voir jusqu’où vous pouvez étendre vos images générées par l’IA.

Créer des images générées par l’IA avec DALL-E

DALL-E est un outil d’intelligence artificielle facilement accessible que vous pouvez utiliser pour créer de l’art ou générer des images, dont aucune n’a jamais existé auparavant. Il utilise des avancées incroyables dans l’apprentissage automatique, y compris GPT-3 et les modèles de diffusion. La connaissance de DALL-E du monde humain, y compris l’histoire de l’art, provient de millions d’images qui ont probablement été recueillies sur Internet.

La combinaison de plusieurs nouvelles technologies dans l’IA générative signifie que vous pouvez prendre plaisir à donner vie à votre imagination en utilisant uniquement des mots pour peindre une image.