Lyria 3 lance la production musicale au sein de Gemini

Cette fois, Google se développe dans le domaine de l'intelligence artificielle générative production musicale je l'ai déplacé sur le côté. Gémeauxne crée plus seulement du texte et des images ; Il convertit directement les commandes saisies et les photos téléchargées en chansons. Au centre de cette étape se trouve la technologie signée Google DeepMind. Lyrie 3 Il est situé.

Google DeepMind a rendu disponible à l'échelle mondiale Lyria 3, qu'il positionne comme le modèle musical le plus avancé à ce jour. Comme ça Application Gémeauxactivé la fonction de production musicale sur le bureau. Le support des applications mobiles devrait arriver dans les prochains jours. Les utilisateurs peuvent essayer la fonctionnalité directement via gemini.google.com.

Le modèle fonctionne avec un système multimodal capable de traiter ensemble les entrées textuelles et visuelles. De cette façon, non seulement une commande écrite mais aussi une photo téléchargée font partie de la production musicale. Par exemple, lorsqu'une photo d'une promenade en forêt est téléchargée, le système analyse l'atmosphère de la scène et crée une composition adaptée.

Cependant, Lyria 3 transforme un texte ordinaire en un morceau parlé et composé en quelques secondes. Une liste de courses, un court message ou une conversation informelle peuvent être produits directement au format rap. Une simple liste comme « chips, soda, chocolat, pain et yaourt » se transforme en paroles rythmées.

Gemini crée des chansons à partir de textes et d'images avec Lyria 3

Lyria 3 se démarque par trois fonctionnalités principales. Premièrement Paroles automatiques Le système entre en jeu et crée directement des mots appropriés à la commande donnée. Ainsi, l’utilisateur n’a pas besoin d’écrire des mots supplémentaires.

Deuxièmement, le modèle BPM (tempo)offre un contrôle sur le style musical et les détails vocaux. L'utilisateur définit la valeur du tempo, sélectionne le genre et décrit le caractère vocal. Le modèle produit alors une composition adaptée à ces paramètres.

Troisièmement, le système utilise activement la production visuelle. Gemini analyse les tons de couleur, l'environnement et le contexte de la photo téléchargée. Ensuite, il détermine l'ambiance musicale en cohérence avec cette analyse. Ainsi, une relation directe s’établit entre le visuel et le sonore.

Une image de couverture spéciale est préparée pour chaque pièce de 30 secondes produite. L'infrastructure Nano Banana crée automatiquement ces conceptions de couverture. Les utilisateurs téléchargent le morceau et le visuel ou les partagent via le lien.

Google intègre également le côté vérification du contenu dans le système. Tous les fichiers audio produits ID de synthétiseur Il est marqué d’un filigrane numérique. L'oreille humaine ne détecte pas cette empreinte ; Cependant, le système vérifie techniquement que le fichier est une production d’intelligence artificielle.

Cela ne se limite pas à cela. Gemini analyse un fichier audio téléchargé en externe et vérifie s'il a été généré par Google AI. Le modèle analyse à la fois la signature SynthID et active son propre mécanisme d'analyse.

Lyrie 3 ; Il est disponible en huit langues : anglais, allemand, espagnol, français, hindi, japonais, coréen et portugais. La fonctionnalité est ouverte aux utilisateurs âgés de 18 ans et plus. Les abonnés Google AI Plus, Pro et Ultra bénéficient de limites d'utilisation plus élevées.

Google prévoit d'étendre la couverture linguistique et la qualité de la production. Comme ça production musicale par intelligence artificielleprend sa place au sein de Gemini en tant que troisième couche de contenu en plus de la production textuelle et visuelle.

blog technologiquepartage régulièrement son agenda technologique sur différentes plateformes. Il transmet instantanément les principales actualités de la chaîne WhatsApp, propose du contenu actualisé via Google News, résume les gros titres des comptes Instagram et X et complète le contenu avec des critiques de produits et des explications détaillées sur la chaîne YouTube.