DeepSeek a annoncé l'aperçu de la V4 avec deux modèles ouverts appelés Pro et Flash. L'entreprise dans le modèle V4-Pro 1,6 billion de paramètres au totaldans le modèle V4-Flash 284 milliards de paramètres au total Il a déclaré avoir utilisé . Les deux modèles Fenêtre contextuelle de 1 million de jetons offre, ce qui en fait une option importante pour les développeurs travaillant avec de longues bases de code et l'analyse de documents.
Côté V4-Pro, DeepSeek se concentre sur les tâches de codage et d'agent avec son architecture MoE avec 49 milliards de paramètres actifs. La page Hugging Face montre également que les modèles sont livrés avec des poids ouverts sous licence MIT. Cela ouvre la porte à une exécution locale pour les équipes qui ne souhaitent pas utiliser d'API cloud, mais il faut dire que la V4-Pro nécessite une mémoire GPU importante.
Le côté prix rend l’actualité encore plus importante. La page de prix de DeepSeek est à 1 million de jetons de sortie pour V4-Pro 3,48 $ indique le niveau. Ce chiffre change directement le calcul des coûts pour les équipes développant des applications d’IA à grande échelle.
Nouvelle édition côté modèle ouvert
DeepSeek affirme que V4-Pro fournit d'excellents résultats dans des tests tels que Codeforces et LiveCodeBench. Cependant, l'AP souligne spécifiquement la nécessité d'une vérification indépendante des affirmations de référence de l'entreprise. Pour faire court, la V4 accélère la compétition de modèles ouverts, mais les développeurs devraient prendre la vraie décision en testant leurs propres charges de travail.
Pour ne pas rater l'agenda technologique, 📰 ajoutez-le à Google News, 💬 rejoignez notre chaîne WhatsApp, ▶ abonnez-vous à YouTube, 📷 suivez-nous sur Instagram et 𝕏 X.