Deepseek, le Laboratoire d'intelligence artificielle basé en Chine, est allé en haut des listes d'App Store avec l'application de chat et a suscité un grand intérêt à l'échelle internationale. Des modèles d'intelligence artificielle formés avec des techniques de calcul efficaces de l'entreprise ont conduit au leadership américain dans la race de l'intelligence artificielle et à la durabilité de la demande de puces d'intelligence artificielle parmi les analystes de Wall Street et les experts en technologie.
Quand et par qui Deepseek a été fondé?
Deepseek est soutenu par le fonds spéculatif quantitatif chinois, High Flyer Capital Management, qui prend des décisions commerciales soutenues par l'intelligence artificielle. High-Flyer a été fondé en 2015 par Liang Wenfeng, qui a commencé à être intéressé par le commerce lorsqu'il était étudiant à l'Université du Zhejiang. En 2019, l'entreprise a commencé à fonctionner comme un fonds spéculatif qui se concentre sur le développement et la mise en œuvre d'algorithmes d'intelligence artificielle. En 2023, High-Flyer a fondé Deepseek, un laboratoire dédié à l'étude des véhicules d'intelligence artificielle en dehors de ses affaires financières.
Développements techniques et modèles
Deepseek a commencé la formation du modèle en créant ses propres grappes de centres de données. Cependant, comme les autres sociétés de renseignement artificiel chinois, elle a été influencée par les interdictions d'exportation des équipements américains. La société a dû utiliser les puces NVIDIA H800, une version moins puissante des puces H100 offertes aux sociétés américaines pour former l'un de ses derniers modèles. L'équipe technique de Deepseek est composée de jeunes chercheurs et la société engage des chercheurs en renseignement artificiel des principales universités chinoises au niveau du doctorat. Il emploie également des personnes qui n'ont pas d'histoire de l'informatique pour mieux comprendre un large éventail de technologies.
En novembre 2023, Deepseek a présenté le premier ensemble de modèles – Deepseek Coder, Deepseek LLM et Deepseek Chat -. Cependant, la principale attention de l'entreprise a été au printemps dernier lorsque la famille Deepseek-V2 de la prochaine génération a sorti. Deepseek-V2 a bien fonctionné dans divers critères d'intelligence artificielle en tant que système d'analyse de texte et d'image à usage général et a travaillé à un coût inférieur à celle des modèles similaires à l'époque. Cela a forcé des concurrents locaux, tels que Bytedance et Alibaba, pour réduire les prix d'utilisation de certains modèles et rendre certains d'entre eux complètement gratuits.
Deepseek-V3, publié en décembre 2024, a encore accru la réputation de l'entreprise. Selon les tests internes de Deepseek, Deepseek V3 a quitté les modèles de Llama et GPT-4O d'OpenAI. En outre, le modèle «Response» R1 de Deepseek, qui a été publié en janvier, se produit de manière similaire à l'O1 d'Openai. R1 se démarque comme un modèle d'auto-contrôleur qui produit des résultats plus fiables dans des domaines tels que la physique, les sciences et les mathématiques.
Impact du marché et perspectives futures
Le prix de Deepseek bien en dessous de la valeur marchande et offre à certains d'entre eux gratuitement conduit à des incertitudes sur le modèle commercial. La société déclare qu'elle maintient une compétitivité des coûts excessive grâce aux percées de la productivité. Cependant, certains experts discutent des chiffres de l'entreprise. Malgré tout, les développeurs sont intéressés par les modèles de Deepseek. Bien que les modèles de l'entreprise ne soient pas acceptés comme open source, ils sont présentés avec des licences flexibles qui permettent une utilisation commerciale. Par exemple, selon le PDG de Hughing Face, Clem Dengue, les développeurs sur la plate-forme de visage émouvants ont créé plus de 500 modèles de «dérivés» du modèle R1 et ces modèles ont atteint un nombre total de 2,5 millions de téléchargements.
Le succès de Deepseek contre les concurrents plus grands et longs est défini comme le début d'une «nouvelle ère ında dans le domaine de l'intelligence artificielle. Le succès de la société a fait chuter le cours de l'action de Nvidia de 18% lundi et a conduit à une réponse publique du PDG d'Openai, Sam Altman. L'avenir de Deepseek reste incertain. Les modèles développés devraient être lancés, mais le gouvernement américain est prudent contre la situation qu'elle perçoit comme un impact étranger nuisible.