La startup chinoise DeepSeek a récemment lancé une nouvelle génération de modèles d’intelligence artificielle qu’elle affirme être comparables, voire supérieurs, aux modèles les plus avancés développés aux États-Unis, mais à un coût bien inférieur. Cette avancée pourrait profondément redistribuer les cartes du paysage technologique mondial.
DeepSeek a attiré l’attention des experts internationaux après avoir publié, en décembre 2024, un article indiquant que l’entraînement de son modèle phare, DeepSeek-V3, avait requis moins de 6 millions de dollars en puissance de calcul, grâce à l’utilisation des puces Nvidia H800.
Son assistant virtuel, basé sur DeepSeek-V3, a rapidement surpassé ChatGPT pour devenir l’application gratuite la mieux notée sur l’App Store américain. Ce succès a provoqué des interrogations sur les investissements massifs promis par certaines entreprises technologiques américaines dans l’IA, tout en affectant les actions de plusieurs grandes entreprises, dont Nvidia.
Ce qui distingue DeepSeek dans le secteur de l’IA
Le lancement de ChatGPT par OpenAI en 2022 avait déclenché une course effrénée parmi les entreprises technologiques chinoises pour développer leurs propres solutions d’IA. Cependant, le lancement du chatbot chinois de Baidu, bien qu’attendu, avait déçu, soulignant un écart apparent entre les capacités des entreprises américaines et chinoises en matière d’IA.
DeepSeek a renversé cette perception grâce à des modèles performants et économiques. Ses deux modèles phares, DeepSeek-V3 et DeepSeek-R1, sont présentés comme aussi avancés que les solutions d’OpenAI et de Meta. De plus, DeepSeek-R1 est nettement plus abordable à utiliser, coûtant entre 20 et 50 fois moins cher que le modèle GPT-4 d’OpenAI selon les tâches, d’après un communiqué officiel publié sur WeChat.
Cependant, certains sceptiques émettent des doutes sur cette réussite. Alexandr Wang, PDG de Scale AI, a affirmé lors d’une interview sur CNBC que DeepSeek disposerait de 50 000 puces Nvidia H100, une acquisition qui pourrait violer les restrictions américaines sur l’exportation de technologies avancées vers la Chine. DeepSeek n’a pas encore répondu à ces accusations.
De plus, des analystes de Bernstein ont souligné que les coûts réels d’entraînement des modèles V3 et R1 restent flous et pourraient être bien supérieurs aux chiffres annoncés par la startup.
Les origines de DeepSeek
Basée à Hangzhou, DeepSeek est majoritairement détenue par Liang Wenfeng, cofondateur du fonds spéculatif quantitatif High-Flyer. Ce fonds avait annoncé en 2023 un changement stratégique, délaissant partiellement le trading pour se concentrer sur le développement de l’intelligence générale artificielle (AGI). DeepSeek a vu le jour peu après.
Les liens entre High-Flyer et DeepSeek sont notables. Les deux entités partagent des bureaux et des brevets liés aux grappes de puces utilisées pour entraîner des modèles d’IA. High-Flyer avait par ailleurs déclaré en 2022 posséder une grappe de 10 000 puces Nvidia A100, renforçant son infrastructure d’entraînement.
La position de Pékin sur DeepSeek
Le succès de DeepSeek n’est pas passé inaperçu auprès des autorités chinoises. Le jour de la sortie de DeepSeek-R1, Liang Wenfeng a participé à un symposium organisé par le Premier ministre chinois Li Qiang, un événement à huis clos regroupant experts et chefs d’entreprise.
Cette réunion pourrait signaler que DeepSeek joue un rôle clé dans les efforts de Pékin pour contourner les restrictions technologiques américaines et atteindre l’autonomie dans des secteurs stratégiques comme l’IA. En 2024, un symposium similaire avait déjà accueilli Robin Li, PDG de Baidu.
Les contrats à terme du Nasdaq ont chuté
Les actions technologiques ont reculé au Japon ce lundi, alors que la popularité croissante d’un modèle d’intelligence artificielle chinois à bas prix a ébranlé la confiance des investisseurs dans la rentabilité de l’IA et dans la forte demande du secteur pour des puces technologiques avancées.
Les contrats à terme sur le Nasdaq 100 ont reculé de 2,4 %, tandis que ceux sur le S&P 500 étaient également en baisse dans l’après-midi en Asie. Parallèlement, les actions d’Advantest, un fournisseur de Nvidia, ont chuté de 8,5 % à Tokyo.
La startup DeepSeek a lancé un assistant gratuit qui, selon elle, utilise des puces moins coûteuses et moins de données, mettant en question une hypothèse largement répandue sur les marchés financiers selon laquelle l’IA stimulerait la demande tout au long de la chaîne d’approvisionnement, des fabricants de puces aux centres de données.
DeepSeek-R1 moins cher que OpenAI
La startup chinoise DeepSeek a annoncé la mise à disposition de son nouveau modèle R1 sous licence ouverte MIT. Ce modèle inclut une IA de raisonnement open-source, appelée DeepSeek-R1, qui rivalise avec le modèle o1 d’OpenAI sur de nombreux benchmarks.
DeepSeek avait déjà attiré une attention considérable le mois dernier en lançant DeepSeek-V3, un modèle d’IA qui a surpassé ceux développés par de grandes entreprises technologiques, tout en étant entraîné à une fraction de leur coût.
Adoptant une structure similaire basée sur le mélange d’experts, DeepSeek affirme que le développement de DeepSeek-R1 a coûté 95 % moins cher que celui de son équivalent chez OpenAI.
Pour Jacques-Aurélien Marcireau, Co-Head of Equities at Edmond de Rothschild AM , le meilleur de la Chine
L’intégration de la Chine dans l’économie mondiale depuis les accords de l’OMC a été, pour le dire simplement, une aventure mouvementée. Alors que le pays est de plus en plus perçu comme un ‘rival stratégique’ et que les désaccords augmentent sur divers sujets, nous considérons Deepseek comme une opportunité de faire le point et de réfléchir aux contributions positives que la Chine peut apporter au monde.
Les récentes annonces de Deepseek dans le domaine de l’IA générative ont deux principales caractéristiques qui ont retenu notre attention : premièrement, elles ont considérablement réduit les coûts de calcul d’un facteur de 10 par rapport à leurs concurrents occidentaux, ce qui est bénéfique pour rendre l’IA générative plus viable et respectueuse de l’environnement. Deuxièmement, Deepseek est open source, ce qui signifie qu’au lieu de garder secrètes les avancées, la Chine contribue activement à la communauté open source, partageant des connaissances pour le bénéfice de tous. Au-delà des avantages concrets, réaliser des progrès importants sans moyens financiers démesurés nous encourage également, en tant qu’Européens, à reconsidérer positivement notre rôle dans le monde à venir : en étant créatifs, nous pouvons surmonter une partie de la ‘dette technologique’ que certains pessimistes considèrent comme insurmontable.Au-delà de Deepseek, qui, en fin de compte n’est peut-être pas aussi révolutionnaire que le suggèrent les titres de presse et les réactions du marché actuels, un sujet souvent sous-estimé est la santé. La Chine innove dans le secteur de la santé, et il serait difficile d’argumenter contre plus de découvertes de médicaments et de méthodes pour traiter les patients. Les entreprises pharmaceutiques basées aux États-Unis accordent de plus en plus de licences pour des actifs en phase précoce issus de sociétés biotechnologiques chinoises. Certains des médicaments les plus efficaces et innovants, y compris les anticorps-médicaments en oncologie, ont été licenciés auprès de sociétés chinoises.
Enfin, dans un monde où la concentration industrielle augmente et est destinée à croître encore, surtout avec l’agenda de déréglementation du président Trump, il convient de noter qu’à la fois théoriquement et empiriquement, l’innovation tend à souffrir d’une trop grande concentration. Pourquoi innover lorsque vous pouvez simplement extraire de la valeur de votre position dominante ? Dans de nombreux cas, China Inc. apporte la concurrence nécessaire pour maintenir vivante l’incitation à innover. La question de savoir si cette concurrence est équitable est bien sûr discutable—et à juste titre—mais dans le cas de Deepseek, il n’y a pas de débat.
Par Navidh Mansoor