L'IA générative chinoise DeepSeek fait déjà trembler les géants américains

Pour échanger sur les avancées, les applications et les défis de l'IA.
Répondre
Avatar du membre
chtimi054
Administrateur du site
Administrateur du site
Messages : 9072
Enregistré le : ven. 26 juil. 2013 06:56
A remercié : 110 fois
A été remercié : 658 fois
    Windows 10 Firefox

L'IA générative chinoise DeepSeek fait déjà trembler les géants américains

Message par chtimi054 »

L'IA générative chinoise DeepSeek fait déjà trembler les géants américains

Pendant que les géants high-tech américains investissent des milliards dans les infrastructures IA, l'IA générative chinoise Deepseek prétend faire aussi bien que GPT-4o pour beaucoup moins cher. Malaise.
Image C'est l'un des axes stratégiques annoncés lors de l'investiture de Donald Trump : les Etats-Unis doivent devenir les champions de l'intelligence artificielle en contrôlant la diffusion des puces IA dans le monde, en investissant dans les infrastructures et en disposant des meilleurs modèles d'IA.

Depuis, les géants de la high-tech américaine se bousculent pour rivaliser d'investissements dans les infrastructures IA à coups de dizaines de milliards de dollars tandis que le projet Stargate fait miroiter 500 milliards de dollars pour les besoins d'OpenAI.

Aussi, quand une IA générative chinoise prétend faire aussi bien que les meilleurs chatbots américains du moment pour beaucoup moins cher, c'est un peu la panique. Le nouveau DeepSeek affirme arriver au niveau de GPT-4o d'OpenAI pour un coût bien moindre : 6 millions de dollars !

L'IA chinoise n'a pas dit son dernier mot

Et DeepSeek n'a pas profité des accélérateurs IA les plus récents du marché, ces derniers étant interdits d'exportation en Chine. La présentation ce 20 janvier de DeepSeek R1, spécialisé dans la résolution de problèmes complexes, a créé la surprise et fait dire à l'entrepreneur Marc Andreessen qu'il s'agissait là du moment Spoutnik de l'IA, en référence à la sonde soviétique lancée juste avant la conquête spatiale américaine, comme un camouflet pour les Etats-Unis.
Image Les agents conversationnels de DeepSeek se sont retrouvés en bonne place des classements des IA les plus performantes et l'application sur iOS a pris la tête des téléchargements d'applications gratuites sur l'App Store aux Etats-Unis.

C'est un coup dur pour les tenants américains du secteur de l'IA dont la croissance repose sur la vente d'accélérateurs IA et d'équipements spécialisés dont le volume est censé garantir la puissance des intelligences artificielles.

Quand on a moins de moyens, on a plus d'idées ?

De fait, le cours en Bourse de Nvidia a connu une sévère correction, chutant de 10% avant de se reprendre. D'autres entreprises, comme le néerlandais ASML ou ASM International qui fournissent les équipements de lithographie ont reculé de plus de 10%. En Asie, le groupe Softbank, partenaire du projet Stargate américain, a aussi senti le vent du boulet chinois.

DeepSeek joue par ailleurs sur le terrain de l'open source. Il reste encore des mystères sur son fonctionnement et la façon dont le modèle d'IA a été créé et entraîné mais il pose forcément des questions sur la stratégie d'investissement massif en cours des géants américains de l'IA et des énormes valorisations dont elles bénéficient.
Image Il y a potentiellement des limites dans la contextualisation des conversations longues demandant de grosses capacités de traitement et il faut composer avec la censure chinois sur certains sujets sensibles mais DeepSeek a réussi à semer le doute dans le concert de louanges et de démonstrations de force exprimé ces derniers jours, rappelant que la Chine ne fait pas de la figuration en matière d'intelligence artificielle.

Le français Mistral AI avait aussi joué à ses débuts la carte du petit Poucet capable de proposer des modèles d'IA efficaces pour une fraction du prix des grands modèles d'IA américains. Mais l'astuce peut-elle suffire face aux gros sous sur le long terme ?

merci à CLUBIC
Avatar du membre
MyPOV
Membre VIP
Membre VIP
Messages : 1215
Enregistré le : sam. 11 déc. 2021 14:40
A remercié : 111 fois
A été remercié : 150 fois
    Windows 10 Chrome

Re: L'IA générative chinoise DeepSeek fait déjà trembler les géants américains

Message par MyPOV »

Bonjour,

Début décembre, après la lecture de sites non basiquement anti-ceci ou pro-cela, j'avais découvert le chinois Deepseek dont j'ai déjà écrit une bafouille sur sa qualité en programmation ; à noter qu'elle accepte parfaitement la conversation en français.

A propos des bridages des cartes Nvidia pour le marché chinois dans le but de freiner ses capacités en IA ; par exemple avec la RTX 4090 D d'une perte de 20% par rapport au modèle normal :

Si une carte A a une puissance de 100 et le modèle D est bridé à 80, alors ça n'empêche en rien d'atteindre l'objectif visé. Si un calcul dure 1H avec A, alors il mettra simplement 1H15 avec D. Dans le cas d'un cluster de calcul qui nécessite une puissance de 1000, il faut 10 cartes A ou 12 à 13 cartes D. Ça a donc un impact non rédhibitoire sur le temps et l'investissement qui par ailleurs est aussi dépendant du coût de la main d'œuvre, notamment de celui des ingénieurs ; il y a un fossé entre le prix d'un ingénieur en IA de la Silicon Valley et celui travaillant en Chine.
"𝓛𝓮 𝓭𝓸𝓾𝓽𝓮 𝓮𝓼𝓽 𝓵𝓮 𝓬𝓸𝓶𝓶𝓮𝓷𝓬𝓮𝓶𝓮𝓷𝓽 𝓭𝓮 𝓵𝓪 𝓼𝓪𝓰𝓮𝓼𝓼𝓮" 𝖠𝗋𝗂𝗌𝗍𝗈𝗍𝖾, 𝖼𝗈𝗆𝗉𝗅𝗈𝗍𝗂𝗌𝗍𝖾 𝖦𝗋𝖾𝖼
odjinan
Membre VIP
Membre VIP
Messages : 645
Enregistré le : sam. 13 avr. 2013 11:55
A remercié : 31 fois
A été remercié : 80 fois
    Windows 10 Firefox

Re: L'IA générative chinoise DeepSeek fait déjà trembler les géants américains

Message par odjinan »

pour 6k, tu peux meme monter un setup pour le lancer localement :116:

x.com/carrigmat/status/1884244369907278106
Avatar du membre
MyPOV
Membre VIP
Membre VIP
Messages : 1215
Enregistré le : sam. 11 déc. 2021 14:40
A remercié : 111 fois
A été remercié : 150 fois
    Windows 10 Chrome

Re: L'IA générative chinoise DeepSeek fait déjà trembler les géants américains

Message par MyPOV »

L'impact de DeepSeek pourrait aller bien au-delà des géants de la tech américaine. Comme c'est écrit sur wiki, étant open source avec une licence MIT elle permet beaucoup de choses avec en plus un coût de fonctionnement nettement moindre. Elle rend l'IA accessible à la planète entière, dont de petits pays ou de petites organisations, mais aussi à la Russie. Qu'on ne puisse pas avec critiquer les dirigeants de la Chine, cela ne nous concerne pas.

D'ailleurs, au moins hier, la plateforme Deepseek est difficile d'accès en raison d'une surcharge en accès ; un bandeau indique une attaque.

A ce propos, tant elles veulent s'émanciper des GAFAM, j'ai été étonné de certaines réactions, dont d'organisations pro-Trump :o qui l'accueillent avec un énorme enthousiasme.

J'ai l'impression d'une déflagration mondiale, difficile de savoir ce qui va advenir. Depuis quelques jours des modèles DeepSeek-R1 apparaissent sur LM Studio.
"𝓛𝓮 𝓭𝓸𝓾𝓽𝓮 𝓮𝓼𝓽 𝓵𝓮 𝓬𝓸𝓶𝓶𝓮𝓷𝓬𝓮𝓶𝓮𝓷𝓽 𝓭𝓮 𝓵𝓪 𝓼𝓪𝓰𝓮𝓼𝓼𝓮" 𝖠𝗋𝗂𝗌𝗍𝗈𝗍𝖾, 𝖼𝗈𝗆𝗉𝗅𝗈𝗍𝗂𝗌𝗍𝖾 𝖦𝗋𝖾𝖼
Répondre