Se rendre au contenu

Qui est DeepSeek, la start-up chinoise qui fait vaciller nVidia dans le domaine de l'IA ?

Commencez à écrire ici ...

DeepSeek, la nouveauté en provenance de Chine : qui est derrière l’intelligence artificielle qui rivalise avec OpenAI et Google ?


La start-up chinoise DeepSeek a apparemment transformé l'industrie depuis le lancement de son chatbot R1 il y a une semaine, grâce à un parcours plutôt unique.


Découvrir plus

En décembre 2022, la petite start-up OpenAI, créatrice du chatbot ChatGPT, a rapidement gagné en notoriété mondiale et a réalisé d'importantes levées de fonds, atteignant une valorisation impressionnante en deux ans. Une nouvelle dynamique semble se dessiner avec l'émergence de la start-up chinoise DeepSeek, qui possède une histoire originale.


Initialement, un fonds de placement.

DeepSeek, une société ayant bouleversé le secteur de l'intelligence artificielle, est issue d'un hedge fund. Initialement nommée Fire-Flyer, elle faisait partie de la recherche en deep learning du fonds quantitatif High-Flyer, fondé en 2015 par Lian Wenfeng. Ce hedge fund, reconnu en Chine, a été le premier à lever 100 milliards de yuans. High-Flyer a investi dans des GPU et construit des supercalculateurs pour Fire-Flyer, afin d'analyser des données financières.

En 2023, Liang Wenfeng a créé DeepSeek, une nouvelle entité dédiée au développement de modèles de langage avancés et à l'ambition d'atteindre l'intelligence artificielle générale. DeepSeek se distingue par son indépendance vis-à-vis des financements des grands acteurs du numérique chinois tels qu'Alibaba, Baidu et ByteDance.


DeepSeek recherche des jeunes talents prometteurs qui viennent de terminer leurs études universitaires.

DeepSeek a une approche unique pour réussir, axée sur le recrutement. La société privilégie les chercheurs prometteurs diplômés des grandes universités, comme Tsinghua ou l'université de Pékin, plutôt que des ingénieurs expérimentés. Contrairement aux grandes entreprises numériques chinoises, ces chercheurs bénéficient d'une grande liberté pour mener des recherches innovantes.

Les restrictions américaines sur les GPU pour les entreprises chinoises ont poussé DeepSeek à innover dans l'entraînement de ses modèles de langage avec moins de matériel haut de gamme. Selon Wendy Chang du Mercator Institute for China Studies, l'entreprise a optimisé l'architecture de ses modèles grâce à diverses techniques, incluant des schémas de communication personnalisés, la réduction de la taille des champs pour économiser de la mémoire, et l'utilisation de l'approche "mix-of models" (Mélange de modèles).

Développer un modèle open source permet à l'entreprise d'attirer davantage d'utilisateurs et de contributeurs, l'aidant ainsi à combler une partie de son retard sur ses concurrents occidentaux. Une stratégie réussie ?


Source: Clubic



Les premiers modèles RX 9000 seront destinés aux ordinateurs de bureau et ne seront pas nécessairement à un prix abordable.