Un moment Sputnik
-Le l'ancien employé du microsoft, Dave Plummer, parle du Ki-Chatbot Deepseek chinois sur sa chaîne YouTube Dave's Garage. Il explique ce qui rend Deepseek comme spécial pour sa compétition comme Chatgpt.
Contenu éditorial recommandé
À ce stade, vous trouverez un contenu externe de YouTube qui complète l'article.
Vous pouvez le faire afficher en un clic et le masquer à nouveau.
Je suis d'accord que le contenu iTube est affiché.
Les données personnelles peuvent être transmises aux plates-formes de troisième partie. Plus à ce sujet dans notre.
Se lier àContenu YouTube
Une Ferrari des pièces de rechange
Deepseek est imen tant que chatt et LLMS comparables. Quel facteur il devrait en fait être moins cher, cependantcontroversé.
L'ancien employé de Microsoft Plummer parle sur sa chaîne YouTube ainsi que sur d'autres sourcesqui aurait coulé dans Deepseek. Il s'agit d'une fraction des investissements d'un milliard de dollars dans les modèles de la concurrence.Néanmoins, l'IA peut suivre les produits phares comme Chatgpt.
De plus, les développeurs de l'IA n'auraient pas eu accès aux dernières puces Nvidia. Après tout, leur performance devrait être si intégrale pour le boom de l'IA. Et pendant le produit de base pour lequel de nombreux Nvidia savent, à savoir.
Deepseek est selon le Plummer comme
Une Ferrari construite à partir de pièces de rechange - tout aussi bonne, mais beaucoup moins chère.
Comme maître et apprenti
Ceci est possible grâce à un autre type de formation. Deepseek, tout comme le Chatt, est un modèle sur la base d'un modèle de grande longueur.Cependant, c'est unmodèle distillé
(modèle distillé
).
Cela signifie qu'un modèle plus petit est formé à l'aide de grands modèles de telle manière qu'il fournit les résultats les plus similaires que les grands - mais avec beaucoup moins de ressources.
Il arrive donc que les énormes modèles aient encore une plus grande connaissance des connaissances,Le modèle plus petit fonctionne presque aussi bien dans la plupart des applications.
Plummer le compare dans sa vidéo comme celle-ci:
C'est comme si un maître forme son apprenti - l'apprenti n'a pas à tout savoir, mais il peut également faire le travail.
Un de cesMeister
Était le modèle de modèle open source de Meta, mais aussi le chat openais.
Cette distillation des connaissances rend Deepseek beaucoup plus d'économie de ressources. Pour le fonctionnement, il n'a plus besoin de l'immense matériel avec des centaines de GPU dans d'énormes centres de données tels que les grands modèles.
Cela conduit également à la question:
Si vous pouvez construire une Ferrari dans votre garage à partir de parties Chevy, qu'est-ce que cela signifie pour la valeur d'une Ferrari?
Mémoire de la révolution PC
Bien sûr, cela ne signifie rien de bon pour la Ferrari d'origine chère.
Cependant, c'est un avantage pour les utilisateurs qu'ilsLe modèle peut également s'exécuter localement sur votre matériel domestique. Bien sûr, Deepseek ne peut pas fonctionner localement sur un petit cahier de travail. Plummer a besoin du plus grand modèle en profondeurUn ripper AMD avec un GPU NVIDIA RTX 6000 (48 Go de VRAM). Des variantes plus petites ont même couru sur unMacBook Pro.
Il se sent rappelé le temps de la révolution du PC de ce développement.
Cela me rappelle les premiers jours des PC - ils n'étaient pas aussi bons que les mainframes, mais ils ont changé le monde.
Que les principaux systèmes informatiques sous ordinateur (Gâchis mainframes
) Personne ne pouvait imaginer que tout le monde aurait quelque chose à la maison à la maison à un moment donné.
Un moment Sputnik
Contrairement à la révolution du PC, cependant, les implications géopolitiques doivent également être observées aujourd'hui. Deepseek est un modèle chinois qui rivalise particulièrement avec les groupes américains de la Silicon Valley.
Plummer décrit cela commeSputnik-Moment
. Ceci est une allusion au satellite soviétique Spoutnik, dont le début en 1957 le début de la compétition spatiale (Course spatiale
) etUne nouvelle phase de concurrence systémique entre l'Union soviétique et l'Occident pendant la guerre froide marquée.
De même, le développement de Deepseek conduit à des tensions géopolitiques qui reflètent la concurrence entre les États-Unis en tant qu'hégémon technologique et la Chine en tant que puissance mondiale émergente.
Cette concurrence technologique n'est pas seulement une lutte pour les innovations, mais aussi un symbole de la rivalité systémique entre la démocratie capitaliste des États-Unis et le capitalisme de la Chine.