Elon Musk a annoncé "le Schlaute Ki of the World", mais ce n'est pas si facile

Les KIS plus petits et plus grands sont annoncés chaque jour qui veulent dépasser dans différents domaines. Souvent, cependant, cela ne se produit que dans certaines références ou des tâches plus complexes telles que la programmation..

Néanmoins, Elon Musk Grok 3, le nouveau modèle de grande langue (LLM) de sa société d'IA Xai, décrit comme leSchlaute ki du monde. Mais qu'est-ce qui est derrière cette affirmation?

Grok 3: C'est dedans

Musk et certains développeurs de XAI ont introduit Grok 3 dans un flux en direct sur X. Il y avait également une mini version et un modèle de raisonnement spécial.

Contenu éditorial recommandé

À ce stade, vous trouverez un contenu externe de Twitter, qui complète l'article.
Vous pouvez le faire afficher en un clic et le masquer à nouveau.

Autoriser le contenu Twitter

Je suis d'accord que le contenu de Twitter est affiché.

Les données personnelles peuvent être transmises aux plates-formes de troisième partie. Plus à ce sujet dans notre.

Se lier àContenu Twitter

Selon Musk, l'IA devraiteffrayant intelligentSoyez si intelligent que c'est effrayant. En conséquence, Grok 3 devrait avoir de meilleures conclusions logiques, plus de puissance de calcul et une adaptabilité plus élevée que ChatGPT-4O.

Cela signifie que le modèle calcule plus rapidement, comprend des relations complexes plus précisément et peut réagir encore plus de manière flexible à différentes questions.

Qu'y a-t-il dans Grok 3 selon Xai:

L'IA aurait été formée avec le supercalculateur Colossus (100 000 GPU NVIDIA H100).
200 millions de leçons GPU auraient été dépensées pour la formation dix temps plus qu'avec Grok 2.
Le modèle a été formé sur des données générées artificiellement. Cedonnées synthétiquesdevrait garantir un ensemble de données diversifié et contrôlé et réduire les préoccupations concernant la protection des données.
Les développeurs ontRênepour l'apprentissageUtilisé, une méthode d'apprentissage automatique, dans laquelle le modèle évalue et améliore sa sortie à l'aide d'une fonction de récompense.
Était égalementApprentissage du renforcement avec rétroaction humaine(RLHF) Appliqué: Ici, les personnes réelles évaluent la sortie afin d'affiner la fonction de récompense et d'améliorer davantage la qualité du contenu d'IA.
La formation contextuelle devrait garantir que l'IA comprend et s'adapte mieux dans le contexte.
Le LLM devrait être en mesure de se corriger en analysant les réponses et en comparant avec les faits.
Avec DeepSearch, une fonction de recherche et de langage étendue doit être soumise.

Le grand but: Moins d'hallucinations et une précision logique plus élevée.

Que sont les hallucinations?Les hallucinations se réfèrent à des informations fausses ou fictives sur les LLM. Il s'agit d'une faiblesse bien connue de tous les chatbots courants et de la principale raison pour laquelle vous devez toujours remettre en question les réponses générées par l'AI.

Quand Grok 3 vient-il?Grok 3 devrait pouvoir en utiliser certains aux États-Unis. Tout d'abord, c'est le tour de paiement des abonnés (40 $ / mois). Cependant, un calendrier précis est manquant.

Grok 3 n'est pas disponible dans l'UE et la Grande-Bretagne pour le moment, car XAI doit faire des ajustements pour respecter les réglementations de l'UE.

Grok 3: Le Schlauste Ai dans le monde?

Qu'est-ce que Grok 3 fait mieux que les autres LLMS? Selon les repères, que Xai a montrés dans le livestream, Grok 3 est meilleur que la compétition, en particulier dans les tâches logiques telles que les mathématiques, la programmation et les questions scientifiques.

Cependant, Xai s'est abstenu de présenter des références dans d'autres domaines - plus à ce sujet.

Même si Grok 3 est censé générer moins d'hallucinations, cela ne signifie pas que cet objectif a déjà été atteint. OpenAI s'appuie également sur l'auto-correction, les données synthétiques et l'apprentissage des forces de nouveau avec la rétroaction humaine (RLHF).

La qualité de l'IA ne sera réellement montrée que lorsque les utilisateurs indépendants peuvent les tester.

Déclarations douteuses dans le flux en direct

Certaines déclarations de Musk et de son équipe pourraient être trompeuses ou trompeuses. C'est pourquoi nous voulons y aller ici:;

Vérité ultime - voir AI: Musk a affirmé pendant le ruisseau que Grok 3 était l'ultime vérité - voir Ai qui étaitParfois contredisant ce qui est politiquement correctest. Il est difficile de vouloir indiquer que d'autres développeurs embellissent délibérément des faits s'il veut présenter activement des faits ou des antécédents ou s'il s'agit d'une simple provocation politique.

L'IA s'améliore chaque jour: Musk affirme que le modèle sera encore amélioré chaque jour. Si cela signifiait des ajustements mineurs, ce serait également OK. Cependant, nous voulons indiquer clairement que la formation d'un LLM se termine enfin avant la publication - après cela, seuls des ajustements mineurs sont effectués.

Temps de développement remarquable: Musk a souligné que XAI n'a commencé le développement qu'en 2023, tandis que d'autres entreprises travaillent sur les LLM depuis 2019. Il n'a pas été mentionné que la percée réelle n'est pas dans le temps de développement, mais en raison d'énormes quantités de données et de puissance de calcul. Il est donc relativement facile pour les entreprises financièrement fortes de développer rapidement leurs propres modèles d'IA.

Benchmarks uniquement dans trois domaines: La bonne performance de Grok 3 dans d'autres domaines, comme avec les tâches linguistiques, reste ouverte. Parce que Musk et son équipe n'ont montré que des repères de tâches logiques.

La désignationSchlaute ki du mondeest donc plus marketing qu'un fait vérifiable. Au moins Musk et son équipe ne montrent aucune innovation révolutionnaire qui justifierait en quelque sorte ce superlatif.

Même si Grok 3 était actuellement au sommet, les nouveaux modèles d'Openai, Google et Anthropic sont certainement déjà en cours de développement.

Lors du Sommet mondial du gouvernement (du 11 au 13 février), Musk a déclaré que "la dernière fois pourrait être que d'autres sont meilleurs que Grok". Cela reste à voir.

Aucune fonction de commentaire?
En raison de l'effort de modération élevé attendu, nous avons décidé de déplacer les commentaires vers le forum. Vous pouvez discuter comme d'habitude: