Après plus de 70 ans: l'IA existe le test de Turing et semble plus humain que les humains

Dans le test de Turing, les gens et la machine se rivalisent les uns contre les autres: qui est l'homme et qui la machine?

Percée dans l'intelligence artificielle: un modèle d'IA a été maintenu plus souvent dans un test de Turing prolongé que les personnes réelles.

Cependant, l'éruption décisive a donné une technologie bien connue pour de bonnes invites.

C'est arrivé:

L'Université de Californie à San Diego en a uneÉtudePublié, dans le modèle OpenAIS AI GPT-4.5, dans le test Turing dans une version étendue particulièrement de manière convaincante. L'expérience a été réalisée en ligne avec environ 300 participants et est partie comme suit.

Un observateur (leInterrogateur) a parlé séparément avec une personne pendant 5 minutes chacun et avec une IA, sans savoir quels des deux interlocuteurs la machine et quel homme était.
La tâche de l'observateur était de décider qui était humain et qui était la machine en fonction des conversations.

Dans certaines conditions, le modèle GPT-4.5 a pu tromper considérablement plus de la moitié des participants en étant humain de manière convaincante.

Le test de Turing: une référence du développement de l'IA

LeTest de TuringDéveloppé par Alan Turing en 1950, sert à évaluer la capacité d'une machine à imiter l'intelligence humaine. Ce qui suit est procédé:

Je suisJeu d'imitation- comme appelé Turing lui-même - un questionneur humain communique avec deuxTémoin- une personne et une machine.
MourirLa communication a lieu par écrit, de sorte que le questionneur n'a pas de références visuelles ou acoustiques à l'identité des interlocuteurs.
Si le questionneur ne peut pas distinguer de manière fiable entre l'homme et la machine,La machine est considérée comme intelligente dans le sens du test.

Il est important de noter que le test de Turing ne mesure pas la capacité de pensée ou la conscience réelle d'une machine, mais plutôt sa capacité à simuler le comportement de communication humaine.

Une astuce d'incitation fait la différence

Fait intéressant, le type d'incidence sur l'IA a joué un rôle crucial: si le GPT-4.5 a été utilisé sans instructions spéciales, il n'a convaincu que dans 36% des cas. Mais quand l'IA avec unPersonnage, il était équipé, pour ainsi dire, c'était beaucoup plus convaincant. Dans le rôle d'unInternetaffinen jeune hommeL'IA a convaincu 73% des testeurs.

Le fait que Chatgpt fonctionne mieux avec un rôle assigné n'est qu'un des conseils que nous avons mis en place pour vous:

Cependant, comme une certaine invite était nécessaire pour réaliser l'amélioration significative, ce n'est plus le test de Turing au sens classique, mais une version étendue.

Qu'est-ce que cela signifie pour nous?

Le test de Turing est souvent utilisé comme référence pour l'intelligence humaine, bien que de nombreux chercheurs le considèrent insuffisante. Il ne demande plutôt que la facette des compétences en communication. Par exemple, Ned Block a critiqué le test de Turing dans les années 1980..

Les modèles linguistiques tels que GPT-4.5 sont formés pour reconnaître les modèles dans les textes et formuler des réponses convaincantes à cet égard, le résultat ne doit pas nécessairement être surpris.

Cependant, cela montre que des sauts encore plus importants sont possibles dans le développement ultérieur des modèles de langage: OpenAIS GPT-4O, sur lequel Chatgpt est actuellement basé, a été testé, mais bien pire: le modèle linguistique sans personnage affecté n'était que 21% des testeurs convaincants.