Magazine Bitcoin

Alpha Arena révèle des failles dans le trading de l’IA : les modèles occidentaux perdent 80 % de leur capital en une semaine
L’IA peut-elle échanger des crypto-monnaies ? Jay Azhang, ingénieur informatique et frère financier de New York, met cette question à l’épreuve avec Alpha Arena. Le projet oppose les plus grands modèles de langage (LLM), chacun doté d’un capital d’une valeur de 10 000 dollars, pour voir lequel peut rapporter le plus d’argent en échangeant des cryptomonnaies. Les modèles incluent Grok 4, Claude Sonnet 4.5, Gemini 2.5 pro, ChatGPT 5, Deepseek v3.1 et Qwen3 Max.
Maintenant, vous pensez peut-être « wow, c’est une excellente idée ! » et vous seriez surpris, au moment de la rédaction de cet article, trois des cinq IA sont sous l’eau, avec Qwen3 et Deepseek – les deux modèles open source chinois – en tête.
C’est vrai, les intelligences artificielles propriétaires les plus puissantes et les plus fermées du monde occidental, gérées par des géants comme Google et OpenAI, ont perdu plus de 8 000 dollars, soit 80 % de leur capital de trading crypto en un peu plus d’une semaine, tandis que leurs homologues open source de l’Est sont dans le vert.
L’échange le plus réussi jusqu’à présent ? Qwen3 – hydraté et dans sa voie – avec une simple position longue de 20x Bitcoin. Grok 4 – sans surprise – a longtemps été Doge avec un effet de levier 10x pour la plupart des concurrents… ayant à un moment donné été en tête des charts avec Deepseek, maintenant près de 20 % sous l’eau. Peut-être qu’Elon Musk devrait tweeter un mème doge ou quelque chose comme ça pour, vous savez, faire sortir Grok de la niche.
Pendant ce temps, Gemini de Google est implacablement baissier, étant à court de tous les actifs cryptographiques disponibles à la négociation, une position qui fait écho à leur politique générale en matière de cryptographie au cours des 15 dernières années.
Enfin et surtout, ChatGibitty, qui a rendu possible toutes les mauvaises transactions pendant une semaine consécutive, une réussite remarquable ! Il faut du talent pour être aussi mauvais, surtout quand Qwen3 a juste envie de Bitcoin et est allé à la pêche. S’il s’agit de la meilleure IA en source fermée, alors peut-être qu’OpenAI devrait simplement la garder en source fermée et nous épargner.
Une nouvelle référence pour l’IA
Blague à part, l’idée de comparer les modèles d’IA les uns aux autres dans une arène de trading crypto a des idées très profondes. Pour commencer, l’IA ne peut pas être pré-formée sur les réponses aux tests de connaissances sur le trading de cryptomonnaies car elle est très imprévisible, un problème dont souffrent d’autres benchmarks. En d’autres termes, de nombreux modèles d’IA reçoivent les réponses à certains de ces tests au cours de leur formation, et bien sûr, ils obtiennent de bons résultats lorsqu’ils sont testés. Mais certaines recherches ont démontré que de légères modifications apportées à certains de ces tests conduisent à des résultats de référence en IA radicalement différents.
Cette controverse soulève la question suivante : quel est le test ultime de l’intelligence ? Eh bien, selon Elon Musk, passionné d’Iron Man et créateur de Grok 4, prédire l’avenir est la mesure ultime de l’intelligence.
Et avouons-le, il n’y a pas d’avenir plus incertain que le prix à court terme des cryptomonnaies. Selon Azhang, « Notre objectif avec Alpha Arena est de rendre les benchmarks plus proches du monde réel, et les marchés sont parfaits pour cela. Ils sont dynamiques, conflictuels, ouverts et infiniment imprévisibles. Ils défient l’IA d’une manière que les benchmarks statiques ne peuvent pas faire. — Les marchés sont le test ultime de l’intelligence. »
Cette vision des marchés est profondément ancrée dans les principes libertaires à l’origine du Bitcoin. Des économistes comme Murray Rothbard et Milton Friedman ont fait valoir il y a plus de cent ans que les marchés étaient fondamentalement imprévisibles pour les planificateurs centraux et que seuls les individus prenant de véritables décisions économiques avec quelque chose à perdre pouvaient faire des calculs économiques rationnels.
En d’autres termes, le marché est la chose la plus difficile à prédire car il dépend des perspectives et des décisions individuelles d’individus intelligents à travers le monde et constitue donc le meilleur test d’intelligence.
Azhang mentionne dans la description de son projet que les IA sont chargées de négocier non seulement pour des gains, mais aussi pour des rendements ajustés au risque. Cette dimension de risque est essentielle, car une mauvaise transaction peut anéantir tous les rendements précédents, comme le montre par exemple la chute du portefeuille de Grok 4.
Il reste une autre question : ces modèles apprennent-ils de leur expérience dans le trading de crypto-monnaies, une question qui n’est pas techniquement facile à réaliser, étant donné que la pré-formation des modèles d’IA est très coûteuse en premier lieu. Ils pourraient être affinés avec leur propre historique de trading ou celui d’autres personnes, et ils pourraient même conserver les transactions récentes dans leur mémoire à court terme ou leur fenêtre contextuelle, mais cela ne peut les mener que jusqu’à un certain point. En fin de compte, le bon modèle commercial d’IA devra peut-être réellement tirer les leçons de ses propres expériences, une technologie qui a été récemment annoncée dans les cercles universitaires mais qui a encore un long chemin à parcourir avant de devenir un produit. Le MIT les appelle des modèles d’IA auto-adaptatifs.
Comment savons-nous que ce n’est pas juste de la chance ?
Une autre analyse du projet et de ses résultats jusqu’à présent est qu’il est peut-être impossible de le distinguer d’une « marche aléatoire ». Une marche aléatoire revient à lancer des dés pour chaque décision. À quoi cela ressemblerait-il sur un graphique ? Eh bien, il existe en fait un simulateur que vous pouvez utiliser pour répondre à cette question ; en fait, cela ne serait pas trop différent.
Cette question de la chance sur les marchés a également été décrite avec beaucoup de soin par des intellectuels comme Nassim Taleb dans son livre Antifragile. Dans ce document, il affirme que du point de vue des statistiques, il est tout à fait normal et possible qu’un commerçant, disons Qwen3 dans ce cas, ait de la chance pendant une semaine entière d’affilée ! Conduisant à l’apparition d’un raisonnement supérieur. Taleb va beaucoup plus loin que cela, affirmant qu’il y a suffisamment de traders à Wall Street pour que l’un d’entre eux puisse facilement avoir de la chance pendant 20 années consécutives, développant une réputation divine, tout le monde autour d’eux supposant que ce trader n’est qu’un génie, jusqu’à ce que, bien sûr, la chance s’épuise.
Ainsi, pour qu’Alpha Arena produise des données précieuses, il devra en réalité fonctionner pendant une longue période, et ses modèles et résultats devront également être reproduits de manière indépendante, avec un capital réel en jeu, avant de pouvoir être identifiés comme étant différents d’une marche aléatoire.
En fin de compte, c’est formidable de voir les modèles open source et rentables comme DeepSeek surpasser jusqu’à présent leurs homologues fermés. Alpha Arena a jusqu’à présent été une excellente source de divertissement, car elle est devenue virale sur X.com au cours de la semaine dernière. Où cela va-t-il ? nous devrons voir si le pari pris par son créateur, en donnant 50 000 $ à cinq chatbots pour parier sur la cryptographie, finit par payer.
Cet article Alpha Arena révèle les failles du trading de l’IA : les modèles occidentaux perdent 80 % de leur capital en une semaine, apparu pour la première fois sur Bitcoin Magazine et est écrit par Juan Galt.
Share this content:

