All in AI、All in Web4.0 c'était en fait ouvrir une station relais pour vendre des tokens

Auteur : Fugui

0x0 Préface

Début mai 2026, trois événements se sont produits simultanément : Sun Yuchen a publié un post sur X vantant B.AI, la famille Trump a lancé WorldClaw lors de la conférence Consensus, et Fusheng a lancé EasyRouter.io en criant « 15 % de réduction sur toute la salle ». Ces trois choses, mises ensemble, semblent invraisemblables, mais elles sont bel et bien arrivées.

Un vendeur de bananes, un vendeur de meme coin, un vendeur de navigateurs, ont tous lancé simultanément une plateforme de relais AI dans la même semaine.

C’est un peu comme si trois personnes de provinces différentes allaient le même jour dans le même supermarché acheter la même bouteille d’eau minérale — on ne peut s’empêcher de penser qu’il doit y avoir quelque chose derrière cette bouteille.

0x1 Qu’est-ce qu’un relais API, en langage simple

Commençons par clarifier cela.

OpenAI, Anthropic, Google, ces entreprises proposent leurs grands modèles sous forme d’API, facturant par token, et vendent aux développeurs. Un token correspond à peu près à une demi-mot en anglais, ou à un peu moins d’un caractère chinois. Vous posez une question au modèle, recevez une réponse, et cela consomme quelques milliers de tokens, ce qui peut vous coûter moins d’un centime ou quelques dizaines de centimes.

Mais le problème, c’est que ces API officielles ont des barrières : il faut une carte de crédit, un numéro de téléphone étranger, un accès à Internet hors Chine, et des limites de débit. Pour les utilisateurs en Chine, c’est compliqué, et pour les entreprises qui consomment beaucoup, elles veulent aussi des réductions.

Alors, voici le relais. La logique est simple : je vais chercher en gros des quotas API auprès des officiels, tu m’achètes à moi, et je gagne la différence et des frais de service. En langage professionnel, on appelle ça « importation de tokens », plus simplement, ce sont des « revendeurs d’AI ».

Mais ce business n’est pas nouveau, ni très technique. La nouveauté, c’est qu’il a été habillé d’un nouveau manteau : Web4.0, économie des agents IA, infrastructure blockchain. Avec ce manteau, on peut facilement vendre des tokens — pas des tokens API, mais des tokens de cryptomonnaie.

C’est une vieille affaire, habillée d’un vêtement très moderne.

0x2 B.AI de Sun Yuchen : chaque appel est une transaction sur la chaîne

Commençons par Sun Yuchen, car il a été le premier à agir, de façon très directe.

Le 1er mai 2026, Sun Yuchen a publié sur X :

La plateforme relais IA la plus puissante de l’histoire, B.AI, est là. Une clé API = Claude + GPT + Gemini + toute la série de grands modèles nationaux. Connexion blockchain, paiement anonyme, aucune altération, prix le plus bas du net.

Ce message est très précis. Il intègre GPT-5.5, Claude Opus 4.7, et d’autres modèles populaires, prétendant offrir zéro différence de prix avec l’officiel, et aurait déjà dépassé un million d’utilisateurs. Rien qu’en regardant la description, cela ressemble à un service d’agrégation API normal.

Mais le mode de paiement trahit tout : pas de dollars, pas de RMB, il faut utiliser USDT, et tout se règle sur la blockchain.

Ce détail est crucial.

TRON, la blockchain qui supporte la plus grande circulation de USDT dans le monde, est détenue par Sun Yuchen. Chaque fois qu’un utilisateur appelle B.AI, une transaction est enregistrée sur TRON, avec frais, flux sur la chaîne, données écologiques, tout cela entre dans ce système. En langage simple, c’est « infrastructure Web3 », une « identité financière autonome pour que l’agent IA puisse payer lui-même ».

En termes plus clairs : chaque clic sur mon relais alimente ma blockchain publique.

Ce récit est emballé dans une vision Web4.0. La définition de Sun Yuchen pour Web4.0 : lisible, modifiable, possédé, avec autonomie d’exécution IA. Ça paraît ambitieux, mais en pratique, c’est une plateforme d’agrégation API, qui impose la règlementation sur la stabilité de la blockchain, transformant chaque inférence en une transaction sur TRON.

Le vrai calcul est clair : la marge sur l’importation d’API, la transaction sur TRON pour l’écosystème, et la narration « Tout dans Web4.0 » qui fait monter la valeur de TRX et de tout l’écosystème Tron.

Une seule opération, trois profits : le relais n’est que la tête de pont.

0x3 WorldClaw de la famille Trump : faire entrer le dîner de Mar-a-Lago dans la grille tarifaire

L’opération de la famille Trump est plus directe, presque spectaculaire.

Le 5 mai 2026, WLFI (World Liberty Financial, projet crypto cofondé par la famille Trump) a lancé WorldClaw lors de la conférence Consensus 2026, avec pour produit phare WorldRouter — une plateforme d’API qui agrège plus de 300 modèles, prétendant offrir des prix 30 % moins chers que l’officiel, avec un accès à tous les modèles via un seul compte, sans KYC, sans carte étrangère.

Cela ressemble à d’autres relais, mais dès que le tarif apparaît, le ton change.

Quatre forfaits : le plus bas à 9,9 dollars, standard à 99 dollars, premium à 999 dollars, et flagship à 9999 dollars. Le forfait flagship inclut 1 million de crédits IA, et un hardware « confidentiel, non divulgué » — le site précise « images à titre indicatif, le produit réel peut différer », avec livraison prévue pour le troisième trimestre 2026.

Et, parmi certains acheteurs, un tirage au sort pour une soirée privée à Mar-a-Lago avec Donald Trump Jr.

Ce tirage au sort est la partie la plus honnête du produit : il montre que ce n’est pas seulement un API, mais une consommation de foi autour de l’IP Trump.

Le paiement n’accepte qu’une seule devise : USD1. C’est la stablecoin liée au dollar, lancée par WLFI en mars 2025, adossée à des obligations américaines et des dépôts en dollars, fonctionnant sur Ethereum, BNB Chain et Solana. Avec WorldClaw, il faut d’abord acheter USD1, puis utiliser USD1 pour acheter des crédits. Si vous ne voulez pas dépenser, vous pouvez aussi verrouiller des tokens WLFI pour obtenir des crédits : 250 000 WLFI pour le pack Pro, 2 500 000 pour le flagship.

La logique est la suivante : fournir du flux via API → imposer le règlement en USD1, augmentant l’utilisation de la stablecoin → verrouiller WLFI pour réduire la circulation, faire monter le prix du token → récolter via l’économie de tokens. La différence de prix API n’est qu’un droit d’entrée, l’écosystème de tokens est la véritable cible.

Zach Witkoff a déclaré en public :

« À l’avenir, des dizaines de milliers d’IA agents fonctionneront, ils devront payer entre eux, payer les entreprises, mais les banques traditionnelles sont trop lentes pour ça, le KYC est impossible pour les machines — elles ont besoin de USD1. »

Il n’a pas tort, mais il utilise cette phrase pour vendre le forfait à 9999 dollars et la chance de dîner à Mar-a-Lago.

0x4 Qui d’autre dans cette voie Web3

Sun Yuchen et la famille Trump ne sont pas seuls. La voie des relais IA avec tokens est déjà bien encombrée.

Gate.io a lancé GateRouter, qui agrège plus de 25 modèles, permettant aux agents IA de payer en USDT de façon autonome — une logique très proche de B.AI, avec une plateforme relais, règlement sur la chaîne, prélèvements.

Heurist vise à décentraliser la puissance de calcul IA, en agrégeant les GPU inactifs du monde entier pour fournir une API de inférence sans serveur. Elle possède sa propre couche ZK (Heurist Chain), son token HEU, supporte les protocoles x402 et ERC-8004, et permet aux développeurs de s’échanger entre modèles et agents via sa blockchain. En surface, c’est un réseau de calcul décentralisé, mais au fond, c’est une plateforme d’API relais avec incitations en tokens.

Virtuals Protocol est surnommé « Stripe pour agents IA » : il permet aux développeurs de tokeniser leurs agents IA, de les émettre et de les échanger sur la chaîne — votre agent devient un token, et détenir ce token équivaut à posséder une part de l’agent. En poussant plus loin, l’API relais n’est qu’une capacité de l’agent, la vraie vente, c’est la croissance anticipée du token de l’agent.

Le point commun de ces projets : ils agrègent des API modèles, lient tout à des paiements sur la chaîne, et ont tous un token en ligne de mire.

De B.AI à WorldClaw, à GateRouter, à Heurist, chaque projet a sa propre emballage, mais la ligne directrice du token est constante.

Ce secteur ne se trompe pas de direction, mais il faut distinguer qui construit l’infrastructure et qui l’utilise pour vendre des tokens. Comme en 2000, quand les entreprises de fibre optique construisaient la large bande, et que les portails Internet faisaient du « concept Internet » pour lever des fonds — tous se disaient « entreprises Internet », mais leur cœur de métier était différent.

0x5 Trois façons de gagner avec un relais, et pourquoi mettre le chapeau « Web4.0 »

Les revenus d’un relais se décomposent en trois couches, indépendantes, qui forment ensemble un business complet.

Première couche : l’asymétrie d’information. Les API étrangères ont des restrictions géographiques, des différences de prix, des barrières d’accès. Le relais exploite ces frictions pour acheter en gros à moindre coût, puis vendre au prix officiel ou légèrement inférieur, réalisant une marge. En surface, on parle de « zéro marge », mais en réalité, il y a souvent des marges occultes, des facturations déformées. Selon des insiders, près de la moitié des neuf fournisseurs dissimulent des surcharges — vous payez pour du Claude, mais c’est peut-être du bean.

Deuxième couche : la taxe implicite sur le paiement. En évitant la carte de crédit, en utilisant des stablecoins ou des tokens maison, chaque appel génère du flux dans votre écosystème. Vous gagnez sur les frais de gas, sur les données de transaction, sur la circulation interne.

Troisième couche : la pompe à tokens. En émettant ou en liant un token propre, en verrouillant une partie pour réduire la circulation, en faisant monter le prix sur le marché secondaire, vous réalisez une sortie à haut niveau. WLFI, par exemple, voit 75 % de ses bénéfices aller directement à des entités liées à la famille Trump.

Ces trois couches, combinées, forment le vrai modèle commercial : « Tout dans l’IA, tout dans Web4.0 ».

Mais pourquoi mettre le chapeau « Web4.0 » ?

Parce qu’en l’absence de cette étiquette, le token ne se vendrait pas cher.

Un relais API, c’est un relais, avec une marge limitée, soumis à la régulation, et où changer de plateforme coûte zéro pour l’utilisateur. Mais si c’est « l’infrastructure de la prochaine génération d’Internet », la « base financière de l’économie des agents IA », ou « la couche de paiement de l’ère Web4.0 », la logique d’évaluation change, le récit peut attirer plus d’investisseurs, le token peut se vendre plus cher, et le coût de migration pour l’utilisateur devient psychologiquement plus élevé.

Le concept, c’est qu’il donne l’illusion que si vous ratez cette opportunité, vous ratez toute une époque.

0x6 À quoi ressemble la vraie infrastructure

Après avoir parlé de la faucille, parlons de la vraie houe.

L’économie des agents IA a besoin d’infrastructures fondamentales, mais il en existe deux types : la couche de protocole de paiement et la couche de calcul. Les deux sont en développement sérieux, mais moins médiatisés que la vente de tokens.

Le protocole de paiement représentatif est x402. Proposé par Coinbase en mai 2025, basé sur le code d’état HTTP 402 — un code réservé depuis près de trente ans, signifiant « demande de paiement », jamais utilisé car il manquait un mécanisme de paiement instantané programmable. La montée en puissance des stablecoins blockchain et des agents IA leur donne enfin une utilité. La logique est simple : le client envoie une requête, le serveur répond 402 avec le montant et l’adresse de paiement, le client paie sur la blockchain, fournit une preuve, le serveur libère l’accès — tout cela sans compte ni KYC. Cloudflare, Google, Stripe, AWS, Visa, Mastercard s’y connectent, la Linux Foundation en assure la maintenance, et fin 2025, le volume hebdomadaire frôlait le million de transactions. C’est open source, gratuit, sans token à verrouiller.

Sur cette couche x402, deux projets méritent d’être mentionnés.

Pay.sh, lancé par la Solana Foundation en partenariat avec Google Cloud, le 5 mai 2026, est une passerelle de paiement IA basée sur x402 et MPP, avec un registre open source. Elle intègre Gemini, BigQuery, Vertex AI, et plus de 50 API communautaires, comme Dune Analytics, Helius, The Graph. L’agent IA utilise un portefeuille Solana comme identité, paie en stablecoins, sans compte ni clé API, avec règlement en secondes sur Solana, et les fournisseurs reçoivent leur monnaie fiat. En résumé : transformer l’API d’entreprise Google Cloud en un étal de produits que l’agent peut payer directement par carte.

Kite AI (KITE), une blockchain Layer 1 conçue pour l’économie des agents, lancée fin avril 2026 sur Avalanche, délivre un « passeport » pour chaque agent — le Kite Agent Passport — contenant une identité cryptographique vérifiable et des droits de consommation programmables, pour répondre au problème de conformité : « l’agent paie seul, mais l’humain ne sait pas combien, ni où ». x402 est sa primitive de paiement native. Le projet a levé 33 millions de dollars en série A, avec PayPal Ventures et General Catalyst en lead, Coinbase Ventures en co-investisseur, et des pilotes avec PayPal et Shopify. Ce n’est pas un relais API, mais une infrastructure pour délivrer une identité aux machines.

Côté calcul, trois projets méritent d’être mentionnés.

Bittensor (TAO), le plus ancien, surnommé « le Bitcoin de l’IA », avec une offre totale de 21 millions de tokens, un mécanisme de halving, et une logique d’exploitation par « calcul utile » : contribution de modèles, de puissance, de données, en échange de récompenses TAO. Le réseau est divisé en centaines de sous-réseaux spécialisés dans différentes tâches IA, pouvant s’appeler entre eux pour former une chaîne de services. Ce n’est pas un relais, c’est une expérience pour créer un cerveau décentralisé via une incitation token. En mai 2026, TAO a refait surface avec un volume de 200 millions de dollars par jour. La question n’est pas de savoir si ça fonctionne, mais ce qu’ils font n’est pas de la revente d’API.

Phala Network (PHA) se concentre sur le calcul privé. Sa technologie clé est TEE (Trusted Execution Environment) : les données entrent dans un enclave cryptographique isolé, même les opérateurs ne peuvent pas voir leur contenu, et la vérification se fait sur la blockchain. Fin 2025, elle a migré de Polkadot vers une couche L2 sur Ethereum, traitant plus d’un milliard de tokens par jour. Dans l’IA, beaucoup de données sensibles — médicales, financières, juridiques — ne peuvent pas être envoyées à un relais centralisé. Phala permet d’utiliser l’IA sans exposer ses données.

Fluence (FLT) est un marché décentralisé de puissance de calcul. Elle agrège des GPU de centres de données mondiaux, permettant aux développeurs d’acheter de la puissance à environ 80 % moins cher qu’AWS ou Azure. La demande en tokens FLT dépend directement de la consommation de puissance — c’est la quantité d’heures GPU réellement utilisées qui compte, pas la narration. Fin 2025, le chiffre d’affaires dépassait 1 million de dollars, avec plus de 1400 GPU répartis dans 32 régions et 71 centres. Ce n’est pas un relais API, c’est une véritable infrastructure décentralisée de calcul.

Ces projets, par leur nature, diffèrent nettement de B.AI ou WorldClaw : ils construisent des infrastructures fondamentales pour que d’autres fassent des choses, plutôt que de faire eux-mêmes un intermédiaire pour revendre. x402 n’émet pas de token, OpenRouter n’en a jamais eu, mais ils supportent tous des milliards d’appels. TAO, PHA, FLT ont des tokens, mais ceux-ci représentent une contribution réelle en puissance ou en sécurité, pas une simple « verrouillage de 250 000 tokens pour un pack maximal ».

0x7 Quelques mots de conclusion

L’économie des agents IA est une réalité, tout comme la nécessité de micro-paiements entre machines, et la « couche de paiement de la prochaine génération d’Internet » est une narration crédible.

Le seul problème : qui construit vraiment cette infrastructure, et qui l’utilise pour vendre des tokens ?

La méthode est simple : si on enlève le token d’un produit, peut-il encore fonctionner ?

B.AI, sans USDT, reste une plateforme d’API, mais perd la valeur liée à l’écosystème de Sun Yuchen. WorldClaw, sans USD1 ni verrou WLFI, n’est qu’une agrégation API ordinaire, et le forfait à 9999 dollars n’a plus de raison d’être.

Fluence, sans FLT, continue de faire fonctionner ses 1400 GPU, et les économies de cloud de 4 millions de dollars sont réelles.

Bittensor, sans TAO, continue de faire tourner ses sous-réseaux, et la compétition se poursuit. Phala, sans PHA, maintient ses capacités de calcul privé, et le volume de milliards de tokens traités ne disparaîtra pas. x402, qui n’a jamais eu de token, est déjà adopté par Cloudflare et Google.

La méthode pour distinguer infrastructure et simple pompe à tokens : si, après suppression du token, le service continue, c’est une infrastructure. Sinon, c’est une pompe.

Ce n’est pas que les tokens soient mauvais, la stabilité sur la chaîne et l’incitation décentralisée sont des besoins réels. Mais le problème, c’est que les outils de paiement et la spéculation sur les tokens sont deux choses différentes. La première, c’est un canal ; la seconde, c’est vendre de l’eau en installant une porte de péage et en vendant aussi des actions du canal.

Quand quelqu’un vous vend à la fois API, stablecoins et verrouillage de tokens, l’un de ces éléments est votre capital.

Lequel ? À vous de deviner.

TOKEN0,02%
TRUMP-0,49%
MEME-0,09%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler