Version de référence de cet article : paulantoinetual.fr/blog/ou-va-la-valeur-de-lia-trois-signaux-de
Par Paul-Antoine TUAL — AI Transformation Leader, Croissance et Transitions — Juin 2026.
Posture. Ce qui suit n'Ă©tait pas vrai il y a une semaine : le lancement de Gemma 4 12B, le 3 juin 2026, a dĂ©placĂ© la frontière de ce qui tourne sur une machine personnelle. On dĂ©bat beaucoup de savoir si l'IA est une bulle. C'est la mauvaise question. La bonne question, pour un dirigeant comme pour un investisseur, est : dans quelle couche de la chaĂ®ne de valeur la valeur est-elle en train de migrer ? Trois signaux de 2026 — le rattrapage des modèles ouverts, la suffisance des modèles compacts locaux, et le clonage en une nuit de la couche logicielle — dessinent une rĂ©ponse cohĂ©rente. Elle ne condamne pas l'IA ; elle condamne certaines valorisations. Et elle indique prĂ©cisĂ©ment oĂą une PME doit investir.
1. Premier signal : un modèle ouvert dépasse un modèle phare propriétaire
Le 7 avril 2026, Z.ai a publiĂ© GLM-5.1 — modèle open-weight sous licence MIT (MoE de 754 Md de paramètres, 40 Md actifs par token, contexte 202 752 tokens, exĂ©cution autonome jusqu'Ă 8 h) [1]. Il a pris la tĂŞte du classement SWE-Bench Pro avec 58,4 %, devant GPT-5.4 (57,7 %), Claude Opus 4.6 (54,2–57,3 % selon le harness) et Gemini 3.1 Pro (54,2 %) [1][2]. Sur Terminal-Bench 2.0, il devance Ă©galement Gemini 3.1 Pro (63,5 % vs 56,9 %) et il est le premier open-weight de l'histoire dans le top 3 de Code Arena [2]. Sur le coding et l'agentique — prĂ©cisĂ©ment les deux usages qui portent la transformation IA des entreprises — un modèle tĂ©lĂ©chargeable gratuitement fait donc jeu Ă©gal, voire mieux, que les modèles phares facturĂ©s Ă l'usage.
La nuance qui Ă©vite le sensationnalisme : Claude Opus 4.6 conserve la tĂŞte sur Terminal-Bench 2.0 (68,5 %) et les propriĂ©taires dominent encore le raisonnement abstrait pur (GPQA Diamond : 94,3 % vs 86,2 %) [2]. Epoch AI mesure le retard moyen des meilleurs open-weight Ă 3-4 mois sur les modèles frontière [3]. La frontière n'a pas disparu ; elle s'est rĂ©duite Ă quelques points, sur quelques benchmarks, pour quelques mois d'avance — imperceptible pour 95 % des cas d'usage d'entreprise.
Mais l'économie, elle, a déjà basculé. Le prix d'une performance donnée s'effondre : Epoch AI mesure une division du prix par 40 par an pour atteindre le niveau GPT-4 sur des questions scientifiques de niveau doctorat [3] ; l'API de Gemini 3.1 Flash coûte 0,10 $/M tokens en entrée là où GPT-4 coûtait 30 $ en 2023, soit ~99,7 % de baisse en trois ans [4] ; Gartner prévoit que l'inférence d'un modèle à 1 000 milliards de paramètres coûtera 90 % de moins en 2030 qu'en 2025 [5].
Conclusion intermĂ©diaire : quand le sous-jacent (le modèle) rattrape le propriĂ©taire en qualitĂ© et tend vers le coĂ»t marginal du calcul, la rente du modèle seul s'Ă©vapore. Ce qui se vend encore cher, c'est l'avance de quelques mois — un actif qui se dĂ©prĂ©cie Ă la vitesse des releases.
2. Deuxième signal : le modèle compact local suffit pour l'essentiel des tâches agentiques
Ce signal est tout rĂ©cent : il date du lancement de Gemma 4 12B le 3 juin 2026, quatre jours avant l'Ă©criture de ces lignes. Grâce Ă son architecture unifiĂ©e sans encodeur, Gemma 4 12B tourne intĂ©gralement en local sur une machine Ă 16 Go de RAM — un laptop professionnel standard — avec un contexte de 256 000 tokens et de l'audio/vision natifs [6][7]. Ses performances agentiques sont sĂ©rieuses : 69,0 % sur tau2-bench (simulation d'agent en environnement d'entreprise rĂ©el), contre 76,9 % pour son grand frère 31B — et le 12B dĂ©passe l'ancien Gemma 3 27B, deux fois plus lourd, sur la vision documentaire et le raisonnement [7]. Google documente explicitement les « workflows agentiques locaux » sur laptop [8].
La lecture stratĂ©gique compte autant que la prouesse technique. En publiant gratuitement un modèle local qui couvre l'essentiel des usages agentiques, Google applique le vieux principe « commoditize your complement » formulĂ© par son propre Ă©conomiste en chef, Hal Varian : il cannibalise dĂ©libĂ©rĂ©ment la couche modèle — celle dont les laboratoires sans autre source de revenu tirent leur rente — parce que sa propre valeur est ailleurs : distribution, cloud, matĂ©riel, publicitĂ©. Quand l'acteur le mieux dotĂ© du secteur dĂ©cide que le modèle est un produit d'appel, la commoditisation n'est plus une dĂ©rive du marchĂ© ; c'est une stratĂ©gie assumĂ©e.
Combien de tâches d'entreprise cela couvre-t-il ? Le position paper de NVIDIA Research « Small Language Models are the Future of Agentic AI » estime que 80 Ă 90 % des invocations agentiques relèvent de la catĂ©gorie « un petit modèle suffit » — appels d'outils, raisonnement structurĂ©, Ă©tapes orchestrĂ©es — pour un coĂ»t d'infĂ©rence 10 Ă 30 fois infĂ©rieur [9].
L'échelle de matériel 2026 (ordres de grandeur relevés) :
| Besoin | Machine | Budget | Ce qui tourne |
|---|---|---|---|
| Agentique locale courante | Laptop / mini-PC 16 Go | < 1 000 € | Gemma 4 12B et Ă©quivalents quantizĂ©s |
| Agentique avancĂ©e + multimodal | Mac Studio 64 Go ou mini-PC AMD/Qualcomm 128 Go de mĂ©moire unifiĂ©e | ~2 000–3 500 € | Gemma 4 31B et au-delĂ |
| Modèle de classe frontier en local | Mac Studio 512 Go — option retirĂ©e du catalogue Apple en mars 2026 (pĂ©nurie DRAM) ; marchĂ© secondaire spĂ©culatif ou cluster de machines 256 Go | > 12 000 € (estimation) | GLM-5.1 quantizĂ© 8 bits |
Deux lectures de ce tableau. D'abord, la nouvelle gĂ©nĂ©ration de mini-PC Ă mĂ©moire unifiĂ©e (AMD Ryzen AI Max+ 128 Go entre ~2 400 et 3 200 $, contre 4 699 $ pour la station NVIDIA DGX Spark Ă©quivalente) fait chuter le coĂ»t du token local : Ă prix de marchĂ©, le ratio tokens gĂ©nĂ©rĂ©s par dollar investi penche nettement en faveur de ces machines banalisĂ©es [26]. Ensuite, la disparition du Mac Studio 512 Go illustre par l'absurde la thèse de cet article : courir après l'infrastructure frontier en local est devenu un jeu spĂ©culatif — alors que la machine Ă 2 500 € qui couvre 80-90 % des usages, elle, reste en rayon.
Et la courbe continue de descendre grâce aux innovations de quantization : TurboQuant (Google Research, prĂ©sentĂ© Ă ICLR 2026) combine rotation alĂ©atoire des vecteurs, quantization agressive et correction rĂ©siduelle 1 bit pour diviser par 3,2 l'empreinte mĂ©moire des poids — avec, en configuration 4 bits + rĂ©sidu 8 bits, une perte de perplexitĂ© strictement nulle par rapport au modèle 16 bits [10][11]. Des modèles qui exigeaient un cluster de GPU datacenter tournent dĂ©sormais sur du matĂ©riel grand public ou semi-professionnel [11]. La quantization ne grignote pas la commoditisation de l'infĂ©rence : elle l'accĂ©lère structurellement, en dĂ©plaçant la frontière datacenter/local d'un cran tous les six mois.
Le contre-courant Ă ne pas occulter : le coĂ»t de la mĂ©moire. Il serait malhonnĂŞte de prĂ©senter la bascule locale comme un long fleuve tranquille. La crise n'est pas un accident d'usine, c'est un choix stratĂ©gique : pour servir la demande de puces IA des datacenters, Samsung, SK Hynix et Micron ont converti la majoritĂ© de leurs lignes vers la HBM (haute marge), sacrifiant la DRAM classique de nos PC, serveurs et Mac. RĂ©sultat mesurĂ© par TrendForce : contrats DRAM +90-95 % au T1 2026, puis +58-63 % au T2 (NAND : +70-75 %), les hyperscalers verrouillant l'offre par des contrats long terme [23]. Gartner anticipe une hausse cumulĂ©e pouvant atteindre 130 % sur l'annĂ©e [24], et aucune dĂ©tente n'est attendue avant la montĂ©e en volume des nouvelles usines — fin 2027 au plus tĂ´t, retour aux standards de prix 2024 plutĂ´t vers 2028 [23][25]. C'est cette pĂ©nurie qui a poussĂ© Apple Ă retirer le Mac Studio 512 Go de son catalogue plutĂ´t que d'afficher des prix absurdes [26].
La consĂ©quence pratique pour un dirigeant tient en deux lignes. Besoins standards (16-64 Go) : acheter malgrĂ© la hausse — un surcoĂ»t de l'ordre de 100-150 € reste marginal face au gain de productivitĂ© des modèles compacts, et cette hausse frappe le matĂ©riel neuf, pas les prix des API cloud qui continuent de s'effondrer. Besoins massifs (128 Go et au-delĂ ) : attendre ou louer — le segment est en surchauffe spĂ©culative ; mieux vaut consommer du token en API pendant les 12-18 prochains mois que surpayer une infrastructure physique appelĂ©e Ă se dĂ©prĂ©cier fortement quand l'offre se dĂ©tendra vers 2028. L'arbitrage local/cloud se fait donc usage par usage. Et la quantization compense partiellement la hausse en divisant le besoin mĂ©moire Ă qualitĂ© quasi Ă©gale. Dernier point de vigilance : l'auto-hĂ©bergement suppose des compĂ©tences d'ingĂ©nierie que beaucoup de PME n'ont pas encore en interne — c'est prĂ©cisĂ©ment lĂ que se loge la valeur de l'accompagnement (section 5).
Ce qui justifie encore une infrastructure lourde : le raisonnement frontier longue durĂ©e, le temps rĂ©el Ă grande Ă©chelle (voix, vidĂ©o, trading), les contextes très longs, l'entraĂ®nement. C'est rĂ©el — mais ce sont des usages de pointe, pas le quotidien de 99 % des PME et ETI. Pour la majoritĂ© des entreprises, l'infrastructure IA pertinente tient dans un budget de poste de travail, pas dans un contrat datacenter.
3. Troisième signal : la couche logicielle s'est clonée en une nuit
Le 31 mars 2026, un fichier .map publiĂ© par erreur dans le paquet npm de Claude Code a exposĂ© l'architecture interne complète de l'agent de coding d'Anthropic (512 000 lignes, 1 906 fichiers) [12]. En quelques heures, la communautĂ© open-source en a produit une rĂ©implĂ©mentation propre (Claw Code, Python/Rust, sans copier une ligne de code propriĂ©taire), qui a atteint 100 000 Ă©toiles GitHub en 24 heures — record absolu de la plateforme [12][13].
La leçon dĂ©passe l'anecdote : la couche logicielle qui entoure le modèle (le « harness » : boucle agentique, outils, permissions) est architecturalement transparente. Sa protection par le secret ou la propriĂ©tĂ© intellectuelle est très dĂ©licate ; sa rĂ©plication coĂ»te une nuit de travail Ă une communautĂ© motivĂ©e. Ce qui reste dĂ©fendable dans cette couche : la distribution installĂ©e, la marque, la confiance, le rythme de release, les intĂ©grations profondes — c'est-Ă -dire des actifs commerciaux, pas du code.
4. Conséquence : les laboratoires deviennent-ils de simples loueurs de calcul ?
Si le modèle se commoditise (signal 1), si l'infĂ©rence descend sur le poste de travail (signal 2) et si le logiciel se clone (signal 3), que reste-t-il aux laboratoires ? La tentation est de rĂ©pondre : la location de puissance de calcul — un mĂ©tier de tĂ©lĂ©com, Ă rendements comprimĂ©s par la guerre des prix.
Les chiffres 2026 dessinent dĂ©jĂ cette Ă©conomie de tĂ©lĂ©com. Anthropic a franchi 30 Md$ de revenus annualisĂ©s en avril 2026 et dĂ©passĂ© OpenAI (~25 Md$) — mais l'abonnement grand public plafonne, avec une marge opĂ©rationnelle non-GAAP de -122 % chez OpenAI au T1 2026 [14] : la croissance vient de l'API d'entreprise, c'est-Ă -dire de la vente de tokens au volume — littĂ©ralement de la location de calcul cognitif. Et la rĂ©alitĂ© est plus inconfortable encore : la plupart des laboratoires ne possèdent mĂŞme pas le calcul qu'ils loueraient. Ils le louent eux-mĂŞmes aux hyperscalers et aux fabricants de puces, souvent via des montages circulaires — l'accord Nvidia-OpenAI reprĂ©senterait ~13 % des revenus projetĂ©s de Nvidia en 2026 [15] — qui rappellent le vendor financing des tĂ©lĂ©coms de la fin des annĂ©es 1990. Le capex 2026 des hyperscalers (~725 Md$, dont 180-190 Md$ pour le seul Alphabet, soit plus de 3 % du PIB amĂ©ricain selon Goldman Sachs) [15], le « trou » de revenus applicatifs (plus de 500 Md$ nĂ©cessaires pour justifier ~1 000 Md$ d'infrastructures, selon Sequoia et Goldman) [15], et l'Ă©tude NBER de fĂ©vrier 2026 (sur ~6 000 cadres : 90 % ne mesurent aucun impact de l'IA sur la productivitĂ© de leur entreprise en trois ans, pour un usage moyen de 1,5 h/semaine) [16] disent la mĂŞme chose : les valorisations actuelles des couches modèle et application supposent une rente que les trois signaux ci-dessus sont en train de dissoudre.
Les contre-arguments des laboratoires existent et mĂ©ritent d'ĂŞtre pris au sĂ©rieux : intĂ©gration verticale dans des produits (l'avance se vend en produit, pas en API), donnĂ©es d'usage, marque grand public, relations entreprise. Mais chacun de ces actifs relève de la distribution et du service — pas du modèle.
Et il y a un aveu plus explicite encore : les laboratoires et leurs alliĂ©s lancent eux-mĂŞmes des cabinets de conseil. L'alliance IBM-Google Cloud du 4 juin 2026 mobilise des milliers de consultants autour de Gemini Enterprise [18] ; les Ă©diteurs de modèles dĂ©veloppent leurs branches d'intĂ©gration et de dĂ©ploiement chez le client. Un vendeur de modèles qui embauche des consultants — mĂ©tier Ă marge de service, lĂ oĂą l'API promettait une marge logicielle — reconnaĂ®t trois choses : que le modèle seul ne se vend plus assez cher, que la valeur est dans le dernier kilomètre qu'il ne contrĂ´lait pas, et que la thèse de la migration est juste. Quand le vendeur descend la chaĂ®ne vers l'aval, c'est que la rente de sa couche d'origine s'Ă©rode.
5. Où la valeur se réfugie
La grille est désormais lisible, couche par couche :
| Couche | Tendance de valeur | Pourquoi |
|---|---|---|
| Semi-conducteurs, énergie, foncier datacenter | Soutenue mais cyclique | Rareté physique réelle ; risque de surcapacité |
| Modèles (laboratoires) | En compression | Open-weight + chute des prix d'inférence |
| Couche logicielle / agents | En compression rapide | Clonable en heures ; pas de protection durable |
| Données propriétaires vivantes | En hausse | Coût opérationnel continu, non réplicable par le code |
| Agréments, conformité, distribution | En hausse | Barrières administratives et contractuelles |
| IntĂ©gration workflow + accompagnement humain | En forte hausse | Le service EST le produit ; Infosys chiffre l'opportunitĂ© services IA Ă 300–400 Md$ d'ici 2030 [17] ; IBM et Google Cloud s'allient le 4 juin 2026 prĂ©cisĂ©ment sur « l'expertise humaine Ă l'Ă©chelle » [18] ; en France, l'IA pèse dĂ©jĂ plus de 11 % des prises de commandes de Capgemini au T1 2026 [19] |
L'accompagnement humain n'est donc pas « ce qui reste » par dĂ©faut : c'est la couche vers laquelle tous les acteurs rationnels convergent, laboratoires compris. Pour une PME, la consĂ©quence est directe : la dĂ©pense IA pĂ©renne n'est ni la licence du modèle ni l'outil du moment — c'est la mĂ©thode, les donnĂ©es gouvernĂ©es et les compĂ©tences internes. Exactement la thèse de la MĂ©thode Junyr™ : structurer l'organisation pour absorber des modèles et des outils devenus interchangeables, plutĂ´t qu'Ă©pouser un fournisseur.
Trois questions Ă poser dès lundi matin. 1. Quelle part de nos usages IA exige rĂ©ellement un modèle frontier facturĂ© Ă l'usage — et quelle part tournerait sur une machine Ă 2 500 € ? 2. Si notre outil IA principal disparaissait ou dĂ©cuplait son prix demain, que perdrions-nous : du code (remplaçable) ou des donnĂ©es et des compĂ©tences (les nĂ´tres) ? 3. Notre budget IA finance-t-il des rentes de fournisseurs en voie de commoditisation, ou des actifs internes qui s'apprĂ©cient ?
6. Ce que cela dit des valorisations — sans catastrophisme
Faut-il en conclure Ă l'« explosion » prochaine ? Non : les travaux multi-mĂ©thodes rĂ©cents [20] et l'analyse par couches [21] convergent vers un diagnostic plus utile — il n'y a pas une bulle, il y a des couches surĂ©valuĂ©es et des couches soutenables, avec des horizons de correction diffĂ©rents. La concentration des indices et un Shiller P/E Ă 42,3 — tout près du record de 44,2 de l'an 2000 — rendent la correction des couches fragiles douloureuse pour tous : le 3 juin 2026, Broadcom a perdu 15 % et 280 Md$ de capitalisation en une sĂ©ance pour une prĂ©vision Ă peine infĂ©rieure aux attentes [22]. Cela ne change pas la direction de la migration. Le dirigeant n'a pas Ă prĂ©dire la date ; il a Ă se positionner du bon cĂ´tĂ© de la migration. C'est un calendrier de dĂ©cisions, pas une alarme.
En pratique
Croissance et Transitions accompagne les dirigeants de PME et d'ETI pour se positionner du bon cĂ´tĂ© de cette migration : diagnostic de maturitĂ© (MĂ©thode Junyr™), arbitrage local/cloud usage par usage, gouvernance des donnĂ©es propriĂ©taires et montĂ©e en compĂ©tences des Ă©quipes — les actifs qui s'apprĂ©cient quand modèles et outils se banalisent.
→ Diagnostic IA Express — 90 minutes en visio. croissance-transitions.fr
Paul-Antoine TUAL — AI Transformation Leader · Croissance et Transitions (SAS) · MĂ©thode Junyr™
FAQ
Un modèle open-source est-il vraiment au niveau des modèles propriĂ©taires en 2026 ? Sur le coding et l'agentique, oui pour certains benchmarks : GLM-5.1 (licence MIT) dĂ©passe Gemini 3.1 Pro sur SWE-Bench Pro (58,4 % vs 54,2 %) et sur Terminal-Bench 2.0 (63,5 % vs 56,9 %). Les modèles propriĂ©taires conservent une avance sur d'autres composites — une avance qui se compte en points et en mois, plus en ordres de grandeur.
Une PME a-t-elle besoin d'une infrastructure cloud lourde pour l'IA agentique ? Dans 80 Ă 90 % des invocations agentiques (estimation NVIDIA Research), un modèle compact suffit — et tourne en local dès 16 Go de RAM (Gemma 4 12B), ou sur un Mac Studio 64 Go (~2 500 €) pour la version 31B.
Qu'est-ce que la quantization change pour une PME ? Des techniques comme TurboQuant (Google Research, ICLR 2026) divisent par ~3,2 l'empreinte mémoire des modèles avec une perte de qualité nulle à marginale : des modèles autrefois réservés aux clusters tournent sur du matériel semi-professionnel. La frontière datacenter/local descend en continu.
La couche logicielle des agents IA est-elle protégeable ? Faiblement : l'architecture de Claude Code, exposée par erreur en mars 2026, a été réimplémentée en open-source en une nuit (Claw Code, 100 000 étoiles GitHub en 24 h). La défense durable est commerciale (distribution, confiance, intégrations), pas technique.
OĂą investir son budget IA en 2026 ? Dans les couches qui s'apprĂ©cient : donnĂ©es propriĂ©taires gouvernĂ©es, conformitĂ©, intĂ©gration aux workflows et compĂ©tences internes — pas dans des rentes de modèles ou d'outils en voie de commoditisation.
Sources
[1] Z.ai — GLM-5.1: Towards Long-Horizon Tasks (7 avril 2026). https://z.ai/blog/glm-5.1 · Documentation : https://docs.z.ai/guides/llm/glm-5.1
[2] DeepInfra — GLM-5.1 Model Overview (SWE-Bench Pro / Terminal-Bench 2.0 / Code Arena). https://deepinfra.com/blog/glm-5-1-model-overview · Artificial Analysis — GLM-5.1 vs Gemini 3.1 Pro. https://artificialanalysis.ai
[3] Epoch AI — Open-weight models lag state-of-the-art by around 3 months on average. https://epoch.ai/data-insights/open-closed-eci-gap · LLM inference price trends. https://epoch.ai/data-insights/llm-inference-price-trends
[4] AI Magicx — The LLM Pricing Collapse of 2026. https://www.aimagicx.com/blog/llm-pricing-collapse-developer-guide-building-cheap-ai-2026
[5] Gartner — By 2030, Performing Inference on an LLM With 1 Trillion Parameters Will Cost Over 90% Less Than in 2025 (25 mars 2026). https://www.gartner.com/en/newsroom/press-releases/2026-03-25-gartner-predicts-that-by-2030-performing-inference-on-an-llm-with-1-trillion-parameters-will-cost-genai-providers-over-90-percent-less-than-in-2025
[6] Google — Introducing Gemma 4 12B: a unified, encoder-free multimodal model (3 juin 2026). https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/
[7] Sierra Research — Ď„²-bench. https://taubench.com/ · VentureBeat — Gemma 4 12B runs entirely locally on a typical 16GB enterprise laptop. https://venturebeat.com
[8] Google Developers Blog — Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows. https://developers.googleblog.com/bringing-gemma-4-12b-to-your-laptop-unlocking-local-agentic-workflows-with-google-ai-edge/
[9] NVIDIA Research — Small Language Models are the Future of Agentic AI (arXiv:2506.02153). https://arxiv.org/abs/2506.02153
[10] Google Research — TurboQuant: Redefining AI efficiency with extreme compression (ICLR 2026). https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/ · https://arxiv.org/abs/2504.19874
[11] AI Indigo — TurboQuant Explained: How This New Compression Method Changes Local LLM Inference. https://aiindigo.com/blog/turboquant-explained-how-this-new-compression-method-changes-local-llm-inference
[12] Zscaler ThreatLabz — Anthropic Claude Code Leak. https://www.zscaler.com/blogs/security-research/anthropic-claude-code-leak
[13] GitHub — claw-code (ultraworkers). https://github.com/ultraworkers/claw-code · Cybernews — Leaked Claude Code source spawns GitHub's fastest repo. https://cybernews.com
[14] SaaStr — Anthropic Just Passed OpenAI in Revenue. https://www.saastr.com · Medium — Anthropic just passed OpenAI in revenue. Here is why it matters. https://medium.com/@david.j.sea/anthropic-just-passed-openai-in-revenue-here-is-why-it-matters-e3dd9bb04069
[15] Allianz Research — AI capex cycle: war-proof for now (25 mars 2026). https://www.allianz.com · Goldman Sachs — AI: In a Bubble? https://www.goldmansachs.com · IDC — Circular financing has muddied the AI story. https://www.idc.com/resource-center/blog/circular-financing-has-muddied-the-ai-story-watch-the-application-layer-instead/
[16] NBER — Firm Data on AI (Working Paper w34836, fĂ©vrier 2026). https://www.nber.org/papers/w34836 · NBER w34851 — Does Generative AI Narrow Education-Based Productivity Gaps? https://www.nber.org
[17] Infosys — AI First Value Framework: AI Services Opportunity of Over $300 Billion. https://www.infosys.com/newsroom/press-releases/2026/unveils-ai-first-value-framework.html
[18] IBM — IBM and Google Cloud Announce Strategic Partnership to Scale AI with Human Expertise (4 juin 2026). https://newsroom.ibm.com/2026-06-04-ibm-and-google-cloud-announce-strategic-partnership-to-scale-ai-with-human-expertise-and-ai-powered-delivery
[19] Capgemini Investors — Q1 2026 revenues. https://investors.capgemini.com
[20] arXiv — Boom, Bubble, or Buildout? A Multi-Method Evaluation (2606.01575). https://arxiv.org/html/2606.01575
[21] VentureBeat — Stop calling it 'The AI bubble': It's actually multiple bubbles. https://venturebeat.com/infrastructure/stop-calling-it-the-ai-bubble-its-actually-multiple-bubbles-each-with-a
[22] TradingKey — S&P 500 valuation, Shiller P/E 42.32, Broadcom -15 %. https://www.tradingkey.com/analysis/stocks/us-stocks/261950917-sp500-valuation-bubble-ai-concentration-shiller-pe-buffett-indicator-fed-hawkish-yield-market-nifty-fifty-strategy-tradingkey
[23] TrendForce — AI Server Demand to Drive Memory Contract Price Increases in 2Q26 (31 mars 2026). https://www.trendforce.com/presscenter/news/20260331-12995.html · Tom's Hardware — DRAM prices predicted to jump 63% in Q2, NAND up to 75%. https://www.tomshardware.com/pc-components/dram/dram-and-nand-contract-prices-to-climb-again-in-q2
[24] TechTimes — RAM Prices 2026: Gartner Forecasts 130% Memory Cost Surge (5 juin 2026). https://www.techtimes.com/articles/317872/20260605/ram-prices-2026-buy-now-wait-gartner-forecasts-130-memory-cost-surge.htm
[25] SaaS Sentinel — RAM Shortage Could Last Until 2028 as AI Demand Reshapes Memory Markets (avril 2026). https://saassentinel.com/2026/04/19/ram-shortage-could-last-until-2028-as-ai-demand-reshapes-memory-markets/
[26] Tom's Hardware — Apple pulls 512GB Mac Studio upgrade option. https://www.tomshardware.com/tech-industry/apple-pulls-512-mac-studio-upgrade-option · MacRumors (5 mars 2026). https://www.macrumors.com/2026/03/05/mac-studio-no-512gb-ram-upgrade/ · TechSpot — AMD Ryzen AI Halo mini PC, 128GB, vs DGX Spark. https://www.techspot.com/news/112287-amd-ryzen-ai-halo-mini-pc-coming-june.html · Liliputing — Ryzen AI Max+ mini PCs with 128GB. https://liliputing.com/more-ryzen-ai-max-395-mini-pcs-with-128gb-are-now-available-if-you-can-afford-one/