Un ancien ingénieur de Microsoft a publié une série de révélations accablantes sur l'état réel d'Azure. Entre fuite massive des talents, décisions architecturales absurdes et pari tout-IA au détriment de l'infrastructure, le numéro deux mondial du cloud vacille sur des fondations que ses propres équipes ne comprennent plus.Il aura fallu un Substack, six épisodes et la plume d'un ancien cadre technique pour mettre des mots sur ce que beaucoup dans l'industrie murmuraient depuis des années : Azure ne fonctionne pas comme annoncé. Axel Rietschin, ingénieur senior qui a travaillé neuf ans chez Microsoft, dont une année au sein de l'équipe Azure Core Compute et huit ans sur le noyau Windows, a publié fin mars 2026 une série d'articles intitulée How Microsoft Vaporized a Trillion Dollars. Le titre n'est pas une métaphore : la capitalisation boursière de Microsoft a chuté de plus de 30 % depuis son sommet d'octobre 2025, effaçant plus de mille milliards de dollars de valeur de marché.
Rietschin reconte comment Microsoft a précipité le lancement d'Azure en 2008 pour concurrencer Amazon Web Services, sacrifiant la stabilité sur l'autel de la vitesse de mise sur le marché, et ratant ainsi des occasions cruciales de consolider la plateforme tout en laissant les équipes sans soutien suffisant. Ce que le monde voyait comme un cloud robuste et scalable était, selon lui, un système sophistiqué maintenu en permanence sous perfusion artificielle. Cette fragilité fondamentale, enracinée dans des décisions prises à la hâte et dans un optimisme excessif quant à la vitesse à laquelle la plateforme pouvait croître et se stabiliser, a engendré de petites perturbations permanentes qui se sont accumulées au fil du temps.
173 agents, et personne ne sait pourquoi
Le récit de Rietschin commence dès son premier jour, le 1er mai 2023, lorsqu'il rejoint l'équipe Overlake, les ingénieurs derrière la carte d'accélération réseau Azure Boost. Il arrive dans une salle de réunion bondée où l'on débat sérieusement de l'idée de porter une partie de la pile logicielle Windows sur une puce ARM minuscule, sans ventilateur, disposant de ressources infimes. Une organisation de 122 ingénieurs, supervisée par un Principal Group Engineering Manager, envisageait concrètement de porter Windows vers Linux pour faire tourner ses agents de gestion de nœuds.
Plus révélateur encore : personne dans l'organisation Microsoft n'était capable d'expliquer pourquoi jusqu'à 173 agents logiciels tournaient sur chaque nœud Azure, ce qu'ils faisaient tous, comment ils interagissaient, ou même pourquoi ils existaient. Cette accumulation d'agents incontrôlés, véritable dette organisationnelle solidifiée en code, illustre le cœur du problème : des années de recrutement massif, de turn-over élevé et d'absence de documentation ont produit une infrastructure que ses propres gardiens ne comprennent plus. Cette pile non maîtrisée orchestre pourtant les machines virtuelles hébergeant les API de ce qui reste d'OpenAI sur Azure, SharePoint Online, les clouds gouvernementaux et d'autres infrastructures critiques et un grain de sable dans cet empilement fragile peut provoquer un effondrement mondial, avec des implications sérieuses pour la sécurité nationale.
La fuite des cerveaux comme diagnostic central
Pour Rietschin, la cause profonde de toutes ces défaillances n'est pas technique mais humaine. Il estime que le départ massif des talents après le lancement, le manque de discipline en matière de qualité logicielle et de tests, l'absence de vision architecturale et une exécution durablement défaillante ont laissé le service cloud à lutter en permanence contre les incendies. Sa prescription est claire : les dirigeants de Microsoft devraient prioritairement chercher à ramener des leaders techniques expérimentés pour améliorer la formation des développeurs à tous les niveaux, car leur défi le plus significatif a été la dilution des connaissances causée par un taux d'attrition élevé.
Le paradoxe est cruel : au moment précis où Azure aurait besoin de renforcer ses équipes d'infrastructure, Microsoft fait le choix inverse. Microsoft a licencié environ 15 000 personnes entre mai et juillet 2025 et a depuis gelé les recrutements dans son unité cloud et ses équipes commerciales nord-américaines. Azure Core lui-même n'a plus la capacité ni l'autorisation de recruter. Des ingénieurs actuels et anciens décrivent un environnement de travail de plus en plus absorbé par les initiatives d'IA au détriment des services cloud fondamentaux. Les équipes responsables des services Azure de base (calcul, réseau, stockage) ont subi des réductions d'effectifs et des réallocations budgétaires au profit des projets liés à l'IA. Un ancien ingénieur a caractérisé cette dynamique interne comme un système à deux vitesses : les projets d'IA bénéficient d'un soutien quasi illimité, tandis que les équipes d'infrastructure cloud traditionnelles se voient demander de faire plus avec moins.
OpenAI, le signal le plus éloquent
Le vote de défiance le plus visible est venu de là où on ne l'attendait pas : d'OpenAI lui-même,...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.
à toutes et tous,

La dépendance croissante de GitHub à Azure est-elle une stratégie délibérée pour créer du lock-in, ou un pari risqué sur une infrastructure encore instable ?