Am Puls von Microsoft

Flaschenhals Infrastruktur: GitHub gibt Statement zu den aktuellen Ausfällen ab

Flaschenhals Infrastruktur: GitHub gibt Statement zu den aktuellen Ausfällen ab

Wir erleben bei Microsoft momentan an ganz vielen Stellen, dass die Infrastruktur hinter den diversen Diensten an zunehmende Grenzen stößt und auch zunehmend auffällig daran zu arbeiten scheint, diese zu stabilisieren oder umzubauen. GitHub gab in Person von CTO Vlad Fedorov nun anlässlich der letzten beiden Großstörungen ein Statement ab, die auch unsere Vermutung nachzeichnen: Microsoft kommt mit den benötigten Kapazitäten nicht mehr hinterher.

Kernursachen

Der Haupttreiber sind Künstliche Intelligenz und vor allem agentische Workflows, die Microsofts Infrastruktur, die auch GitHub zur Verfügung steht, spätestens seit Dezember 2025 mit einer zunehmend exponentiellen Nachfrage aus- und belasten. Im Oktober 2025 hatte man entschieden, dass man in Sachen Zuverlässigkeit und Ausfallsicherheit um das Zehnfache besser werden müsse. Nur wenige Monate später, im Februar 2026, wurde allen klar, dass Microsoft mindestens um das Dreißigfache zulegen muss, und das exponentielle Wachstum samt Belastung der Infrastruktur dauert weiter an.

Die exponentielle Nachfrage hämmert letztlich auf die Ressourcen ein, die GitHub aktuell zur Verfügung stellen kann, und strukturell verschlechtert sich hier ein Großteil des Dienstes, wenn ein Subsystem unter Druck gerät. Momentan konzentriert sich das Team auf Akutmaßnahmen und die Beseitigung bzw. Kleinhaltung von Engpässen. Hier macht man zwar schnell Fortschritte und hat sich zum Ziel gesetzt, zunächst die Verfügbarkeit, dann die Kapazitäten und erst danach neue Funktionen zu entwickeln, aber solange dieser Druck durch agentische KI anhält, bleibt das ein Katz-und-Maus-Spiel.

Azure unter Druck

Eine der wesentlichen Informationen ist dabei auch, dass GitHub intensiv seine Migration zu Microsoft Azure nutzt und diesen Vorgang nun entsprechend beschleunigt. Wenn man mit dem Bau neuer Rechenzentren nicht schnell genug hinterher kommt, was beim aktuellen KI-Boom auch ein zunehmend gesellschaftlich kritisch gesehenes Phänomen wird, ist es naheliegend, dass man in den bestehenden Rechenzentren entweder Ressourcen umschichtet und vorhandene Systeme mit neuen Komponenten für eine neue Aufgabe aufrüstet.

Entsprechend kann man darüber spekulieren, dass die Probleme von uns in anderen Bereichen wie den Timeouts bei der Passwort-Anmeldung in Microsoft-Konten oder Ausfälle bei Outlook und anderen Bereichen von Microsoft 365 hiermit zu tun haben. Gegenüber der Nachfrage von kommerziellen Kunden hat der Consumer bei Microsoft immer das Nachsehen und da Azure auch für Microsoft private Infrastruktur und sowas wie Xbox Cloud Gaming verantwortlich ist, wäre es alles andere als überraschend, wenn Microsoft als erstes hier schaut, wie man Ressourcen zusammenlegen und umschichten kann, um Unternehmen besser zu bedienen.

Aber wie gesagt: Das sind alles Puzzlestücke, die wir weiter zusammensetzen und dann an Microsoft noch weiterleiten müssen. Spannend könnte und dürfte es allerdings werden, wenn Dienste wie GitHub, Azure AI und Azure DevOps im Laufe des Jahres feststellen, dass sie wegen agentischer KI auch mit dem Dreißigfachen nicht auskommen und wir vielleicht über einen Faktor 50, 100 oder noch mehr reden. Bei dem Tempo kann das schnell passieren.

DrWindows News per WhatsApp: Abonniere unseren Kanal.

Über den Autor

Kevin Kozuszek

Kevin Kozuszek

Seit 1999 bin ich Microsoft eng verbunden und habe in diesem Ökosystem meine digitale Heimat gefunden. Bei Dr. Windows halte ich euch seit November 2016 über alle Neuigkeiten auf dem Laufenden, die Microsoft bei seinen Open Source-Projekten und den Entwicklerthemen zu berichten hat. Beiträge über Edge, Mozilla, Europas Digitalwirtschaft und inklusive Informatik runden meinen Bereich ab.

Anzeige