Am Puls von Microsoft

Metallum Potentiae – wir basteln uns eine Band rein mit AI

Metallum Potentiae - wir basteln uns eine Band rein mit AI

Die beste Power‑Metal‑Band südlich des Tibers Metallum Potentiae existiert nur in Bits und verbrauchten Tokens. Von der Idee über die Musik bis hin zur fertigen Bandidentität und einem ganzen Album entsteht alles nur mittels AI.

Wir haben schon viele kreative Projekte umgesetzt – Podcasts, Live‑Streaming, visuelle Experimente –, aber noch nie etwas so Komplexes wie ein kurzes, wenn auch vollständiges Album. Der Prozess ist zugleich Experiment, Spielplatz und ernst gemeinter Blick in die Zukunft kreativer Arbeit.

Die Band: Eine vollständig erfundene Legende

Ihre Geschichte, ihre Mitglieder, ihre lateinischen Texte: alles reine Fantasie. Und weil Latein für die meisten Menschen eine Art „klingt‑episch‑aber‑keiner‑kann‑es‑prüfen“-Bonus hat, funktioniert es perfekt als stilistisches Werkzeug für eine nicht real existierende Band.

Die Gruppe ist ein bewusst überzeichnetes Projekt, das zeigt, wie eine moderne KI den Nutzer nicht nur unterstützen, sondern selbst gestalten kann. Die Figuren, ihre Biografien, ihre Rollen in der Band – all das wurde von Microsoft Copilot erfunden. Die KI hat Namen, Charakterzüge, musikalische Rollen und sogar interne Running Gags erschaffen und mittels ironischen Floskeln und Anspielungen nicht nur in die Biografie, sondern auch in das Gesamtkonzept wie der Webseite einfließen lassen.

Damit wird Metallum Potentiae zu einem Paradebeispiel dafür, wie KI nicht nur Inhalte generiert, sondern ganze in sich stimmige Welten baut. Eine fiktive Legion römischer Metal‑Krieger, die nie existiert hat – aber trotzdem eine erstaunlich konsistente Identität besitzt.

Die KI‑Bausteine des Projekts

Experten und Könner schaffen wohl alles in einer Multi-Agent-Session zu lösen. Ich wählte den Ansatz, so weit wie mögliche kostenfreie KI-Angebote zu nutzen. Aus diesem Grund nutze ich von diversen Anbietern verschiedene Dienste, welche dann doch überraschend gut ineinander griffen.

Microsoft Copilot – Geschichtenerzähler, Texter, Weltenbauer

Microsoft Copilot war das Herzstück der kreativen Konzeption. Hier wurden nicht nur Lieder erfunden, sondern die komplette Vitae der Band erdacht. Inklusive aller Mitglieder, ihrer Hintergrundgeschichten und wie sich dies auf die Liedtexte auswirkten. Auch im Bezug auf Latein machte Copilot eine gute Figur, auch wenn freilich das Nachprüfen sich als schwer herausstellte und ich mich schließlich mit reinen Stichproben zufrieden geben musste. Egal! Spricht ja eh „niemand“!

Damit Microsoft Copilot nicht den Kontext verlor, nutzte ich das „Projekt“-Feature im Web-Client. So konnte ich auch in verschiedenen Tagen immer wieder schlüssige Ergebnisse aus dem selben Gedanken-Universum erhalten.

Sonu AI – Musikgenerator mit Feinschliff

Die musikalische Ebene entstand mithilfe von Sonu, einer künstliche Intelligenz, die aus Prompts komplette Songs generiert. Simpel gesagt gibt man einen Liedtext und eine Stilrichtung vor und alles andere übernimmt der Dienst selbst. Wie erwähnt schrieb Copilot die Liedtexte und auch eine grobe Beschreibung, was „Power Metal“ ist. Spannenderweise hat Suno eine „Promp-Refinement“-AI eingebaut, also eine AI die einen eingegebenen Prompt nochmal für andere AI aufbereitet. So lernt man übrigens auch, wie fein-granular man KIs bedienen kann, aber auch wohl sollte.

Hier muss ich zugeben, dass ich für einen Monat 9 Euro eingeworfen habe. Der Vergleich von freien Modellen zu bezahlten war mehr als nur etwas zu spüren. Auch der „AI-generated music video export“ ist wohl etwas, für die es sich nicht wirklich lohnt zu bezahlen – wie sind eure Erfahrungen?

Google Gemini – Visuelle Identität der Band

Audio und Musik ist eins, eine Power Metal Band braucht auch was fürs Auge! Aus diesem Grund kam für Logos, Albumcover, Bandporträts und weitere grafische Elemente Googles Gemini zum Einsatz. Dies in der kostenfreien Version. Ich war überrascht! Jeder von uns kennt noch das Problem mit der richtigen Anzahl von Fingern oder das korrekte Schreiben von Wörtern. All das scheint wohl der Geschichte anzugehören, denn ich war wirklich erstaunt, wie super dies funktionierte.

Die „Stimmigkeit“, wie Gemini verschiedene grafische Assets erstellen konnte, welche sich jedoch eine „Stilrichtung“ teilen, war enorm. Sogar das Fine-Tuning mit „platziere dieses Bandmitglied dort, lass es Riff X spielen“ konnte nach meinem ermessen sehr gut umgesetzt werden.

Google Stitch – Konzept der Webseite

Natürlich braucht man auch eine Webseite, um Albumverkäufe anzukurbeln! Doch wer kann heutzutage noch wirklich HTML, CSS und JavaScript schreiben, ohne gleich in einem npm-Desaster zu enden? Dabei ist noch nicht einmal geklärt, wie die Webseite aussehen soll.

Hierzu nutzte ich einen weiteren Google Dienst namens „Stitch“. Ich geb grob an, was ich möchte, gab die Band Bio und das Word-Building vom Copiloten mit hinein und ließ es die AI arbeiten. Spannenderweise erzeugte es erst eine DESIGN.md Datei, was mittlerweile Standard für Design-Konzepte ist, und machte sich anschließend an das interaktive Designen des Prototypen.

Dies klappte – wieder entgegen meiner Vorahnung – wunderbar und sogar besser als ich es selbst könnte. So hat Spark sehr viele kleine Details eingebaut, welche zum Schmuntzeln sind. Die (Fake) Datumsangabe wann das Album erscheint ist in römischen Ziffern, die Konzerte finden in deutschen Städten jedoch mit den lateinischen Namen statt – und dies war nur das Offensichtlichste.

Spark kann noch keine Webseiten direkt exportieren und auch sonst sah ich noch viele Fehler – dennoch klappte der Export nach Figma via MCP-Schnittstelle super, von wo ich dann den Rohcode als html-Datei exportieren konnte.

GitHub Copilot – Code‑Verbesserer und technischer Feinschliff

Visual Studio Code und dessen GitHub Copilot Integration kam zum Polieren der Webseite zum Einsatz. Noch etwas mehr Responsivität hier, noch eine Englische Variante dort und, achso ja, die eigentliche Musik sollte man auch nicht einbinden.

Ich bin zwar seit einer Dekade Software-Engineer, an Webseiten, die vor allem auch noch hübsch aussehen sollen, wage ich mich, auch aus eigener Abneigung, nicht.

Dank Copilot generierter Git-Commit-Nachrichten sowie einer Readme sieht auch das Repository gut und vorzeigbar aus. Denn natürlich wird die Seite als via GitHub Actions als GitHub Pages gehostet und dies ist im kostenfreien Modus nur möglich, wenn das Repository öffentlich ist.

Warum dieses Projekt wichtig ist

Dieses Projekt ist mehr als ein Herumgespiele mit den verschiedensten Werkzeugen. Es zeigt, wie kreative KI‑Ökosysteme zusammenarbeiten können. Jede KI übernimmt eine Rolle – wie echte Bandmitglieder. Und gemeinsam entsteht etwas, das größer ist als die Summe seiner Teile.

Es ist ein Beispiel dafür, wie KI nicht nur Aufgaben automatisiert, sondern kreative Prozesse erweitert. Sie wird zum Co‑Autor, Co‑Designer, Co‑Komponist.

Fazit: KI ist mehr als Code und Kuchenrezepte

Künstliche Intelligenz wird oft auf zwei Extreme reduziert: Entweder sie soll Quelltext schreiben oder Kuchenrezepte ausspucken. Dieses Projekt zeigt das Gegenteil: KI kann kreativ, spielerisch, künstlerisch und experimentell sein. Sie kann Welten erschaffen, Musik komponieren, Bilder „malen“ und Geschichten erzählen welche in sich stimmig. Die Zukunft der Kreativität ist nicht Mensch oder Maschine. Sie ist Mensch mit Maschine – und manchmal sogar eine komplette Band.

Was man jedoch auch anmerken muss: Jeder verwendete Service ist nicht europäisch, wenn wir hierzulande wirklich autonom von den USA werden wollen, haben wir noch eine weite Reise vor uns, auf die wir uns schnellstmöglichst machen sollten.

DrWindows News per WhatsApp: Abonniere unseren Kanal.

Über den Autor

Tobias Scholze

Tobias Scholze

Bayrischer Open Source- und Community-Enthusiast, Verfechter des neuen Microsoft und Wandler zwischen den Betriebssystemwelten. #communityrocks Von Herzen ein Nerd mit der festen Überzeugung, dass man gemeinsam und durch den Einsatz von moderner IT die Welt für jeden ein Stückchen besser machen kann.

Anzeige