Am Puls von Microsoft

AI Memory Poisoning: Microsoft warnt vor neuartiger Angriffsmethode

AI Memory Poisoning: Microsoft warnt vor neuartiger Angriffsmethode

Dass von der rasanten Verbreitung der aktuellen Generation Künstlicher Intelligenz auch neue Angriffsvektoren wie Prompt Injections ausgehen, wissen wir bereits. Mit dem AI Memory Poisoning warnt Microsoft nun von einer weiteren neuartigen Angriffsmethode, bei der es sich um kein isoliertes Problem handeln soll. Betroffen sind vor allem die Chatbots, wobei diese weiterhin mit klassischen Prompt Injections verwandt ist.

Vereinfacht gesagt verstecken Unternehmen oder andere Akteure Anweisungen in den Prompts, die dem KI-Assistenten wie eine kleine Notiz eine neue Richtung geben können und er so zum Beispiel bestimmte Produkte oder Handlungen gegenüber dem Nutzer empfiehlt. Dabei wird ausgenutzt, dass diese Chatbots Informationen über verschiedene Sitzungen hinweg speichern können und der Nutzer selbst diese versteckte Anweisung nicht sieht. Dennoch würde jemand wie Copilot dann damit beginnen, durch diese versteckte Anweisung ein bestimmtes Produkt oder etwas Ähnliches zu bevorzugen.

Der Speicher wird dabei nicht korrumpiert. Dennoch ist das ein gefährlicher Angriff, weil ein bösartiger Akteur jeglicher Form so zum Beispiel zweifelhafte Finanztipps, Empfehlungen von zweifelhaften Gesundheitsprodukten oder Produkte, die zum Beispiel die Sicherheit der Kinder oder anderen nahestehenden Personen gefährden können, an die Nutzer durchreichen kann. Diese Angriffe dauern derzeit an. Innerhalb von 60 Tagen hat Microsoft selbst allein über 50 Angriffsversuche von 31 Unternehmen aus 14 Branchen festgestellt.

Microsoft empfiehlt, bei Links, die ein KI-Assistent einschleust, grundsätzlich vorsichtig zu sein. Der Speicher des eigenen Assistenten sollte regelmäßig überprüft werden. Sollte einem etwas merkwürdig vorkommen oder sich ein KI-Assistent wie Copilot aus irgendeinem Grund mitmal seltsam verhalten, soll grundsätzlich der komplette Speicher bzw. die vorhandenen Unterhaltungen gelöscht werden. Damit wird dieser Angriffsvektor nach Aussage der Redmonder dann zuverlässig unterbrochen und unterbunden.

DrWindows News per WhatsApp: Abonniere unseren Kanal.

Über den Autor

Kevin Kozuszek

Kevin Kozuszek

Seit 1999 bin ich Microsoft eng verbunden und habe in diesem Ökosystem meine digitale Heimat gefunden. Bei Dr. Windows halte ich euch seit November 2016 über alle Neuigkeiten auf dem Laufenden, die Microsoft bei seinen Open Source-Projekten und den Entwicklerthemen zu berichten hat. Beiträge über Mozilla, Europas Digitalwirtschaft und inklusive Informatik runden meinen Bereich ab.

Anzeige