Persönliche Daten, Code, Fäkalsprache: Microsoft will Office-Dokumente automatisch kennzeichnen

Persönliche Daten, Code, Fäkalsprache: Microsoft will Office-Dokumente automatisch kennzeichnen

Microsoft will Unternehmen eine neue Möglichkeit an die Hand geben, den Inhalt von Office-Dokumenten auszuwerten und diese automatisch klassifizieren zu lassen. Auf dieser Basis kann dann auch der Zugang zu diesen Dokumenten gewährt oder untersagt werden, außerdem kann man Verstößen gegen den Verhaltenskodex schneller auf die Spur kommen.

Im Grunde müsste man eine solche Nachricht auf einem deutschen Portal nicht weiter behandeln. Wenn nicht schon die automatische Auswertung von Dokumenten bedenklich ist, so ist es spätestens die automatische Ableitung von Maßnahmen auf Basis dieser Auswertungen. Es ist schwer vorstellbar, dass sich das in einem deutschen Unternehmen einfach so einsetzen lässt. Also betrachten wir die Sache aus rein technischem Blickwinkel.

In den Office-Programmen Word, Excel und PowerPoint sollen sich erstellte Inhalte künftig klassifizieren lassen. So soll die Automatik beispielsweise in der Lage sein, ein Dokument als „Lebenslauf“ zu kennzeichnen, wenn darin typische persönliche Informationen zum beruflichen Werdegang oder zu früheren Arbeitgebern zu finden sind.

Das Label „Quellcode-Dokument“ wird vergeben, wenn sich darin Programmcode wiederfindet. Die 25 am häufigsten auf GitHub genutzten Sprachen werden laut Microsoft erkannt.

Außerdem gibt es vier weitere Kennzeichnungen wie „Offensive Sprache“, „Bedrohung“, „Belästigung“ und „Profanität“, in die Dokumente eingeteilt werden können, die beispielsweise vulgäre Sprache, Gewaltandrohungen, Rassismus oder andere beleidigende Inhalte aufweisen.

Administratoren können sich im Microsoft 365 Compliance Center eigene Ansichten erstellen, um den Überblick über die automatisch klassifizierten Dokumente zu behalten.

Das Auto-Labeling steht derzeit im Rahmen einer limitierten Preview zur Verfügung, interessierte Kunden müssen sich explizit dafür einschreiben. Weitere Infos dazu findet man auf dem Microsoft Blog.

Über den Autor
Martin Geuß
  • Martin Geuß auf Facebook
  • Martin Geuß auf Twitter
Ich bin Martin Geuß, und wie unschwer zu erkennen ist, fühle ich mich in der Windows-Welt zu Hause. Seit mehr als zwölf Jahren lasse ich die Welt an dem teilhaben, was mir zu Windows und anderen Microsoft-Produkten durch den Kopf geht, und manchmal ist das sogar interessant. Das wichtigste Motto meiner Arbeit lautet: Von mir - für Euch!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.



Kommentare
  1. Ähnliche Programme haben viele Firmen ja schon im Einsatz. Schön ist es, das dies hier ins Office integriert ist.Generell ist das Thema Kategorisierung ein Painthema in Firmen. Wenn es jemand gibt der dies vereinfacht, wird das mit Sicherheit seine Kunden finden.
    Was ist daran jetzt neu?
    Das geht doch schon länger mit Azure Information Protection. OK, es kommen ein paar neue Pattern dazu und man braucht, wenn die Office Product Group mal so weit ist, den zusätzlichen AIP Client nicht mehr, um Recomended oder Automatic Classification zu nutzen. Man braucht für alles was mit Analyse zu tun hat allerdings auch noch immer AIP P2 oder ein Bundle in dem das drin ist. Alles in allem ein sehr gutes Feature um Datensicherheit und Compliance zu erhöhen.
    Die Schutzmaßnahmen kann auch schon lange mit den Labels steuern. Da kommt dann AzRMS zum Einsatz - die "Engine", die auch bei outlook.com für do not forward und encrypt verwendet wird - ein noch älterer Hut im Enterprise Umfeld.
    Raphael und ich haben dazu letztes Jahr ein Vortrag gehalten. Hier ist noch ein Wrap Up, das wir dazu geschrieben haben.
    Das ist gar nicht gruselig. Das ist ein tolles Feature um Daten- und Infromationssicherheit zu erhöhen, wenn man das vernünftig einsetzt ;)
    Ich verstehe ich nicht, wie Informationen sicherer werden, wenn sie in Rechenzentren außerhalb der eigenen vier Wände analysiert werden.
    Und den Mehrwert einer Kennzeichnung mit "Profanität" sehe ich auch nicht. Was sind das für Dokumente? Wer schreibt die und für wen werden die geschrieben? Sind das private Dateien oder haben die tatsächlich was mit Arbeit zu tun?
    Klingt vielleicht nicht so, aber ich meine die Frage durchaus ernst. Ich verstehe den Anwendungszweck nicht.
    Wenn die Dokumente klassifiziert sind, kann man Regeln anwenden um z.B. zu verhindern, dass sie statt im Corporate OneDrive for Business oder Teams in einem privaten DropBox gespeichert werden. Dazu bedarf es allerdings weiterer Komponenten als nur Office wie z.B. den WindowsDefenderATP und Microsoft Cloud Access Security.
    In den Dokumentklassen lassen sich ebenfalls Regeln definieren, nach denen Dokumente verschlüsselt werden. Damit lässt sich verhinder dass eine beliebige Person ein Dokument lesen kann, dass eigentlich streng vertraulich ist.
    Die Beispiele - auch in dem Artikel von MS - sind vielleicht nicht so einleuchtend.
    Bisher gab es schon vordefinierte Pattern oder Keywords, wie Kreditkarten-, Konto- oder Ausweisnummern etc. an denen eine vorgeschlagene oder erzwungene Klassifizierung fest gemacht werden konnte. Jetzt kommen Funktionen für eine weitergehende Analyse um gezielter vertrauliche Informationen zu identifizieren.
    @nada:
    Ein (vereinfachtes) Beispiel:
    Laut GDPR ist der Besitzer von personenbezogenen Daten verpflichtet, diese vor unberechtigtem Zugriff zu schützen. Diese Anforderung an sich ist allerdings auch schon älter.
    Wie sieht das für Dich aus?
    Wenn Du eine Bewerbung an ein Sammelpostfach sendest, sind dort Informationen enthalten wie Lebenslauf, Zeugnisse usw. In späteren eMails ist dann auch der Personalfragebogen enthalten.
    Der Empfänger (der zukünftige Arbeitgeber) ist nun automatisch zum Schutz dieser Daten verpflichtet, auch wenn er den Eingang / Empfang als solches nicht zu verantworten hat.
    Daher hat bisher der SUeCase schon länger gefehlt, dieses durch "automatisierte Erkennung" ohne Benutzereinwirkung (wegen zeitlicher Verzögerung oder menschlichem Versagen) zu schützen. Z.Bsp. durch Verschlüsselung der Dokumente, durch automatiserte Workflows an "sichere" Dokumentenbibliotheken zu leiten oder gar jedes neue Dokument automatisch mit einer Regel (Klassifizierung) zu versehen und dann z.B. wegen den Anforderungen der Rentenversicherer 15 Jahre unverändert aufzubewahren...
    Ist dieser Anwendungsfall besser zu verstehen?
    Danke für die Erklärung @mriw.
    Wahrscheinlich unterschätze ich die Unfähigkeit der Menschen, sich selbst Gedanken über den Inhalt ihrer Dokumente zu machen.
    @UGOffice365:
    Oh! Danke. Jetzt verstehe ich. Ja, da kann die Automatisierung sinnvoll sein.
Nach oben