Skype und Cortana: Auch bei Microsoft wird von Menschen ausgewertet

Skype und Cortana: Auch bei Microsoft wird von Menschen ausgewertet

In den letzten Wochen haben wir verschiedene Berichte darüber gehört, dass Mitarbeiter von Google, Amazon oder Apple Zugriff auf Spracheingaben von Nutzern hatten und sich diese auch fleißig anhörten. Microsoft fehlte in dieser Aufzählung bislang, aber damit hat es sich wohl.

Dem Magazin Motherboard wurden Daten zugespielt, die offenbar beweisen, dass sowohl bei Cortana als auch bei Skypes Übersetzungs-Service mitgeschnitten wird und diese Sprachdateien auf den Microsoft-Servern landen. Der Informant, der als Vertragspartner für Microsoft arbeitet oder gearbeitet hat, beschreibt die zum Teil sensiblen Inhalte, zum Beispiel Gespräche über Beziehungskrisen oder Gewichtsprobleme. Einiges, was er sich angehört habe, könne man auch durchaus als „Telefonsex“ beschreiben. Außerdem gibt es Mitschnitte, wie Nutzer mit Cortana nach sensiblen oder fragwürdigen Inhalten suchten, zum Beispiel Pornografie.

Die Daten werden dabei wohl insoweit anonym gehalten, als dass sie keinem Account zugeordnet werden können. Außerdem weist Microsoft in den Nutzungsbedingungen von Cortana und Skype darauf hin, dass die Daten zur Verbesserung der Dienste genutzt werden können.

In einer Stellungnahme gegenüber Motherboard hat Microsoft die Praxis nicht bestritten, sondern darauf verwiesen, dass die Mitarbeiter, die diese Mitschnitte anhören, um beispielsweise bessere Übersetzungen vorzuschlagen, eine spezielle Vertraulichkeits-Vereinbarung unterschreiben müssen. Außerdem werden die Daten so weit als möglich anonymisiert.

Der Informant wird von Motherboard abschließend mit der Aussage zitiert, dass man zwar keine Personen identifizieren könne, aber wenn die Microsoft-Nutzer wüssten, dass vielleicht irgendwo gerade jemand im Pyjama sitzt und mit seinen Freunden über das scherzt, was er sich gerade angehört hat, dann würde ihnen das womöglich nicht gefallen.

Meine Meinung mag vielleicht mal wieder unpopulär sein, aber mein erster Gedanke ist, dass ich dem Informanten gerne etwas auf die Nase geben würde, und es wäre kein Kuss. Da sucht wohl jemand nach seinen 15 Minuten Ruhm.

Ich habe die „Skandalgeschichten“ zu Amazon, Google und Apple mit einem Schulterzucken zur Kenntnis genommen, weil ich beim besten Willen nicht überrascht sein konnte. Wenn man Dienste entwickelt, die den Menschen verstehen sollen, dann brauche ich logischerweise auch menschliche Qualitätskontrollen. Natürlich sollten die Nutzungsbedingungen hier absolut transparent sein und den Hinweis enthalten, dass möglicherweise ein Mitarbeiter tatsächlich hören kann, was man sagt.

Das Szenario, welches der anonyme Informant so süffisant aufzeigt, beschreibt aber nicht den schlampigen Umgang eines Unternehmens mit sensiblen Daten, sondern einen Mitarbeiter, der seinen Vertrag auf eklatante Weise bricht und sofort gefeuert werden sollte.

Nichtsdestotrotz gibt es natürlich Nachholbedarf: Es muss die Möglichkeit geben, der Auswertung dieser Spracheingaben zu widersprechen, ohne dadurch den Zugriff auf die Funktion zu verlieren. Bei Cortana ist das derzeit nicht der Fall, wenn ich den entsprechenden Schalter in den Datenschutzeinstellungen von Windows 10 umlege, dann funktioniert auch Cortana nicht mehr. Das ist definitiv nicht in Ordnung und sollte angepasst werden.

Den großen Skandal kann ich hier dennoch nicht erkennen, gleichwohl sind Sprachdaten besonders sensibel, weil sie nun mal nicht komplett anonymisiert werden können, außer man baut noch einen Sprachverzerrer mit ein.

Über den Autor
Martin Geuß
  • Martin Geuß auf Facebook
  • Martin Geuß auf Twitter
Ich bin Martin Geuß, und wie unschwer zu erkennen ist, fühle ich mich in der Windows-Welt zu Hause. Seit mehr als elf Jahren lasse ich die Welt an dem teilhaben, was mir zu Windows und anderen Microsoft-Produkten durch den Kopf geht, und manchmal ist das sogar interessant. Das wichtigste Motto meiner Arbeit lautet: Von mir - für Euch!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.



Kommentare
  1. Ich habe noch nie diejenigen verstanden, die sich freiwillig einen Spion in die Wohnung gestellt haben. Die Diskussion wird zwei Wochen lang geführt und wird dann wieder vergessen. Wir leben zunehmend in einer Matrix, nicht nur technisch, sondern auch politisch!
    Dem Magazin Motherboard wurden Daten zugespielt, die offenbar beweisen, dass sowohl bei Cortana als auch bei Skypes Übersetzungs-Service mitgeschnitten wird und diese Sprachdateien auf den Microsoft-Servern landen.

    Wie soll denn auch anders der Service bereitgestellt werden :grübel
    Das ausgewertet wird um an den Stellschrauben drehen zu können, dürfte auch keinen überraschen.
    Es war ja auch von Anfang an bekannt, dass teilweise aufgezeichnet wird, um das Sprachverhalten zu verbessern, insofern immer mit offenen Karten gespielt, nur wenn da einige aus dem Nähkästchen plaudern geht gar nicht. Glatter Vertragsbruch
    Warum sollte es auch anders sein?
    Deswegen habe ich nur einen Teil von Cortana zum Diktieren genutzt, der Rest ist bei mir deaktiviert bzw absichtlich Fehlkonfiguriert, sodass Cortana auf Nichtbenutzbarkeit meckert. Zudem diktiere ich mit Platzhaltern für Namen/Firmen etc und Musterzahlen und korrigiere diese später.
    Was hat man sich immer alles anhören müssen, von wegen Aluhutträger etc. Dabei hätte ein bisschen Verstand einschalten schon genügt, um zu wissen, das diese Services manuell korrigiert werden müssen, damit sie besser werden.
    Merke: Datenschützer sind immer die Spielverderber, Querulanten etc.
    Datenschutz ist nämlich uncool, Daten an andere heraus schleudern dagegen selbst in 2019 immer noch irgendwie hip
    Warum auch immer.
    Ich würde eher das Gegenteil behaupten. Es scheint umheimlich hip und cool zu sein, sich ständig abgehört und überwacht zu fühlen. Von wem eigentlich? Von Software, die automatisiert die Userexperience verbessert? Na denn.
    Mir gehen übrigens diese persönlichen Assistenten komplett vorbei. Brauch ich nicht, und werde ich wahrscheinlich nie brauchen.
    Heute muss doch alles "smart" sein, leider scheint das bei manchen Zeitgenossen schon ziemlich weit fortgeschritten zu sein. Cortana oder Alexa statt brain.exe ... Wovon einst Stasi und Co nur träumen konnten, wird heute dank der tollen Technik Realität... Privatsphäre ade... und kaum jemand regt sich darüber auf. Immerhin findet sich hier und da sogar in der Presse ein mahnendes Wort:
    https://www.focus.de/digital/dldaily/kolumnen/gastbeitrag-von-konstantin-kuhle-nirgendwo-mehr-sicher-finger-weg-von-alexa-und-co_id_10798596.html
    Diejenigen die nach "fragwuerdigen" Inhalten suchen stoert das ja mal so garnicht - die Daten haette sonst ja eh Bing, Google oder die Suchmaschine der Wahl...
    Interessanter ist das ganze im geschaeftlichen Umfeld: was ist z.B. wenn jemand einen neuen Begriff erfindet? Und so ein Sprach-KI Mitarbeiter denkt sich "cooler Domainname"...
    Aber wer als Firma da Daten in die Cloud entlaesst ist halt auch selbst in Schuld.
    "Das Szenario, welches der anonyme Informant so süffisant aufzeigt, beschreibt aber nicht den schlampigen Umgang eines Unternehmens mit sensiblen Daten, sondern einen Mitarbeiter, der seinen Vertrag auf eklatante Weise bricht und sofort gefeuert werden sollte."
    Das ist durchaus richtig. Die Konsequenz, die Microsoft daraus ziehen sollte, ist die Kündigung des Mitarbeiters/Aufragnehmers.
    Andererseits sollten die Menschen nicht vergessen, dass viele politische, gesellschaftliche und moralische Veränderungen gerade aufgrund von Vertragsbruch und Ungehorsam erst möglich wurden.
    Bleibt zu hoffen, dass die Menschen und Unternehmen neu über ihre Sprachassistenten nachdenken und eben den Aus-Schalter einbauen bzw. nutzen.
    Datenschutz und Privatsphäre steht leider bei allen großen Firmen ganz hinten an, da kann es IMO solche Negativmeldungen gar nicht genug geben.
    Es fehlen einem die Worte, wenn man sich die Privacy FAQ eines Unternehmens anschaut, was zuletzt 8,8 Mrd. Gewinn gemacht hat:

    Bei der Verwendung von Übersetzung auf Skype werden Mein Inhalt der Unterhaltung werden erfasst und wie verwendet diese?
    Bei Verwendung Skypes Übersetzungsfeatures Skype sammelt und Ihre Unterhaltung zur Verbesserung von Microsoft-Produkten und Diensten verwendet. Mit denen die Übersetzung und Speech Recognition Technologie Hier erfahren Sie, und wachsen, Sätze und automatische Protokolle analysiert und alle Korrekturen in unserem System, um weitere leistungsfähige Dienste erstellen eingegeben werden. Um Ihre Privatsphäre zu schützen, sind die Gespräche, die zur Verbesserung des Produkts verwendet werden durch alphanumerische Bezeichner indiziert, die Teilnehmer zur Unterhaltung nicht identifizieren.

    https://support.skype.com/de/faq/FA34583/skype-translator-privacy-haufig-gestellte-fragen
    Durchaus verständlich, dass nicht jeder Text professionell immer (sofort) in alle Sprachen übersetzt werden kann, aber so etwas beim Thema Datenschutz & Privatsphäre?
    nur wenn da einige aus dem Nähkästchen plaudern geht gar nicht. Glatter Vertragsbruch
    Im Grunde kann man trotzdem eher sagen "Glück gehabt, da nur aus dem Nähkästchen geplaudert wurde". Da hätte man die Daten ja noch für ganz andere Zwecke verwenden / missbrauchen können.
    Wie ich schon schrieb auf deskmodder.de:
    Ich bin immer wieder über diese Aufregung verwundert und amüsiert, wie man den Gebrauch dieser Geräte verurteilt oder deren Nutzer herabsetzt.
    Es zeigt immer wieder, dass die Meisten wohl nie sich belesen über solche Dinge oder mal nachdenken über die Folgen.
    Als ich zum ersten Mal ein Programm zum Diktieren nutzte, musste ich elendig lange Übungen vorlesen, bis meine Stimme halbwegs verstanden wurde. Algorithmen müssen lernen und woher sollen sie Beispiele bekommen? Um im Alltag bestehen zu können, braucht es Umstände wie im Alltag. Dort findet man die besten Beispiele zum Lernen.
    Das einzige, das ich bemängle, ist die fehlende Klarheit für den Benutzer, man hätte schon viel früher solche Optionen einführen sollen, obwohl ich sicher bin, dass die Technik sich nie so hätte verbessern können.
    (Und ich bleibe dabei, nur hat Martin es besser ausgedrückt: durch menschliche Kontrolleure der Qualität haben wir Fortschritte erzielt bei der Sprachverarbeitung, wie es ohne wohl nie geklappt hätte, aber man muss das klar benennen und den Ausstieg ermöglichen)
    Ich bin vor Jahren mal ihrgendwo in Bings Einstellungen auf meine Sprachdateien gestoßen und war doch geschockt über meine Spracheingaben. Es war dort alles abrufbar was ich wann und wie eingesprochen habe. War kein schönes Gefühl. Allerdings verstehe ich natürlich das der Dienst ohne diese Auswertungen nicht besser werden kann und ihne die Verbesserungen bin ich auch am Meckern.
    Wenn man sowas im Kern von Betriebssystemen anbietet reicht die Information zu solchen "Verwendungsmöglichkeiten" eben nicht aus. Wer das nicht verwenden will muß diese "Assistenzsysteme" deaktivieren können. Nicht irgendwie beschränken sondern komplett abschalten. Auch wenn in der "Userherde" nur wenige damit überhaupt auseinanderzusetzen gewillt sein sollten.
    Man kann das in den Einstellungen weitgehend deaktivieren. Was mich dabei stört ist dieses "weitgehend". Der Rest ist Vertrauenssache.
    Vertrauen zu meinem Hausarzt, meinem Bäcker und meinem Fleischer kann ich selber beeinflussen. Vertrauen zum Gebrauchtwagenhändler um die Ecke oder zum Callcenter-Veerkäufer der Telekom fällt da schon deutlich sparsamer aus. Und dann kommt sowas um die Ecke, das Sprachassistenten auch ungefragt mithören können.
    Wer sich vorstellen kann, das eine Alexa &Co. auf Sprachbefehle reagieren soll, dem sollte klar sein, das dieser Assistent ALLES mithören muß, was gesprochen wird um die Kommandos nicht zu verpassen. Warum wird das so nicht kommuniziert? Würde überhaupt Jemand diesen Krempel benutzen wollen? Von der geistig sparsam beleuchteten Klientel mal abgesehen.
    Totale Überwachung um das Licht auszuschalten oder eine Pizza zu bestellen. Nur um das Sofa nicht verlassen zu müssen und sich das letzte bischen Kondition fürs Fitnessstudio aufzuheben. Sowas ist doch krank!
    Assistenten für Menschen, die in irgendeiner Form eingeschränkt sein sollten sind absolut ok. Allerdings ist diese Möglichkeit das allzu knappe Alibimäntelchen um solche "Assistenten" überhaupt irgendwie sinnvoll erscheinen zu lassen. Notorische Faulheit ist dabei in dieser Frage kaum als Einschränkung zu betrachten.
    Wie oben schon angemerkt - stimmt - da hat Jemand aus dem Nähkästchen geplaudert. Wertfrei eingeschätzt haben wir genau solchen Umständen die Steuer-CDs und die Panama-Papers und eine ganze Reihe ähnlich interessanter Sachverhalte zu verdanken die vielen Betroffenen die Schweißperlen auf die Stirn gebracht haben.
    Ansonsten - wir sind im Sommerloch und die Boulevardjournaille treibt das übliche Schwein durchs Dorf. Stellt sich die Frage warum das denen immer so leicht gemacht werden muß. Genau dasselbe könnte zu jedem Zeitpunkt veröffentlicht werden seit es diese Sprachassistenten gibt. Man aktiviert das und schneidet den Datenverkehr mit und - oh Wunder - es wird "nach Hause telefoniert". Schalte die Netzwerkverbindung aus und diese Dinger liegen als Briefbeschwerer herum. Ganz neue Erkenntnisse!
    Ich denke das reicht jetzt.
    Mich amüsiert ja immer wieder aufs Neue die Doppelmoral in solchen Fan Foren.
    Während solche Meldungen bzgl. Google und Amazon einen wahren Shitstorm auslösen und MS gleichzeitig für den Datenschutz gelobt wird, wird bei einer solchen Meldung MS betreffend plötzlich alles relativiert.
    Plötzlich ist es doch völlig logisch das auch dort "mitgehört" wird und das ist dann auch gar nicht so schlimm sondern dient ja der Verbessrung der Produkte
    Sowas versüßt mir immer wieder den Tag. ;-).
    "Shitstorms" beschränken sich in der Regel auf wenige Internetnutzer, nicht auf die breite Masse da draußen. Das ist auch das Problem mit dem Internet generell. Ein Hort von Nischenmeinungen aller Art. Ist halt auch doof, wenn die Leute es wie bekloppt kaufen, weil sie kein Problem damit haben, und man selbst ganz allein mit seiner Meinung da steht, und sich Gleichgesinnte suchen muss.
    chakko
    Von wem eigentlich? Von Software, die automatisiert die Userexperience verbessert? Na denn.
    Tja, da hast Du das Argument ja mal ordentlich totgeschlagen. Es ist verdammt noch mal egal, ob das Abhören mit oder durch Software oder von Menschen durchgeführt wird. Es ist schlicht illegal, weil niemand der Verwender dieser tollen Alexas, Siris oder Cortanas ausschließen kann, daß Worte von unwissenden Dritten aufgezeichnet werden. Somit ist bei allen, die diese Dinger in nicht öffentlichen Gelegenheiten mit sich herumtragen bzw. betreiben zumindest die Mittäterschaft gegeben. Müßte eben nur mal ein Staatsanwalt verfolgen.
    Edit: Es ist strafrechtlich völlig egal, ob sich ein Mensch das anhört. Schon die Aufnahme an sich ist strafbar. Die einzige Bedingung für die Strafbarkeit, ist die Nicht-Öffentlichkeit und dazu gehört nicht viel.
    skalar
    Wir leben zunehmend in einer Matrix, nicht nur technisch, sondern auch politisch!

    Polypol und Polykratie. ^^
    build10240
    Tja, da hast Du das Argument ja mal ordentlich totgeschlagen. Es ist verdammt noch mal egal, ob das Abhören mit oder durch Software oder von Menschen durchgeführt wird. Es ist schlicht illegal, weil niemand der Verwender dieser tollen Alexas, Siris oder Cortanas ausschließen kann, daß Worte von unwissenden Dritten aufgezeichnet werden. Somit ist bei allen, die diese Dinger in nicht öffentlichen Gelegenheiten mit sich herumtragen bzw. betreiben zumindest die Mittäterschaft gegeben. Müßte eben nur mal ein Staatsanwalt verfolgen.

    Hui, da hast du mich aber mal mächtig missverstanden. Was ich mit automatisiertem "Abhören" meinte, ist die Auswertung durch die Algorithmen der Spracherkennung, was zwingend nötig ist, damit die Software dich versteht. Das ist ja auch gerade das Problem. Für viele Leute ist "Abhören", dass Gespräche mitgezeichnet werden, und erkannt wird, was gesprochen wurde. Das ist nicht die Aufgabe der Spracherkennung, von daher zeigt diese Vorstellung vor allem eins: Naivität und Unkenntnis.
    Allerdings muss ich sagen, die Sache, wegen der Google zuletzt in den Schlagzeilen war, nämlich, dass Gespräche durch menschliche Mitarbeiter ohne dem Einverständnis der Kunden analysiert wurde, wenn auch nur zur Entwicklung der Software, das geht so nicht, und, genau da ist auch die Grenze zu ziehen. Nicht dort, wo eine Datenverarbeitung notwendig ist. Ich sag's noch einmal: Wo Datenverarbeitung nötig ist. Offensichtlich verstehen viele nicht, dass es immer um die Verarbeitung von Daten geht, daher auch der Name, und die große Bedeutung in der Computerei, seit Anbeginn.
    Für viele Leute ist "Abhören", dass Gespräche mitgezeichnet werden, und erkannt wird, was gesprochen wurde. Das ist nicht die Aufgabe der Spracherkennung
    Doch genau, daß ist die Aufgabe der Spracherkennung wie sie die Assistenten verwenden. Denn ohne das Was oder zumindest einer ungefähren Ahnung davon, funktionieren die Assistenten nicht. Nur Diktiersoftware kann darauf verzichten.
    Allerdings muss ich sagen, die Sache, wegen der Google zuletzt in den Schlagzeilen war, nämlich, dass Gespräche durch menschliche Mitarbeiter ohne dem Einverständnis der Kunden analysiert wurde, wenn auch nur zur Entwicklung der Software, das geht so nicht, und, genau da ist auch die Grenze zu ziehen.
    Warum? Für den Kunden, der diese Spracherkennung bewußt einsetzt, besteht kein Unterschied, ob nur Google als juristische Person oder auch ein Individuum Kenntnis der Inhalte hat. Die Mitarbeiter von Google sollten ja entsprechend belehrt sein, daß sie die Vertraulichkeit wahren. Relevant wäre das nur für die Nutzer, die Bekannte unter den Mitarbeitern der betreffenden Google-Abteilung haben. Datenschutzrechtlich gäbe es vielleicht ein Problem, falls Google nicht auf die gelegentliche Analyse durch menschliche Tester, Entwickler, etc. hingewiesen hat. Gegenüber Dritten, die unbewußt aufgezeichnet werden, ist es hingegen wieder egal, denn strafbar wäre beides, das Aufzeichnen an sich und auch das Verschaffen der Aufnahme.
    dass du damit jede automatisierte Telefonansage als illegal bezeichnest?
    Wieso meinst Du das? Eine Ansage zeichnet doch nichts auf. Und wenn doch, wäre es illegal, sofern die Nutzer nicht vorher darüber informiert werden.
    OK, formulieren wir es anders. Warum ist eine automatisierte Telefonsansage für dich "Abhören"? Denn das hast du im ersten Absatz deines Posts gesagt.
    Keine Ahnung, wie Du das da hineininterpretieren willst. Ich habe nur entgegnet, daß die Analyse der Sprache eben die Aufgabe der Spracherkennung ist, wie sie die Assistenten verwenden, weil Du das mit Deinem "erkannt wird, was gesprochen wurde. Das ist nicht die Aufgabe der Spracherkennung"
    Was die "Leute" unter Abhören verstehen, sei mal dahingestellt. Wobei die meisten wohl alle diesbezüglichen Vorgänge, die unter dem entsprechenden Strafrechtsparagraphen gesammelt sind, darunter verstehen werden. Das schließt nunmal sowohl den technischen Vorgang als auch die menschliche Komponente mit ein.
    Das wage ich zu bezweifeln, sonst würden viele nicht meinen, ihre Webcam zukleben zu müssen. Irgendwie ist da eine irrationale Angst, die vor allem auf Unkenntnis zurückzuführen ist. So ungefähr wie in Zeiten, in denen nicht klar war, woher denn das Licht am Himmel kommt, wenn ein Gewitter aufgezogen ist. Ich denke, den allermeisten ist überhaupt nicht klar, inwiefern sie denn meinen "abgehört" zu werden. Und, die allermeisten werden darunter so etwas verstehen, wie wenn der Geheimdiensten Wanzen im Wohnzimmer anbringt. Liest man ja auch so 1:1 oft hier. "Der verwanzte Computer". Tja, bei so einem Verständnis, bzw. Unverständnis lohnt es sich dann im Grunde auch gar nicht aufzuklären, oder zu diskutieren, denn, wenn man etwas glauben will, dann bringen auch rationale Argumente nichts.
    Das war genau, was ich erwartet habe.
    Danke für die Bestätigung meiner korrekten Einschätzung deiner Fehleinschätzung :).
    Genau deshalb habe ich dir den Link ja auch geschickt.:D
    Deine Reaktion darauf ist nämlich genau das was ich erwartet habe.;)
Nach oben