Digitale Assistenz und Sprachbedienung - Traum und Wirklichkeit

Digitale Assistenz und Sprachbedienung - Traum und Wirklichkeit

Ein Gastbeitrag von Guido Egert.

Irgendwann im noch jungen Jahr 2017 saß ich in aller Seelenruhe beim Frühstück, als mir aus der Hosentasche jemand nahelegte, mich so langsam mal zu meinem Auto zu begeben, da bei der aktuellen Verkehrssituation Gefahr bestünde, meinen 30 Kilometer entfernt praktizierenden Zahnarzt zu versetzen. Damals dachte ich, jetzt sei der Knoten geplatzt und der Hersteller meiner digitalen Helferlein hätte endlich verstanden, wozu die geballte Rechenpower, die wir täglich mit uns umhertragen, in der Lage ist.

Leider ein Trugschluss. Zwar wurde weiter über die großartigen Möglichkeiten schwadroniert, die uns irgendwelche Assistenten eröffnen, aber Ereignisse wie mein Frühstückserlebnis blieben singulär und waren eher Wundertüten als zuverlässige Dienste.

Schon lange lese ich mit großer Aufmerksamkeit Artikel über die Entwicklung digitaler Alltagshilfe und bin immer wieder erstaunt, mit welcher Selbstverständlichkeit Begriffe wie digitale Assistenz und Sprachassistenz durcheinandergeworfen werden, ohne sich Gedanken über die Wortinhalte zu machen. Für mich hat das Eine mit dem Anderen kaum etwas zu tun. Um das zu verdeutlichen, möchte ich für diesen Artikel eine Festlegung treffen:

Ein Assistent ist im Allgemeinen ein Zuarbeiter. Hilfreich ist er, wenn er Aufgabenlösungen erleichtert. Gut ist er, wenn er Aufträge oder Teilaufgaben selbstständig erfüllt, und ein Zauberer, wenn ich ihn bei seiner Arbeit kaum bemerke. Vor allem aber, ist er dazu da, dem Nutzer zu nützen.

Oberflächlich betrachtet, geht aus dieser Festlegung hervor, dass alles, was sich uns zurzeit bietet, den Kinderschuhen noch nicht entwachsen ist. Wenn man sich jetzt aber mal näher mit dem beschäftigt, was als Sprachassistenten bezeichnet wird, stellt sich die Frage, wem sie zuarbeiten. Es geht hier um die Entwicklung der Spracheingabe, die in den letzten Jahren enorme Fortschritte gemacht hat. Das was dem Anwender als Helfer angeboten wird ist eigentlich ein Assistenzwerkzeug der Entwickler, für den Anwender ist es eher ein Analytiker oder, freundlicher ausgedrückt, ein Interpreter.

Letztlich geht es um das legitime Anliegen, die Möglichkeiten der Kommunikation mit digitalen Helfern zu erweitern. Dass man dazu übergegangen ist, den Begriff der Spracheingabe aufzuhübschen, hat sicherlich mit dem Bestreben nach größerer Akzeptanz für die Datenerhebung zu tun, die zu ihrer Entwicklung notwendig ist. Mehr möchte ich zum Thema Sprachassistenz nicht sagen, für mich ordnet sie sich neben Tastatur, Maus, Touchscreen etc. in die Reihe der Eingabemethoden ein.

Erst jetzt wird es interessant, es bleibt nämlich der Begriff digitale Assistenz. Und da geht’s gleich los mit den Fragen. Um hier nicht eine endlose Liste konkreter Merkwürdigkeiten runter zu tippen, versuche ich zusammenzufassen: Warum sind die digitalen Hilfsmittel, die ich nutze, nicht in der Lage, die enorme Menge an Fakten, die sie über mich und mein Tun haben, sinnvoll zu verknüpfen, um daraus den Mehrwert zu schaffen, den sie angesichts ihrer vorhandenen Rechenleistung zu schaffen in der Lage wären?

Nun mag man einwenden, dass wir gar nicht bereit sind, diese enorme Menge an Fakten über uns preis zu geben, was wahrscheinlich Wunschdenken ist. Aber sind wir da nicht schon beim grundsätzlichen Problem der Architektur digitaler Assistenten? Ich glaube, was ich oben zur Entwicklung der Eingabemethoden bereit war beizutragen, nämlich die Analyse meines gesprochenen Wortes zuzulassen, um besser mit digitalem Gerät kommunizieren zu können und gescheite Übersetzungen zu ermöglichen, ist für das Funktionieren digitaler Assistenz nicht notwendig.

An dieser Stelle sehe ich mich gezwungen, etwas zu tun, was ich sehr ungern mache, nämlich Parallelen zu ziehen zwischen analogen und digitalen Verhaltensweisen. Grundsätzlich denke ich, dass die Orientierung an analogen Vorgängen in der digitalen Welt den Blick für die Möglichkeiten verstellt. Allerdings gibt es Befindlichkeiten, die essentiell sind, also nicht unbeachtet bleiben sollten.

Uns ist es unbehaglich, wenn die Putzfrau über unseren Saustall berichtet, wenn unser Steuerberater die drohende Insolvenz herausposaunt, die Vorzimmerdame mit dem Geschäftspartner essen geht. Mit anderen Worten, wir verlangen von unseren Assistenten Loyalität. Warum sollten wir daher einem digitalen Assistenten vertrauen, der mit unseren Daten quer über den Planeten spaziert.

Das ist aber noch nicht alles, auch technisch ist es nicht sinnvoll, die Assistenz auszulagern. An Konnektivität gebundene Hilfeleistung ist offline handlungsunfähig, als lokale Instanz wäre ihr Handlungsspielraum eingeschränkt, aber immer noch vorhanden. Um das zu verdeutlichen, muss man sich nur ansehen, mit welcher Vielzahl an Sensoren zur Ermittlung von Umgebungsvariablen mittelprächtige Smartphones ausgestattet sind.

Wenn ich jetzt ganz naiv mein Smartphone an sich als digitalen Assistenten betrachte, stelle ich fest, dass es folgende Dinge über mich wissen sollte: es kennt meine Kontakte, Termine, beliebtesten Kommunikationswege, weiß wo ich mich häufig und wie lange aufhalte und wann ich wie lange auf welche Weise mit jemandem in Kontakt trete. Es ermittelt ständig wo, woher und wohin ich mich in welcher Geschwindigkeit und welchem Rhythmus bewege. Es könnte auch ohne Internetanbindung ziemlich exakte Aussagen dazu treffen, ob ich mich mit dem Fahrrad, dem Auto oder öffentlichen Verkehrsmitteln bewege. Wenn es sich in der Nähe zu verbundenen Rechnern, Tablets oder anderer digitaler Schalteinheiten befindet, wäre es in der Lage, sich jede Menge Informationen über mein Nutzungsverhalten anzueignen.

Noch immer ist keine Internetanbindung im Spiel und noch immer bewege ich mich in meinem ganz persönlichen Kosmos, d.h. all diese Daten könnten problemlos lokal verarbeitet, verschlossen und versiegelt werden. So manche Vorzimmerdame könnte mit diesen Informationen zaubern. Auch viele digitale Hilfestellungen wären schon allein durch sinnvolle Verknüpfungen dieser Daten möglich. Ich sollte nicht mehr nach einem Kontakt suchen müssen, wenn ich an einem konkreten Projekt arbeite und Nachfragen habe, Geräte oder Programme könnten unter gegebenen Voraussetzungen selbstständig starten bzw. Parameter ändern. Da fällt jedem bestimmt etwas Anderes ein.

Erweitern wir nun noch unseren Kosmos um den des Internets, könnte einem fast schwindlig werden. Orte werden konkret, geben hilfreiche Informationen preis, Texte werden übersetzt, Begriffe definiert, Personen, Musik und Filme gefunden, Produkte analysiert, weiß der Teufel wo die Möglichkeiten anfangen und aufhören. Wir stehen ziemlich klein da in diesem Wust, dabei ist unser Bewegungsradius doch schon ziemlich klar umrissen, durch die Dinge, die unser Digitaler Assistent von uns wissen könnte, aber für sich behalten sollte.

Warum meinen nun die Anbieter digitaler Helfer uns in riesige Töpfe schmeißen zu müssen, um daraus einen schönen leicht konsumierbaren Einheitsbrei herzustellen, der völlig unverbindlich ist und für Viele auf viele Situationen passt, nur eines nicht ist, nämlich persönlich? Das ist nichts anderes als Horoskop-Schreiberei.

Wo liegt der Hund begraben? Wir kaufen noch immer massenweise Geräte, die mit niedrigem Entwicklungsaufwand uns immer wieder als neu angeboten werden, die aber nicht die Hardwareeigenschaften mitbringen, ihr Potential auszureizen und gleichzeitig unsere Persönlichkeit ausreichend zu schützen. Es lässt sich mit uns nach wie vor gut Geld verdienen. Außerdem basieren zu viele Geschäftsmodelle auf dem Handel mit unseren Daten, führende Entwickler schössen sich selbst ins Knie, wenn sie ohne Not auf unsere Befindlichkeiten eingehen würden. Ein neues „Google“, das den Markt in kurzer Zeit umkrempelt ist momentan nicht in Sicht. Alternativmodelle wie Unix oder Linux Systeme treten ohne eigene Hardwareentwicklung auf der Stelle. Die großen Entwickler, die qua ihrer Größe auf Massenumsätze angewiesen sind, leiden an ihrer eigenen Schwerfälligkeit und der, ihrer Gewohnheitsträgheit verfallenen, Kundschaft.

Mit optimistischem Trotz sehe ich dennoch eine neue Gerätekategorie auf uns zukommen, die meine Persönlichkeit hütet und sich selbständig Daten von außen beschafft, um mir hilfreich zur Seite zu stehen, eine lokale Instanz also, die anonym notwendige Umgebungsvariablen ermittelt, um Entscheidungen zu treffen und Handlungsoptionen auf ein relevantes Maß einzugrenzen und prominent anzubieten. Natürlich habe ich immer die Wahl, ihr Angebot kopfschüttelnd abzulehnen.

Ich möchte auch nach wie vor Denen entgegentreten, die Microsoft auf diesem Feld für tot erklären. Dumme Quasselstrippen wie Alexa sehe ich nicht als Schlachtengewinner, sie sind ein notwendiger Entwicklungsschritt.

Damit habe ich gerade noch mal die Kurve zum Schaufenster in die Microsoft-Welt erwischt, als mehr will ich es auch nicht verstanden wissen. Wer da in Zukunft womit um die Ecke kommt, wäre auch wieder nur Kaffeesatzleserei.

Anmerkung 1:
Den Begriff Künstliche Intelligenz habe ich absichtlich ganz außen vor gelassen. Der ist mir eindeutig zu schwammig, denn damit werden uns heute sogar Dinger angedreht, die zu einer bestimmten Uhrzeit oder beim Öffnen der Haustür die Heizung hochdrehen, wofür es seit Jahrzehnten autark funktionierende Lösungen gibt. Angetreten ist dieses Schlagwort in erster Linie, um noch mehr Daten in einen völlig unübersichtlichen Strudel zu schicken, mit sehr zweifelhaftem Zusatznutzen. Dass unter diesem Begriff auch Lernsysteme firmieren, die in der Lage sind, die intelligentesten Strategen in hochkomplexen Spielen zu schlagen, macht den Begriff als solchen für mich nicht interessanter, sondern stellt eher in Frage, was man uns Konsumenten in seinem Namen anbietet.

Anmerkung 2:
Ich bin weder Programmierer, noch anderweitig mit digitalem Expertentum verbandelt. Weitestgehend habe ich versucht, jeglichem Fachterminus aus dem Weg zu gehen, wenn mir trotzdem der eine oder andere Lapsus unterlaufen ist, so bitte ich das zu entschuldigen. Mein Anliegen ist einzig, als Nutzer digitaler Technik Anregungen zu geben, die Augen offen zu halten für Möglichkeiten, die da sind, uns aber nicht geboten werden. Mich als Tagträumer zu bezeichnen, ist also durchaus eine relevante Kommentaroption.

Über den Autor
Dr. Windows
Dies ist der allgemeine Redaktions-User von Dr. Windows. Wird verwendet für allgemeine Ankündigungen und Gastartikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.



Kommentare
  1. Der Artikel hat mir gefallen. Einmal weil er einfach schön zu lesen war und zum Anderen weil er in mir eine interessante Frage aufwirft die auch ein Gedankenspiel zulässt.
    Warum gibt es keinen Assistenten als kostenpflichtigen Service?
    Ein toller Artikel! Hut ab.
    @Setter: Wenn ich mal - wieder - in die Autoindustrie abschweifen darf...Es gibt dort einen kostenpflichtigen Assistenten.
    Nennt sich "Concierge Service" und kostet pro Jahr mehr als 100 Euro Gebühr. Dafür erhält man 24/7 eine Assistenz, die Adressen heraussuchen und ans Navi vom Auto schicken kann und noch etwas mehr.
    Wie viele Fahrzeughalter tatsächlich bereit sind, 250 Euro pro Jahr für einen Assistenten zu bezahlen, steht auf einem anderen Blatt.
    Assistenten funktionieren nun mal leider nicht autark, sondern nur mit einem Server im Hintergrund, das Gerät ist doch nur Schnittstelle. Cortana will mich eben gerade nach Hause schicken, dabei muss ich gleich noch los zu einem Termin, der geographisch fast genau in der Gegenrichtung liegt. Mein Handy kennt meine Termine, ist aber nicht in der Lage, mir damit zu assistieren, weil die Daten nicht über den Server/Anbieter gesynct werden, der auch die Rechenpower stellt. Und da liegt das Entwicklungspotential der Assistenten: Eben unabhängig und nur mit lokalen Ressourcen Hilfestellung geben können.
    Generell mus man sowieso zwischen Spracherkennung und Sprachverständnis unterscheiden. Meiner Wahrnehmung nach klappt zwar die Erkennung (Sprache in Text) inzwischen recht gut, nicht aber die Umsetzung Text in Aktion (allerdings kann ich da auch nur Cortana und Siri beurteilen, und ohne Onlineverbindung sind die doch eh verloren...)
    Inhaltlich stecke ich zu wenig in diesem Thema um in eine Diskussion eintreten zu wollen oder gar zu können. Ich weiß auch bis heute nicht, ob ich mich damit beschäftigen mag, manchmal verwundert oder beeindruckt, manchmal schockiert mich die Assistenz.
    Aber die Art des Schreibens, die Gedankengänge, die Logik, der Aufbau; haben mir beim Lesen große Freude bereitet.
    Vielen Dank und gerne mehr davon!
    Claus007

    @Setter: Wenn ich mal - wieder - in die Autoindustrie abschweifen darf...Es gibt dort einen kostenpflichtigen Assistenten.
    Nennt sich "Concierge Service" und kostet pro Jahr mehr als 100 Euro Gebühr. Dafür erhält man 24/7 eine Assistenz, die Adressen heraussuchen und ans Navi vom Auto schicken kann und noch etwas mehr.

    Ähnlich OnStar von Opel.
    Na, das meine ich nicht - fast nicht:)
    Also ich wäre durchaus bereit 50€ Jahr zuzuzahlen, wenn ich dafür eine gute Unterstützung für Termine/Zeitplanung erhalten würde und eine Verknüpfung zu meinen genutzten Produkten besteht auch wenn diese nicht direkt vom gleichen Anbieter sind quasi einen personalisierten Assistenten. Jedoch würde ich auch mehr Datenschutz erwarten.
    Hallo, schön geschrieben und toll zu lesen. Und zustimmen muss ich dem eigentlich auch. Mal sehen was da noch kommt, bis jetzt nutze ich Cortana und Co nicht. Komme auch ohne klar...
    Ich schließe mich den lobenden Kommentaren an. Sehr Ledernäher geschrieben. Neue Ideen überlegt dargestellt und mich zum Nachdenken angeregt. Herzlichen Dank!
    Inhaltlich kann man so und so zu dem Thema stehen, aber der Artikel ist sprachlich einfach gelungen. Liest sich gut, danke!
    Danke für die Kommentare. Mit solch positiver Resonanz habe ich nicht gerechnet, da man sich durch einige meiner Zeilen doch ganz schön durchkämpfen muss.
    Guido
    Den Begriff Künstliche Intelligenz habe ich absichtlich ganz außen vor gelassen. Der ist mir eindeutig zu schwammig, denn damit werden uns heute sogar Dinger angedreht, ...

    Der Begriff ist nicht (nur) schwammig, sondern unglücklich bis falsch.
    Wenn mir Begriffe wie künstliche Zähne oder künstliche Hüftgelenke durch den Kopf gehen, denke ich beim Begriff Künstliche Intelligenz an eine Intelligenzprothese.
    Der Artikel selbst ist 1A.
    Mir gefällt dein Artikel auch. Und noch viel mehr gefällt mir, daß die digitalen Helfer noch nicht so wahnsinnig gut vernetzt arbeiten (können).
    Brillanter Beitrag in jeder Hinsicht, bitte gern mehr davon.
    Die Begründung dafür, dass der besprochene Mangel bei den derzeitigen digitalen Assistentchen besteht, ist der, dass ohne always connected und Serverbasiertheit damit eben kein Geld zu machen wäre. Weiterhin sind die Funktionen serverbasiert einfacher herzustellen und zu warten.
    Das Klima hierfür könnte dann umschlagen, wenn das Netz zu unsicher wird oder die paar infrage kommenden Anbieter das in sie gesetzte Vertrauen verspielen. Dann könnte sich ein deutlicher Bedarf nach sicheren, mehr autonomen Diensten herausbilden.
    Ich finde ja Konzepte wie Steamit sehr interessant, welche mir Hoffnung geben, dass wir bald nicht mehr mit unseren Daten bezahlen sondern für unsere Daten bezahlt werden!
    Steamit hier jetzt genau zu beschreiben, ginge zu weit :-) Sollte sich jeder aber mal angesehen haben!
Nach oben