Digitale Sprachassistenten sind Softwareprogramme, die natürliche Sprache verstehen und mit Hilfe von Sprache z.B. Fragen beantworten können. Sprachassistenten sind bereits in vielen Autos integriert, in vielen Smartphones und in Smart Speakern. Die Verarbeitung der Daten zwischen den Smart Speaker – Geräten und den digitalen Sprachassistenten passiert im Bruchteil einer Sekunde – also rasend schnell.
Wie funktionieren Sprachassistenten?
Der digitale Sprachassistent befindet sich in der sog. Cloud – durchs Internet verbundene Computer. Die Smart Speaker sind mit dem Internet verbunden. Sie haben Lautsprecher und integrierte Mikrofone.
Vereinfacht zusammengefasst passiert folgender Ablauf:
Mensch aktiviert Smart Speaker durch Aktivierungswort – er sendet durch Sprache Schallwellen (Frage) zum Smart Speaker – in der Cloud wird jedes Wort in Text umgewandelt, Speech to Text (STT) – aus dem erkannten Text wird eine Absicht (Intent) erkannt – Anwendungsfunktion ruft mit Nutzerdatensatz und Intent entsprechende Datenquellen ab – Antwort wird in Sprache umgewandelt, Text to Speech (TTS) und an den Smart Speaker gesendet – Ausgabe der Antwort als Schallwellen über den Lautsprecher des Smart Speakers.
Mit jeder Frage lernt der digitale Sprachassistent dazu. Diese künstliche Intelligenz nutzt dabei sehr komplizierte Lernalgorithmen.
Welche Digitalen Sprachassistenten gibt es?
Die bekanntesten Sprachassistenten sind der Google Assistant, Amazon Alexa, Apple Siri, Microsoft Cortana und Samsung Bixby.
Warum sollte man sie nutzen?
Der große Vorteil ist die Sprachsteuerung an sich. Handsfree – Eyesfree. Man benötigt weder Hände noch Augen, um an Informationen zu kommen oder Dinge zu steuern. So wie Radio sehr persönlich ist – der Moderator/die Moderatorin ist „FreundIn/BekannteR“ – können auch Skills oder Actions auf Smart Speakern für den Nutzer zur persönlichen Alltagsfreude werden.