wie moderne sprachsteuerung unsere welt verändert

Maschinen verstehen den Menschen

Vor dreißig Jahren war für uns der sprechende Bordcomputer aus dem Film „Raumschiff Enterprise“ sensationelle Science Fiction.

Heute ist mobiles Telefonieren und die Sprachkommunikation mit Maschinen für uns normaler Alltag. Die Vorteile einer sprachgestützten Maschinen-Mensch-Kommunikation liegen auf der Hand:

  • Sprechen ist für die meisten Menschen einfacher als tippen und lesen
  • Sprachsteuerung kann auf Anzeige- und Tastaturmedien verzichten.
  • Die notwendige Hardware kann also handlicher und leichter werden
  • Mobile Datenerfassungsaufgaben jenseits des Büroarbeitsplatzes lassen sich berührungsfrei per Sprachsteuerung effizienter erledigen

Bekannte Beispiele für sprachgesteuerte Programme im Business-Umfeld sind Pick-by-Voice-Lösungen oder das Programm dawin checkMaster mit Sprachsteuerung.
Doch wie funktioniert das Sprechen mit Maschinen? Eigentlich ganz einfach, sagt die dawin gmbh aus Troisdorf. Das Unternehmen hat sich auf die Entwicklung von sprachgestützten Softwarelösungen spezialisiert und bietet u. a. eine Plattform zur mobilen Datenerfassung per Sprachsteuerung an. Die Software lässt sich auf Tablet-PCs oder PDAs einfach installieren und ermöglicht die Erfassung vielfältigster Daten, darunter alphanumerische Informationen, Auswahlfelder und Textblöcke. Selbst die Aufnahme von Bilddaten, GPS-Koordinaten oder die Erfassung von Barcodes und RFID können per Sprachbefehl gesteuert werden.

Mittels moderner Sprachtechnologie ist es möglich, das aufgezeichnete Wort in einen Kontext zur Eingabesituation bzw. zum Anwendungszusammenhang zu setzen. Dadurch wird der relevante Wortschatz für die Spracherkennung drastisch reduziert. Die Wahrscheinlichkeit, dass das Programm die Eingabe korrekt versteht, ist damit sehr hoch. Dennoch betont auch dawin, dass es für sprachgesteuerte Programme keine 100 %-ige Trefferquote gibt. Die gibt es allerdings auch beim Menschen nicht. In zwischenmenschlichen Gesprächen bitten wir unseren Gesprächsteilnehmer gelegentlich, etwas zu wiederholen, weil wir es akustisch nicht verstanden haben. Diese Art der Interaktion und des Nachfragens ist auch mit guten Softwareprogrammen möglich. Sowohl Mensch als auch Programm können bei Bedarf nachfragen und sich die Eingabe bzw. die Sprachausgabe noch einmal wiederholen lassen.

Mobiles Arbeiten gehört für immer mehr Menschen zum Alltag. Der Wechsel zwischen den eingesetzten Geräten wie Client-PC, Laptop, Pad oder Smartphone wird fließender und richtet sich nach den individuellen Anwendungsanforderungen. Sprache kann dabei einen wichtigen Beitrag leisten, um mobile Datenerfassung sicherer, bequemer und effizienter zu machen.