Zwiegespräche mit dem Computer

Ein Mann mit Headset vor einem PC

Mit Windows 10 erobern sprachgesteuerte Assistenten nun auch den herkömmlichen PC. Das wird nach Ansicht von Experten das Zusammenspiel von Mensch und Maschine radikal verändern.

 

Thomas Kuhn Wirtschaftswoche Düsseldorf Die Zeiten sind vorbei, da Menschen, die gestikulierend und vor sich hin sprechend auf der Straße standen, als – vorsichtig formuliert – mental angeschlagen galten. Heute ahnt der mobilkommunikative Zeitgenosse: Der einsame Plauderer telefoniert mit entfernten Gesprächspartnern. Oder er wendet sich gerade direkt an sein Handy: „Hey Siri“, „Hey Cortana“, „Okay Google“, die klassischen Signalsätze, um die Spracherkennung in den Handys von Apple, Microsoft oder mit Googles Android zu aktivieren.

 

Künftig kommen solche Zwiegespräche zwischen Mensch und Maschine nicht mehr nur auf der Straße vor – sondern auch am Schreibtisch. Denn so wie heute Millionen von Smartphone-Besitzern Apples sprachgesteuerten, digitalen Assistenten Siri in ihren iPhones nutzen oder den Cyber-Sekretär Google Now in Android-Telefonen, werden wir künftig auch unseren Schreibtisch-PCs Aufträge diktieren – und sie werden uns antworten.

 

Verantwortlich für den Sprung dieser Technik in die klassische PC-Welt ist Microsofts neues Windows 10. Das wird der Softwaregigant nicht bloß weltweit Abermillionen Kunden als kostenlosen Download anbieten. Es beherbergt zugleich mit der App Cortana erstmals einen kommunikativen Softwareassistenten als Kernfunktion eines PC-Betriebssystems: Ohne dass der Nutzer noch einen Buchstaben tippen müsste, lauscht der Rechner dann seinen Befehlen.

 

Auf eine vergleichbare Funktion warten Apple-Anwender bei Mac Computern bis heute. Und das, obwohl die Kalifornier ihre Sprachsoftware Siri schon 2011 mit dem iPhone 4s vorgestellt und damit die quasi natürliche Kommunikation mit der Maschine eingeführt haben.

 

Nutzte laut einer Verbrauchs- und Medienanalyse noch vor zwei Jahren nur knapp jeder zehnte Deutsche über 14 Jahren die Sprachsteuerung seines Handys, war es 2014 schon rund jeder sechste. Und mit dem Sprung der Technik auf den Tischrechner wird sich dieser Trend noch beschleunigen.

 

„Wenn Millionen von Nutzern plötzlich in natürlicher Sprache mit ihren Rechnern kommunizieren, wird das den Umgang mit der Technik grundlegend verändern“, sagt Reinhard Karger, Präsident der Deutschen Gesellschaft für Information und Wissen (DGI).

 

Verstärkt wird dieser Trend dadurch, dass einige Programme immer besser werden. Vor allem Google Now antwortet erstaunlich ausführlich und korrekt. Künftig nun wissen auch die grauen Kästen auf dem Schreibtisch die Antwort auf die Frage nach dem nächsten Spiel des Lieblingsvereins oder berichten auf Wunsch, wie es an der Börse läuft.

 

Das erscheint fast spielerisch und ist doch alles andere als trivial. Vor allem geht es weit über die Spracherkennungsprogramme hinaus, mit denen Mediziner oder Juristen seit Langem Arztbriefe oder Protokolle diktieren. Da reicht es, Klänge sinnvoll in Wortfolgen zu übersetzen. Die digitalen Gesprächshilfen von heute hingegen können mithilfe hochkomplexer semantischer Verfahren und enormer Rechenpower Inhalt und Intention von Fragen und Kommandos tatsächlich verstehen.

 

Das erfordert eine Rechenleistung, die weder die schnellsten Smartphones noch PCs bisher liefern können. Kaum weniger anspruchsvoll ist – nach der Inhaltsanalyse – die Suche nach den gewünschten Informationen. Alle Assistenten lösen das Dilemma durch ein Zusammenspiel aus Software auf dem Gerät des Nutzers und IT-Systemen im Netz: PC oder Handy zeichnen das Kommando auf, schicken es in die Rechenzentren von Apple, Google oder Microsoft. Deren Spracherkennungs- und – Analyse Systeme werten die Anfrage aus, recherchieren die Antwort und senden die zurück zum Nutzer. Dessen Gerät gibt das Ergebnis schließ- lich per Textanzeige oder Sprache wieder. „Ohne das schnelle mobile Internet einerseits und den Boom des Cloud Computing andererseits“, sagt Semvox-Experte Bruss, „wäre der Erfolg der digitalen Assistenten gar nicht denkbar.“

 

Zumal sich Sprachsteuerung schon bald nicht mehr auf Smartphones, Tablets, Laptop-Computer oder Schreibtisch-PCs beschränken wird: „In dem Maße, in dem wir uns daran gewöhnen, Telefonen und Rechnern Aufträge zu erteilen, werden wir das auch mit anderen technischen Geräten tun“, sagt DGI-Präsident Karger.

 

Die Technik steht schon bereit. Google etwa hat seine Nest-Thermostate bereits mit Sprachbedienung via Google Now aufgerüstet. Das Unternehmen Enertex aus dem fränkischen Forchheim vertreibt mit dem Home-Controller Synohr eine per Sprache steuerbare Schaltstelle fürs smarte Heim. Apple hat das Softwaremodul HomeKit in seine Software integriert. Ob schaltbare Steckdose oder Dimmer für die Lampe – wer das Gerät mit dem iPhone gekoppelt hat, kann Siri auch Haushaltsjobs übertragen.

 

Auch hinterm Autosteuer ersetzen Sprachbefehle den Druck auf Schalter oder Touch-Bildschirme. Alle Premiumhersteller bauen bereits auf Wunsch Technik zur Sprachsteuerung in die aktuellen Fahrzeuge ein. Der Softwarehersteller Nuance – mit seiner Technik Teil der Intelligenz von Siri und Google Now – wird im Herbst auf der Internationalen Automobilausstellung in Frankfurt (IAA) einen eigenen persönlichen Assistenten vorstellen.

 

Die Kommunikation zwischen Fahrer und Auto wird immer ungezwungener werden: „Durch den Trend zum autonomen Fahren werden die Fahrzeuge immer intelligenter“, sagt Ralf Lamberti, für das Thema Nutzerführung bei MercedesBenz verantwortlich. In den Limousinen mit dem Stern verarbeitet die Linguatronic-Plattform schon heute Sprachbefehle für die Navigation sowie zur Wiedergabe von Musik oder von Nachrichten. Und das sei erst der Anfang, sagt Lamberti: „In fünf bis zehn Jahren wird sich ein Großteil der Dienste und Funktionen im Fahrzeug per natürlicher Sprache oder Gesten steuern lassen.“

 

Vormachtstellung von Google und Co. wird erschüttert

Wobei zumindest für die Informations- und Unterhaltungsangebote noch völlig offen ist, wer am Ende tatsächlich den Dialog mit dem Nutzer führt – und zwar nicht bloß im Auto. Denn um die Frage, wer den Zugang ins Netz kontrolliert, wer die Sprachbefehle auswertet und – vor allem – welche Antworten er liefert, entfaltet sich in den kommenden Jahren der nächste Kampf der digitalen Riesen.

 

Wenn der Dialog der Nutzer mit sprachgesteuerten Assistenten immer häufiger die traditionelle Suche im Netz ersetzt, erschüttert das die Vormachtstellung der etablierten Torwächter in den digitalen Raum. Jeder Sprachauftrag an Apples Siri oder Microsofts Cortana liefert Antworten, ohne dabei Googles bezahlte Suchanzeigen auf den Handyschirm zu bringen. Jeder mündlich abgesetzte Facebook Status findet seinen Weg ins Netz, ohne dass der Absender dabei noch eine gesponserte Werbebotschaft im sozialen Netzwerk zu Gesicht bekäme.

 

Handelsblatt 30.07.2015

Artikel aus der Branche
17.09.2015
Auf der IFA in Berlin haben sich Fernsehhersteller mit hohen Kontrasten und schillernden Farben gegenseitig überboten. Doch stellt die Superschärfe die TV-Branche vor neue Herausforderungen. 

15.09.2015
Neue Geräte zur Schlafüberwachung sind weit mehr als nur ein weiteres Gadget. Angesichts der Überalterung der Bevölkerung könnten sie zu einem Zukunftsmarkt werden. Elektronikkonzerne wittern bereits ein Milliarden-Geschäft. 

11.09.2015
Mit der Entschlüsselung des Gehirns steht die Menschheit vor einer neuen Epoche: Gedanken beginnen, Maschinen zu steuern, Maschinen, Gedanken zu lesen. Das Marktpotenzial der Hirnforschung ist riesig. 

Weitere Artikel aus der Branche
Wer sind wir
Logo 3M
3M beherrscht die Kunst, zündende Ideen in Tausende von einfallsreichen Produkten umzusetzen – kurz: ein Innovationsunternehmen, welches ständig Neues erfindet. Die einzigartige Kultur der kreativen Zusammenarbeit stellt eine unerschöpfliche Quelle für leistungsstarke Technologien dar, die das Leben besser machen. Deshalb: Wenn Sie denken, dass 3M etwas für Sie tun kann, dann schreiben Sie uns.
Partner:
FAZ - Institut
RWTH Aachen
F&E Manager
Technische Uviversität Berlin
3M - Contentpartner
Steinbeis SMI
eSSENTIAL Accessibility Icon Download free eSSENTIAL Accessibility Browser