KI könnte bald ein Verbündeter sein, um Weckwörter von Sprachassistenten zu verbannen. Forscher der Carnegie Mellon University haben ein Modell für maschinelles Lernen entwickelt, das die Richtung schätzt, aus der eine Stimme kommt, und Ihre Absicht anzeigt, ohne dass eine spezielle Phrase oder Geste erforderlich ist. Der Ansatz basiert auf den inhärenten Eigenschaften des Klangs, wenn er in einem Raum herumspringt.

Das System erkennt, dass der erste, lauteste und klarste Ton immer derjenige ist, der direkt auf ein bestimmtes Motiv gerichtet ist. Alles andere ist leiser, verzögert und gedämpft. Das Modell ist sich auch bewusst, dass die menschlichen Sprachfrequenzen je nach Blickrichtung variieren. Niedrigere Frequenzen sind eher omnidirektional.

Diese Methode ist „leicht“, softwarebasiert und erfordert kein Senden von Audiodaten an die Cloud, fügten die Forscher hinzu.

Es kann eine Weile dauern, bis Sie die verwendete Technologie sehen, obwohl das Team Code und Daten öffentlich veröffentlicht hat, um anderen zu helfen, auf ihrer Arbeit aufzubauen. Zumindest ist leicht zu erkennen, wohin dies führen könnte. Sie können einem intelligenten Lautsprecher anweisen, Musik abzuspielen, ohne ein Weckwort zu verwenden oder eine Horde anderer angeschlossener Geräte auszulösen. Dies kann auch zum Schutz der Privatsphäre beitragen, indem Sie Ihre physische Anwesenheit benötigen und gleichzeitig keine Blickerkennungskameras benötigen. Mit anderen Worten, es wäre näher dran Star Trek Vision von Sprachassistenten, die immer wissen, wann Sie mit ihnen sprechen.

Weiterlesen  Apple erklärt, wie AirPods Max-Energiesparmodi funktionieren