Alles rund um Windows

Microsoft Copilot erweitert Windows 11 um Sprachinteraktion

Microsoft hat ein bedeutendes Update für Copilot unter Windows 11 vorgestellt und damit frühere kryptische Andeutungen über eine bevorstehende Funktion bestätigt, die es Benutzern ermöglichen würde, "ihre Finger auszuruhen". Diese wichtige Verbesserung führt Sprachinteraktionsfunktionen ein, mit denen Benutzer direkt mit dem KI-Assistenten kommunizieren können. Dies ist ein entscheidender Schritt bei der Umwandlung von Windows in eine vollständig integrierte KI-native Plattform.

Die wichtigste Neuerung ist Copilot Voice, das in allen Ländern, in denen Copilot-Dienste unter Windows 11 unterstützt werden, allgemein verfügbar sein wird. Benutzer können Gespräche mit dem Befehl "Hey Copilot" beginnen und mit "Goodbye" beenden. Diese Opt-in-Funktion, die in Copilot aktiviert werden muss, zielt auf eine natürlichere Interaktion ab. Sie ermöglicht Aufgaben wie das Zusammenfassen von Webseiten, das Einrichten von Besprechungen, das Verfassen von E-Mails oder das Bearbeiten von Dokumenten in Word, ohne dass etwas getippt werden muss, und unterstützt kontinuierliche, anwendungsübergreifende Befehle, ähnlich wie ein persönlicher Sekretär.

Ergänzt wird die Sprachfunktion durch Copilot Vision, das der KI die Fähigkeit verleiht, zu "sehen", was sich auf dem Bildschirm des Benutzers befindet, einschließlich Tabellen in Bildern, gescannten Dokumenten oder PowerPoint-Folien. Wenn ein Benutzer seinen Desktop oder eine Anwendung freigibt, analysiert Copilot die Anfragen und bietet über eine "Highlights"-Funktion Echtzeit-Anleitungen. Dabei kann es sich um visuelle Hinweise handeln, wo geklickt werden muss, oder um die Demonstration von Anwendungsschritten innerhalb einer Anwendung. Für Benutzer, die weniger an Sprachsteuerung interessiert sind, bereitet Microsoft auch einen Text-in-Text-out-Modus für die Windows Insider-Build vor.

Die Windows 11-Oberfläche wird mit einer "Ask Copilot"-Schaltfläche in der Taskleiste aktualisiert, die einem Suchfeld ähnelt, sowie mit neuen Verknüpfungen für den schnellen Zugriff auf die Sprach- und Bildfunktionen, wodurch Copilot in die täglichen Arbeitsabläufe integriert wird. Microsoft hat erneut betont, dass sich zwar die Reaktionsfähigkeit der Suche verbessert, Copilot jedoch nicht direkt auf Dateien oder Anwendungen zugreift, sondern nur auf die gleichen Windows-APIs wie Windows Search zurückgreift und für jede Zugriffsanfrage die ausdrückliche Genehmigung des Benutzers benötigt.

Die Weiterentwicklung wird mit Copilot Actions, das derzeit mit Windows Insiders getestet wird, und Copilot Labs vorangetrieben. Diese Initiativen konzentrieren sich darauf, Copilot in die Lage zu versetzen, lokale Dateien direkt zu verwalten – beispielsweise Bilder zu organisieren, schräge Fotos zu korrigieren, Duplikate zu löschen oder Daten aus PDF-Dateien zu extrahieren. Diese Hintergrundprozesse ermöglichen es Benutzern, den Fortschritt jederzeit zu überwachen, wobei der Umfang dieser lokalen Dateifunktionen mit der Weiterentwicklung der Funktion voraussichtlich erweitert wird.

Copilot Connectors unter Windows wird die Datenverknüpfung mit Diensten sowohl im Microsoft- als auch im Google-Ökosystem erleichtern, darunter OneDrive, Outlook, Gmail, Google Kalender und Kontakte. Nach der Autorisierung kann Copilot auf der Grundlage von Sprachbefehlen nach persönlichen Daten suchen und diese abrufen – beispielsweise einen Kalendertermin suchen oder ein altes Cloud-Dokument abrufen – und die Ergebnisse dann sofort zur weiteren Bearbeitung an Word, Excel oder PowerPoint weiterleiten.

Um die Systemverwaltung zu vereinfachen, wird Copilot auch vollständig in die Windows-Einstellungen integriert. Benutzer können nun Anfragen wie "Bildschirm besser lesbar machen" oder "Ablenkungen während der Arbeit reduzieren" eingeben oder sprechen, woraufhin Copilot direkt das entsprechende Einstellungsfenster öffnet. Microsoft bestätigt, dass alle neuen Copilot-Funktionen auf der Grundlage einer ausdrücklichen Zustimmung funktionieren, d. h. die KI greift nur dann auf Daten zu, wenn die Berechtigung erteilt wurde, und dieser Zugriff kann jederzeit widerrufen werden. Für die Sprach- und Bildfunktionen unter Windows 11 ist zwar kein NPU-Chip (der für die KI-Verarbeitung entwickelte Chip) erforderlich, aber dessen Vorhandensein gewährleistet eine schnellere und sicherere Audio- und Bildverarbeitung.

Dieses umfassende Update stellt eine bedeutende Veränderung dar und entwickelt Windows von einem Standardbetriebssystem zu einem intuitiveren persönlichen Assistenten, der zuhören, den Bildschirm sehen und auf Anfragen reagieren kann. Ton, Bild und KI werden zu den neuen Eckpfeilern der modernen Benutzererfahrung, wobei Microsoft darauf abzielt, Windows als zentrale Drehscheibe für KI-native Erfahrungen sowohl für Verbraucher als auch für Unternehmen zu etablieren, und weitere Details für Unternehmen auf der nächsten Microsoft Ignite-Veranstaltung verspricht.