GitHub Copilot: Verwendung Ihrer Daten für Trainingszwecke erlauben

Microsoft wird GitHub Copilot standardmäßig mit echten Nutzerinteraktionsdaten trainieren, sofern sich die Nutzer nicht bis zum 24. April dagegen entscheiden.

GitHub Copilot ist ein äußerst leistungsstarker Programmierassistent, der in verschiedenen integrierten Entwicklungsumgebungen (IDEs) eingesetzt werden kann. Hauptsächlich wird er für die Code-Vervollständigung und -Generierung anhand von Eingaben in natürlicher Sprache genutzt, bietet aber auch weitere Funktionen wie die Zusammenfassung von Pull-Anfragen (PRs), Code-Reviews und agentische Automatisierung. Nun hat Microsoft angekündigt, GitHub Copilot noch weiter zu verbessern – unter Verwendung Ihrer Daten.

Microsoft hat bekannt gegeben, dass es seine Richtlinien zur Nutzung von Interaktionsdaten von GitHub Copilot aktualisiert, um dem Unternehmen die Verwendung dieser speziellen Art von Daten zum Trainieren seines KI-Modells zu ermöglichen. Zur Klarstellung: Interaktionsdaten umfassen Eingaben, Ausgaben, Code-Schnipsel, Code-Kontext, Kommentare, Dokumentation, Dateinamen, Repository-Struktur, Navigationsmuster und im Grunde jede Interaktion mit Copilot.

Dies ist eine ziemlich bedeutende Änderung, die auf der Überzeugung von Microsoft beruht, dass Daten aus der Praxis direkt zu intelligenteren Modellen führen. Bislang nutzte das Unternehmen zu diesem Zweck öffentliche, auf GitHub gehostete Code-Repositorys zusammen mit handgefertigten Spezialmodellen, begann jedoch kürzlich auch, Daten von Microsoft-Mitarbeitern einzubeziehen, was zu erheblichen Verbesserungen der Modellqualität führte.

Daher hat Microsoft beschlossen, seinen Ansatz zu ändern und nun auch Daten aus der Praxis von Kunden zu sammeln. Diese Daten werden von Nutzern der Versionen Copilot Free, Pro und Pro+ erhoben, während Copilot Business, Enterprise oder unternehmenseigene Repositorys davon ausgenommen sind. Darüber hinaus wird Microsoft Ihre gespeicherten Daten nicht verwenden.

Ein weiterer wichtiger Hinweis in dieser Ankündigung ist, dass Ihre Interaktionsdaten auch an mit GitHub verbundene Unternehmen weitergegeben werden, doch Microsoft versichert den Kunden, dass ihre Daten nicht an Drittanbieter von KI-Modellen weitergegeben werden. Ein weiterer Vorteil dieses Ansatzes ist, dass alle Nutzer die Möglichkeit haben, sich hier über ihre Datenschutzeinstellungen abzumelden. Wenn sie dies jedoch nicht vor dem 24. April tun, werden sie automatisch angemeldet – was wohl eine fragwürdige Taktik ist, aber hey, Microsoft ist der Ansicht, dass die Nutzung realer Daten "einen bedeutenden Unterschied bei der Entwicklung von KI-Tools machen wird, die der gesamten Entwickler-Community dienen".