Satya Nadella glaubt, dass das chinesische KI-Startup DeepSeek ein Gewinn für die Tech-Branche sein könnte

Montag, 27.01.2025

Das neu vorgestellte Logikmodell R1 des chinesischen KI-Chatbots DeepSeek hat die Big Tech-Branche aufgemischt. Die App hat OpenAI's ChatGPT als meistgeladene App im App Store von Apple entthront und die globalen Tech-Aktien abgestraft, da befürchtet wird, dass Amerikas Einfluss auf die KI-Entwicklung nachlässt. DeepSeek behauptet, dass sein neu vorgestelltes R1-Modell genauso effektiv ist wie das o1 von OpenAI – und Berichten zufolge für einen Bruchteil des Budgets entwickelt wurde.

Ein CEO scheint von der Entstehung des Start-ups unbeeindruckt zu sein. Microsoft-Chef Satya Nadella behauptete, dass DeepSeaks David für den etablierten KI-Sektor Goliath tatsächlich eine gute Nachricht für die gesamte Tech-Branche sein könnte.

"Jevons Paradox schlägt wieder zu!", schrieb Nadella am Montag auf LinkedIn und bezog sich dabei auf eine Theorie, nach der eine höhere Effizienz bei der Produktion eines Produkts zu einer höheren Nachfrage führt. "Je effizienter und zugänglicher KI wird, desto stärker wird sie genutzt und zu einer Ware, von der wir einfach nicht genug bekommen können."

Letzte Woche stellte das aufstrebende chinesische KI-Unternehmen DeepSeek R1 vor, ein Open-Source-Modell, das verspricht, mit dem im letzten Jahr veröffentlichten o1-Modell von Open AI gleichzuziehen, das in der Lage ist, logische Schlussfolgerungen zu ziehen und mathematische Probleme zu lösen. Die Veröffentlichung sorgte für Aufsehen. DeepSeek war nicht nur ein potenzieller aufstrebender Rivale von OpenAI, sondern entwickelte Berichten zufolge auch sein großes Sprachmodell V3 mit einem Budget von 5,6 Millionen US-Dollar – ein Bruchteil der 100 Millionen US-Dollar, die OpenAI in die Schulung von ChatGPT-4 gesteckt hat. DeepSeek behauptet auch, dass es weniger Rechenressourcen benötigt als die Konkurrenz.

Die Effektivität von DeepSeek – in Kombination mit dem angeblich sehr geringen Budget – hat das Unternehmen zu einer Bedrohung für die Vormachtstellung der USA in der KI-Entwicklung gemacht. Die USA haben seit 2022 Exportkontrollen und Beschränkungen für den Verkauf fortschrittlicher Halbleiter an chinesische Unternehmen eingeführt, um die nationale Sicherheit zu gewährleisten, was die chinesischen Konkurrenten behindert hat. Der Risikokapitalgeber Marc Andreessen weckte Erinnerungen an den Kalten Krieg und bezeichnete die Vorstellung des DeepSeek-Modells als „Sputnik-Moment der KI“, in Anlehnung an den Tag im Jahr 1957, an dem die Sowjetunion die USA beim Start des ersten Satelliten in die Umlaufbahn schlug.

Die Märkte reagierten entsprechend: Die Nasdaq-100-Futures stürzten am Montag um fast 2,5 % ab, und der S&P 500 rutschte um 1,8 % ab. Die Microsoft-Aktie stürzte um 3,8 % ab, und Meta und Alphabet lagen mit einem Rückgang von 3,1 % bzw. 3,3 % nicht weit dahinter. Der KI-Liebling Nvidia musste mit einem Kursverlust von 13 % im vorbörslichen Handel die größte Niederlage einstecken.

Was ist das Jevons-Paradoxon?

Aber anstatt DeepSeek als Bedrohung für die gesamte US-amerikanische Technologiebranche zu betrachten, sah Nadella die Vorstellung von DeepSeek als positiv an, da Big Tech darum kämpft, KI in alle Bereiche des menschlichen Lebens zu integrieren.

Nadellas Optimismus basiert auf einer 160 Jahre alten Theorie namens Jevons-Paradoxon. Der englische Ökonom William Stanley Jevons entwickelte die Theorie 1865, nachdem er einen massiven Anstieg des Kohleverbrauchs in England nach der Erfindung der Watt-Dampfmaschine beobachtet hatte, die weniger Ressourcen als frühere Dampfmaschinenmodelle benötigte. Doch statt zu einem geringeren Kohleverbrauch zu führen, führte der weit verbreitete Einsatz der effizienteren Watt-Maschine zu einem höheren Kohleverbrauch. Unter Berufung auf das Jevons-Paradoxon schlägt Nadella vor, dass eine effizientere KI, wie sie am Beispiel des R1-Modells von DeepSeek veranschaulicht wird, die Nachfrage nach der Technologie erhöhen wird.

Unabhängig davon, ob das Jevons-Paradoxon zum Tragen kommt, ist sich Nadella bewusst, dass man mit dem Start-up nicht spaßen sollte. Letzte Woche scheute der Microsoft-Chef auf dem Weltwirtschaftsforum in Davos, Schweiz, nicht davor zurück, die Technologie als echten Konkurrenten in der Welt der KI anzuerkennen.

Das neue DeepSeek-Modell ist wirklich beeindruckend, sowohl in Bezug auf die effektive Umsetzung eines Open-Source-Modells, das diese Inferenzzeitberechnung durchführt, als auch in Bezug auf die hohe Recheneffizienz. Wir sollten die Entwicklungen aus China sehr, sehr ernst nehmen.