Google will ChatGPT mit dieser KI abhängen

Google hat Gemini vorgestellt, sein bisher größtes und leistungsstärkstes KI-Modell, wie es heißt. Die Fähigkeiten von Gemini übertreffen laut Google die von ChatGPT und anderen konkurrierenden KI-Modellen.

Gemini ist eine multimodale KI, die in der Lage ist, Informationen aus verschiedenen Quellen einzubeziehen. Diese Fähigkeit bedeutet, dass sie "verallgemeinern und nahtlos verschiedene Arten von Informationen, einschließlich Text, Code, Audio, Bild und Video, verstehen, verarbeiten und kombinieren kann", so Google DeepMind Gründer und CEO Demis Hassabis.

Gemini wird laut Google für jedermann verfügbar sein. Die erste Version, die Google als Gemini 1.0 bezeichnet, wird in drei verschiedenen Versionen ausgeliefert:

  • Gemini Ultra - das "leistungsfähigste" Modell für "hochkomplexe Aufgaben".
  • Gemini Pro - das "beste Modell" für die Skalierung auf eine breite Palette von Aufgaben.
  • Gemini Nano - für Aufgaben auf Geräten.

Gemini ist so konzipiert, dass es auf allen Gerätetypen funktioniert, von Smartphones und PCs bis hin zu Rechenzentren.

Gemini ist überlegen, sagt Google

Google behauptet, dass die Leistung von Gemini die seines Hauptkonkurrenten, GPT-4, übertrifft. Gemini Ultra hat es geschafft, GPT-4 in 30 von 32 "weit verbreiteten wissenschaftlichen Benchmarks" zu schlagen, so das Unternehmen.

Die Unterschiede sind bei vielen der aufgeführten Benchmarks marginal. Gemini erreichte 53,2 % im MATH-Benchmark, was 0,3 % besser als GPT-4 ist. Der einzige Benchmark mit einem deutlichen Vorsprung ist die Python-Code-Generierung HumanEval. Gemini erreichte 74,4 % in diesem Benchmark, GPT-4 laut Google nur 67,0 %.

Gemini bricht mit dem Status Quo der multimodalen Modelle. Bislang wurden getrennte Komponenten trainiert und dann zusammengeführt. Google sagt, dass es Gemini darauf trainiert hat, nativ multimodal zu sein, indem es es von Anfang an auf verschiedene Modalitäten trainiert hat.

Dies verbessert das Verständnis der KI laut Hassabis "weit besser als bestehende multimodale Modelle".

Google hat Gemini darauf trainiert, "Text, Bilder, Audio und mehr gleichzeitig zu erkennen und zu verstehen".  Dadurch ist es besser geeignet, Informationen zu verstehen und Antworten auf Fragen zu geben, selbst auf komplexe Fragen.

Gemini ist auch gut gerüstet, wenn es um die Codierung geht. Laut Google kann es "qualitativ hochwertigen Code in den beliebtesten Programmiersprachen der Welt verstehen, erklären und generieren".

Google verspricht, dass bei der Entwicklung von Gemini "Verantwortung und Sicherheit im Mittelpunkt stehen".

Das Unternehmen plant, Gemini Pro in Google-Produkte zu integrieren. Google Bard wird ab heute eine "feinabgestimmte Version von Gemini Pro" verwenden. Das Upgrade ist derzeit nur in englischer Sprache verfügbar, aber laut Google in mehr als 170 Ländern und Territorien.

Gemini Nano kommt auf das Google Pixel 8 Pro. Es wird neue Tools enthalten, wie Summarizer in der Recorder-App, Smart Reply in Gboard und mehr.

Gemini wird in andere Google-Produkte integriert, darunter der Chrome-Webbrowser, die Suche, Werbung und Duet AI.

Entwickler und Enterprise-Kunden können ab dem 13. Dezember über die Gemini-API in Google AI Studio Zugang zu Gemini Pro erhalten.

Nach dem eher enttäuschenden Start von Google Bard hofft Google, mit Gemini die Öffentlichkeit, Entwickler und Unternehmenskunden davon überzeugen zu können, dass das Unternehmen im Bereich der KI führend ist. Es bleibt abzuwarten, wie gut sich die verschiedenen Gemini-Typen schlagen, sobald sie verfügbar sind.