Microsoft entwickelt Phi-3 mini für leichte KI-Aufgaben

Microsoft hat die Veröffentlichung eines kleinen Sprachmodells (Small Language Model, SLM) angekündigt, das für leichtgewichtige Aufgaben im Bereich der künstlichen Intelligenz (KI) entwickelt wurde und einen Schwerpunkt auf die Kosteneffizienz legt.

In der offiziellen Erklärung von Microsoft heißt es, dass das neue KI-Modell Unternehmen und anderen Endnutzern eine Alternative zu den herkömmlichen großen Sprachmodellen (LLMs) bieten wird, die in der Regel eine erhebliche Rechenleistung erfordern. Das leichtgewichtige KI-Modell mit dem Namen Phi-3 mini zeigt laut Microsoft beeindruckende Kodierungs-, Sprach- und Mathematikfähigkeiten, verglichen mit größeren Modellen.

Der Phi-3 mini enthält nur 3,8 Milliarden Parameter, ist aber dank der fortschrittlichen Trainingssysteme von Microsoft dennoch sehr leistungsfähig. Im Vergleich dazu liegen die Parameter von OpenAI's GPT-4 und Meta's Llama 2 bei 1,76 Billionen bzw. 70 Milliarden für die größten Versionen.

Die Forscher von Microsoft rechnen fest mit der Akzeptanz von SLMs durch die breite Masse. Zunächst einmal erklärt das Unternehmen, dass Firmen bei der Umstellung auf KI eine breitere Auswahl an Optionen haben werden, stellt aber klar, dass alle Größen von KI-Modellen im selben Ökosystem koexistieren können.

Was wir sehen werden, ist keine Verschiebung von großen zu kleinen Modellen, sondern eine Verschiebung von einer einzelnen Kategorie von Modellen zu einem Portfolio von Modellen, bei dem die Kunden die Möglichkeit haben, eine Entscheidung darüber zu treffen, welches das beste Modell für ihr Szenario ist.

Ein weiterer potenzieller Anwendungsfall für SMLs ist die Lokalisierung von KI-Modellen von Geräten, für die keine Internetverbindung erforderlich ist. Firmen oder Unternehmen, die nach KI-Funktionen suchen, aber vor Datenlecks zurückschrecken, könnten sich für SMLs entscheiden, um ihre Daten im eigenen Haus zu halten.

Abgesehen von einem höheren Sicherheitsniveau wird die Nutzung von SMLs die Latenzzeit verringern und KI-Anwendung in ländlichen Gebieten, insbesondere in solchen ohne Internetanbindung, zu fördern.

Die leichtgewichtige SLM wird auf Hugging Face, Microsoft Azure AI Model Catalog und Ollama eingeführt, wobei Microsoft eine interoperable API andeutet.

Microsoft will sein Engagement bei SMLs verdoppeln, indem es in den kommenden Monaten neue Versionen von Phi-3 herausbringt. Das Unternehmen plant die Veröffentlichung von Versionen mit 7 Milliarden und 14 Milliarden Parametern, um die Leistungsfähigkeit zu erhöhen, ohne dabei übermäßige Rechenleistung zu benötigen.

Auf dem Weg zur KI

Microsofts neuestes KI-Angebot baut auf seinen früheren Experimenten mit leichtgewichtigen KI-Modellen auf, die in der Veröffentlichung von Phi-1 und Phi-2 im Jahr 2023 gipfelten. Von der „überraschenden Leistungsfähigkeit“ der SMLs beeindruckt, hat sich der Technologiekonzern auf kleinere KI-Modelle konzentriert.

Microsoft hat Partnerschaften mit führenden Unternehmen der Branche geschlossen, darunter G42 in den Vereinigten Arabischen Emiraten, Vodafone und KPMG. Darüber hinaus investiert der Konzern in aufstrebende Technologien in Australien, Großbritannien und den USA, um den Talentpool zu erweitern und die Cloud-Funktionen zu verbessern.