Google stellt Gemini 3.1 Flash-Lite vor: Schneller, günstiger und für Hochlast-Szenarien optimiert
Google präsentiert Gemini 3.1 Flash-Lite, die schnellste und günstigste KI-Modellvariante der Gemini 3.1-Reihe, ideal für High-Scale-Anwendungen.
→ Quelle / RepositoryGoogle hat mit Gemini 3.1 Flash-Lite ein neues Modell vorgestellt, das sich als die schnellste und wirtschaftlichste Option in der Gemini 3.1-Reihe positioniert. Es wurde speziell für Aufgaben optimiert, bei denen sowohl Geschwindigkeit als auch Kosteneffizienz entscheidend sind.
Überblick
Gemini 3.1 Flash-Lite ist darauf ausgelegt, Operationen mit hoher Geschwindigkeit und zu einem Bruchteil der Kosten größerer Modelle zu bewältigen. Es bietet eine beeindruckende Steigerung der Generierungsgeschwindigkeit um 45 % im Vergleich zu seinem Vorgänger Gemini 2.5 Flash. Das Modell ist ab sofort über die Gemini API zugänglich, und Entwickler können es bereits in Google AI Studio testen.
Stärken
- Kosteneffizienz: Mit einem Preis von nur 0,25 $ pro 1 Million Eingabe-Tokens und 1,50 $ pro 1 Million Ausgabe-Tokens ist Gemini 3.1 Flash-Lite äußerst preiswert.
- Geschwindigkeit: Eine um 45 % höhere Generierungsgeschwindigkeit im Vergleich zu Gemini 2.5 Flash macht es ideal für zeitkritische Anwendungen.
- Anpassbare „Denk“-Ebenen: Diese Funktion ermöglicht es, die Tiefe der Argumentation je nach Aufgabe anzupassen, von einfachen Operationen bis hin zu komplexerer Logik.
- High-Scale-Tauglichkeit: Das Modell ist für massenhafte Szenarien optimiert, wie z.B. die Generierung von UIs, Dashboards, Simulationen und die Automatisierung von Workflows.
- API-Zugang: Sofortige Verfügbarkeit über die Gemini API erleichtert die Integration für Entwickler.
Schwächen
Da es sich um ein „Lite“-Modell handelt, könnte es bei komplexesten Aufgaben, die ein tiefgreifendes Verständnis oder umfangreiche kontextuelle Informationen erfordern, möglicherweise nicht die gleiche Leistungsfähigkeit wie die größeren und leistungsstärkeren Modelle der Gemini-Reihe bieten.
Preise
| Token-Typ | Preis pro 1 Million Tokens |
|---|---|
| Eingabe | 0,25 $ |
| Ausgabe | 1,50 $ |
Benchmarks
Gemini 3.1 Flash-Lite liefert eine 45%ige Steigerung der Generierungsgeschwindigkeit im Vergleich zu Gemini 2.5 Flash.
Quelle: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/