Google stellt Gemini 3.1 Flash Live vor: Audio-First für natürliche Konversationen
Google hat ein Update für Gemini 3.1 Flash Live veröffentlicht, eine Audio-First-KI, die auf natürliche Dialoge und Sprachinterfaces abzielt.
Google hat vor Kurzem ein signifikantes Update für sein Sprachmodell veröffentlicht: Gemini 3.1 Flash Live. Dieses innovative Audio-First-Modell ist speziell auf Live-Dialoge und Sprachinterfaces zugeschnitten, mit einem klaren Fokus auf Natürlichkeit und Reaktionsschnelligkeit.
Gemini 3.1 Flash Live: Eine neue Ära der Sprachinteraktion
Google verspricht extrem schnelle Antworten mit minimaler Latenz. Ein herausragendes Merkmal von Gemini 3.1 Flash Live ist die Fähigkeit, nicht nur Intonationen gut zu unterscheiden, sondern sich auch an diese anzupassen. Sollte ein Nutzer im Gespräch mit der KI beispielsweise genervt oder in Eile klingen, erkennt das Modell dies am Sprechtempo und passt seinen Antwortstil entsprechend dem emotionalen Zustand des Gesprächspartners an.
Verbesserter Kontext und Robustheit
Im Vergleich zur vorherigen Gemini Live-Version wurde die Dauer der Kontextbindung nahezu verdoppelt. Dies stellt sicher, dass das Modell den Gesprächsfaden auch bei längeren Interaktionen nicht verliert. Gemini 3.1 Flash Live schneidet nun souverän in Benchmarks ab: Es ist deutlich widerstandsfähiger gegenüber Hintergrundgeräuschen geworden und meistert komplexe Aufgaben, wie mehrstufige Tool-Aufrufe direkt aus dem Audiostream, mit Bravour.
Verfügbarkeit und Preisgestaltung
Für Endnutzer wird das aktualisierte Modell den Kern von Search Live und dem überarbeiteten Gemini Live bilden. Entwickler können sich über die API im Google AI Studio verbinden. Die Preisgestaltung für Token bleibt dabei auf dem Niveau von 2.5 Flash Live, was einen reibungslosen Übergang für bestehende Nutzer verspricht.