VIBE CODING
NEWS3 min read

KI-News 2026: Warum Anthropic und Google jetzt dominieren Guide

Erfahre alles über die KI-Highlights 2026: Anthropic nutzt SpaceX-Power, Google beschleunigt Gemma 4 und Apple öffnet iOS 27 für externe LLMs wie Claude.

Die Entwicklung künstlicher Intelligenz erreicht im Jahr 2026 eine neue Skalierungsstufe durch massive Hardware-Investitionen und tiefgreifende Software-Integrationen. Während Hardware-Engpässe durch Kooperationen mit Raumfahrtunternehmen gelöst werden, optimieren neue Architekturen die lokale Ausführung auf Endgeräte.

Warum mietet Anthropic Kapazitäten von SpaceX?

Anthropic mietet Rechenkapazitäten des Typs Colossus 1 von SpaceX, um die Nutzungslimits seiner KI-Modelle signifikant zu erhöhen. Die Vereinbarung umfasst die gesamte verfügbare Leistung von über 300 Megawatt und mehr als 220.000 NVIDIA-GPUs. Diese Kapazitäten ergänzen bestehende Abkommen mit Partnern wie Amazon, Google, Microsoft und Fluidstack, um den wachsenden Bedarf der Claude-Plattform zu decken.

Die zusätzlichen Ressourcen führen zu einer unmittelbaren Verbesserung der Nutzererfahrung für Abonnenten. Insbesondere Claude Code und die Claude API profitieren von den neuen Rechenpower-Clustern im Jahr 2026.

Tarif/DienstÄnderung der LimitsBesonderheiten
Claude Code (Pro/Max)Verdoppelung der 5-Stunden-LimitsKeine Drosselung bei Spitzenlast
Claude API (Opus Tier 4)10M Input / 800K Output TokensPro Minute verfügbar
InfrastrukturÜber 220.000 GPUsColossus 1 Standort

Wie beschleunigt Google Gemma 4 mit MTP-Draftern?

Google veröffentlicht kürzlich Multi-Token Prediction (MTP) Drafter für die Gemma 4-Modellfamilie, um die Effizienz der Textgenerierung zu steigern. Diese Technik nutzt spekulatives Dekodieren, um das Problem der Speicherbandbreite bei der autoregressiven Erzeugung zu lösen. Ein leichter MTP-Drafter berechnet mehrere Tokens im Voraus, während das Hauptmodell pausiert, und lässt diese anschließend parallel verifizieren.

Die Vorteile dieser Architektur zeigen sich vor allem in der Geschwindigkeit:

  • Inferenz-Beschleunigung um bis zu den Faktor 3.
  • Optimiert für lokale Agenten und mobile Anwendungen.
  • Verfügbarkeit unter der Apache 2.0 Lizenz auf Hugging Face.
  • Reduzierter Energieverbrauch bei Programmierassistenten.

Welche Neuerungen bringt Microsoft Copilot Cowork?

Microsoft erweitert den autonomen Agenten Copilot Cowork für Microsoft 365 um mobile Apps für iOS und Android sowie eine neue Skills-Plattform. Nutzer können nun komplexe, mehrstufige Aufgaben direkt über das Smartphone steuern. Die Plattform ermöglicht es zudem, eigene Fähigkeiten (Skills) für spezifische Geschäftsprozesse zu definieren oder vorgefertigte Dokumenten- und Meeting-Tools zu nutzen.

Die Integration in das Unternehmens-Ökosystem wird durch die Anbindung an Fabric IQ und Dynamics 365 vertieft. In den kommenden Wochen folgen Konnektoren für Drittanbieter wie Miro, Monday und S&P Global Energy. Diese Funktionen sind aktuell exklusiv für Unternehmenskunden im Rahmen des Frontier-Programms zugänglich.

Wie öffnet Apple Intelligence das iOS-System?

Apple öffnet Apple Intelligence in diesem Jahr für Modelle von Google und Anthropic, um Nutzern mehr Flexibilität bei Systemaufgaben zu bieten. Ab Herbst 2026 können Anwender unter iOS 27, iPadOS 27 und macOS 27 in den Systemeinstellungen wählen, welche LLM für Funktionen wie Textgenerierung oder Bildbearbeitung genutzt werden soll.

Der Mechanismus basiert auf sogenannten Extensions. Entwickler müssen ihre Modelle lediglich kompatibel zu den Apple-Schnittstellen im App Store bereitstellen. Berichten zufolge laufen bereits geschlossene Tests mit Anthropic und Google, um eine nahtlose Integration zum Launch der neuen Betriebssystemversionen zu gewährleisten.

Warum erforscht Google DeepMind AGI in EVE Online?

Google DeepMind nutzt kürzlich eine Offline-Version des Weltraum-MMOs EVE Online als Sandbox für die Erforschung allgemeiner künstlicher Intelligenz (AGI). In Zusammenarbeit mit Fenris Creations (ehemals Teil von Pearl Abyss) wird eine komplexe Umgebung geschaffen, in der KI-Agenten in einer lebendigen Welt interagieren können. Dies setzt die Tradition von Projekten wie AlphaStar fort, findet jedoch in einer deutlich dynamischeren Simulationsumgebung statt. Details zu den Experimenten werden auf dem Fanfest 2026 erwartet.

Quelle: anthropic.com

Häufige Fragen

Warum nutzt Anthropic die Colossus 1 Kapazitäten von SpaceX?

Anthropic mietet über 300 Megawatt Leistung und 220.000 NVIDIA-GPUs von SpaceX, um die Nutzungslimits seiner KI-Modelle signifikant zu erhöhen. Diese zusätzliche Rechenpower verhindert Drosselungen bei Spitzenlast und verdoppelt beispielsweise die 5-Stunden-Limits für Claude Code Pro-Nutzer. Die Partnerschaft ergänzt bestehende Infrastrukturen von Amazon und Google, um den wachsenden Bedarf der Claude-Plattform im Jahr 2026 zu decken.

Wie verbessert Google Gemma 4 die Geschwindigkeit der Textgenerierung?

Google setzt Multi-Token Prediction (MTP) Drafter ein, um die Inferenz der Gemma 4-Modelle um bis zu Faktor 3 zu beschleunigen. Diese Technik nutzt spekulatives Dekodieren, bei dem ein leichter Drafter Tokens im Voraus berechnet und diese vom Hauptmodell parallel verifizieren lässt. Die Architektur reduziert zudem den Energieverbrauch und ist speziell für den Einsatz in lokalen Agenten sowie mobilen Anwendungen optimiert.

Welche Änderungen gibt es bei Apple Intelligence unter iOS 27?

Apple öffnet sein System für Drittanbieter wie Google und Anthropic, sodass Nutzer in den Systemeinstellungen eigene LLMs für Systemaufgaben wählen können. Die Integration erfolgt über spezielle Extensions, die Entwickler über den App Store kompatibel zu den Apple-Schnittstellen bereitstellen müssen. Diese Flexibilität umfasst Funktionen wie die Textgenerierung und Bildbearbeitung auf iOS, iPadOS und macOS.

Quellen

  1. oninvest.com oninvest.com (abgerufen 2026-05-07)
  2. marketpower.pro marketpower.pro (abgerufen 2026-05-07)
  3. pimenov.ai pimenov.ai (abgerufen 2026-05-07)