VIBE CODING
NEWS2 min read

Anthropic's Claude 3.5 Sonnet: KI steuert jetzt deinen Mac – ein Blick auf Computer Use

Anthropic erweitert Claude 3.5 Sonnet um die Funktion 'Computer Use', mit der die KI deinen Mac direkt steuern kann.

Anthropic hat ein lang erwartetes Feature für Claude 3.5 Sonnet ausgerollt: die Fähigkeit, deinen Computerbildschirm zu steuern. Buchstäblich. Claude kann nun mit der Maus klicken, auf der Tastatur tippen, Dateien öffnen und im Browser navigieren – und das alles ohne separate Einrichtung oder Plugins.

Wie Claude deinen Computer nutzt

Das Prinzip ist einfach: Wenn Claude für eine bestimmte Aufgabe keine direkte Schnittstelle (API, Konnektor) zur Verfügung steht, greift die KI auf die Bildschirmsteuerung zurück. Sie scrollt, klickt auf Schaltflächen und sucht nach relevanten Informationen, so wie es ein Mensch tun würde. Vor der Interaktion mit einer neuen Anwendung fragt Claude um Erlaubnis, und der Vorgang kann jederzeit manuell gestoppt werden.

Anthropic hat auch an die Sicherheit gedacht: Bestimmte Anwendungen sind standardmäßig blockiert, der Zugriff auf sensible Daten ist eingeschränkt, und das System scannt die Aktivitäten automatisch auf potenzielle Prompt Injections.

Ergänzt wird dies durch „Dispatch“: Man kann eine Aufgabe vom Telefon aus delegieren, und Claude führt sie auf dem Computer aus. Während man sich anderen Dingen widmet, arbeitet die KI im Hintergrund.

Aktuell handelt es sich um eine Research Preview, die ausschließlich unter macOS und nur für Abonnenten von Claude Pro oder Max verfügbar ist. Die Funktion ist noch nicht perfekt – komplexe Aufgaben müssen manchmal erneut gestartet werden, und die Bildschirmsteuerung ist naturgemäß langsamer als eine direkte API-Integration. Dennoch ist die Richtung klar.

Computer Use: Ein Übergangsschritt

Ehrlich gesagt ist diese gesamte Computer-Nutzungsfunktion ein eleganter Workaround. Moderne Benutzeroberflächen sind für Menschen konzipiert. Schaltflächen, Menüs, Fenster – alles ist auf unsere Augen und Hände zugeschnitten. Die KI ist gezwungen, sich als Mensch auszugeben, um diese Schnittstellen zu nutzen. Sie klickt auf Pixel, anstatt einfach eine Funktion direkt aufzurufen.

Ich glaube, dass wir diese Schicht in Zukunft überwinden werden. Programme werden direkt über APIs mit der KI kommunizieren, während menschliche Schnittstellen uns vorbehalten bleiben – für jene Momente, in denen wir selbst Hand anlegen wollen. Die „Computer Use“-Funktion ist ein Übergangsstadium, eine Brücke zwischen einer Welt, die für Menschen gebaut wurde, und einer Welt, in der KI nativ arbeitet.

Wer ein MacBook mit Pro/Max-Abonnement besitzt, sollte diese Funktion unbedingt ausprobieren.