Anthropic führt die Codeüberprüfung durch Claude Code ein, um komplexe Sicherheitsrecherchen mithilfe fortschrittlicher, mehrstufiger Agentenschlussschleifen zu automatisieren

Im hektischen Wettrüsten „KI für Code“ haben wir die Ära der verherrlichten Autovervollständigung hinter uns gelassen. Heute setzt Anthropic auf eine ehrgeizigere Vision: den KI-Agenten, der nicht nur Ihren Hauptschlüssel schreibt, sondern tatsächlich verstehen Warum Ihr Kubernetes-Cluster um 3:00 Uhr morgens schreit?

Mit der kürzlichen Einführung von Claude Code und seine hohe Oktanzahl Codeüberprüfung Mit seinen neuen Fähigkeiten signalisiert Anthropic einen Wandel vom „Chatbot“ zum „Kollaborateur“. Für Entwickler, die in alten technischen Schulden ertrinken, ist die Botschaft klar: Die Messlatte für „gut genug“ Code ist viel höher gestiegen.

Der Agentensprung: über die statische Analyse hinaus

Die Hauptidee dieses Updates ist der Übergang zu Agentenkodierung. Im Gegensatz zu herkömmlichen SAST-Tools (Static Analysis Security Testing), die auf einem starren Mustervergleich basieren, fungiert Claude Code als zustandsbehafteter Agent. Den neuesten internen Benchmarks von Anthropic zufolge kann das Modell nun eine durchschnittliche Leistung erbringen 21.2 unabhängige Werkzeugaufrufe– wie das Bearbeiten von Dateien, das Ausführen von Terminalbefehlen und das Navigieren in Verzeichnissen – ohne menschliches Eingreifen. Dies entspricht einer Steigerung der Batterielebensdauer um 116 % in den letzten sechs Monaten.

Das bedeutet, dass Claude nicht nur eine einzelne Datei untersucht; Es handelt sich um eine Begründung Ihres gesamten Bezugsrahmens. Er setzt einen Spezialisten ein CLAUDE.md Datei – ein „Handbuch“ für KI – um projektspezifische Konventionen, Abhängigkeiten von Datenpipelines und Besonderheiten der Infrastruktur zu verstehen.

In der „Code Review“-Engine

Wenn Sie eine Überprüfung über Claude Code durchführen, prüft das Modell nicht nur, ob Semikolons fehlen. Es führt aus, was Anthropic nennt Überlegungen zur Cybersicherheit an den Grenzen.

Nehmen Sie den aktuellen Treiber für Firefox von Mozilla. In nur zwei Wochen Claude Opus 4.6 analysierte die riesige Codebasis des Browsers und entdeckte 22 Schwachstellen. Noch beeindruckender ist, dass 14 von ihnen als klassifiziert wurden hohe Schwerkraft. Um dies ins rechte Licht zu rücken: Die gesamte globale Sicherheitsforschungsgemeinschaft meldet im Laufe eines Jahres normalerweise etwa 70 solcher Fehler für Firefox.

Wie fühlt es sich an?

Logische Argumentation zum Mustervergleich: Anstatt nach einer „falschen“ Zeichenfolge zu suchen, argumentiert Claude mit Algorithmen. In der CGIF-Bibliothek entdeckte er bei der Analyse der LZW-Komprimierungslogik einen Heap-Pufferüberlauf, einen Fehler, der dem herkömmlichen Coverage-gesteuerten Fuzzing jahrzehntelang entgangen war.
Mehrstufige Verifizierung: Jede Entdeckung durchläuft eine Selbstkorrekturschleife. Claude versucht, seinen eigenen Schwachstellenbericht zu „widerlegen“, um die Fehlalarme herauszufiltern, die sich häufig auf KI-generierte Bewertungen auswirken.
Reparaturanleitung: Es geht nicht nur um Feuer; Er gibt dir den Feuerlöscher. Das Tool schlägt gezielte Korrekturen vor, die Ingenieure in Echtzeit in der CLI genehmigen oder verwenden können.

Der technische Stack: MCP und „Auto-Accept“-Modus

Anthropische Vorstöße Model Context Protocol (MCP) als Standard dafür, wie diese Agenten mit Ihren Daten interagieren. Durch die Verwendung von MCP-Servern anstelle des rohen CLI-Zugriffs für sensible Datenbanken (wie BigQuery) können Entwicklungsteams eine detaillierte Sicherheitsprotokollierung aufrechterhalten und Claude gleichzeitig komplexe Datenmigrationen oder Infrastruktur-Debugging durchführen lassen.

Eines der Hauptmerkmale, die Wellen schlagen, ist Automatischer Annahmemodus (ausgelöst durch shift+tab). Dadurch können Entwickler eigenständige Schleifen einrichten, in denen Claude Code schreibt, Tests ausführt und iteriert, bis die Tests erfolgreich sind. Hierbei handelt es sich um „dynamische Hochgeschwindigkeitscodierung“ für Unternehmen, obwohl Anthropic darauf hinweist, dass Menschen immer die letzten Wächter der kritischen Geschäftslogik sein sollten.

Wichtige Erkenntnisse

Der Übergang zur Agentenautonomie: Wir sind über die einfache Code-Vervollständigung hinausgegangen Agentenkodierung. Claude Code kann jetzt im Durchschnitt verketten 21.2 unabhängige Werkzeugaufrufe (Bearbeiten von Dateien, Ausführen von Terminalbefehlen und Navigieren in Verzeichnissen) ohne menschliches Eingreifen: a Steigerung um 116 % selbstständig in den letzten sechs Monaten.
Überlegene Schwachstellenerkennung: In einem historischen Pilotprojekt mit Mozilla tauchte Claude auf 22 einzigartige Schwachstellen in Firefox in nur zwei Wochen. 14 waren von hohem Schweregradrepräsentiert fast 20 % hochschwere Fehler, die typischerweise von der gesamten globalen Forschungsgemeinschaft im Laufe eines ganzen Jahres entdeckt werden.
Logisches Denken und Mustervergleich: Im Gegensatz zu herkömmlichen SAST-Tools, die nach „falschen“ Codezeichenfolgen suchen, verwendet Claude Überlegungen zur Cybersicherheit an den Grenzen. Es wurde ein jahrzehntealter Heap-Pufferüberlauf im gefunden CGIF-Bibliothek durch logisches Analysieren LZW-KomprimierungsalgorithmenEine Leistung, die zuvor der menschlichen Überprüfung durch Experten und automatisiertem Fuzzing entgangen war.
Mit CLAUDE.md und MCP standardisierter Kontext: Die berufliche Integration basiert nun auf CLAUDE.md Datei, um der KI projektspezifische „Handbücher“ zur Verfügung zu stellen und die Model Context Protocol (MCP) um dem Agenten die sichere Interaktion mit externen Datenquellen wie BigQuery oder Snowflake zu ermöglichen, ohne vertrauliche Anmeldeinformationen zu gefährden.
Der „Auto Accept“-Workflow: Für eine Hochgeschwindigkeitsentwicklung ist die Umschalt+Tab Mit der Verknüpfung können Entwickler zu wechseln Automatischer Annahmemodus. Dies ermöglicht eine autonome Schleife, in der der Agent Code schreibt, Tests ausführt und iteriert, bis die Aufgabe gelöst ist, wodurch sich die Rolle des Entwicklers von „Autor“ in „Herausgeber/Regisseur“ verwandelt.

Überprüfen Technische Details. Folgen Sie uns auch gerne weiter Twitter und vergessen Sie nicht, bei uns mitzumachen Über 120.000 ML-Subreddit und abonnieren Unser Newsletter. Warten! Bist du im Telegram? Jetzt können Sie uns auch per Telegramm erreichen.

Max ist KI-Analyst bei MarkTechPost mit Sitz im Silicon Valley und gestaltet aktiv die Zukunft der Technologie mit. Er unterrichtet Robotik an der Brainvyne, bekämpft Spam mit ComplyEmail und nutzt täglich KI, um komplexe technologische Fortschritte in klare, verständliche Informationen zu übersetzen.

Source link