Im Laufe der letzten Jahre hat sich mit dem schnellen Fortschritt der Künstlichen Intelligenz (KI)-Technologie die Art und Weise, wie Programmierwerkzeuge verwendet werden, erheblich verändert. Es gab eine Zeit, in der Tools wie Cursor, Windsurf und GitHub Copilot die Hauptströmung der kI-gestützten Softwareentwicklung waren. Doch mit dem Aufstieg von „autonomen Agenten“ und der Popularität von „Atmosphäre-Programmierung“ änderte sich die Weise, wie KI-Systeme mit Software interagieren, subtil. Heute interagieren KI-Werkzeuge zunehmend direkt mit der Befehlszeilenschnittstelle (Terminal) des Systems.
Das Terminal, das in den 90er-Jahren durch Hackerfilme bekannt wurde, ist zwar nicht so beeindruckend wie moderne Code-Editoren, doch seine leistungsstarke Bedienungsfähigkeit spielt eine entscheidende Rolle bei der Softwareentwicklung. Nicht nur kann die KI Code schreiben und debuggen, sondern auch das Terminal ist entscheidend, um Code in nutzbare Software zu verwandeln.
Dieser Wandel zeigt sich besonders deutlich an der Einführung von Befehlszeilentools durch führende Labore. Seit Februar dieses Jahres haben Unternehmen wie Anthropic, DeepMind und OpenAI nacheinander Befehlszeilentools wie Claude Code, Gemini CLI und CLI Codex veröffentlicht, die sich schnell zu beliebtesten Produkten ihrer Unternehmen entwickelten.
Obwohl dieser Wandel kaum merkbar ist, markiert er tatsächlich eine grundlegende Veränderung im Umgang von KI mit Computern. Viele Experten sind der Ansicht, dass diese Entwicklung erst beginnt. Mike Merrill, Mitgründer von Terminal-Bench, sagte: „Wir sind überzeugt, dass in Zukunft 95 % der Interaktionen zwischen großen Sprachmodellen (LLMs) und Computern über eine ähnliche Terminal-Schnittstelle erfolgen werden.“
Gleichzeitig stehen traditionelle Code-Editoren vor erheblichen Herausforderungen. Der KI-Code-Editor Windsurf erlebte eine Reihe von Übernahmen, wodurch die Zukunft des Unternehmens ungewiss wird. Neue Forschungen zeigen, dass Entwickler die Produktivitätssteigerung durch traditionelle Werkzeuge überschätzen. Zum Beispiel zeigte eine Studie von METR, dass Entwickler glaubten, dass die Nutzung von Cursor Pro ihre Effizienz um 20 bis 30 Prozent steigern würde, während beobachtete Ergebnisse zeigten, dass die Taskbearbeitung sogar um fast 20 Prozent langsamer war.
In diesem Umfeld stiegen Unternehmen wie Warp schnell auf und erzielten hohe Bewertungen in Terminal-Bench, wodurch sie zu den führenden Terminale-Tools wurden. Der Gründer von Warp, Zach Lloyd, ist optimistisch über die Zukunft des Terminals und glaubt, dass es der ideale Ort für die Lösung von Problemen ist, die Code-Editoren nicht bewältigen können.
Der Schlüssel dieser neuen Methode liegt darin, wie Leistungsbewertungen definiert werden. Traditionelle Werkzeuge konzentrieren sich oft darauf, Probleme auf GitHub zu lösen, während Terminale Werkzeuge einen breiteren Blickwinkel einnehmen und Aspekte wie Code-Entwicklung, DevOps-Aufgaben usw. abdecken. Zum Beispiel verlangt eine Aufgabe von Terminal-Bench von der KI, einen Komprimierungsalgorithmus rückwärts zu analysieren, und eine andere, Linux-Kernel aus Quellcode zu bauen. Dies erfordert die Ausdauer und Problemlösefähigkeit eines Programmers.
Obwohl die aktuellen Terminal-Werkzeuge noch nicht ihre gesamte Potenzial erschlossen haben, ist Lloyd überzeugt, dass sie bereits viele nicht-programmierischen Arbeiten von Entwicklern bewältigen können. Dies ist zweifellos eine vielversprechende Zukunft.