Nos últimos anos, com o rápido desenvolvimento das tecnologias de inteligência artificial (IA), o modo de uso de ferramentas de programação também sofreu mudanças significativas. Havia um tempo em que ferramentas de edição de código como Cursor, Windsurf e GitHub Copilot eram a principal forma de desenvolvimento de software com IA. No entanto, com o surgimento dos "agentes autônomos de IA" e a popularidade da "programação por ambiente", a forma como os sistemas de IA interagem com o software mudou silenciosamente. Agora, as ferramentas de IA interagem cada vez mais diretamente com a interface de linha de comando (terminal) do sistema.

O terminal, que era amplamente divulgado nas películas de hackers dos anos 90, apesar de parecer menos impressionante do que os editores de código modernos, tem uma poderosa capacidade operacional que não pode ser subestimada no desenvolvimento de programas. A IA não só pode escrever e depurar código, mas as ferramentas de terminal são essenciais para transformar o código em software funcional.

Apple-MacBook-Pro-M3-Xcode,,苹果,电脑,M3芯片,深空灰,编程

Essa mudança é mais evidente com o lançamento de ferramentas de codificação na linha de comando pelos principais laboratórios. Desde fevereiro deste ano, a Anthropic, DeepMind e OpenAI lançaram sucessivamente ferramentas como Claude Code, Gemini CLI e CLI Codex, tornando-se rapidamente um dos produtos mais populares das empresas.

Embora essa mudança possa parecer sutil, ela realmente marca uma mudança fundamental na forma como a IA interage com os computadores. Muitos especialistas acreditam que esse movimento está apenas começando. Mike Merrill, co-criador do Terminal-Bench, disse: "Acreditamos firmemente que nos próximos 95% dos modelos de linguagem grandes (LLM) interagirão com os computadores através de interfaces semelhantes ao terminal."

Enquanto isso, as ferramentas tradicionais de edição de código enfrentam desafios significativos. O editor de código AI Windsurf passou por várias aquisições, tornando o futuro da empresa incerto. Além disso, estudos recentes mostram que os programadores superestimam a melhoria da produtividade com ferramentas tradicionais. Por exemplo, um estudo da METR descobriu que, embora os desenvolvedores acreditem que usar Cursor Pro aumente a eficiência em 20% a 30%, os resultados observados mostraram que a velocidade de conclusão das tarefas diminuiu em quase 20%.

Nesse cenário, empresas como Warp se destacaram rapidamente, obtendo pontuações altas no Terminal-Bench, tornando-se líderes entre as ferramentas de terminal. O fundador da Warp, Zach Lloyd, tem confiança total no terminal, acreditando que ele é o local ideal para resolver problemas que os editores de código têm dificuldade em lidar.

A chave para esse novo método está em como definir seus critérios de desempenho. Ferramentas tradicionais normalmente se concentram em resolver problemas de código no GitHub, enquanto as ferramentas de terminal adotam uma visão mais abrangente, abrangendo desde a escrita de código até tarefas de DevOps. Por exemplo, um dos problemas do Terminal-Bench exige que a IA reverse engenhe um algoritmo de compressão, outro exige que ela construa o núcleo Linux a partir do código-fonte. Isso exige a resiliência necessária para resolver problemas.

Ainda que as ferramentas de terminal não tenham totalmente explorado seu potencial, Lloyd acredita que elas já conseguem lidar com muitas tarefas não relacionadas à programação dos desenvolvedores, algo promissor e merecedor de expectativas positivas.