A Amazon lançou na segunda-feira o Nova Act, um agente de IA genérico capaz de controlar navegadores da web e executar tarefas simples de forma independente. Juntamente com ele, foi lançado o SDK do Nova Act, permitindo que desenvolvedores criem protótipos de agentes usando o Nova Act.
O Nova Act foi desenvolvido pelo recém-criado laboratório AGI da Amazon em São Francisco, e fornecerá funcionalidades essenciais para o próximo Alexa+ (a versão aprimorada com IA generativa do assistente de voz da Amazon). No entanto, a versão atual do Nova Act é classificada como "pré-visualização de pesquisa", e os desenvolvedores podem acessar o kit de ferramentas do Nova Act através do site nova.amazon.com.
Este produto representa uma clara iniciativa da Amazon para competir com o Operator da OpenAI e o Computer Use da Anthropic. Muitas grandes empresas de tecnologia acreditam que agentes de IA capazes de navegar na web para os usuários aumentarão significativamente a utilidade dos atuais chatbots de IA. Embora a Amazon não seja pioneira nesse campo, seu alcance por meio do Alexa+ pode se tornar o mais amplo.
Segundo a Amazon, os desenvolvedores podem usar o SDK do Nova Act para automatizar tarefas básicas para os usuários, como fazer pedidos online ou reservar passagens. O kit de ferramentas suporta a integração de várias funções, permitindo que o agente de IA navegue em páginas da web, preencha formulários ou selecione datas em um calendário.
A Amazon afirma que o Nova Act superou seus concorrentes em testes internos. Na avaliação ScreenSpot Web Text, o Nova Act obteve uma pontuação de 94%, superando o CUA da OpenAI (88%) e o Claude3.7Sonnet da Anthropic (90%). No entanto, a Amazon não utilizou benchmarks mais comuns para agentes, como o WebVoyager, para testar o Nova Act.
O Nova Act é o primeiro produto público do laboratório AGI, liderado pelos ex-pesquisadores da OpenAI, David Luan e Pieter Abbeel. Ambos fundaram suas próprias startups de IA — Luan fundou a Adept, e Abbeel cofundou a Covariant — e foram contratados pela Amazon no ano passado para liderar seus trabalhos com agentes de IA.
Luan disse ao TechCrunch que acredita que os agentes são um passo crucial para a criação de sistemas de IA superinteligentes, definindo AGI como "um sistema de IA capaz de ajudar a realizar tudo o que os humanos fazem em um computador". Ele disse que o objetivo da equipe ao projetar o SDK do Nova Act era automatizar tarefas curtas de forma confiável e permitir que os desenvolvedores definissem precisamente quando a intervenção humana é necessária no fluxo de trabalho.
O principal desafio enfrentado pelos agentes de IA iniciais é a confiabilidade entre domínios. Nos testes, os sistemas existentes tendem a ser lentos, têm dificuldade em funcionar de forma independente por longos períodos e cometem erros que os humanos não cometeriam. O mercado logo verá se a Amazon superou essas limitações ou se seu agente também apresenta os mesmos problemas que afligem seus concorrentes.