Recentemente, a Universidade West Lake lançou um sistema de IA chamado DeepScientist, que completou os resultados científicos de três anos de um cientista humano em apenas duas semanas. O DeepScientist não apenas gerou mais de 5000 ideias científicas por conta própria, mas também validou 1100 delas. Além disso, superou com sucesso os registros mais recentes dos humanos em três tarefas avançadas de IA, demonstrando sua forte capacidade de pesquisa científica.
Na história da pesquisa científica com IA, embora muitas ferramentas e sistemas tenham surgido, a maioria deles são apenas ferramentas auxiliares e não conseguem realizar pesquisas sozinhas. Sistemas de IA anteriores, como PaperBench e Agent Laboratory, ajudavam principalmente os cientistas a reproduzir artigos ou resolver problemas específicos de aprendizado de máquina. Já o AlphaTensor otimizava o desempenho do código por meio de muita tentativa e erro. No entanto, essas ferramentas frequentemente não questionavam os paradigmas atuais da pesquisa científica.
Com o avanço da tecnologia, alguns sistemas de IA científicos totalmente automáticos, como o AI Scientist, surgiram. Eles demonstraram que a IA pode realizar todo o ciclo de pesquisa e descobrir novos resultados científicos, mas ainda carecem de objetivos e direções científicas claros. Em comparação, o DeepScientist mostra objetividade e insight por meio de seu processo fechado e iterativo. O sistema analisa primeiro os métodos de pesquisa existentes, identifica suas limitações e depois propõe ideias inovadoras e significativas do ponto de vista científico.
O fluxo de trabalho do DeepScientist foi projetado como um ciclo em três etapas: primeira etapa é a geração de novas ideias, na qual o sistema extrai informações de uma grande memória e classifica as novas ideias; em seguida, o sistema usa o algoritmo "Upper Confidence Bound" para decidir quais ideias validar, escolhendo a ideia com a maior pontuação para experimentação; finalmente, com base na validação bem-sucedida, o sistema redige um relatório detalhado de pesquisa, formando um ciclo fechado.
Em tarefas específicas, o DeepScientist selecionou três direções avançadas de pesquisa em IA, incluindo atribuição de falhas de agentes, aceleração da inferência de LLM e detecção de texto de IA. Nesses três tópicos, o DeepScientist propôs métodos novos, como A2P, ACRA e PA-Detect, superando não apenas os registros atuais (SOTA) existentes, mas também demonstrando sua excelente capacidade de aprendizado autônomo e inovação.
Essa descoberta revolucionária confirma novamente o potencial dos cientistas de IA no campo da pesquisa científica e pode desempenhar um papel importante em explorações científicas mais amplas no futuro.
Projeto: https://github.com/ResearAI/DeepScientist
Principais pontos:
- 🚀 O DeepScientist completou a quantidade de pesquisa de três anos de um cientista humano em duas semanas, demonstrando uma forte capacidade de pesquisa.
- 💡 O sistema pode gerar e validar ideias científicas por conta própria por meio de um processo fechado e iterativo, formando um ciclo completo de pesquisa.
- 🧠 O DeepScientist superou com sucesso os registros mais recentes dos humanos em várias tarefas avançadas, demonstrando o grande potencial da IA no campo da pesquisa científica.