Na área de inteligência artificial, os últimos resultados da equipe DeepResearch Tongyi geraram amplo interesse. Essa inovação não apenas fez com que a IA passasse de "ser capaz de conversar" para "saber fazer pesquisa", mas também mostrou ao mundo sua excelente performance com uma postura aberta. O DeepResearch Tongyi obteve resultados avançados em vários benchmarks autoritários, e suas capacidades gerais superam muitos modelos internacionais conhecidos. Além disso, o modelo, o framework e as soluções foram totalmente open source, trazendo verdadeiramente a produtividade da pesquisa profunda para todos.

Em comparação com os modelos caros e limitados internacionalmente, a equipe DeepResearch Tongyi optou por uma abordagem completamente aberta, fornecendo uma série de ferramentas e soluções. Em vários projetos de teste, como Humanity's Last Exam, BrowseComp, GAIA, entre outros, o modelo leve 30B-A3B se saiu bem, atingindo um nível avançado.

image.png

Destaca-se que a equipe compartilhou métodos detalhados sobre como construir o DeepResearch Agent em seu site oficial e no GitHub, abrangendo todo o processo desde a síntese de dados até o aprendizado por reforço. Na parte de raciocínio, o modelo demonstrou duas vantagens: o modo ReAct básico, que libera plenamente o potencial do modelo sem necessidade de prompts complexos, e o modo profundo, que melhora ainda mais seu desempenho em raciocínio e planejamento complexos.

image.png

A equipe DeepResearch Tongyi também fez contribuições significativas na estratégia de dados. Eles adotaram uma estratégia de dados em várias etapas, gerando dados de treinamento de alta qualidade usando pré-treinamento incremental e pós-treinamento, sem depender de anotações manuais caras. Além disso, o modo de raciocínio do modelo é dividido em dois: o modo ReAct nativo e o modo Heavy, usado para tarefas complexas, o que facilita a resolução de tarefas de pesquisa extremamente desafiadoras.

image.png

Durante o processo de aprendizado por reforço, a equipe DeepResearch Tongyi melhorou continuamente o desempenho do modelo por meio de algoritmos otimizados e infraestrutura estável. Eles adotaram estratégias específicas para garantir que os sinais correspondam com precisão durante o processo de aprendizagem, obtendo assim efeitos de aprendizagem eficientes.

A divulgação do DeepResearch Tongyi não apenas fornece novas direções para a pesquisa em IA, mas também representa uma resposta ativa à comunidade tecnológica global, demonstrando a força poderosa da cooperação aberta.