Recentemente, a equipe de IA do Google lançou o MLE-STAR (Engenharia de Aprendizado de Máquina por Busca e Otimização Direcionada), um sistema avançado de agente, projetado para automatizar o design e a otimização de processos complexos de aprendizado de máquina. O MLE-STAR combina busca em larga escala na rede, otimização direcionada de código e módulos de verificação robustos, demonstrando um desempenho notável em várias tarefas de engenharia de aprendizado de máquina, superando agentes anteriores de aprendizado de máquina autônomo e métodos de base humana.

Atualmente, embora modelos de linguagem grandes (LLMs) tenham feito progressos em geração de código e automação de fluxos de trabalho, os agentes de engenharia de aprendizado de máquina ainda enfrentam muitos desafios. Por exemplo, dependem excessivamente da memória do LLM, usando frequentemente "modelos familiares", ignorando métodos avançados e específicos para a tarefa; também, os agentes anteriores modificavam o código de forma "toda de uma vez", sem explorar profundamente componentes como pré-processamento de dados e engenharia de características. Além disso, o código gerado também pode conter erros e vazamentos de dados.

O MLE-STAR aborda esses problemas com uma série de inovações principais. Primeiro, o MLE-STAR seleciona modelos e trechos de código por meio de busca na rede, em vez de depender apenas de sua própria "memória", garantindo que as soluções iniciais sejam baseadas nas melhores práticas atuais. Em segundo lugar, ele adota um processo de otimização em duas etapas: a iteração externa identifica os componentes que afetam o desempenho por meio de estudos de ablação, enquanto a iteração interna explora profundamente esses componentes. Além disso, o MLE-STAR é capaz de propor e implementar métodos de integração inovadores, melhorando o desempenho geral ao combinar várias soluções candidatas.

Para garantir a qualidade do código, o MLE-STAR também introduz vários agentes especializados, incluindo um agente de depuração que captura automaticamente e corrige erros do Python, um agente que verifica vazamentos de dados e um agente de verificação de uso que garante o uso completo de todos os arquivos de dados. Com essas medidas, o MLE-STAR apresenta um desempenho excepcional em diversos testes de benchmark, especialmente no Kaggle, obtendo medalhas de ouro significativas e uma taxa elevada de obras excelentes.
O repositório de código aberto do MLE-STAR permite que pesquisadores e profissionais de aprendizado de máquina integrem essas capacidades avançadas em seus próprios projetos, acelerando assim o progresso da produtividade e da inovação.
Projeto: https://github.com/nv-tlabs/cosmos1-diffusion-renderer
Principais pontos:
💡 O MLE-STAR é um agente avançado de engenharia de aprendizado de máquina desenvolvido pelo Google, projetado para automatizar tarefas complexas.
🔍 Utiliza busca na rede, otimização direcionada e mecanismos de verificação múltiplos, aumentando significativamente a eficiência e a qualidade da engenharia de aprendizado de máquina.
🏆 No Kaggle, o MLE-STAR obteve resultados excelentes, com maior número de medalhas de ouro e taxa de obras excelentes.





