No Google I/O Developer Conference de 2025, a Google mostrou seus mais recentes avanços em IA e tecnologia XR, abrangendo três áreas principais: ferramentas criativas, plataformas para desenvolvedores e experiência do usuário. O novo gerador de vídeo Veo3, o gerador de imagem Imagen4, a nova plataforma XR Android XR e o serviço premium de IA "AI Ultra" foram os destaques da apresentação.

Como uma grande atualização nas ferramentas de criação de IA, o Veo3 pode gerar vídeos com trilhas sonoras nativas, diferenciando-se de produtos como o Sora da OpenAI, que ainda não suporta áudio. Já está disponível para assinantes Ultra nos EUA e clientes empresariais da Vertex AI. O Imagen4 oferece melhor design e detalhes de imagem, além de suporte a múltiplos formatos de saída. Ambos já estão integrados ao aplicativo Gemini, Workspace, Whisk e à nova plataforma de produção de filmes com IA chamada Flow.

QQ20250521-090033.png

A Flow reúne funções como geração de cenas, controle de câmera e gestão de materiais, permitindo que os usuários misturem conteúdo gerado por IA com conteúdo original para criar fluxos de trabalho de nível cinematográfico completos. Além disso, a Google lançou o modelo de geração de música Lyria, disponível via YouTube Shorts e Vertex AI para criadores de música.

Para atender às necessidades de criadores avançados e empresas, a Google lançou o AI Ultra, um plano mensal de US$ 249,99, que inclui Veo3, Imagen4, a ferramenta de proxy Project Mariner, YouTube Premium, 30TB de armazenamento na nuvem e outros serviços de topo. Há também uma versão Pro como opção secundária.

O Gemini Live será lançado no aplicativo Gemini, permitindo colaboração em tempo real por meio de câmera e compartilhamento de tela, ideal para solução de problemas e planejamento de eventos. As funcionalidades do Gemini também estão embutidas no Chrome, permitindo análise e resumo de conteúdo da web.

No campo das comunicações, o Google Meet adicionará uma função de tradução de tom e expressões faciais baseada em IA, inicialmente suportando inglês e espanhol, disponível apenas para usuários Pro e Ultra. O Gmail também introduzirá respostas inteligentes personalizadas com base nos dados históricos de email do usuário, que exigirá autorização para ser ativada.

No que diz respeito aos desenvolvedores, a API do Gemini adicionou funções avançadas como funções assíncronas, áudio nativo e protocolo de contexto de ferramentas (MCP). Modelos novos como Gemma3n (modelo móvel leve), **MedGemma (aplicativos médicos)** e SignGemma (reconhecimento de linguagem de sinais) ampliam ainda mais o portfólio de modelos de IA da Google.

Para fortalecer a confiabilidade do conteúdo gerado por IA, a Google lançou o portal SynthID Detector, que identifica automaticamente fontes de IA em imagens, texto, áudio e vídeo usando marcas invisíveis. Mais de bilhões de projetos já usam esse sistema de marcação.

Por fim, a Google anunciou o lançamento de uma nova plataforma AR/MR chamada Android XR, que fornecerá suporte operacional para dispositivos futuros de AR e MR (como óculos de realidade aumentada e headsets). Integrada com inteligência do Gemini, os dispositivos terão funções como tradução em tempo real, análise ambiental e processamento de mensagens. A Google já está colaborando com marcas como Gentle Monster e Warby Parker e lançará o SDK neste ano.

A apresentação demonstrou que a Google está integrando profundamente a capacidade de IA em seus produtos, processos de criação de conteúdo e plataformas finais, consolidando sua entrada no ecossistema nativo de IA.