A plataforma de compartilhamento de vídeos de jogos Medal recentemente criou uma laboratório de pesquisa em IA chamado General Intuition e anunciou que completou uma rodada de financiamento inicial de 137,7 milhões de dólares, liderada pela Khosla Ventures e pela General Catalyst, com participação da Raine. A startup utiliza os dados massivos de vídeos de jogos acumulados pela Medal para treinar modelos base e agentes de IA, focando em entender como objetos e entidades se movem no espaço e no tempo - essa capacidade é conhecida como raciocínio espaço-temporal.
A General Intuition acredita que o conjunto de dados da Medal é superior aos das plataformas alternativas como Twitch ou YouTube na formação de agentes. Esse conjunto de dados inclui 2 bilhões de vídeos por ano de usuários ativos mensais de 10 milhões, cobrindo milhares de jogos. O CEO da Medal e da General Intuition, Pim de Witte, explicou que os trechos de vídeo carregados pelos jogadores geralmente são casos extremos positivos ou negativos, o que fornece dados valiosos nas bordas para o treinamento. "Você obtém um viés de seleção que aponta exatamente para aquele tipo de dados que realmente deseja usar para o trabalho de treinamento."
Essa vantagem de dados atraiu a atenção da OpenAI, segundo relatos. De acordo com informações do The Information, a OpenAI tentou comprar a Medal por 500 milhões de dólares no ano passado, embora nem a OpenAI nem a General Intuition tenham comentado sobre esse relato.
Em termos de avanços técnicos, a equipe fundadora já alcançou algumas conquistas. O modelo da General Intuition é capaz de compreender ambientes não treinados e prever corretamente as ações neles. Esse modelo realiza isso totalmente por meio de entradas visuais - o agente só vê o que um jogador humano vê e se move no espaço por meio de entradas do controlador. A empresa afirma que esse método pode ser transferido naturalmente para sistemas físicos como braços robóticos, drones e veículos autônomos, pois esses dispositivos geralmente são controlados por manoplas de jogos humanas.
O próximo marco da General Intuition inclui dois direcionamentos: gerar novos mundos simulados para treinar outros agentes e navegar autonomamente em ambientes físicos totalmente desconhecidos.
No aspecto de estratégias comerciais, a General Intuition difere claramente dos desenvolvedores de modelos mundo do mundo. Embora a empresa esteja construindo modelos mundo para treinar agentes, estes modelos em si não são produtos. Ao contrário do DeepMind e do World Labs, que vendem seus modelos mundo Genie e Marble para treinar agentes e criar conteúdo, a General Intuition escolheu outros cenários de aplicação para evitar problemas de direitos autorais.
de Witte afirmou claramente: "Nosso objetivo não é produzir modelos que competam com os desenvolvedores de jogos." Em vez disso, os aplicativos da empresa de jogos se concentram em criar robôs e personagens não jogadores (NPCs) que superem os "robôs determinísticos" tradicionais - personagens programados que sempre produzem a mesma saída.
O membro fundador da General Intuition e parceiro da Lightspeed Ventures, Moritz Baier-Lentz, disse: "Esses robôs podem ser expandidos para qualquer nível de dificuldade. Criar um robô invencível que derrote todos não é atraente, mas se você puder expandir gradualmente e preencher a fluidez para qualquer situação do jogador, mantendo sua taxa de vitória em torno de 50%, isso maximizará seu engajamento e retenção."
de Witte também tem experiência em trabalhos humanitários, o que influenciou o foco da empresa em drones de resgate. Esses drones às vezes precisam navegar em ambientes desconhecidos sem GPS e extrair informações.
Na visão de longo prazo, de Witte e Baier-Lentz acreditam que a funcionalidade central da General Intuition - o raciocínio espaço-temporal - é parte crucial para alcançar inteligência artificial geral (AGI). Enquanto os principais laboratórios de IA se concentram em construir modelos de linguagem cada vez mais poderosos, a General Intuition acredita que a AGI real precisa de algo que os modelos de linguagem grandes simplesmente não possuem.
de Witte disse: "Como humanos, criamos textos para descrever o que acontece no nosso mundo, mas ao fazer isso, você perde muita informação. Você perde a intuição geral sobre o raciocínio espaço-temporal."
Essa elevada rodada de financiamento inicial reflete a confiança dos investidores no setor de inteligência espacial. Diferente dos modelos de IA tradicionais que entendem o mundo por meio de texto e imagens, o raciocínio espaço-temporal se concentra nas mudanças dinâmicas e causalidades no mundo físico. A General Intuition planeja usar esse financiamento para expandir sua equipe de pesquisadores e engenheiros, treinando agentes inteligentes genéricos capazes de interagir com o mundo ao redor, com aplicações iniciais nos campos de jogos e drones de resgate. Em termos de caminho tecnológico, utilizar vídeos de jogos para treinar IA capaz de compreender o mundo físico representa uma nova abordagem para transferir experiências ambientais virtuais para tarefas reais.





