Um novo estudo propõe o método de dicas visuais Set-of-Mark (SoM) para melhorar a precisão visual do GPT-4V. Experimentos demonstraram que o GPT-4V+SoM apresenta desempenho superior em tarefas de segmentação de imagens, aproximando-se do desempenho de modelos especializados. O método de marcação automática/semiautomática do SoM permite que o GPT-4V suporte diversas tarefas visuais de grão fino, incluindo tarefas de referência e segmentação de objetos em vídeo.
Pesquisa da Microsoft: Aprimorando a precisão visual do GPT-4V com 'marcas'

机器之心
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.