A colaboração entre a Universidade de Hong Kong (HKU) e o TikTok resultou em um novo modelo MDE, o Depth Anything, capaz de realizar a estimação de profundidade monocular usando imagens não rotuladas em larga escala. O modelo apresenta desempenho e utilidade robustos, oferecendo melhor capacidade de zero-shot. Ele utiliza um mecanismo de dados projetado para coletar e rotular automaticamente dados não rotulados em larga escala, aumentando o tamanho do conjunto de dados e reduzindo erros de generalização. Sua chegada traz novas esperanças para os campos de robótica, direção autônoma e realidade virtual.
HKU e TikTok lançam novo modelo MDE, Depth Anything, que enxerga através de ilusões de imagem do tipo Monument Valley em questão de minutos

站长之家
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.