WebLlama es un agente basado en Meta Llama 3, específicamente ajustado para la navegación web y la conversación. Su objetivo es construir agentes efectivos centrados en el usuario, ayudándoles a navegar por la web en lugar de reemplazarlos. El modelo superó a GPT-4V (cero-shot) en un 18% en el benchmark WebLINX, demostrando su excelente rendimiento en tareas de navegación web.