WebLlama ist ein auf Meta Llama 3 basierender Agent, der speziell für die Webnavigation und den Dialog optimiert wurde. Er zielt darauf ab, effektive, menschenzentrierte Agenten zu entwickeln, die Benutzer bei der Webnavigation unterstützen, anstatt sie zu ersetzen. Das Modell übertrifft GPT-4V (Zero-Shot) im WebLINX-Benchmark um 18 % und zeigt damit seine herausragende Leistung bei Webnavigationsaufgaben.