Alibaba stellt eine kompakte Qwen3-VL-Modelle vor, um die Effizienz von Multimodal-IA zu verbessern und die Bereitstellung auf Edge-Geräten zu beschleunigen

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 3 Minuten Lesezeit · Oct 15, 2025

Das KI-Abteilung von Alibaba hat heute offiziell die kompakte Version der Qwen3-VL-Serie mit visueller Sprachmodellen veröffentlicht, wobei es sich um Varianten mit 4 Milliarden und 8 Milliarden Parametern handelt. Dieser Schritt markiert einen bedeutenden Fortschritt bei der Anwendung fortschrittlicher multimodaler KI-Technologien auf Edge-Geräte und Ressourcenbegrenzte Umgebungen.

Leistungssteigerung: Kleine Modelle messen sich mit den Großen

Die neu veröffentlichten Modelle mit 4B und 8B bieten sowohl Instruct- als auch Thinking-Versionen und sind für zentrale multimodale Fähigkeiten wie STEM-Reasoning, Visual Question Answering (VQA), Optical Character Recognition (OCR), Videoverstehen und Agentenaufgaben optimiert.

Laut den veröffentlichten Benchmark-Tests zeigten diese kleinen Modelle eine herausragende Leistung und übertrafen dabei Konkurrenten wie Gemini2.5Flash Lite und GPT-5Nano. Besonders beeindruckend ist, dass ihre Leistung in einigen Bereichen sogar mit dem größeren Qwen2.5-VL-72B-Modell vergleichbar ist, das nur sechs Monate zuvor veröffentlicht wurde, was eine sehr hohe Parameter-Effizienz zeigt.

Ressourcenoptimierung, KI-Demokratisierung fördern

Der Schlüsselvorteil des neuen Modells besteht darin, dass der VRAM-Verbrauch deutlich reduziert wird, sodass es direkt auf Verbraucherhardware wie Laptops und Smartphones laufen kann. Um die Effizienz weiter zu steigern, bietet Alibaba auch eine FP8-Quantisierungsversion an, die die Ressourcenverbrauch weiter reduziert, ohne die Kernkompetenzen einzubüßen. „Kleine VL-Modelle eignen sich für die Implementierung und haben in der Mobiltelefon- und Roboterbranche eine große Bedeutung“, sagte ein Mitglied des Qwen-Entwicklerteams.

Schnelle Iteration, Open-Source-Teilung

Die Einführung dieser kompakten Modelle folgt der Roadmap der im September vorgestellten Qwen3-VL-Serie (mit einem Stammmodell mit 235 Milliarden Parametern). Bisher hat Alibaba bereits am Anfang des Oktober eine 30B-A3B-Variante veröffentlicht, die mit nur 30 Milliarden aktiven Parametern Ergebnisse erzielte, die mit GPT-5Mini und Claude4Sonnet vergleichbar sind. Diese schnelle Iteration wird von der Branche als Beweis dafür angesehen, dass Alibaba die Demokratisierung leistungsstarker KI vorantreibt, insbesondere für embodied systems wie Roboter.

Adresse:

https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks

Meituan LongCat-Team stellt VitaBench vor: Ein neuer Benchmark für intelligente Agenten

Das Meituan LongCat-Team hat den VitaBench-Benchmark für intelligente Agenten vorgestellt, der sich auf häufige Lebensszenarien wie Lieferessenbestellung, Restaurantbesuche und Reisen konzentriert. Der Benchmark bietet eine interaktive Umgebung mit 66 Tools, die komplexe Aktionen wie Ticketkauf und Buchungen abdecken und somit eine wichtige Infrastruktur für die Entwicklung von intelligenten Agenten in realen Szenarien bereitstellt.

Europas AI-Star Nexos.ai erhält 30 Millionen Euro Finanzierung, um Unternehmen dabei zu unterstützen, sicher mit KI umzugehen

Die litauische KI-Start-up-Nexos.ai hat eine Finanzierung von 30 Millionen Euro in der A-Runde abgeschlossen, die von Index Ventures und Evantic Capital geleitet wurde. Das Unternehmen konzentriert sich darauf, Unternehmen bei der sicheren Nutzung von KI-Tools zu unterstützen und Risiken von Datenlecks zu lösen, die durch die Nutzung großer Sprachmodelle durch Mitarbeiter entstehen können.

AI-Tageszeitung: Alibaba Quark C-Plan wird enthüllt; Veo 3.1 wird präzisere Videobearbeitungsfunktionen hinzufügen; Anthropic stellt Claude Code im Web-Modus vor

Alibaba Quark hat den C-Plan vorgestellt und baut die对话式 AI-Anwendungen aus, mit dem Ziel, Dou Bao von ByteDance direkt zu konkurrieren, um seine Wettbewerbsfähigkeit im AI-Geschäft zu stärken. Der Plan konzentriert sich auf Entwickler, fördert technologische Trends und innovative Produktanwendungen und hilft Benutzern dabei, die Entwicklungen im AI-Bereich besser zu verstehen.

Ein Klick-Modus für Videos! Google Veo 3.1 wird bald eine präzise Video-Bearbeitungsfunktion einführen, die so realistisch ist, dass man den Unterschied nicht erkennen kann

Google Veo 3.1 bringt eine revolutionäre "präzise Bearbeitungsfunktion" heraus, die es ermöglicht, Videos leichter zu bearbeiten, Elemente hinzuzufügen oder zu entfernen, während der Originalvideo intakt und realistisch bleibt. Diese Technologie kann komplexe Details wie Schatten und Umweltinteraktionen verarbeiten und bietet Kreativen mehr Freiheit, um die AI-Videoerstellung von der Generierung zur professionellen Nachbearbeitung zu führen und eine umfassende Optimierung zu erreichen.

2025 Halbjahr: Chinas AI IaaS-Markt erreicht 19,87 Milliarden Yuan mit einer Wachstumsrate von 122,4%

Laut IDC-Bericht erreichte der chinesische AI IaaS-Markt im ersten Halbjahr 2025 einen Wert von 19,87 Milliarden Yuan und wuchs um 122,4%. Besonders auffällig war der Bereich generative KI IaaS mit einem Marktvolumen von 16,68 Milliarden Yuan und einer Wachstumsrate von 219,3%. Der Rest des AI IaaS-Marktes verringerte sich um 14,1% auf 3,19 Milliarden Yuan. Cloud-Anbieter erhöhen kontinuierlich ihre Investitionen in die AI-Infrastruktur.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

AI Models Finder

LLM Leaderboard

Model Providers

Submit Your Model

Compare LLMs

LLM Cost Calculator

LLM Arena

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

GEO Services​

AI Search Visibility Checker

AI Model Compatibility Checker

AI Dataset Collection

Intelligent Document Recognition

Alibaba stellt eine kompakte Qwen3-VL-Modelle vor, um die Effizienz von Multimodal-IA zu verbessern und die Bereitstellung auf Edge-Geräten zu beschleunigen

AIbase基地

Leistungssteigerung: Kleine Modelle messen sich mit den Großen

Ressourcenoptimierung, KI-Demokratisierung fördern

Schnelle Iteration, Open-Source-Teilung

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Schockierend! Der CEO von Vercel behauptet, dass Kimi K2 die Genauigkeit von GPT-5 in der KI-Anwendung um 50 % übertrifft!

AI-Modell-Aktienhandel! DeepSeek erwirtschaftet über 14 %, Gemini 2.5 Pro verliert 40 %

Google AI Research präsentiert DeepSomatic: Ein Modell zur Erkennung von Tumorzell-Genveränderungen

Meituan LongCat-Team stellt VitaBench vor: Ein neuer Benchmark für intelligente Agenten

Europas AI-Star Nexos.ai erhält 30 Millionen Euro Finanzierung, um Unternehmen dabei zu unterstützen, sicher mit KI umzugehen

AI-Tageszeitung: Alibaba Quark C-Plan wird enthüllt; Veo 3.1 wird präzisere Videobearbeitungsfunktionen hinzufügen; Anthropic stellt Claude Code im Web-Modus vor

Ein Klick-Modus für Videos! Google Veo 3.1 wird bald eine präzise Video-Bearbeitungsfunktion einführen, die so realistisch ist, dass man den Unterschied nicht erkennen kann

Youdao Dictionary AI-Übersetzung Nutzer übersteigen 20 Millionen

2025 Halbjahr: Chinas AI IaaS-Markt erreicht 19,87 Milliarden Yuan mit einer Wachstumsrate von 122,4%

Vidu Q2 umfassend aktualisiert: Referenzvideos beschleunigt dreifach, unterstützt die Erstellung von AI-Geschichten bis zu fünf Minuten

GEO Services