ggml-org
これはQwen3-VL-30B-A3B-Instructモデルを変換したGGUF形式のバージョンで、llama.cpp用に最適化されています。このモデルは300億パラメータのマルチモーダル視覚言語モデルで、画像理解とテキスト生成タスクをサポートします。
unsloth
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、そして優れたインテリジェントエージェント対話能力を備えています。
Qwen
Qwen3-VL-30B-A3B-Instructは通義シリーズで最も強力なビジュアル言語モデルで、ハイブリッドエキスパートモデルアーキテクチャを採用し、優れたテキスト理解と生成能力、深いビジュアル感知と推論能力を備え、256Kの長いコンテキストとビデオ理解をサポートし、さまざまなデバイスで推論が可能です。
Qwen3-VLはこれまでのQwenシリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認識と推論、コンテキスト長、空間と動画の動的理解、エージェントの対話能力などの面で全面的にアップグレードされています。このモデルはハイブリッドエキスパート(MoE)アーキテクチャを採用し、卓越したマルチモーダル処理能力を提供します。
Hugguf
Qwen3-VL-30B-A3B-InstructはQwen3-VL-30Bモデルに基づくマルチモーダルビジュアル言語モデルで、画像とテキストの統合理解と生成タスクをサポートします。このモデルは先進的なビジュアル言語融合アーキテクチャを採用しており、複雑なマルチモーダル推論タスクを処理することができます。
noctrex
このプロジェクトでは、慧慧Qwen3-VL-30B-A3B-Instructモデルの量子化バージョンを提供しており、特定のシナリオでのモデルの性能と効率を向上させることを目的としています。これはQwen3-VLアーキテクチャに基づく視覚言語モデルで、画像とテキストのマルチモーダル対話をサポートしています。
このプロジェクトは、慧慧-Qwen3-VL-30B-A3B-Instruct-abliteratedモデルのMXFP4_MOE量子化バージョンで、テキスト生成タスクに特化しています。このモデルはQwen3-VLアーキテクチャに基づいており、最適化と量子化処理が行われており、現在はまだ実験段階にあります。
このプロジェクトはQwen3-VL-30B-A3B-InstructモデルをMXFP4_MOE量子化した成果物です。このモデルは画像テキストからテキストへの変換を実現し、関連分野のアプリケーションに新しい解決策を提供します。2025年10月22日現在、このモデルはまだ実験段階にあります。
mlfoundations-cua-dev
OLGAはQwen3-VL-30B-A3B-Instructをベースに構築されたオンライン強化学習位置特定エージェントで、33億のアクティブパラメータを持つエキスパート混合モデルを採用しています。既存のデータセット、新しいデータ収集、自動フィルタリング、およびオンライン強化学習による新しいデータレシピを組み合わせてトレーニングされ、オープンソースモデルで先進的な位置特定性能を実現しています。
ticoAg
Qwen3-VL-30B-A3B-Instruct-AWQはQwen3-VLシリーズの量子化バージョンで、強力なビジュアル言語処理能力を備え、画像理解、ビデオ分析、マルチモーダル推論などのタスクをサポートします。このモデルは、テキスト理解、ビジュアル感知、空間理解、長文脈処理などの面で顕著な向上が見られます。
mlx-community
これはQwen3-VL-30B-A3B-Instructモデルの4ビット量子化MLX形式のバージョンで、mlx-communityによって変換および維持されています。このモデルは300億パラメータのマルチモーダル視覚言語モデルで、画像理解とテキスト生成タスクをサポートします。
bartowski
これはQwen3-VL-30B-A3B-InstructモデルのLlamaCPP量子化バージョンで、先進的な量子化技術によりモデル性能を最適化し、さまざまなハードウェア環境でより効率的に動作するようにしています。マルチモーダル視覚言語理解タスクをサポートします。
QuantTrio
Qwen3-VL-30B-A3B-Instruct-AWQはQwen/Qwen3-VL-30B-A3B-Instructに基づく量子化バージョンで、強力な視覚言語処理能力を備え、テキスト理解、視覚認知、推論などの多方面で優れた性能を発揮します。
Qwen3-VL-30B-A3B-Instruct-FP8は通義シリーズで最も強力なビジュアル言語モデルのFP8量子化バージョンで、ブロックサイズ128の細粒度FP8量子化を採用し、性能は元のBF16モデルとほぼ同じです。このモデルは卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈サポート、強力なエージェント対話能力を備えています。
Qwen3-VLは通義シリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈処理、空間およびビデオ動態理解能力、そして優れたインテリジェントエージェント対話能力を備えています。