アリババは秘密裏に「千問」プロジェクトを開始し、Qwenモデルを基に個人向けAIアシスタントアプリを開発、ChatGPTに対抗。オープンソース技術を活用し、BtoBから個人AI市場へ参入する重要戦略。....
微博のAI部門はオープンソースの大規模モデルVibeThinker-1.5Bをリリースしました。このモデルには15億のパラメータがあり、アリのQwen2.5-Math-1.5Bに基づいて最適化されており、数学とコードのタスクで優れた性能を発揮します。現在、Hugging Faceなどのプラットフォームで無料で公開されており、MITライセンスに従い、商用利用も可能です。
アリババクラウドの通義シリーズAI大規模モデルは「ダブル11」において初めて大規模に小売業分野に応用され、淘宝と天猫の消費者体験、運営管理、トラフィック配分を全面的に最適化しました。その中で、通義Qwen-MTなどの翻訳モデルが多言語取引において中心的な役割を果たしました。
アリババはアップグレードされたAI推論モデルQwen3-Max-Thinkingを発表しました。このモデルはアメリカンインビテーショナルマスゲームとハーバード・マサチューセッツ工科大学数学トーナメント(HMMT)の両方で満点を達成し、中国のAIモデルとして初めてこの2つの上級数学コンペティションで100%の正確率を達成したことを示しています。これにより、その強力な推論力と問題解決能力が際立っています。
Qwen Image AIはアリババグループのQwenチームが開発したオープンソースの画像生成および編集ベースモデルで、正確な画像テキストレンダリングと高度な編集が可能です。
Qwen Image はアリババが提供する無料でオープンソースのAI画像ジェネレーターであり、画像内のテキストレンダリングに長けています。
Qwen2.5-Omniは、アリババクラウドの通義千問チームが開発したエンドツーエンドのマルチモーダルモデルであり、テキスト、音声、画像、ビデオ入力をサポートしています。
Qwen2.5-Coderシリーズをベースとした大規模言語モデルで、エージェントアプリケーションに特化しています。
alibaba
$0.72
入力トークン/百万
出力トークン/百万
128k
コンテキスト長
$2.16
-
32k
1M
DavidAU
これは、Qwen3-VL-8B-Thinkingモデルをベースにした強化版のマルチモーダルビジュアル言語モデルです。Brainstorm 20x技術を用いて12Bパラメータに拡張され、NEO Imatrixで強化されたGGUF量子化が適用されています。このモデルは、画像理解、テキスト生成、マルチモーダル推論の能力が強く、ビジュアル感知、テキスト品質、クリエイティブなシーンでの性能が著しく向上しています。
tlennon-ie
Qwen-Edit-Skinは、Qwen/Qwen-Image-Edit-2509モデルをベースに微調整されたLoRAモデルで、画像中の人物の肌のリアリティと細部を向上させることに特化しており、より自然で繊細な肌のテクスチャを生成します。
unsloth
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、そして優れたインテリジェントエージェント対話能力を備えています。
noctrex
慧慧Qwen3-VL-8B指令アブレーションモデルの量子化バージョンで、画像テキストからテキストへの変換タスクに特化しています。このモデルはQwen3-VL-8Bアーキテクチャに基づいており、指令アブレーション最適化と量子化処理を行っており、性能を維持しながら計算リソースの要求を低減できます。
Qwen3-VL-32B-ThinkingはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈処理、空間および動画の動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VL-8B-Thinkingは通義千問シリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VLは通義シリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認知と推論、コンテキスト長、空間およびビデオの動的理解、エージェントインタラクション能力などの面で全面的にアップグレードされています。このモデルは密集アーキテクチャとハイブリッドエキスパートアーキテクチャを提供し、エッジデバイスからクラウドまでの柔軟なデプロイをサポートします。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、包括的な総合アップグレードが実現されています。これには、卓越したテキスト理解と生成能力、より深いビジュアル感知と推論能力、より長いコンテキスト長、強化された空間およびビデオ動的理解能力、そしてより強力なエージェント対話能力が含まれます。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェントインタラクション能力を備えています。このバージョンは2Bパラメータの思考強化版で、推論能力が特別に最適化されています。
JanusCoder-14Bは、Qwen3-14Bをベースに構築された14Bパラメータのオープンソース基礎モデルで、コードインテリジェンスに統一されたビジュアルプログラミングインターフェイスを構築することを目的としています。このモデルはJANUSCODE-800Kマルチモーダルコードコーパスで学習され、さまざまなビジュアルプログラミングタスクを統一的に処理することができます。
Qwen
Qwen3-VL-30B-A3B-Thinkingは通義シリーズで最も強力なビジュアル言語モデルで、優れたテキスト理解と生成能力、深いビジュアル認識と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、およびエージェント対話能力を備えています。
JanusCoder-8Bは、Qwen3-8Bをベースに構築されたオープンソースのコードインテリジェンス基礎モデルで、統一されたビジュアルプログラミングインターフェイスを構築することを目的としています。このモデルは、JANUSCODE-800K(これまでで最大のマルチモーダルコードコーパス)で学習され、データ可視化、インタラクティブなWeb UI、コード駆動のアニメーションなど、さまざまなビジュアルプログラミングタスクを処理できます。
Qwen3 - VLは通義シリーズで最も強力なビジュアル言語モデルで、ハイブリッドエキスパートモデルアーキテクチャ(MoE)を採用し、GGUF形式の重みを提供し、CPU、GPUなどのデバイスで効率的な推論をサポートします。モデルは、テキスト理解、ビジュアル感知、空間理解、動画処理などの面で全面的にアップグレードされています。
Qwen3-VL-30B-A3B-Instructは通義シリーズで最も強力なビジュアル言語モデルで、ハイブリッドエキスパートモデルアーキテクチャを採用し、優れたテキスト理解と生成能力、深いビジュアル感知と推論能力を備え、256Kの長いコンテキストとビデオ理解をサポートし、さまざまなデバイスで推論が可能です。
Qwen3-VL-2B-ThinkingはQwenシリーズの中で最も強力なビジュアル言語モデルの1つで、GGUF形式の重みを使用し、CPU、NVIDIA GPU、Apple Siliconなどのデバイスで効率的な推論をサポートします。このモデルは、優れたマルチモーダル理解と推論能力を備え、特にビジュアル感知、空間理解、エージェントインタラクション機能が強化されています。
Qwen3-VL-8B-Thinkingは通義千問シリーズの中で最も強力なビジュアル言語モデルで、強化された推論能力を備えた8Bパラメータ版です。このモデルは、テキスト理解、ビジュアル認知、空間理解、長文脈処理などの面で全面的にアップグレードされ、マルチモーダル推論とエージェントインタラクションをサポートしています。
Qwen3-VL-32B-Instructは通義シリーズで最も強力なビジュアル言語モデルで、優れたテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、およびエージェント対話能力を備えています。
Qwen3-VL-8B-Instructは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力を備えています。
Qwen3-VL-4B-Instructは通義シリーズの最強のビジュアル言語モデルの1つで、テキスト理解、ビジュアル感知、空間理解、ビデオ処理などの面で全面的にアップグレードされ、さまざまなハードウェアデバイスでの実行をサポートし、卓越したマルチモーダル推論能力を備えています。
Qwen3-VL-2B-Instruct-GGUFは通義千問シリーズのマルチモーダルビジュアル言語モデルのGGUF量子化バージョンで、20億のパラメータを持ち、画像理解とテキスト生成のシームレスな融合をサポートし、CPUやGPUなどのデバイスで効率的に動作します。