アリババの通義千問チームがNeurIPS 2025で最優秀論文賞を受賞。論文『Attention Gating Makes Better Foundation Models』は「スライドゲート」機構を提案し、標準アテンション後に学習可能なゲートを追加して重要ヘッドとトークンを動的に選別。1.7Bパラメータモデルが15B MoEモデルと同等性能を達成。応募2万件中4作品の受賞作で唯一の中国成果。....
アリババクラウドの BaiLian は、2025年11月13日から、通義千問3-Maxモデルのコア呼び出し費用が半額となり、キャッシュ計費ポリシーが最適化され、企業のAIアプリケーションコストが大幅に削減される。この措置により、大規模モデルの利用ハードルを下げ、中小企業のデジタルトランスフォーメーションを加速する目的がある。
米国のNof1機関が開催した初回のAI大規模モデル投資コンテストが終了し、アリババの通義千問Qwen3-Maxが22.32%の収益率で優勝しました。これにより、同モデルが量化取引において先進的な実力を示しました。コンテストでは6つのトップモデルにそれぞれ1万ドルの初期資金が与えられ、Hyperliquidプラットフォームのリアルなトレード環境で競争されました。
阿里通義千問がQwen3-Maxを発表。新機能「深度思考」モードで複雑なタスク処理を効率化。パラメータ数1兆超、学習データ36Tトークンの大規模モデルで、コード生成とエージェント能力が向上。....
Qwen2.5-Omniは、アリババクラウドの通義千問チームが開発したエンドツーエンドのマルチモーダルモデルであり、テキスト、音声、画像、ビデオ入力をサポートしています。
コードデモプラットフォーム。スマートなQ&A体験を提供します。
コード アーティファクトを提供するオンラインプラットフォームです。
人間の指示に特化して応答する大規模言語モデル
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Alibaba
-
$1
$10
256
$4
$16
1k
$2
$20
$8
$240
52
$3.9
$15.2
64
$0.8
128
$54
$163
$1.6
$0.75
unsloth
Qwen3-VL-8B-Thinkingは通義千問シリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen
Qwen3-VL-8B-Thinkingは通義千問シリーズの中で最も強力なビジュアル言語モデルで、強化された推論能力を備えた8Bパラメータ版です。このモデルは、テキスト理解、ビジュアル認知、空間理解、長文脈処理などの面で全面的にアップグレードされ、マルチモーダル推論とエージェントインタラクションをサポートしています。
Qwen3-VL-2B-Instruct-GGUFは通義千問シリーズのマルチモーダルビジュアル言語モデルのGGUF量子化バージョンで、20億のパラメータを持ち、画像理解とテキスト生成のシームレスな融合をサポートし、CPUやGPUなどのデバイスで効率的に動作します。
jackcloudman
Qwen3-Next-80B-A3B-Thinkingは通義千問チームが開発した新世代の思考型大規模言語モデルで、革新的な混合注意力機構と高疎性MoEアーキテクチャを採用し、高効率推論を維持しながら強力な複雑推論能力を備え、ネイティブで262Kの文脈長をサポートします。
prithivMLmods
ドラドーネットワークサーフィンツール拡張版は、通義千問3 - 4Bをベースに微調整された関数呼び出しとインテリジェント推論モデルで、ネットワーク検索の編成、ツール強化推論、動的問題解決のために設計されています。 このモデルは、インテリジェント決定、ツール選択、構造化された実行フローにおいて優れた性能を発揮します。
cpatonn
Qwen3-Next-80B-A3B-Instructは通義千問チームが開発した効率的な疎な混合エキスパートモデルで、総パラメータ数は80B、活性化パラメータ数はわずか3Bです。このモデルは革新的な混合注意力機構と極低活性化率のMoEアーキテクチャを採用し、強力な性能を維持しながら推論効率を大幅に向上させ、ネイティブで262Kのコンテキスト長をサポートし、1Mトークンまで拡張可能です。
TIGER-Lab
Qwen2.5-VL-7B-Instructはアリババの通義千問チームによって開発されたマルチモーダル視覚言語モデルで、70億のパラメータ規模に基づき、視覚的質問応答タスクに特化して最適化トレーニングが行われています。このモデルは画像内容を理解し分析し、正確な自然言語の回答を生成することができます。
lmstudio-community
Qwen3-Next-80B-A3B-Instructはアリババクラウドの通義千問チームによって開発された大規模言語モデルで、MLXフレームワークを用いた4ビット量子化最適化を行い、Appleチップデバイス向けに性能最適化を行い、効率的な推論能力を提供します。
Qwen3-Next-80B-A3B-Instructは、アリババの通義千問チームによって開発された最新世代の大規模言語モデルです。革新的な混合注意力機構と高疎なエキスパート混合アーキテクチャを採用し、総パラメータ数を80Bに保ちながら3Bのパラメータのみを活性化させ、効率的なコンテキストモデリングと推論の高速化を実現しています。ネイティブで262Kのコンテキスト長をサポートし、1Mトークンまで拡張可能です。
Loke-60000
Qwen3-4B-Instructは、アリババの通義千問チームによって開発された40億パラメータの指令微調大規模言語モデルです。Qwen3アーキテクチャを最適化し、対話と指令追従タスクに特化して訓練されており、強力なテキスト生成と理解能力を備えています。
Qwen3-30B-A3B-Instruct-2507はアリババの通義千問チームが開発した300億パラメータの大規模言語モデルで、命令追従タスクに特化して最適化されています。このモデルは、テキスト生成や対話インタラクションなど、様々な自然言語処理タスクをサポートし、LM Studioコミュニティモデルプロジェクトを通じて開発者に提供されています。
huynguyendbs
Qwen3-Embedding-8Bはアリババの通義千問チームによって開発された80億パラメータのテキスト埋め込みモデルで、MLXライブラリを基に最適化されており、文の類似度計算とテキスト特徴抽出タスクに特化しています。
QuantFactory
Qwen3-4Bは通義千問シリーズの最新大規模言語モデルで、4Bパラメータ規模を持ち、思考モードと非思考モードの切り替えをサポートし、推論、指示追従、多言語処理に優れています。
Qwen3は通義千問シリーズの大規模言語モデルの最新世代で、密モデルと混合専門家(MoE)モデルの包括的なスイートを提供します。大規模なトレーニングに基づき、Qwen3は推論、コマンドフォロー、エージェント能力、多言語サポートにおいて画期的な進歩を実現しました。
Qwen3は通義千問シリーズの最新世代大規模言語モデルで、密モデルと混合エキスパート(MoE)モデルの完全なスイートを提供します。大規模なトレーニングに基づき、Qwen3は推論能力、命令追従、エージェント機能、多言語サポートにおいて画期的な進歩を実現しました。
Qwen3は通義千問シリーズの最新世代大規模言語モデルで、完全な密モデルと混合エキスパート(MoE)モデルの組み合わせを提供します。大規模なトレーニングに基づき、Qwen3は推論能力、命令追従、エージェント機能、多言語サポートにおいて画期的な進歩を実現しました。
Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、一連の高密度型および混合エキスパート(MoE)モデルを提供しています。大規模なトレーニングに基づき、Qwen3は推論、指示追従、エージェント能力、多言語サポートにおいて画期的な進歩を実現しました。
Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、一連の高密度型および混合専門家(MoE)モデルを提供しています。大規模なトレーニングに基づき、Qwen3は推論能力、命令追従、エージェント機能、多言語サポートにおいて画期的な進歩を実現しました。
Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、密モデルと混合専門家(MoE)モデルの完全なセットを提供します。膨大なトレーニングデータに基づき、Qwen3は推論能力、命令追従、エージェント機能、多言語サポートにおいて画期的な進歩を実現しました。
通義千問が提供するマルチモーダル大規模モデルで、画像とテキストの生成、および128kの長コンテキスト処理をサポートし、多言語能力を備えています。
MCPサーバーは、ファイル管理、データベース操作、API統合、ベクトル検索をサポートするマルチファンクションのバックエンドサービスプラットフォームで、Dockerデプロイソリューションと通義千問統合の例を提供します。