大規模モデルの競争焦点は性能の比較から企業シナリオにおけるスケーラブルな応用へと移り、コストパフォーマンスと効率が重要視されている。アント・テクノロジーはLing-2.6-flashビジネス版であるLingDT-2.6-flashをリリースし、メインとなるのは「Token効率」で、同パラメータレベルのモデルと比較して90%のToken消費量を節約でき、より速く、より低コストで、企業の現実的なシナリオに適した大規模な展開が可能になる。
美団はAIアシスタント「小団」の大幅アップグレードを発表。アプリのトップページに入口を移し、フルリリースを実現。ユーザーは簡単操作でスマートアシスタントを利用でき、五一連休中の地域生活や都市間旅行需要の急増に対応し、消費体験を向上させる。....
4月24日の北京モーターショーで、支付宝(アリペイ)と斑馬智能(バンマ・インテリジェント)が共同で「AI付」車載版を統合した新型AIコックピットソリューションを発表。スマートコックピットを「聞いて話す」から「支払って処理する」へと進化させた。初回はエンターテインメントと移動生活シーンをカバーし、音声コマンドでチケット購入、ホテル予約、食事注文などの消費サービスが可能に。....
ルオヨウは自社開発の端末側AIスマートエージェントYOYO Clawを発表し、初めてMagicBookシリーズノートパソコンに搭載されました。この技術により50%の単語消費量を節約し、AIの使用効率を向上させ、ユーザーにさらにスマートな体験を提供します。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$4
$16
$2
$20
$8
$240
52
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
Acly
MobileSAMは軽量級の画像分割モデルで、点またはボックスのプロンプトに基づいてターゲットのマスクを生成でき、消費者向けハードウェアでの効率的な推論用に設計されています。
moonshotai
Kimi-VL-A3B-Thinking-2506はKimi-VL-A3B-Thinkingのアップグレード版で、マルチモーダル推論、視覚認知と理解、ビデオシーン処理などの分野で著しい向上が見られ、より高解像度の画像をサポートし、より少ないトークンを消費しながらよりスマートな思考を実現します。
facebook
MobileLLM-ParetoQは、モバイルデバイス向けに最適化された極低ビットの大規模言語モデル量子化フレームワークで、1ビット、1.58ビット、2ビット、3ビット、4ビットの量子化設定をサポートし、高いパフォーマンスを維持しながらリソース消費を大幅に削減します。
wan-community
万2.1はオープンで先進的な大規模動画生成モデルであり、最先端の性能を備え、消費者向けGPUでの実行をサポートし、マルチタスク処理において卓越したパフォーマンスを発揮します。
MCPBenchは、MCPサーバーのパフォーマンスを評価するためのフレームワークで、Web検索とデータベースクエリの2種類のタスクの評価をサポートし、ローカルおよびリモートのサーバーと互換性があり、主に精度、遅延、トークン消費を評価します。
最適化されたPlaywright MCPサーバーで、クライアント - サーバーアーキテクチャを採用してブラウザ自動化を実現し、革新的なセマンティックスナップショットアルゴリズムによりページコンテンツの転送量を大幅に削減し、重要な要素を保持しながらトークン消費を90%削減します。
OmniMCPはセマンティックルーティングツールで、単一のインターフェースを通じて複数のMCPサーバーを統一的に管理し、従来のMCPツール定義によるコンテキストの膨張問題を解決し、必要に応じてツールを動的にロードし、トークン消費を大幅に削減します。
quiet - shellは、shellコマンドの出力をインテリジェントにフィルタリングすることで、AIエージェントのコンテキスト消費を削減し、エラー、失敗、要約情報を表示することに焦点を当て、開発効率を向上させるMCPサーバーです。
インタラクティブフィードバックMCPサーバープロジェクトは、ユーザーのフィードバックによってAIアシスタントのタスクフローを最適化し、リソースの消費を削減し、パフォーマンスを向上させます。
slack - cli - mcpは、Slack MCPサーバーをDockerコマンドラインインターフェイスにラップするプロジェクトで、CLI方式によりLLMエージェントのトークン消費を大幅に削減し、効率を向上させることを目的としています。