レーシンテクノロジーは「AI+グローバル化」戦略によって成長を推進し、株価は逆張りで3.66%上昇しました。2025年第三四半期の売上高は22億8,600万元に達し、前年同期比で13.90%増加し、パフォーマンス計算分野において強い競争力を維持しています。
ミートゥーの口頭ビデオツール「開拍」は、シードランス2.0の大モデルに接続され、2月末日にリリース予定です。この取り組みにより、AI生成能力をユーザーの作業フローに深く統合し、ショートビデオの制作効率を向上させます。国内でユーザー数が最も多く、口頭ビデオアプリとしてリーディング地位を持つ「開拍」は、以前はスクリプト表示やスマートなミキシングなどの機能で知られていました。今回のアップグレードにより、そのAIによるクリエイティブ能力がさらに強化されることになります。
バイチューティッョンのSeedチームが、スマートな画像創作モデル「Seedream5.0Lite」をリリースしました。このモデルの主要な突破点は、「マルチモーダル統一アーキテクチャ」を採用することで、指示の実行から創造意図の深い理解への飛躍を実現したことです。新しいモデルは論理的理解と視覚推論能力を強調しており、より賢く専門的な視覚的なクリエイティブパートナーとして位置づけられています。
香港中文大学が開発した「香港中華大学一号」衛星が打ち上げに成功し、世界で初めて都市持続可能な発展を対象としたAI大規模モデル衛星となり、人工知能とリモートセンシング技術の深く統合され、スマートシティの発展に新たな解決策を提供する。
Mintliは英国の中小企業向けのAIマーケティングコンテンツ生成ツールで、瞬時に専門的なコンテンツを作成できます。
Seedream 5.0 AIはテキストの指示に基づいてリアルな2K画像を生成でき、複数のテーマの合成もサポートします。
AI駆動のPPT生成ツールで、数分で専門的なプレゼンテーション資料を作成し、スマートに美化・強化します。
AutoSendにログインすると、メールを送信し、マーケティングキャンペーンを管理し、パフォーマンスを追跡できます
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$2
$20
$4
$16
$8
$240
52
PrimeIntellect
INTELLECT-3は1060億のパラメータを持つ混合専門家(MoE)モデルで、大規模な強化学習によって訓練されています。数学、コーディング、推論のベンチマークテストで卓越した性能を発揮し、モデル、訓練フレームワーク、環境はすべて緩やかなライセンス契約でオープンソース化されています。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4bは、高度なColPaliスタイルのマルチモーダル埋め込みモデルで、テキストクエリ、ビジュアルドキュメント(画像やPDFなど)、またはショートビデオをアラインされたマルチベクトル埋め込みにマッピングできます。このモデルは、Qwen3-VL-4B-InstructとQwen3-Embedding-4Bの長所を組み合わせ、ViDoReベンチマークテストで優れた性能を発揮し、同時に埋め込みに必要なスペースを大幅に削減します。
Gjm1234
Wan2.2は基礎ビデオモデルの大幅なアップグレード版で、有効なMoEアーキテクチャ、効率的なトレーニング戦略、マルチモーダル融合などの革新的な技術をビデオ拡散モデルに取り入れ、ビデオ生成分野により強力で効率的な解決策をもたらします。
John1604
Qwen3 VL 4B Thinkingは、画像からテキスト、テキストからテキストへの変換をサポートするマルチモーダルモデルで、4Bのパラメータ規模を持ち、様々な画像とテキストの相互作用のニーズを満たすことができます。
MuXodious
Gemma 3n E4B ITは、Googleが開発した軽量マルチモーダルオープンモデルで、Geminiモデルと同じ研究に基づいて構築されています。このモデルは、テキスト、オーディオ、ビジュアル入力をサポートし、様々なタスクに適用できます。MatFormerアーキテクチャを採用して、効率的なパラメータ利用を実現しています。
pramjana
Qwen3-VL-4B-Instructはアリババが開発した40億パラメータの視覚言語モデルで、Qwen3アーキテクチャに基づいて開発され、マルチモーダル理解と対話タスクをサポートします。このモデルは強力な画像理解とテキスト生成能力を備え、複雑な視覚言語対話シーンを処理することができます。
ExaltedSlayer
Gemma 3はGoogleが開発した軽量オープンソースのマルチモーダルモデルです。このバージョンは12Bパラメータの命令調整量子化感知トレーニングモデルで、MLXフレームワークのMXFP4形式に変換されています。テキストと画像の入力をサポートし、テキスト出力を生成します。128Kのコンテキストウィンドウと140種類以上の言語をサポートしています。
black-forest-labs
FLUX.2 [dev] は320億のパラメータを持つ補正フロートランスフォーマーモデルで、画像生成、編集、および合成タスクに特化しています。このモデルは、テキストから画像への生成、単一参照編集、および多参照編集においてリーディングレベルであり、微調整なしでキャラクター、オブジェクト、およびスタイルの参照を実現し、個人、科学、および商業用途をサポートします。
Kiy-K
Fyodor-Q3-8B-Instructは、スマート推論と堅牢なコード生成のために設計された高忠実度の命令調整モデルです。Qwen3 - 8Bアーキテクチャに基づき、高ランクのLoRA設定で訓練されており、コーディング前の計画立案に長けており、複雑なソフトウェアエンジニアリングタスクに非常に適しています。
mradermacher
これはwexyyyyyy/Ru-Gemma3-1Bモデルの静的量子化バージョンで、ロシア語と英語をサポートし、対話とテキスト生成タスク用に特別に設計されています。このモデルは、さまざまなハードウェア構成とパフォーマンス要件に適した複数の量子化バージョンを提供します。
Justin331
SAM 3はMetaが発表した第3世代のプロンプト可能な分割基礎モデルで、画像とビデオの分割タスクを統一的にサポートします。前代のSAM 2と比べて、オープンボキャブラリ概念分割能力を導入し、大量のテキストプロンプトを処理でき、SA - COベンチマークテストで人間の性能の75 - 80%に達します。
Dogacel
これは、元のDeepSeek-OCRモデルをベースにした最適化バージョンで、Appleのメタルパフォーマンスシェーダー(MPS)とCPUでの推論をサポートするOCRモデルです。画像からテキストを抽出し、構造化された形式に変換することができ、多言語のドキュメント認識をサポートします。
RiosWesley
ブラジル範囲ルーティングモデルは、Gemma 3 270Mをベースにした微調整されたミニマルな大規模言語モデルで、ブラジルの配達サービスシステム用に設計されており、非常に高速で軽量な意図分類器(ルーター)として機能します。このモデルはUnslothを使用してトレーニングされ、GGUF形式に変換されています。
Nanbeige
楠米色4-3B-思考-2511は楠米色シリーズの最新の強化バージョンで、高度な蒸留技術と強化学習による最適化を通じて、コンパクトな3Bパラメータ規模で強力な推論能力を実現しています。このモデルはArena-Hard-V2やBFCL-V4などのベンチマークテストで、パラメータが32B未満のモデルの中で最先端(SOTA)の成果を達成しています。
ai-sage
GigaChat3-10B-A1.8BはGigaChatシリーズの対話モデルで、混合専門家(MoE)アーキテクチャに基づいており、合計100億のパラメータがあり、そのうち18億がアクティブなパラメータです。このモデルは、マルチヘッド潜在注意力と多トークン予測技術を採用しており、25.6万トークンの長文脈をサポートし、多言語対話と推論タスクで優れた性能を発揮します。
OpenMMReasoner
OpenMMReasonerは完全に透明な2段階のマルチモーダル推論アプローチで、教師付き微調整(SFT)と強化学習(RL)を用いてトレーニングされます。SFT段階では874Kのサンプルからなるコールドスタートデータセットを構築し、RL段階では74Kのサンプルを利用して能力をさらに向上させ、マルチモーダル推論のベンチマークテストで優れた結果を示します。
GigaChat3-10B-A1.8B-baseはGigaChatシリーズの基礎事前学習モデルで、混合エキスパート(MoE)アーキテクチャを採用し、総パラメータは100億、アクティブなパラメータは18億です。モデルはマルチヘッド潜在的注意機構(MLA)と多トークン予測(MTP)技術を統合し、推論時に高いスループットの利点を持ちます。
OpenMMReasonerは完全に透明な二段階マルチモーダル推論方案で、教師あり微調整(SFT)と強化学習(RL)を含んでいます。この方案は、質の高いデータセットを精心に構築することで、複数のマルチモーダル推論ベンチマークテストで強力なベースラインモデルを上回り、将来の大規模マルチモーダル推論研究に堅実な実証的基礎を築きました。
Mungert
MiroThinker v1.0はオープンソースの研究エージェントで、モデルレベルの対話型拡張により、ツール強化推論と情報検索能力を向上させます。このモデルは複数のベンチマークテストで優れた性能を発揮し、長文脈と深度のある多段階分析をサポートします。
tencent
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
Supabase MCPサーバーはオープンソースのツールで、IDEが安全にSQLを実行し、スキーマ変更を管理し、Supabase管理APIを呼び出し、Auth Admin SDKを使用できるようにします。組み込みのセキュリティ制御があります。
sitemcpは、ウェブサイト全体の内容を取得し、それをMCPサーバーとして使用できるツールで、カスタムマッチングページ、コンテンツセレクターなどの機能をサポートし、ドキュメントやブログサイトの迅速な検索に適しています。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
Rsdoctorは、Rspackエコシステム向けに開発されたビルド分析ツールで、webpackと完全に互換性があり、可視化ビルド分析、多次元パフォーマンス診断、インテリジェントな最適化提案を提供し、開発者がビルド効率とエンジニアリング品質を向上させるのに役立ちます。
Apple MCPツールセットは、MCPプロトコルに基づくAppleのネイティブツールセットで、メッセージ、メモ、連絡先、メール、リマインダー、カレンダーなどのAppleエコシステムの統合サービスを提供します。
このプロジェクトは、Sonar APIを統合したMCPサーバーの実装で、Claudeにリアルタイムのネットワーク検索機能を提供します。システムアーキテクチャ、ツールの設定、Dockerデプロイ、およびマルチプラットフォーム統合ガイドが含まれています。
デスクトップコマンダーMCPは、Claudeデスクトップアプリケーションがターミナルコマンドを実行し、ファイルシステムを管理できるAIアシスタントツールです。コードの検索、編集、プロセス管理、リモートファイルの読み取りなどの機能をサポートします。
Claude ContextはMCPプラグインで、セマンティックコード検索によりAIプログラミングアシスタントにコードベース全体の深いコンテキストを提供し、複数の埋め込みモデルとベクトルデータベースをサポートし、効率的なコード検索を実現します。
uniprofは、CPUパフォーマンス分析を簡素化するツールで、複数のプログラミング言語とランタイムをサポートし、コードの変更や依存関係の追加なしに、Dockerコンテナまたはホストモードでワンクリックでパフォーマンスプロファイリングとホットスポット分析を行うことができます。
RedNote MCPは、小红书のコンテンツへのアクセスを提供するツールで、認証管理、キーワードによるノート検索、コマンドラインによる初期化などの機能をサポートし、URLを通じてノートコンテンツにアクセスできます。
RedNote MCPは、小红书のコンテンツへのアクセスを提供するMCPサービスツールで、コマンドラインを通じてログインの初期化、キーワードによるノート検索、URLによるノート内容のアクセスなどの機能をサポートしています。
MCP MongoDBサーバーは、モデルコンテキストプロトコルサービスで、LLMがMongoDBデータベースと相互作用できるようにします。コレクションスキーマチェック、クエリ実行、スマートID処理などの機能を提供し、読み取り専用モードとセキュリティ設定をサポートします。
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
ACI.devはオープンソースのAIエージェントツールインフラストラクチャで、600以上の事前統合ツールのマルチテナント認証、権限管理、動的探索機能を提供し、統合MCPサーバーまたは軽量SDKを通じた呼び出しをサポートし、本番レベルのAIエージェント開発を簡素化します。
OpenZeppelin Contracts Wizardはインタラクティブなスマートコントラクト構築ツールで、ユーザーがコントラクトタイプ、パラメータ、機能を選択することで、OpenZeppelinコンポーネントに基づくコントラクトコードを生成できます。複数のプログラミング言語をサポートし、APIと埋め込み機能を提供します。
ミニマックス公式のモデルコンテキストプロトコル(MCP)サーバーで、テキスト読み上げ、ビデオ/画像生成などのAPIとのやり取りをサポートします。
LLM Contextは、開発者がコード/テキストプロジェクトの内容を大規模言語モデルのチャットインターフェースに迅速に注入するのを支援するツールで、スマートなファイル選択と複数の統合方法をサポートしています。