ロボット企業ピクルロボットは、元テスラの幹部エイヴァンソン氏を初のCFOとして迎え入れた。同社とUPSの協力が重要な時期に向けた動きである。エイヴァンソン氏は昨年9月からコンサルティングを提供していたが、その後はフルタイムで参画し、以前はテスラで投資家関係と戦略を担当していた。
全国初のオープンなロボットレンタルプラットフォーム「ジェンティエンズ」が上海で発表され、ロボットサービスが散在したレンタルからエコシステムへと進化しました。イノベーティブなモデルにより利用のハードルを下げ、シェアドチャージャーのような利便性を提供しており、50の主要都市をカバーし、600社以上のサプライヤーに加わっており、多ブランド・多型式のロボットレンタルサービスを提供しています。
グーグルが新しいA2UI標準を導入し、AIが直接グラフィックインタフェース要素、例えばボタンやフォームを生成できるようにしました。これにより、インタラクション体験が向上します。従来のAIインタラクションはテキストに依存しており、複雑なタスクを処理するのが煩雑でした。A2UIオープンソースプロジェクトでは、AIが視覚的に反応するための基準が設定され、カスタマーサービスなどの場面で即座にインタフェースを作成でき、操作プロセスが簡素化されます。
メタのスマートグラスのアップグレードにより、「対話焦点」の補聴機能が追加され、騒音のある環境でも相手の声を明確にキャッチするための定向マイクが使用され、Spotifyと深く統合されており、インタラクティブな体験が向上しています。
無料の統合型AI音声創作プラットフォームで、テキストを音声に変換するなどの機能をサポートしています。
20以上のオープンソースモデルをサポートするプライベートなAIチャットプラットフォームで、会話のプライバシーとコンテキストを保護します。
次世代のAIアプリケーションに対して、インテリジェントAPIインフラストラクチャを提供します。
専門のAIプロンプト構築ツールとライブラリで、画像、ビデオ、テキスト生成のための構造化されたプロンプトを作成します。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$2
$20
$4
$16
PrimeIntellect
INTELLECT-3は1060億のパラメータを持つ混合専門家(MoE)モデルで、大規模な強化学習によって訓練されています。数学、コーディング、推論のベンチマークテストで卓越した性能を発揮し、モデル、訓練フレームワーク、環境はすべて緩やかなライセンス契約でオープンソース化されています。
ostris
これはLoRA技術に基づくテキストから画像への変換モデルで、フランスの印象派画家ベルト・モリソーの芸術スタイルを持つ画像を生成するために特別に設計されています。このモデルはFLUX.2-devベースモデル上で訓練され、通常の画像またはテキスト記述をモリソースタイルの絵画に変換することができます。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4bは、高度なColPaliスタイルのマルチモーダル埋め込みモデルで、テキストクエリ、ビジュアルドキュメント(画像やPDFなど)、またはショートビデオをアラインされたマルチベクトル埋め込みにマッピングできます。このモデルは、Qwen3-VL-4B-InstructとQwen3-Embedding-4Bの長所を組み合わせ、ViDoReベンチマークテストで優れた性能を発揮し、同時に埋め込みに必要なスペースを大幅に削減します。
Trilogix1
Fara-7Bは、コンピューターの使用シーンに特化して設計された、パラメータがわずか70億の効率的な小型言語モデルです。ウェブ操作などの高度なユーザータスクで優れた性能を発揮し、より大規模なプロキシシステムと競争することができます。
John1604
Qwen3 VL 4B Thinkingは、画像からテキスト、テキストからテキストへの変換をサポートするマルチモーダルモデルで、4Bのパラメータ規模を持ち、様々な画像とテキストの相互作用のニーズを満たすことができます。
MCG-NJU
SteadyDancerは、画像から動画へのパラダイムに基づく強力なアニメーションフレームワークで、高忠実度で時間的に連続した人体アニメーションの生成に特化しています。このフレームワークは、堅牢な最初のフレームの保持メカニズムにより、従来の方法におけるアイデンティティドリフトの問題を効果的に解決し、視覚的な品質と制御性に優れており、同時にトレーニングリソースの必要量を大幅に削減します。
MuXodious
Gemma 3n E4B ITは、Googleが開発した軽量マルチモーダルオープンモデルで、Geminiモデルと同じ研究に基づいて構築されています。このモデルは、テキスト、オーディオ、ビジュアル入力をサポートし、様々なタスクに適用できます。MatFormerアーキテクチャを採用して、効率的なパラメータ利用を実現しています。
pramjana
Qwen3-VL-4B-Instructはアリババが開発した40億パラメータの視覚言語モデルで、Qwen3アーキテクチャに基づいて開発され、マルチモーダル理解と対話タスクをサポートします。このモデルは強力な画像理解とテキスト生成能力を備え、複雑な視覚言語対話シーンを処理することができます。
Clemylia
Gheya-1はLES-IA-ETOILESエコシステムにおける次世代の基礎言語モデルで、2.02億のパラメータを持ち、旧版のSmall-laminaシリーズのアップグレード版です。このモデルは専門的な微調整用に設計されており、人工知能、専門言語モデル、生物学の分野で対象的な訓練を行っています。
OpenOranje
TweeTaal-nl-en-0.6Bは、オランダ語と英語の双方向翻訳タスクに特化して微調整された言語モデルで、Qwen3-0.6Bアーキテクチャに基づいて開発されています。このモデルは、リソースが制限された環境でも正確で流暢な翻訳サービスを提供し、オランダ語と英語の相互翻訳をサポートします。
ExaltedSlayer
Gemma 3はGoogleが開発した軽量オープンソースのマルチモーダルモデルです。このバージョンは12Bパラメータの命令調整量子化感知トレーニングモデルで、MLXフレームワークのMXFP4形式に変換されています。テキストと画像の入力をサポートし、テキスト出力を生成します。128Kのコンテキストウィンドウと140種類以上の言語をサポートしています。
black-forest-labs
FLUX.2 [dev] は320億のパラメータを持つ補正フロートランスフォーマーモデルで、画像生成、編集、および合成タスクに特化しています。このモデルは、テキストから画像への生成、単一参照編集、および多参照編集においてリーディングレベルであり、微調整なしでキャラクター、オブジェクト、およびスタイルの参照を実現し、個人、科学、および商業用途をサポートします。
Sachin-0001
これは🤗 Transformersライブラリに基づく双方向自己回帰Transformerモデルで、モデルセンターにアップロードされています。モデルカードはシステムによって自動生成され、具体的な技術詳細とアプリケーション情報はさらに補足する必要があります。
Kiy-K
Fyodor-Q3-8B-Instructは、スマート推論と堅牢なコード生成のために設計された高忠実度の命令調整モデルです。Qwen3 - 8Bアーキテクチャに基づき、高ランクのLoRA設定で訓練されており、コーディング前の計画立案に長けており、複雑なソフトウェアエンジニアリングタスクに非常に適しています。
Justin331
SAM 3はMetaが発表した第3世代のプロンプト可能な分割基礎モデルで、画像とビデオの分割タスクを統一的にサポートします。前代のSAM 2と比べて、オープンボキャブラリ概念分割能力を導入し、大量のテキストプロンプトを処理でき、SA - COベンチマークテストで人間の性能の75 - 80%に達します。
DreadPoor
Strawberry_Smoothie-TESTは、mergekitツールを使用して3つの12Bパラメータモデルを統合した混合モデルです。Unity-12B、Chaos-Unknown-12b、Smoothie-12B-Model_Stockの長所を組み合わせ、より良いテキスト生成と対話能力を提供することを目的としています。
Owen777
UltraFluxは、Fluxベースの拡散トランスフォーマーで、ネイティブ4Kのテキストから画像への生成に特化しています。データ、アーキテクチャ、損失関数の協調設計により、様々なアスペクト比で一貫した画像品質を維持することができます。
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
RiosWesley
ブラジル範囲ルーティングモデルは、Gemma 3 270Mをベースにした微調整されたミニマルな大規模言語モデルで、ブラジルの配達サービスシステム用に設計されており、非常に高速で軽量な意図分類器(ルーター)として機能します。このモデルはUnslothを使用してトレーニングされ、GGUF形式に変換されています。
Intel
DeepMathは40億パラメータの数学推理モデルで、Qwen3 - 4B Thinkingをベースに構築され、微調整された大規模言語モデルとサンドボックス化されたPython実行器を組み合わせています。これは計算ステップに対して簡潔なPythonコード断片を生成し、エラーを大幅に減らし、出力長を短縮します。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
Acemcpは、コードライブラリのインデックス化と意味検索を行うMCPサーバーです。自動増分インデックス、複数エンコーディングファイルの処理、.gitignore統合、およびWeb管理インターフェイスをサポートしており、開発者がコードのコンテキストをすばやく検索し、理解するのに役立ちます。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
ソロンは、高効率、オープン、エコシステムにやさしいJavaのエンタープライズアプリケーション開発フレームワークで、全シナリオの開発に対応し、高性能、低メモリ消費、高速起動、小さなパッケージサイズなどの特徴があり、Java8からJava24まで、およびGraalVMネイティブランタイムと互換性があります。
FastAPI - MCPは、FastAPIエンドポイントをモデルコンテキストプロトコル (MCP) ツールとして公開するライブラリで、組み込み認証機能を備え、柔軟なデプロイとASGI伝送をサポートします。
Awesome-MCP-ZHは、中国語ユーザー向けに作成されたMCP(モデルコンテキストプロトコル)のリソースコレクションです。MCPの基本的な説明、使い方、クライアント、サーバー、コミュニティリソースが含まれ、ユーザーがすぐにMCPを使い始めるのに役立ちます。
AWS MCPサーバーは、Model Context Protocolに基づく専用サーバーのセットであり、ドキュメント検索、知識ベース照会、CDKのベストプラクティス、コスト分析、画像生成など、さまざまなAWS関連機能を提供します。標準化されたプロトコルを通じてAIアプリケーションとAWSサービスの統合を強化することを目的としています。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
FastMCPは、TypeScriptに基づくフレームワークで、クライアントセッションをサポートするMCPサーバーを構築するために使用されます。ツール、リソース、プロンプトの簡単な定義を提供し、認証、セッション管理、画像と音声コンテンツの返却、ログ記録、エラー処理、SSE通信などの機能をサポートし、テストとデバッグ用のCLIツールも含まれています。
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
OpenSumiは、AIネイティブのIDE製品を迅速に構築するのに役立つフレームワークで、クラウドとデスクトップの開発環境をサポートし、豊富なサンプルプロジェクトとテンプレートを提供します。
XcodeBuild MCPは、AIアシスタントとMCPクライアントにXcode関連のツールを統合するサーバーで、Xcodeプロジェクト管理、シミュレーター制御、アプリユーティリティなどの機能をサポートし、開発プロセスの自動化を実現します。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
hyper - mcpはWebAssemblyプラグインに基づく高性能MCPサーバーで、コンテナレジストリを通じたプラグイン配布をサポートし、さまざまなAIアプリケーションシーンに適しています。
このプロジェクトは、Sonar APIを統合したMCPサーバーの実装で、Claudeにリアルタイムのネットワーク検索機能を提供します。システムアーキテクチャ、ツールの設定、Dockerデプロイ、およびマルチプラットフォーム統合ガイドが含まれています。
Claude ContextはMCPプラグインで、セマンティックコード検索によりAIプログラミングアシスタントにコードベース全体の深いコンテキストを提供し、複数の埋め込みモデルとベクトルデータベースをサポートし、効率的なコード検索を実現します。
MiniMax Model Context Protocol (MCP) は公式サーバーで、強力なテキスト読み上げ、ビデオ/画像生成APIとのやり取りをサポートし、Claude Desktop、Cursorなどの様々なクライアントツールに適しています。
RedNote MCPは、小红书のコンテンツへのアクセスを提供するツールで、認証管理、キーワードによるノート検索、コマンドラインによる初期化などの機能をサポートし、URLを通じてノートコンテンツにアクセスできます。