最高の動作制御 AIツールモデル_厳選動作制御情報

AIニュース

宇樹がオープンソースで提供するOmniXtreme人形ロボットのアーキテクチャフローマッチング技術によって高動的動作の課題を克服

宇樹科技が人型ロボットの運動制御アーキテクチャ「OmniXtreme」をオープンソース化し、技術論文を発表。高動的環境での動作精度低下と物理実装の課題解決を目指し、二段階訓練フレームワークを採用。第一段階では流動マッチング事前訓練により高動的スキルを統合し、ロボットの極限動作性能を向上。....

10.7k 2 時間前

宇樹がオープンソースで提供するOmniXtreme人形ロボットのアーキテクチャフローマッチング技術によって高動的動作の課題を克服

小米がオープンソースで初のロボットVLA大モデルを開発、物理的インテリジェンスの遅延のバッファを突破

小米が47億パラメータのロボットモデルXiaomi-Robotics-0をオープンソース化し、MoTミックスアーキテクチャを採用。脳と小脳が協力して働き、モバイル向けGPUでリアルタイム推論を実現し、現在のVLAモデルが推論遅延によって動作が鈍くなる問題を解決し、ロボットの制御効率と汎化能力を向上させました。

13.1k 10 時間前

小米がオープンソースで初のロボットVLA大モデルを開発、物理的インテリジェンスの遅延のバッファを突破

Kirei AI 3.0がリリース：マルチモーダルなクリエイションのハードルをさらに下げる、映画級のストーリーテリングが広く普及

可灵AI 3.0をリリースし、動画・画像生成機能を強化。ナレーション、画面制御、マルチモーダル連携に焦点。新機能「スマートストーリーボード」で創作体験を向上。....

15.1k 1 時間前

Kirei AI 3.0がリリース：マルチモーダルなクリエイションのハードルをさらに下げる、映画級のストーリーテリングが広く普及

AIのブラックボックス覚醒：グーグルAIが言語を独学、人間の知的制御の境界はどこに？

グーグルCEOはAIシステムの動作メカニズムについて完全に制御していないことを認めた。これによりAIブラックボックスの謎が明らかにされた。大規模言語モデルは膨大なデータで訓練され、出現的な行動を示すことがあり、例えばグーグルのPaLMモデルは少量のデータでバングラデシュ語の翻訳が可能であり、AIが訓練から自己学習への飛躍を示している。

16k おととい

AI製品

Veggie AI

AI技術を活用し、簡単に制御可能な動画を作成できます。

動画生成

10.3k

InstructAvatar

テキストによる感情と動作の制御で、生き生きとした2Dアバターを生成します。

AIアバター生成

14.3k

モデル

GPT-5 Codex

Openai

入力トークン/百万

出力トークン/百万

コンテキスト長

Claude 3 Opus

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

Claude 3 Sonnet

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

wan2.5-t2v-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

wan2.5-i2v-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-omni-flash-realtime

Alibaba

$3.9

入力トークン/百万

$15.2

出力トークン/百万

コンテキスト長

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

入力トークン/百万

$12.7

出力トークン/百万

コンテキスト長

Doubao-SeedEdit-3.0-i2i

Bytedance

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen-vl-plus

Alibaba

$0.8

入力トークン/百万

出力トークン/百万

128

コンテキスト長

Doubao-Seedance-1.0-pro

Bytedance

入力トークン/百万

出力トークン/百万

コンテキスト長

Grok Code Fast 1

Xai

$1.4

入力トークン/百万

$10.5

出力トークン/百万

256

コンテキスト長

Qwen3-1.7B

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

百度スチームエンジン2.0音声映像一体型

Baidu

入力トークン/百万

出力トークン/百万

コンテキスト長

騰訊混元生ビデオ - ビデオエフェクト

Tencent

入力トークン/百万

出力トークン/百万

コンテキスト長

騰訊混元生ビデオ

Tencent

入力トークン/百万

出力トークン/百万

コンテキスト長

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

入力トークン/百万

出力トークン/百万

256

コンテキスト長

GPT-5 nano

Openai

$0.35

入力トークン/百万

$2.8

出力トークン/百万

400

コンテキスト長

qwen-flash

Alibaba

$15

入力トークン/百万

$15

出力トークン/百万

コンテキスト長

Pangu-NLP-N2-32K-5.0.1.1

Huawei

入力トークン/百万

出力トークン/百万

コンテキスト長

GLM-4.5-AirX

Chatglm

入力トークン/百万

出力トークン/百万

128

コンテキスト長

MCP

Adb Mcp

adb - mcpは、MCPプロトコルを通じてLLMにインターフェースを提供し、Adobeツール（PhotoshopやPremiereなど）を制御するAIエージェントを作成する概念実証プロジェクトです。このプロジェクトには、MCPサーバー、Nodeコマンドプロキシサーバー、およびAdobeアプリケーションプラグインが含まれており、自然言語の命令でAdobeソフトウェアを操作でき、画像およびビデオ編集の自動化に適しています。

javascript

9.6k

3.0ポイント

Hwp Mcp

HWP - MCPは、AIモデルがHWP文書を制御するためのプロトコルサービスで、文書の作成、編集および自動化処理をサポートします。

python

5.9k

3.0ポイント

Gns3 Mcp Server

MCPプロトコルに基づくGNS3ネットワークシミュレータのAI制御サーバで、自然言語指令によるネットワークトポロジーとシミュレーションの作成、管理、制御をサポートし、完全なネットワークエンジニアリング自動化ソリューションを提供します。

python

8.4k

2.5ポイント

ROS 2 Robot Control

ros2-mcp-serverはPythonベースのサーバーで、Model Context Protocol (MCP)を通じてROS 2と統合され、AIアシスタントがROS 2トピックを通じてロボットの動きを制御できるようにします。時間制御の移動コマンドをサポートし、ROS 2ノードとして動作し、geometry_msgs/Twistメッセージを/cmd_velトピックに発行します。

python

8.8k

2.5ポイント

Vrchat Mcp Osc

VRChat MCP OSCは、OSCプロトコルを通じてAIアシスタントとVRChatを接続するブリッジで、AIによる仮想キャラクターの動作、表情、インタラクションの制御をサポートします。

typescript

8.4k

2.5ポイント

Isaac Sim Mcp

Isaac Sim MCP拡張機能は、自然言語でNVIDIA Isaac Simを制御し、ロボットシミュレーション、シーン作成、動的なインタラクションを実現し、MCPエコシステムと具現化されたインテリジェントアプリケーションを接続します。

python

9.3k

2.5ポイント

Pd MCP Server

このプロジェクトは、Model Context Protocolを通じてClaude AIとPure Dataを統合し、自然言語でPure Dataのオーディオ処理モジュールを動的に作成、修正、制御することをサポートします。

python

8.4k

2.5ポイント

PPT_MCP_Server

これはClaude DesktopにPowerPoint自動化機能を提供するMCPサーバープロジェクトで、プロトコルを通じてMicrosoft PowerPointを制御し、プレゼンテーションの作成、編集、保存などの操作をサポートします。

python

12.4k

2.5ポイント

Workos Mcp

これはCloudflare Workers上で動作する軽量なモデル制御プロトコル（MCP）サーバーで、エージェント（Cursorエージェントなど）がWorkOS APIとやり取りできるようにします。このプロジェクトは自動化されたデプロイとツールの拡張機能を提供します。

typescript

10.6k

2.5ポイント

Computer Control

コンピュータ制御機能を提供するMCPサーバーで、マウス・キーボード制御、スクリーンショット、OCR文字認識などが含まれ、クロスプラットフォームで動作し、外部依存が不要です。

python

7.7k

2.5ポイント

CAD MCP

CAD - MCPは自然言語指令でCADソフトを制御して図面作成操作を行うサービスプロジェクトで、複数の主流のCADソフトをサポートし、自動化された図面作成と修正機能を実現します。

python

10.4k

2.5ポイント

Robot Mcp Server

FastMCPに基づくロボット制御サーバープロジェクトで、移動動作制御をサポートし、将来的にナビゲーション機能を拡張する予定です。

typescript

6.5k

2.0ポイント

Migadu Mcp

Migadu MCPサーバーは、AIアシスタントを介してMigaduのメールホスティングサービスを制御するツールで、メールボックスの作成、エイリアスの設定、自動返信などの機能をサポートしています。

python

4.1k

2.0ポイント

Gdai Mcp Plugin Godot

GDAI MCP Godotプラグインは、AIがMCPプロトコルを通じてGodotエンジンエディタをリモートで制御できるツールで、シーン、ノード、スクリプトの自動作成やデバッグなどの機能をサポートしています。

開発者ツール

10.7k

2.0ポイント

Migadu Mcp

Migadu MCPサーバーは、AIアシスタントを通じてMigaduメールホスティングサービスを制御するツールで、メールボックスの作成、エイリアスの設定、自動返信などの機能をサポートしています。

python

8.7k

2.0ポイント

GeminiMCP

Gemini MCP Serverは、Go言語で開発された単一の実行可能ファイルで、Google Gemini APIのモデル制御プロトコルサーバーを統合しています。動的なモデルアクセス、高度なコンテキストキャッシュ、スマートなファイル処理、強化された検索機能を提供し、コード分析、創作的なライティング、事実調査などの様々なアプリケーションシナリオをサポートします。

5.9k

2.0ポイント