月の裏側がKimi K2モデルのAgentモード「OK Computer」を発表、グレーテスト開始。モデル自体がAgentとして機能し、ツール呼び出し能力を強化。簡単な指示で仮想PC操作が可能に。....
DevRev社が対話型AI「Computer」を発表。企業向けにデータアクセスやスケジュール管理を提供、2025年公開予定で現在テスト中。従来のチャットボットを超える機能を目指す。....
AIパートナーアプリ「Dot」は10月5日にサービス終了。New Computer社が開発、元Appleデザイナーのジェイソン・ユアンらが創業。2024年リリースで、AI友達として感情サポートを提供。ユアン氏は「内なる自己との関係促進」と表現。....
コンピュータ使用エージェント(Computer Use Agent)分野において、最近興奮すべき進展がありました。上海交通大学とSIIの研究チームは、わずか312個の人間による操作軌跡を使用して、次世代のオープンソース コンピュータ知能エージェント「PC Agent-E」を開発しました。そのパフォーマンスは241%向上し、著名なClaude3.7Sonnetを超え、Windowsシステム上の最適モデルとなりました。Anthropic以来
オンラインコンピューターサービス。コード入力と変換機能を提供します。
AI駆動の自動化ツールで、正確なシステム操作を実行します。
コンピュータ使用エージェントに関するリソース集
Docker不要求のAnthropic Claude対応コンピューター使用インターフェースです。
Kar1hik
このモデルはDINOv2アーキテクチャをファインチューニングし、皮膚病変画像の疾患分類に使用されます
mestrevh
これは豆類データセットでファインチューニングされたビジョントランスフォーマー(ViT)モデルで、豆類の葉の病害状況を識別するために使用されます。
togethercomputer
RedPajama-INCITE-Instruct-3B-v1は、Together Computerが複数の研究機関と共同で開発した28億パラメータの指令微調言語モデルで、少サンプルアプリケーションシナリオに特化して最適化され、さまざまなテキスト処理タスクをサポートしています。
RedPajama-INCITE-Chat-3B-v1は、Together ComputerがオープンソースAIコミュニティのリーダーと共同で開発した28億パラメータのチャット言語モデルで、OASST1とDolly2のデータセットで微調整され、会話能力を強化するために特別に設計されています。
iyzg
これはPyTorchとHuggingPicsを基に構築された画像分類モデルで、一般的なコンピュータ機器の識別と分類に特化しています。
YOLO MCPサービスは、強力なコンピュータビジョンサービスで、モデルコンテキストプロトコル(MCP)を通じてClaude AIと統合され、物体検出、セグメンテーション、分類、リアルタイムカメラ分析機能を提供します。
Internet Computer上のDAOとやり取りするためのTypeScriptベースのMCPサーバー
コンピュータビジョンツールと言語モデルのMCPによる統合を展示
コンピュータ制御機能を提供するMCPサーバーで、マウスとキーボードの制御、OCR認識、ウィンドウ管理などが含まれ、PyAutoGUIとRapidOCRに基づいて実現され、外部依存関係はありません。
コンピュータ制御機能を提供するMCPサーバーで、マウス・キーボード制御、スクリーンショット、OCR文字認識などが含まれ、クロスプラットフォームで動作し、外部依存が不要です。
Data MCP Serverは、ウェブページの取得、構造化データの抽出、およびクローリング機能を提供するツールセットです。同時に、OpenAI CUAやClaude Computer Useなどの複数のブラウザーエージェントツールをサポートしています。
Screenpipeによって開発されたComputer Use AI SDKは、オープンソースプロジェクトで、MCPサーバーとクライアントを提供し、AIによるコンピューター操作の制御を可能にします。macOSネイティブ環境をサポートし、仮想マシンを必要とせず、任意のアプリケーションやウェブサイトと直接やり取りできます。アプリケーションの起動、内容の読み取り、クリック、テキストの入力などの基本機能を提供し、自動化ワークフローやインテリジェントエージェントの構築を目的としています。