Googleが開発ツール「Antigravity」を発表。Gemini3Proとサードパーティモデルを統合し、エージェント主導のプログラミングを推進。作業過程を自動記録し、タスクリストや計画、スクリーンショットを含む成果物を生成、エージェントのタスク完了を検証可能に。....
GoogleがGemini3とAIネイティブIDE「Antigravity」を発表。AIが能動的な開発パートナーとなり、開発者のコーディング負担を軽減。Cursorなどの競合製品の課題に対応。無料公開中で、マルチOS対応、Gemini3 Proのクォータも十分。....
美团AI编程ツール「Meituan CatPaw」が公測開始。スマートAgentと人間の協調による効率向上が特徴。Askモード(手動コンテキスト選択)とAgentモード(高機能)を提供。公式サイトからインストール後、招待コード申請で体験可能。初期500回利用枠、追加申請可。....
メイドゥー初のAI統合開発環境「CatPaw」が公開ベータテストに入りました。この製品は人機協働を核心としており、スマートプログラミングにより開発効率を向上させます。主な機能にはスマートドライブプログラミング、コード補完およびプロジェクトプレビューとデバッグが含まれます。この製品は2023年から内部でエディタープラグインとして使用されており、現在は全面的なアップグレード後、正式に外部へのテストが開始されました。
Google Antigravity - 新しい構築の方法。
無料のAIタトゥー生成ツールで、独特なタトゥーを瞬時にデザイン。プレビューや細部調整などの機能を備えています。
Windsurfは世界でもっとも進んだAIコードアシスタントで、初のAIネイティブIDEを備え、開発者に高い効率を提供します。
CLI AIツールを統合した未来型IDEで、マルチセッションの編成、アトミックブランチ、そして本当の開発者の生産性向上を実現します。
IDEA-Research
これは画像テキストからテキストへの変換モデルで、画像とテキスト入力を処理し、対応するテキスト出力を生成できます。
docling-project
SmolDoclingは、超コンパクトなマルチモーダルビジュアル言語モデルで、効率的なドキュメント変換用に特別に設計されています。このモデルはIdefics3アーキテクチャに基づいており、256Mのパラメータ規模で強力なドキュメント理解能力を実現しています。画像からテキスト、表、数式、コードなどのさまざまなドキュメント要素を抽出することができ、Doclingエコシステムと完全に互換性があります。
ChatRexは優れた知覚能力を持つマルチモーダル大規模言語モデルで、質問に答える際に答えを具体的なオブジェクトに関連付けることができます。
DAB-DETRは改良型DETRモデルで、動的アンカーボックスをクエリとして使用することで、物体検出の性能と学習効率を大幅に向上させます。
DAB-DETRは改良型DETRモデルで、動的アンカーボックスをクエリとして使用することで、物体検出の性能と訓練収束速度を大幅に向上させます。
IDEA-FinAI
ChartMoEはInternLM-XComposer2を基にしたマルチモーダル大規模言語モデルで、専門家混合コネクタを採用し、高度なチャート機能を備えています。
HuggingFaceM4
Idefics3はオープンソースのマルチモーダルモデルで、任意のシーケンスの画像とテキスト入力を処理し、テキスト出力を生成できます。OCR、ドキュメント理解、視覚的推論において顕著な改善が見られます。
DAB-DETRは改良されたDETR物体検出モデルで、動的アンカーボックス検索メカニズムによりトレーニング収束速度と検出精度を大幅に向上
Idefics2はオープンなマルチモーダルモデルで、任意のシーケンスの画像とテキスト入力を受け取り、テキスト出力を生成できます。このモデルは画像に関する質問に答えたり、視覚的コンテンツを説明したり、複数の画像に基づいてストーリーを作成したり、純粋な言語モデルとして使用したりできます。
Idefics2はオープンソースのマルチモーダルモデルで、任意のシーケンスの画像とテキスト入力を受け取り、テキスト出力を生成できます。OCR、ドキュメント理解、視覚的推論において大幅な改善が見られます。
Idefics2はHugging Faceが開発したオープンソースのマルチモーダルモデルで、画像とテキスト入力を処理しテキスト出力を生成でき、OCR、ドキュメント理解、視覚的推論において優れた性能を発揮します。
レイヴン推理行列問題を解くために特別に設計されたマルチモーダルモデルで、ビジュアル - 言語基礎モデルに基づいて構築され、検証セットの正解率は91%に達します。
Shashank91097
このモデルはtransformersライブラリに基づくモデルで、具体的な用途や機能はさらなる情報が必要です。
ideepankarsharma2003
Swin Transformerアーキテクチャに基づく分類器で、Midjourney V6とStable Diffusion XLで生成されたAI画像と手作業で作成された画像を区別するために特別に設計されています。
IDEA-CCNL
Taiyi-Diffusion-XLは、中国語のテキストから画像生成能力を強化しながら、英語の理解能力も保持するバイリンガル拡散モデルです。Stable-Diffusion-XLアーキテクチャに基づき、高品質のバイリンガルデータセットで訓練され、画像品質、多様性、テキストアライメントの面で優れた性能を発揮し、AIGCとデジタルアート創作に新たな選択肢を提供します。
maddes8cht
Refact-1.6Bは1.6Bパラメータのコード生成モデルで、多言語コード補完と対話タスクで優れたパフォーマンスを発揮し、特にIDE統合に適しています。
Grounding DINOはオープンセット物体検出モデルで、DINO検出器とテキストエンコーダを組み合わせることでゼロショット物体検出能力を実現しています。
Grounding DINOはDINO検出器とグラウンディング事前学習を組み合わせたオープンセット物体検出モデルで、ゼロショット物体検出を実現できます。
IDEFICSはDeepmindが開発したクローズドソースの視覚言語モデルFlamingoのオープンソース再現版で、マルチモーダル入力(画像+テキスト)をサポートし、テキスト出力を生成します。
IDEFICSはDeepmindが開発したクローズドソースの視覚言語モデルFlamingoのオープンソース再現版で、任意のシーケンスの画像とテキスト入力を受け取り、テキスト出力を生成できるマルチモーダルモデルです。
Supabase MCPサーバーはオープンソースのツールで、IDEが安全にSQLを実行し、スキーマ変更を管理し、Supabase管理APIを呼び出し、Auth Admin SDKを使用できるようにします。組み込みのセキュリティ制御があります。
セレナは強力なオープンソースのコーディングエージェントツールキットで、大規模言語モデル(LLM)をコードベース上で直接動作するフル機能のエージェントに変えることができます。IDEに似た意味論的なコード検索と編集ツールを提供し、様々なプログラミング言語をサポートし、MCPプロトコルまたはAgnoフレームワークを介して様々なLLMと統合することができます。
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
JetBrains MCPプロキシサーバーは、クライアントとJetBrains IDEの間でリクエストを転送するために使用されます
OpenSumiは、AIネイティブのIDE製品を迅速に構築するのに役立つフレームワークで、クラウドとデスクトップの開発環境をサポートし、豊富なサンプルプロジェクトとテンプレートを提供します。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
MCP LLMS-TXTドキュメントサーバーは、開発者がMCPプロトコルを使用してIDEやアプリケーションからllms.txtドキュメントリソースにアクセスできるようにするオープンソースツールです。
即夢AIをベースにした画像生成サービスで、Cursor IDE用に設計され、テキスト記述から画像の生成と保存を実現します。
JetBrains MCPサーバープラグインは、LLMとIDEをシームレスに統合し、カスタムツールの拡張ポイントを提供します。
DBCodeはVS Code用のデータベース管理プラグインで、20種類以上のデータベース接続をサポートし、データ編集、自然言語クエリ、ER図生成、可視化分析などの機能を提供し、開発者がIDE内で効率的にデータベース操作を行うのを支援します。
このプロジェクトは、コードをGoogle Cloud RunサービスにデプロイするためのMCPサーバーを提供し、AI支援IDE、AIアシスタントアプリ、およびエージェントSDKなどのさまざまな方法でのデプロイをサポートします。
このプロジェクトは、コードをGoogle Cloud RunにデプロイするためのMCPサーバーで、AIエージェント、IDE、アシスタントアプリを通じたデプロイをサポートしています。
Cursor IDEのSQLiteデータベースにアクセスするためのMCPサーバーで、AIアシスタントがプロジェクトデータ、チャット履歴、エディタ情報を探索できます。
FastAPIに基づいて構築された、ウィンドサーフプロキシIDEに拡張ツールを提供するMCPサーバーで、WebSocketリアルタイム通信とカスタムツール拡張をサポートします。
Pega DX MCP Serverは、モデルコンテキストプロトコル(MCP)を介してPega Infinity™アプリケーションを直感的な対話型体験に変える実験的なプロジェクトです。Pega DX APIと自然言語インターフェースの橋渡しとして機能し、GenAIエージェント、IDE、その他のMCP対応ツールが簡単な人間が読めるコマンドを使用してPega Infinity™アプリケーションと対話できるようにします。
Cursor IDEとAzure DevOpsを統合するMCPサーバーで、プロジェクト、作業項目、コードリポジトリ、Pull Requestの相互作用機能を提供し、テスト計画管理とインテリジェントな応答処理をサポートします。
DeepView MCP は、Gemini 大規模モデルに基づくコード分析サービスで、IDE にコードベース全体のコンテキスト理解能力を提供します。
Trae IDE向けに開発されたMCP診断ツールで、プロジェクトのエラー、警告、ヒント情報をリアルタイムで取得し、AIエージェントが正確なコード分析と修正提案を提供するのを支援します。
DiffuGenは高度なローカル画像生成ツールで、MCPプロトコルを統合し、複数のAIモデル(FluxやStable Diffusionシリーズを含む)をサポートし、開発環境で直接高品質な画像を生成できます。柔軟な設定オプション、複数GPUのサポートを提供し、MCPプロトコルを通じて複数のIDEと統合でき、同時に外部呼び出し用のOpenAPIインターフェースも提供します。
Cursor MCPは、Claude AIとデスクトップアプリケーションをシームレスに統合するツールで、Cursor IDEを通じてAI機能と開発ワークフローを橋渡しし、実時のプログラミング支援とコンテキスト感知型のコード提案を提供します。