アントグループが全モーダルAIアシスタント「霊光」を発表。自然言語で30秒以内に編集可能・対話型の小型アプリを生成し、共有機能をサポート。開発者向け効率的なイノベーションツールを提供。....
非営利機関FutureHouseがAI研究システムKosmosを推出した。12時間で1500編の論文の読解、4万2千行のコード生成および引用レポート作成が可能で、人間チームの6か月分の効率に相当し、出力精度は79.4%である。このシステムは構造化された世界モデルを使用し、並列処理によって検索、分析、検証を処理しており、7つの先端的な発見を再現し成功させた。
マルチモーダルAI企業であるElevenLabsが、統合型のコンテンツ制作プラットフォームをリリースしました。画像生成、動画制作、音声合成、音楽創作、サウンドデザインの機能を統合し、脚本から完成品の動画まで一貫したフローで制作することが可能になります。クリエイターおよびマーケッターが複数のプラットフォームへの切り替えから解放され、効率的に商業用動画制作を行うことを支援します。
アリグループが全モーダルAIアシスタント「霊光」を発表。自然言語で30秒以内に編集・共有可能なモバイルアプリを生成。業界初のコード生成型多モーダルAIとして、3D・音声・動画機能を搭載し、対話の効率と臨場感を向上。AndroidとiOSで利用可能。....
Nano Banana 2はAI画像生成と編集プラットフォームで、先進的なニューラルネットワークを使って文字を瞬時にビジュアル作品に変えます。
Gempix2とGemini 3 Proで駆動される専用4K AI画像生成器。登録すると2ポイントがもらえます。
初のリアルタイムAIホラービデオ生成ツールで、任意の画像からホラー映画を制作できます。
無料のAI画像生成器で、オンラインで4Kのアート、ポートレート、超リアルなビジュアル作品を作成できます。
anthropic
$108
入力トークン/百万
$540
出力トークン/百万
200k
コンテキスト長
moonshotai
$4.1
$16.56
128k
mistral
-
openai
$18
$72
alibaba
32k
cohere
256k
$2.88
$14.4
reka-ai
1M
01-ai
$3.6
$10.8
4.1k
google
8k
DakkaWolf
Trouper-12B GGUFは、DarwinAnim8orによってオリジナルモデルを基に開発されたテキスト生成モデルで、ロールプレイングやクリエイティブライティングのシナリオに特化して最適化されています。このモデルはMistral-Nemo-Base-12Bから微調整され、カスタムの「Actors」データセットを使用して訓練されており、生成されるテキストはより自然で、一般的な「AI言語」の特徴を避けています。
DevQuasar
これはMoonshot AI技術に基づく量子化バージョンのモデルで、ビジュアル言語の理解と生成タスクに特化しており、知識の取得障壁を低くし、知識を誰もが利用できるようにすることを目指しています。
SadraCoding
SDXL-Deepfake-Detectorは、AI生成顔を正確に検出するツールで、デジタル世界の真実性を維持することに特化し、視覚的な虚偽情報に対抗するためのプライバシー保護とオープンソースのソリューションを提供します。このモデルは、事前学習モデルを微調整することで、軽量かつ高精度な検出を実現します。
unsloth
Qwen3-VL-2B-InstructはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間およびビデオ動的理解能力を備えています。このモデルは2Bのパラメータ規模を採用し、命令対話をサポートし、マルチモーダルAIアプリケーションに適しています。
pnnbao-ump
VieNeu-TTSは、個人デバイス上で動作可能な最初のベトナム語のテキスト音声変換モデルで、即時音声クローニング機能を備えています。NeuTTS Airをベースに微調整され、自然でリアルなベトナム語音声を生成でき、CPU上でリアルタイム性能を備えています。
noctrex
これは慧慧AIモデルHuihui-MoE-60B-A3B-abliteratedのMXFP4_MOE量子化バージョンで、テキスト生成をサポートします。この量子化バージョンは特定の基礎モデルに基づいて処理され、モデルのパフォーマンスと使用体験をある程度最適化することができます。
citizenplain
これはWan2.1-T2V-14BモデルをベースにトレーニングされたLoRAアダプターで、テキストからビデオへの変換タスクに特化しています。このモデルはAIツールキットを使用してトレーニングされ、ビデオ生成アプリケーションをサポートします。
lichorosario
これはQwen-Imageモデルをベースに訓練されたLoRA(Low-Rank Adaptation)モデルで、テキストから画像への生成タスクに特化しています。このプロジェクトはAI Toolkitを使用して訓練され、テキスト記述を高品質な画像に変換でき、様々な画像生成ツールでの使用をサポートしています。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
Zlikwid
これはQwen/Qwen-Image-Edit-2509基礎モデルに基づいて訓練されたLoRA画像生成モデルで、画像から画像への変換タスクに特化しており、OstrisによるAIツールキットを使用して訓練されています。
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
abhi099k
DeBERTa-v3-largeをベースに微調整されたAIテキスト検出モデルで、テキストが人間によって書かれたものかAIによって生成されたものかを正確に識別でき、カスタムデータセットでの訓練で約97%の精度を達成します。
zambawi
joywan - loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画および画像生成タスクに特化しており、基礎モデルのWan - AI/Wan2.1 - T2V - 14B - Diffusersと併用する必要があります。
mrgant
lans_v1 - loraは、Qwen/Qwen-Imageモデルをベースに、OstrisによるAIツールキットを使用して訓練されたテキストから画像への変換モデルです。LoRA技術を用いて最適化されており、良好な画像生成能力を備えています。
spamnco
これはWan2.1-T2V-14Bモデルをベースに訓練されたLoRAアダプターで、テキストからビデオへの変換タスクに特化しており、画像生成に強化機能を提供します。このモデルはAI Toolkitを使用して訓練され、画像生成をアクティブにするには特定のトリガーワード「diddly」が必要です。
BarleyFarmer
pejawan22-loraはAI技術を基に訓練されたLoRAモデルで、特定の画像生成に特化しており、複数のAIツールと統合して使用できます。トリガーワード「peja」を使って画像を生成します。
natalie_wan_2.2-loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの変換タスクに特化しており、画像生成の品質と効果を効果的に向上させることができます。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
Mark111111111
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの変換に特化しており、画像生成に新しい体験をもたらします。このモデルは基礎モデルWan2.2-T2V-A14Bと一緒に使用する必要があります。
Ashmotv
animat3d_style_wan-loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの生成に特化しており、画像生成に独特な3Dアニメーションスタイルの効果をもたらします。このモデルはWan2.2 - T2V - A14Bベースモデルを基に微調整されており、複数の主流のAIプラットフォームで使用できます。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
Magic Component Platform (MCP) はAI駆動のUIコンポーネント生成ツールで、自然言語での記述を通じて、開発者が迅速に現代的なUIコンポーネントを作成するのを支援し、複数のIDEとの統合をサポートします。
AWS MCPサーバーは、Model Context Protocolに基づく専用サーバーのセットであり、ドキュメント検索、知識ベース照会、CDKのベストプラクティス、コスト分析、画像生成など、さまざまなAWS関連機能を提供します。標準化されたプロトコルを通じてAIアプリケーションとAWSサービスの統合を強化することを目的としています。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
FAL AIをベースにしたロゴ生成サーバーで、画像生成、背景除去、自動スケーリング機能を提供します。
即夢AIをベースにした画像生成サービスで、Cursor IDE用に設計され、テキスト記述から画像の生成と保存を実現します。
AI開発アシスタントMCPサーバーは、AIベースのコード開発ツールキットで、コードアーキテクチャ生成、UIスクリーンショット分析、コードレビューなどの機能を提供し、Cursor用に設計されています。
Tripo MCPサーバーは、AIアシスタントとTripo AIをつなぐインターフェースプロジェクトで、自然言語で3Dアセットを生成し、Blenderにインポートできます。
Video Editor MCPは、ビデオのアップロード、検索、生成、編集機能を提供するビデオ編集サーバーで、LLMとVideo Jungleプラットフォームを通じた操作をサポートしています。
このプロジェクトはLangChainにModel Context Protocol(MCP)ツールの呼び出しサポートを提供し、MCPツールキットを通じてAIモデルとの相互作用を実現します。例えば、ファイルの読み取りや要約の生成などです。
MemoryMeshは、AIモデル向けの知識グラフサーバーで、テキストロールプレイングゲームとインタラクティブな物語に特化しています。動的なスキーマ定義と自動生成ツールを通じて、AIが対話中に一貫した構造化された記憶を維持し、より豊かで動的な対話体験を実現します。
UE5 - MCPは、AI駆動の自動化ツールを統合し、BlenderとUnreal Engine 5のワークフローを最適化し、シーン生成からゲーム開発までのエンドツーエンドのソリューションを提供します。
mcp-hfspaceは、Hugging Face Spacesに接続するMCPサーバーで、画像生成、音声処理、ビジュアルモデルなど、さまざまなAI機能をサポートし、Claude Desktopとの統合を簡素化します。
RagRabbitは自ホスト型のAIサイト検索およびLLM.txt生成ツールで、Vercel上にワンクリックでデプロイできます。
DB MCP Serverは、マルチデータベースをサポートするサーバーで、モデルコンテキストプロトコル(MCP)を実装し、AIアシスタントに構造化されたデータベースアクセス機能を提供します。MySQLとPostgreSQLをサポートし、複数のデータベースに同時に接続でき、専用ツールを自動生成し、明確なアーキテクチャ設計に準拠しています。
Tripo MCP ServerはAIアシスタントとTripo AIを接続するインターフェースツールで、自然言語を通じて3Dアセットを生成し、Blenderにインポートすることをサポートします。
Unreal Engineの生成型AIサポートプラグインで、最新のLLM/GenAIモデルAPIを統合し、ゲーム開発におけるAI統合層のサポートを提供します。OpenAI、Claude、Deepseekなどのモデルのチャット、構造化出力などの機能を備え、Model Control Protocol(MCP)をサポートしてシーンオブジェクトの制御やブループリントの生成などの高度な機能を実現します。
DeepSeekの推論とClaudeの生成を組み合わせた二段階AI会話サービス