【AIニュース】KeLing 2.5 Turboモデルをリリースし、新たに「最初と最後のフレーム」機能を追加し、AI動画生成の制御性、安定性、一貫性を著しく向上させ、プロのクリエイティブコンテンツ制作にさらに優れた解決策を提供します。
可灵AI動画モデル2.5Turboがリリースされ、先頭/末尾フレーム機能を追加。動画生成の制御性・安定性・一貫性が大幅向上。動的効果、テキスト精度、スタイル維持、美的効果で革新を実現し、プロ向けクリエイティブ制作を強化。....
国家ネット情報弁公室は生成式AIサービスの登録を積極的に進め、新たに73種が登録を完了しました。地方のネット情報部門はすでに登録されたモデルのAPI呼び出しを強化して監督しており、イノベーションの促進と規範的な応用の目的としています。
ナノバナナ2 AI画像モデルで重要な突破を遂げ、複雑な細部の再現問題を克服しました。人間の多段階の創作プロセスを模倣することで、画像生成はランダムな出力からコントロール可能な精修へと進化し、文章、時間、光などの細部が誤りやすい問題を完全に解決し、業界を正確な生成の新たな段階へと導いています。
次世代のAI画像生成と編集モデルで、4Kに対応し、超リアルな効果と正確な制御が可能です。
無料のAI ASMRビデオ生成ツール。高度なモデルとテンプレートを搭載し、簡単に人気ビデオを作成できます。
通义万2.2 Plusモデルに基づいて、高品質のAIビデオを迅速に生成でき、機能が強力です。
複数のAIモデルを統合し、対話を通じて画像、ビデオ、音声を生成し、クリエイティブプロセスを最適化します。
anthropic
$108
入力トークン/百万
$540
出力トークン/百万
200k
コンテキスト長
moonshotai
$4.1
$16.56
128k
mistral
-
openai
$18
$72
cohere
256k
$2.88
$14.4
reka-ai
01-ai
32k
$3.6
$10.8
4.1k
google
8k
moonshot
$1
$8
智谱ai
$0.5
DevQuasar
これはMoonshot AI技術に基づく量子化バージョンのモデルで、ビジュアル言語の理解と生成タスクに特化しており、知識の取得障壁を低くし、知識を誰もが利用できるようにすることを目指しています。
SadraCoding
SDXL-Deepfake-Detectorは、AI生成顔を正確に検出するツールで、デジタル世界の真実性を維持することに特化し、視覚的な虚偽情報に対抗するためのプライバシー保護とオープンソースのソリューションを提供します。このモデルは、事前学習モデルを微調整することで、軽量かつ高精度な検出を実現します。
unsloth
Qwen3-VL-2B-InstructはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間およびビデオ動的理解能力を備えています。このモデルは2Bのパラメータ規模を採用し、命令対話をサポートし、マルチモーダルAIアプリケーションに適しています。
pnnbao-ump
VieNeu-TTSは、個人デバイス上で動作可能な最初のベトナム語のテキスト音声変換モデルで、即時音声クローニング機能を備えています。NeuTTS Airをベースに微調整され、自然でリアルなベトナム語音声を生成でき、CPU上でリアルタイム性能を備えています。
noctrex
これは慧慧AIモデルHuihui-MoE-60B-A3B-abliteratedのMXFP4_MOE量子化バージョンで、テキスト生成をサポートします。この量子化バージョンは特定の基礎モデルに基づいて処理され、モデルのパフォーマンスと使用体験をある程度最適化することができます。
citizenplain
これはWan2.1-T2V-14BモデルをベースにトレーニングされたLoRAアダプターで、テキストからビデオへの変換タスクに特化しています。このモデルはAIツールキットを使用してトレーニングされ、ビデオ生成アプリケーションをサポートします。
lichorosario
これはQwen-Imageモデルをベースに訓練されたLoRA(Low-Rank Adaptation)モデルで、テキストから画像への生成タスクに特化しています。このプロジェクトはAI Toolkitを使用して訓練され、テキスト記述を高品質な画像に変換でき、様々な画像生成ツールでの使用をサポートしています。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
Zlikwid
これはQwen/Qwen-Image-Edit-2509基礎モデルに基づいて訓練されたLoRA画像生成モデルで、画像から画像への変換タスクに特化しており、OstrisによるAIツールキットを使用して訓練されています。
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
abhi099k
DeBERTa-v3-largeをベースに微調整されたAIテキスト検出モデルで、テキストが人間によって書かれたものかAIによって生成されたものかを正確に識別でき、カスタムデータセットでの訓練で約97%の精度を達成します。
zambawi
joywan - loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画および画像生成タスクに特化しており、基礎モデルのWan - AI/Wan2.1 - T2V - 14B - Diffusersと併用する必要があります。
mrgant
lans_v1 - loraは、Qwen/Qwen-Imageモデルをベースに、OstrisによるAIツールキットを使用して訓練されたテキストから画像への変換モデルです。LoRA技術を用いて最適化されており、良好な画像生成能力を備えています。
spamnco
これはWan2.1-T2V-14Bモデルをベースに訓練されたLoRAアダプターで、テキストからビデオへの変換タスクに特化しており、画像生成に強化機能を提供します。このモデルはAI Toolkitを使用して訓練され、画像生成をアクティブにするには特定のトリガーワード「diddly」が必要です。
BarleyFarmer
pejawan22-loraはAI技術を基に訓練されたLoRAモデルで、特定の画像生成に特化しており、複数のAIツールと統合して使用できます。トリガーワード「peja」を使って画像を生成します。
natalie_wan_2.2-loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの変換タスクに特化しており、画像生成の品質と効果を効果的に向上させることができます。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
Mark111111111
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの変換に特化しており、画像生成に新しい体験をもたらします。このモデルは基礎モデルWan2.2-T2V-A14Bと一緒に使用する必要があります。
Ashmotv
animat3d_style_wan-loraは、OstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストからビデオへの生成に特化しており、画像生成に独特な3Dアニメーションスタイルの効果をもたらします。このモデルはWan2.2 - T2V - A14Bベースモデルを基に微調整されており、複数の主流のAIプラットフォームで使用できます。
Isshywondertwin
Alexis_Noir_Wan2.2-loraは、OstrisによるAI Toolkitを使用して訓練されたLoRAモデルで、画像から動画への変換タスクに特化しています。このモデルはWan2.2-I2V-A14Bベースモデルに基づいており、高解像度画像の生成をサポートしています。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
このプロジェクトはLangChainにModel Context Protocol(MCP)ツールの呼び出しサポートを提供し、MCPツールキットを通じてAIモデルとの相互作用を実現します。例えば、ファイルの読み取りや要約の生成などです。
MemoryMeshは、AIモデル向けの知識グラフサーバーで、テキストロールプレイングゲームとインタラクティブな物語に特化しています。動的なスキーマ定義と自動生成ツールを通じて、AIが対話中に一貫した構造化された記憶を維持し、より豊かで動的な対話体験を実現します。
mcp-hfspaceは、Hugging Face Spacesに接続するMCPサーバーで、画像生成、音声処理、ビジュアルモデルなど、さまざまなAI機能をサポートし、Claude Desktopとの統合を簡素化します。
DB MCP Serverは、マルチデータベースをサポートするサーバーで、モデルコンテキストプロトコル(MCP)を実装し、AIアシスタントに構造化されたデータベースアクセス機能を提供します。MySQLとPostgreSQLをサポートし、複数のデータベースに同時に接続でき、専用ツールを自動生成し、明確なアーキテクチャ設計に準拠しています。
Unreal Engineの生成型AIサポートプラグインで、最新のLLM/GenAIモデルAPIを統合し、ゲーム開発におけるAI統合層のサポートを提供します。OpenAI、Claude、Deepseekなどのモデルのチャット、構造化出力などの機能を備え、Model Control Protocol(MCP)をサポートしてシーンオブジェクトの制御やブループリントの生成などの高度な機能を実現します。
Notebook Intelligence (NBI) は、JupyterLab用に設計されたAIコーディングアシスタントおよび拡張可能なAIフレームワークで、GitHub Copilotや他のLLMプロバイダーのモデル(ローカルのOllamaモデルを含む)をサポートします。コード生成、自動補完、チャットインターフェイスなどの機能により生産性を大幅に向上させ、モデルコンテキストプロトコル(MCP)サービスの統合をサポートします。
Node.jsとGemini APIに基づくAI研究アシスタントツールで、Firecrawlを通じてウェブデータを収集し、Gemini大規模モデルを利用して深い言語理解とレポート生成を行い、反復的な深層研究をサポートし、MCPプロトコルと統合できます。
HLedger MCPサーバーは、モデルコンテキストプロトコルに基づくサービスで、AIアシスタントがHLedger会計データと機能に直接アクセスするためのインターフェイスを提供します。口座残高の照会、財務報告の生成、新しいエントリの追加、会計データの分析などの操作をサポートします。
ImgFlip APIに基づくミーム生成MCPサーバーで、AIモデルにミーム生成のツールサポートを提供します。
DiffuGenは高度なローカル画像生成ツールで、MCPプロトコルを統合し、複数のAIモデル(FluxやStable Diffusionシリーズを含む)をサポートし、開発環境で直接高品質な画像を生成できます。柔軟な設定オプション、複数GPUのサポートを提供し、MCPプロトコルを通じて複数のIDEと統合でき、同時に外部呼び出し用のOpenAPIインターフェースも提供します。
B12のAIウェブサイト生成モデルプロトコルサーバーで、Claudeデスクトップアプリからの呼び出しをサポートします。
Trellis MCPはAIアシスタントとTrellis 3D生成モデルをつなぐインターフェースサービスで、自然言語で迅速に3Dアセットを生成してBlenderにインポートできます。このプロジェクトはオープンソースモデルに基づいており、APIバックエンドを自分でデプロイする必要があり、高速で無料という特徴がありますが、安定性のリスクがあります。
このプロジェクトは、Google Cloud Vertex AI Geminiモデルに基づくMCPサーバーで、コード支援と一般的な質問応答に使用する豊富なツールセットを提供します。Web検索強化型の回答、ドキュメントの説明生成、ファイルシステム操作などの機能をサポートしています。
Agentify Componentsは、Reactコンポーネントにセマンティックメタデータを追加するフレームワークで、AIシステムや自動化ツールがコンポーネントの機能を理解できるようにします。デコレータを使用してコンポーネントに標準化された説明を追加し、MCPサーバーの設定を生成し、コンポーネントとAIモデルの対話を実現します。
CTXはコードリポジトリと大規模言語モデル(LLM)を接続するツールで、構造化されたコンテキストファイルを自動生成することで、AI開発におけるコードコンテキストの伝達効率が低い問題を解決します。コードファイル、Gitリポジトリ、ウェブページなどの複数のソースから情報を収集することができ、MCPサーバーを通じて直接AIアシスタントにプロジェクトコンテキストを提供することができます。
Lucidityは、モデルコンテキストプロトコル(MCP)サーバーで、インテリジェントなヒント分析によりAIが生成するコードの品質を向上させることを目的としています。これは、構造化されたガイダンスを提供し、コード品質の問題を識別して解決するのを支援し、複数のプログラミング言語をサポートし、AIアシスタントとシームレスに統合できます。
AIビデオ生成MCPサーバーは、テキストと画像入力をサポートして動画ビデオを生成し、様々なパラメーター制御とモデル選択を提供します。
この実験では、ユーザーにMCPサーバーをデプロイし、Microsoft Copilot Studioに統合する方法を案内します。標準化されたプロトコルを通じてAIモデルとデータソースを接続し、リアルタイムのデータアクセスとジョーク生成機能を実現します。