Jay Neo氏がAIショート動画ツール「Palo」を発表。月額250ドル、投資額380万ドル。10万フォロワー以上のクリエイター向けに、AI脚本生成・データ分析・離脱ポイント検出の3機能を提供。18億回再生の知見に基づき効率的なコンテンツ制作を支援。....
グーグルのAIノートツールNotebookLMにスライドジェネレーター機能が追加され、ノートを素早くプレゼンテーション用スライドに変換できます。ユーザーがコンテンツを効率的に整理し、ドラフトを作成および視覚的効果を最適化するのに役立ちます。この機能はインフォグラフィックツールと同様、Gemini3Pro画像生成モデルに基づいており、詳細なプロンプト情報を処理できます。
騰訊元宝が新機能をリリースし、ユーザーは一文または一枚の画像だけで高解像度のビデオを生成できます。HunyuanVideo1.5オープンソースモデルを基盤とし、DiTアーキテクチャを採用し、パラメータ数8.3億個で、5〜10秒間のビデオ生成をサポートし、コンテンツ制作プロセスを簡素化します。
ウィキペディアが『AI執筆識別ガイド』を発表し、大規模言語モデルの文章行動の特徴を系統的に明らかにし、実用的なAIテキストの識別の方法を提供しています。このガイドは2023年に開始されたAIクリーンアップ計画に基づいており、頻出語だけに頼るのではなく、システム的特徴によってAI生成コンテンツを識別することを強調しています。
AIストーリーボード生成ツールで、ストーリーをビデオに変換でき、ワンクリックでレンダリングし、さまざまなコンテンツタイプに対応しています。
テンプレートを使用してウイルス的なAI ASMR動画を作成し、数分でTikTokやYouTube Shortsのコンテンツを生成します。
AIマーケティングツールで、顧客獲得を自動化し、ワークフロー構築、コンテンツ生成、データ分析を行うことができます。
Crano AIはAIによる動画と画像生成ツールで、専門的なコンテンツを迅速に作成でき、デザインスキルは必要ありません。
anthropic
$108
入力トークン/百万
$540
出力トークン/百万
200k
コンテキスト長
chatglm
$2.02
$5.98
128k
moonshotai
$4.1
$16.56
mistral
-
google
$0.72
$2.88
1M
sensetime
$2.8
$8.4
256k
cohere
$5.76
$28.8
alibaba
openai
$3.6
$10.8
4.1k
liquidai
32k
DavidAU
Qwen 3をベースに微調整された12Bパラメータの大規模言語モデルで、256kの超長コンテキスト処理能力を備え、長文テキスト生成タスクに特化して最適化されています。このモデルはVLTO 8Bモデルの基礎、Brainstorm 20xの調整、NEO Imatrixデータセットの量子化技術を組み合わせ、高品質の長文テキストコンテンツを生成できます。
mradermacher
これはManoghn/voicecraft-mistral-7bモデルの静的量子化GGUFバージョンで、Mistral-7Bアーキテクチャに基づいており、コンテンツ生成とテキスト生成タスクに特化しています。このバージョンでは、2.8GBから14.6GBまでのさまざまな量子化レベルが提供されており、ユーザーはハードウェア条件とパフォーマンス要件に応じて適切なバージョンを選択できます。
Clemylia
メルタは、DiscordボットMelta27をベースに開発された独特な小型言語モデルで、可愛く、魅力的で、情熱的な個性を持ち、オリジナルで独特で可愛いテキストコンテンツの生成に特化しています。
これはGemma-3モデルを基に内部の恐怖データセットを使用して微調整されたテキスト生成モデルで、恐怖スタイルのコンテンツ生成に特化しています。モデルはUnslothを通じて最適化され、軽度から強烈な恐怖コンテンツ、長編の恐怖物語を生成することができます。
GatorBarbarian
TRELLIS Text XLは大型の3D生成モデルで、TRELLISのテキスト条件付きバージョンで、モデルサイズはXLです。このモデルは論文「Structured 3D Latents for Scalable and Versatile 3D Generation」に基づいて提案され、テキスト記述に基づいて高品質の3Dコンテンツを生成することができます。
QuantTrio
MiniMax-M2-AWQは、MiniMaxAI/MiniMax-M2モデルをベースとした量子化バージョンで、vLLMフレームワークを通じて効率的なテキスト生成を実現します。このモデルはAWQ量子化技術を採用し、モデルの性能を維持しながら、メモリ使用量を大幅に削減し、推論速度を向上させます。32Kのコンテキスト長とツール呼び出し機能をサポートしています。
LAM-1はlaminaシリーズの最初の完全版の小型言語モデルで、Clemyliaによって開発されました。このモデルは創造的なコンテンツ生成に特化しており、想像力に富み、詩的で叙事性のある回答を生成するように最適化されており、事実性の情報ではありません。
CypressYang
SongBloomは、テキストを音声に変換することに特化した生成モデルで、テキストを生き生きとした音声コンテンツに変換し、ユーザーに新しい音声合成体験を提供します。
cpatonn
Granite-4.0-H-Tiny AWQ - INT4は、Granite-4.0-H-TinyベースモデルをAWQ量子化処理した4ビットバージョンで、性能を維持しながらリソース消費を大幅に削減します。このモデルは70億のパラメータを持ち、多言語処理をサポートし、テキスト生成、コード補完、ツール呼び出しなどの豊富な機能を備えています。
neuralvfx
LibreFLUX-ControlNetは、ControlNetアーキテクチャに基づくテキストから画像への生成モデルで、LibreFLUXを基礎となるTransformerモデルとして使用しています。このモデルはSA1Bデータセットで訓練されており、テキストプロンプトと制御画像に基づいて高品質な画像コンテンツを生成することができます。
loyal-misc
svizzはLoRA技術に基づくテキストから画像への生成モデルで、LyliaEngine/Pony_Diffusion_V6_XLをベースモデルとして、特定のトリガーワードを通じて高品質な画像コンテンツを生成することができます。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
GeneralAnalysis
GA Guard ThinkingはGeneral Analysisが開発した40億パラメータのオープンソース審査モデルで、言語モデルが生成する不安全、不適合なコンテンツを検出し防止するために特別に設計されています。このモデルは7つのセキュリティカテゴリで訓練され、違法活動、憎悪発言、個人情報漏洩などのリスクコンテンツを効果的に識別できます。
chetwinlow1
Oviは、テキストまたはテキスト + 画像の入力に基づいて、同期したビデオとオーディオコンテンツを同時に生成できる高度なオーディオ - ビデオ生成モデルです。このモデルはデュアルバックボーンアーキテクチャを採用し、5秒のビデオ生成をサポートし、マルチメディア創作に強力なツールを提供します。
zenlm
zen-agent-4bは40億のパラメータを持つツール呼び出しインテリジェントエージェントで、モデルコンテキストプロトコル(MCP)をサポートし、テキスト生成タスクに強力な支援を提供します。このモデルはZen Research DAOによって開発され、Zoo Labs Inc非営利組織に所属しています。
DeepSeek-V3.1はDeepSeek-V3.1-Baseをベースに事後学習を行った大規模言語モデルで、128Kのコンテキスト長を持ち、混合思考モード、スマートツール呼び出し、コードエージェント機能をサポートしています。このモデルは複数のベンチマークテストで優れた成績を収めており、特に数学的推論、コード生成、検索エージェントタスクで顕著な向上が見られます。
Wan-AI
Wan2.2-S2V-14Bは、音声駆動の映画レベルのビデオ生成に特化したハイブリッドエキスパート(MoE)モデルです。入力された音声、参照画像、およびテキストプロンプトに基づいて高品質のビデオコンテンツを生成でき、480Pと720Pの解像度をサポートし、複雑な動き生成と映画レベルの美学効果を備えています。
davidrd123
これはQwen/Qwen-Imageに基づくLyCORISアダプターで、テキストから画像への生成タスクに特化しています。このモデルは入力されたテキストの説明に基づいて対応する画像を生成でき、特に落書きスタイルとハイブリッドメディア効果を持つ画像コンテンツの生成に長けています。
dnakov
Seed-OSS-36B-Instructは、バイトダンスによって開発された360億パラメータの大規模言語モデルであり、MLXフレームワークに基づいて最適化され、テキスト生成タスクに特化しています。このモデルは英語と中国語の両方をサポートし、Apache 2.0オープンソースライセンスを採用しており、強力な指令追従とコンテンツ生成能力を備えています。
unsloth
DeepSeek-V3.1はDeepSeek-AIが開発した大規模言語モデルで、DeepSeek-V3のアップグレード版です。このモデルは混合思考モードと非思考モードをサポートし、ツール呼び出し、コード生成、数学的推論などの分野で優れた性能を発揮し、128Kのコンテキスト長をサポートします。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
AI開発アシスタントMCPサーバーは、AIベースのコード開発ツールキットで、コードアーキテクチャ生成、UIスクリーンショット分析、コードレビューなどの機能を提供し、Cursor用に設計されています。
OpenZeppelin Contracts Wizardはインタラクティブなスマートコントラクト構築ツールで、ユーザーがコントラクトタイプ、パラメータ、機能を選択することで、OpenZeppelinコンポーネントに基づくコントラクトコードを生成できます。複数のプログラミング言語をサポートし、APIと埋め込み機能を提供します。
FileScopeMCPはTypeScriptベースのコード分析ツールで、ファイルの重要度スコアを計算し、依存関係を追跡し、可視化チャートを生成し、ファイルの要約を追加することで、開発者がコードライブラリの構造を迅速に理解するのを支援します。多言語のプロジェクト分析をサポートし、Mermaidチャートの生成と永続的なストレージ機能を提供し、Cursorのモデルコンテキストプロトコルと統合できます。
DB MCP Serverは、マルチデータベースをサポートするサーバーで、モデルコンテキストプロトコル(MCP)を実装し、AIアシスタントに構造化されたデータベースアクセス機能を提供します。MySQLとPostgreSQLをサポートし、複数のデータベースに同時に接続でき、専用ツールを自動生成し、明確なアーキテクチャ設計に準拠しています。
クイックスタートオートMCPは、ユーザーがClaude DesktopとCursorでAnthropicモデルコンテキストプロトコル(MCP)を迅速に登録するのを支援するツールです。RAGドキュメント検索、Difyワークフロー、リアルタイムウェブ検索などの機能を提供し、JSON設定ファイルをワンクリックで生成することができます。
このプロジェクトは、FastAPIに基づいたMCPサーバーを実装しており、HTTPリクエストを介してファイルシステムとやり取りできます。ファイルの作成、読み取り、コピー、移動、削除をサポートし、Google Gemini APIを統合してファイルコンテンツの処理と要約生成を行います。
このプロジェクトは、Google Cloud Vertex AI Geminiモデルに基づくMCPサーバーで、コード支援と一般的な質問応答に使用する豊富なツールセットを提供します。Web検索強化型の回答、ドキュメントの説明生成、ファイルシステム操作などの機能をサポートしています。
TypeScriptベースのCanvaコンテンツ生成MCPサーバーで、スプレッドシートの解析、テンプレートの作成、大量コンテンツの生成、ソーシャルメディアの投稿スケジュール設定をサポートします。
Agentify Componentsは、Reactコンポーネントにセマンティックメタデータを追加するフレームワークで、AIシステムや自動化ツールがコンポーネントの機能を理解できるようにします。デコレータを使用してコンポーネントに標準化された説明を追加し、MCPサーバーの設定を生成し、コンポーネントとAIモデルの対話を実現します。
MCPプロトコルを通じて大規模言語モデルと接続し、コンテンツを生成し、自動的に知乎プラットフォームに投稿する知乎記事自動投稿ツールです。
CTXはコードリポジトリと大規模言語モデル(LLM)を接続するツールで、構造化されたコンテキストファイルを自動生成することで、AI開発におけるコードコンテキストの伝達効率が低い問題を解決します。コードファイル、Gitリポジトリ、ウェブページなどの複数のソースから情報を収集することができ、MCPサーバーを通じて直接AIアシスタントにプロジェクトコンテキストを提供することができます。
Claudeをベースとしたコード分析ツールで、オープンソースプロジェクトを分析し、インテリジェントなマージ戦略を生成します。
AI Studio MCP Serverは、Google AI Studio/Gemini APIを統合したモデルコンテキストプロトコルサーバーで、ファイル、対話履歴、システムプロンプトをサポートするコンテンツ生成機能を提供します。
これはRubyベースのMCPサーバーフレームワークで、モデルコンテキストプロトコル(MCP)を実装し、大規模言語モデルがツール(乱数生成など)を呼び出すことを可能にします。プロジェクトには、プロトコル処理、ツール管理、ログ記録などの機能が含まれ、ClaudeなどのLLMとの統合をサポートします。
MiniMax MCP JSは、JavaScript/TypeScriptで実装されたMiniMaxモデルコンテキストプロトコルツールキットで、テキスト読み上げ、画像生成、動画生成、声のクローンなどの機能を提供し、複数の設定方法と転送モードをサポートします。
OpenRouter APIに基づく自動コードドキュメント生成ツールで、コードライブラリのディレクトリ構造とファイル内容を分析し、自動的にドキュメント、テスト計画、およびコードレビューレポートを生成します。
MCP Klingは最初で唯一の完全なKling AI MCPサーバーで、13種類のクリエイティブツールを提供し、ビデオ生成、画像処理、唇形同期、仮想試着などの機能をサポートし、Claudeとのシームレスな統合を実現し、コンテンツクリエイターや開発者に適しています。
これは、自然言語処理、画像生成から自動化ワークフローまで、複数の分野にまたがる多数のオープンソースAIプロジェクトのリストです。これらのプロジェクトは、開発者がAI技術を利用して、チャットボット、コード生成ツール、データ処理システムなどの様々なアプリケーションを構築するのを支援することを目的としています。