最近、アマゾンのドラマ『ダヴィド王朝』で73のエフェクトシーンが生成型AIによって制作され、技術は中国の快手社から来た。このことは撮影と後編のコストを大幅に節約した。この事例は、AIビデオ生成技術が映画制作業界に急速に浸透し始めていることを示しており、産業においてコスト、効率および従来の仕事スタイルに関する関心を引き起こしている。
影禾医脈と北京天壇病院は4月24日、北京で共同で世界初の全疾患対応の頭部CT補助レポート生成の大規模モデル「小君医師2.0」を発表しました。このAI製品は、先端技術を活用して医学画像レポートの効率と正確性を向上させることを目的としており、多くの医療専門家やテクノロジー愛好家の注目を集めています。
Soul AI Labは、14億パラメータを持つリアルタイムデジタルヒューマン生成モデル「SoulXFlashTalk」をオープンソース化。サブ秒レイテンシと毎秒32フレームの高フレームレートを実現し、完全なリアルタイム対話ソリューションを提供。プロジェクトページ、技術レポート、ソースコード、モデル重みを含む全コンテンツを公開し、業界の研究開発ハードルを低減。....
Microsoft AI Tourで、豆神教育が新しい「豆神AI短劇プラットフォーム」を発表。マルチモーダルAIアーキテクチャに基づき、テキスト理解、画像生成、動画生成、スマートナレーション技術を統合。脚本作成、絵コンテ分解、キャラクター設定などの機能を備え、AIによるコンテンツ制作の大きな進歩を示している。....
強力なAI画像とビデオ生成プラットフォームで、先進的な技術があなたの素敵なビジュアル作品を素早く創造するのを支援します。
Flux Kontext技術に基づいたAI画像生成および編集ツールです。
Flux Kontext技術に基づくAI画像生成および編集ツールです。
ナノバナナ2はGoogleの4K AI画像生成技術を統合し、意味検索と高解像度出力をサポートしています。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
Baidu
128
$6
$24
256
$4
$16
$8
$240
52
Bytedance
$1.2
$3.6
4
bartowski
これはai-sageのGigaChat3-10B-A1.8Bモデルを定量処理したバージョンで、llama.cppのimatrix定量技術を採用し、さまざまなハードウェア条件下でより効率的に動作します。モデルはロシア語と英語をサポートし、主にテキスト生成タスクに使用されます。
DevQuasar
これはMoonshot AI技術に基づく量子化バージョンのモデルで、ビジュアル言語の理解と生成タスクに特化しており、知識の取得障壁を低くし、知識を誰もが利用できるようにすることを目指しています。
mrgant
lans_v1 - loraは、Qwen/Qwen-Imageモデルをベースに、OstrisによるAIツールキットを使用して訓練されたテキストから画像への変換モデルです。LoRA技術を用いて最適化されており、良好な画像生成能力を備えています。
BarleyFarmer
pejawan22-loraはAI技術を基に訓練されたLoRAモデルで、特定の画像生成に特化しており、複数のAIツールと統合して使用できます。トリガーワード「peja」を使って画像を生成します。
deadpoolx22
これはAI技術に基づくテキストから動画へのLoRAモデルで、アリタキャラクターに特化して最適化訓練されており、画像生成などのシーンに使用でき、関連分野のアプリケーションに便利をもたらします。
lichorosario
piccoli_no_style-loraは、画像から動画への変換、LoRA技術に基づく生成モデルで、AI Toolkitを使用して訓練され、Qwen/Qwen-Imageをベースモデルとして、さまざまな画像生成シーンをサポートします。
piccoli_no_style-loraは、画像から動画への技術に基づくLoRAモデルで、AI Toolkitを使用してトレーニングされ、主に画像生成タスクに使用され、複数の主流のAIツールと連携できます。
trinty2535425
これはQwen/Qwen-Image基礎モデルに基づいて訓練された画像から動画へのLoRAモデルで、LoRA(Low-Rank Adaptation)技術を用いて効率的な微調整を実現し、AI画像生成などの関連タスクに使用できます。
amd
Llama-3.1-8B-onnx-ryzenai-npuは、AMDがMetaのLlama-3.1-8Bモデルをベースに開発した最適化バージョンで、AMD Ryzen AI NPU向けに最適化されたデプロイが行われています。このモデルは、Quark量子化、OGAモデルビルダー、およびNPU専用の後処理技術を通じて、高品質なテキスト生成能力を維持しながら、AMDハードウェア上での推論効率を大幅に向上させています。
John6666
Noobai-XL-1.0はStable Diffusion XL技術に基づくテキストから画像への生成モデルで、リアルな写实スタイルの画像生成に特化し、画像創作分野に高品質のAI生成ソリューションを提供します。
Keltezaa
AiGirl_IIは、black-forest-labs/FLUX.1-devをベースに構築されたテキストから画像を生成するモデルで、LoRA技術とDiffusersライブラリを組み合わせて、特定のスタイルの画像を生成するために特別に設計されています。このモデルはCC BY-NC-ND 4.0ライセンスを採用しており、非商用用途に適しています。
nvidia
Cosmos-Predict2.5はNVIDIAが開発した、物理AI向けに設計された高性能の事前学習済み世界基礎モデルセットです。拡散モデル技術に基づいており、テキスト、画像、またはビデオの入力に基づいて、物理的な知覚を持つ高品質の画像とビデオを生成することができ、自動運転やロボットなどのアプリケーションに世界シミュレーション能力を提供します。
mykor
Mi:dm 2.0は韓国を中心としたAIモデルで、KTが独自技術を用いて開発しました。このモデルは韓国社会独自の価値観、認知フレームワーク、常識推論を深く内包しており、韓国語のコンテンツを処理および生成するだけでなく、韓国社会の文化規範と価値観に対する深い理解を体現しています。
Zedge
Stability AIが開発したテキストから画像を生成する拡散モデルで、二重テキストエンコーダーと潜在拡散技術を採用し、単独使用または最適化モジュールと組み合わせて効果を向上させることが可能
Yntec
ダ・ヴィンチの芸術スタイルを融合させたテキスト生成画像モデルで、LoRA技術によりルネサンススタイルを現代AI絵画に取り入れています。
MayZhou
e5-smallモデルをLoRA技術でファインチューニングしたテキスト分類モデルで、AI生成と人手作成のテキストを高精度で区別するために特化
dataautogpt3
Proteus v0.6はSDXLアーキテクチャに基づくAI画像生成モデルで、全面的に再構築された後、画像のリアリティ向上に特化しています。これは再構築後の最初のバージョンで、多視点融合技術を用いて訓練され、高品質のリアルな画像を生成することができます。
renderartist
AI生成画像でトレーニングされた3Dおもちゃデザインモデルで、SECoursesの3D LoRAと塗り絵Flux LoRA技術を融合
life
これはAI技術に基づくテキストから画像への生成モデルで、バシキール女性の特色を持つ画像を生成するために特別に設計されています。このモデルは特定のプロンプトワードでトリガーされ、さまざまなシーンやスタイルのバシキール女性画像を生成でき、アート創作やデザインのインスピレーション源となります。
GraySwanAI
Mistral-7B-Instruct-RRはMistral-7Bをベースにした改良モデルで、表現再ルーティング(RR)技術を通じてブレーカーメカニズムを挿入しています。この技術は、有害コンテンツ生成時のモデル表現に直接介入することで、能力損失を最小限に抑えながらAIシステムが有害コンテンツを生成するのを防止します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
PMATはゼロコンフィギュレーションのAIコードコンテキスト生成ツールで、コード品質分析、技術的負債評価、ミューテーションテスト、リポジトリ健全性評価、意味検索などの機能を提供し、17種類以上のプログラミング言語をサポートし、MCPプロトコルを通じてClaude CodeなどのAIアシスタントと統合することができます。
Project Synapseは、革新的なMCPサーバーです。意味解析と知識グラフ技術を通じてテキストを相互に関連する知識ネットワークに変換し、独自に洞察を生成します。モンタギュー意味論とZettelkasten方法を組み合わせることで、AIの認知的協調能力を実現します。
これは、自然言語処理、画像生成から自動化ワークフローまで、複数の分野にまたがる多数のオープンソースAIプロジェクトのリストです。これらのプロジェクトは、開発者がAI技術を利用して、チャットボット、コード生成ツール、データ処理システムなどの様々なアプリケーションを構築するのを支援することを目的としています。
Apple RAG MCPは、AIエージェントにApple開発の専門知識を提供する検索強化生成システムで、公式のSwiftドキュメント、デザインガイド、およびApple Developer YouTubeコンテンツを統合し、AI駆動のハイブリッド検索技術によって正確な技術的な回答を提供します。
AIエキスパートワークフローMCPは、OpenRouter APIに基づくモデルコンテキストプロトコルサーバーです。プロダクトマネージャー、UXデザイナー、ソフトウェアアーキテクトの3つのAIエキスパートロールを通じて、製品の計画から技術的な実現までの完全なワークフローソリューションを提供します。プロジェクトは独立してPRDドキュメントを生成することも、Task Masterと統合してタスク管理を行うこともできます。
MongoDB Atlasベクトル検索とVoyage AI埋め込み技術に基づくドキュメント検索システムで、意味検索とテキストマッチングをサポートし、ドキュメント分割、埋め込み生成、および保存機能を備えています。
マーキュリー特殊作戦MCPサーバーは革新的なAIツールプラットフォームで、動的なプロンプト生成とテンプレート組み立てをプログラム可能なツールとしてAIアシスタントに提供します。これはモジュール化アーキテクチャを採用し、31の技術スタック、10の分析次元、34のテンプレートコンポーネントをサポートし、6つのツールを通じて技術固有のコンテンツ生成を実現し、AIと専門コンテンツのやり取り方法を根本的に変えました。
FOCUS DATA MCPサーバーは、自然言語をSQL文に変換するAIアシスタントサービスで、2段階生成方式を採用してLLMの幻覚をコントロールし、非技術ユーザーがSQL結果に対する信頼度を向上させます。
Memory Bank MCPは、モデルコンテキストプロトコル(MCP)に基づくプロジェクト知識管理システムです。AI生成と構造化ドキュメントにより、チームがプロジェクトの知識を管理するのを支援します。これには、プロジェクトの目標、製品コンテキスト、システムアーキテクチャ、技術的詳細、現在のタスク、および進捗状況などの6つの核心ドキュメントタイプが含まれます。
Open Deep Research MCP ServerはAI駆動の深度研究アシスタントで、検索エンジン、ウェブクローリング、AI技術を組み合わせて反復的な深度研究を行い、包括的なレポートを生成します。MCPプロトコルとCLIの2つの使用方法をサポートし、信頼性評価、範囲制御、自動的な後続質問生成などの機能を備えています。
このプロジェクトは、ChatGPTを使用してLLMの情報検索、API統合(IGNのAPICARTOやGéoPlateformeサービスなど)、コード生成などの能力をテストし、地理コード化、郵便番号照会などの機能を含み、AIを技術評価と開発支援に活用する方法を探索します。
DBChatはAI技術を通じてユーザーが自然言語でデータベースと会話できるツールで、SQLを記述することなくデータをクエリし、可視化グラフを生成でき、複数のデータベースタイプをサポートしています。
これは、複数のオープンソースAIプロジェクトのリストで、自動化エージェント、大規模言語モデル、画像生成からAI開発フレームワークまで、複数の分野をカバーしています。これらのプロジェクトは、開発者がAI技術を活用して収益を上げるのを支援することを目的としており、スマートアシスタントの構築、自動化ワークフロー、コンテンツ生成などのアプリケーションが含まれます。
Cloudflare Workerをベースにした極簡画像生成テンプレートで、workers-mcpパッケージとWorkers AI技術を使用し、ローカル開発と迅速なデプロイをサポートしています。
Agent-Skill-Kitは、AIエージェント向けに設計されたローカル優先のスキルフレームワークで、APIキーや登録が不要で、MCPプロトコルを通じてClaudeやCopilotなどのエージェントにローカルスキルを提供します。コードの可視化、技術情報の取得、スキルの生成などの機能が含まれています。
MITRE ATT&CK MCPサーバーはAIネイティブの脅威インテリジェンスツールで、Model Context Protocolを通じてMITRE ATT&CKフレームワークに全面的にアクセスできます。200以上の技術、140以上の脅威組織、700以上のソフトウェアエントリの検索機能を備え、ATT&CK Navigatorの可視化レイヤー生成をサポートし、セキュリティチームとAIエージェント向けに設計されています。
企業レベルのコードインテリジェント分析プラットフォームで、MCPサーバーを通じてAIアシスタントにコードライブラリの分析、技術的負債評価、セキュリティホール検出などの機能を提供し、ローカルとリモートのコードソースをサポートし、自動的にPDFレポートを生成します。
このプロジェクトにはMCPサーバーとVSCode拡張機能が含まれており、自然言語のプロンプトでHTML、CSS、JavaScriptアプリケーションを生成し、GoogleのLLM技術を利用してAIによるコード生成を実現します。