フランスのカンヌ映画祭で、ビットテック傘下のボルカニックエンジンは動画生成モデル「Seedance2.0」を発表し、その映画制作における商業的応用を紹介した。このモデルを基に制作された8本のAI映画が展示され、アメリカのHiggsfieldが制作した世界初の95分のAI長編映画『HELL GRIND』の初上映も行われ、ジェネラティブAIが主流の映画産業へと加速的に進出していることを示した。
智象未来、北京オープンデーでUnified Transformerアーキテクチャに基づく画像大規模モデルHiDream-O1-Image-Proを発表。パラメータ数は2000億を超え、複数のSOTA記録を更新。同日、半月以内に2回目の資金調達を完了し、深創投や金浦投資などのトップ機関が支援。資本市場がネイティブ全モーダル技術を認めたことを示す。....
智象未来は初のオープンデーで、パラメータが2000億を超える「Unified Transformer(UiT)」アーキテクチャに基づく画像大規模モデルHiDream-O1-Image-Proを発表。ピクセル、テキスト、タスク条件を統一し、文生成画像、文字レンダリング、画像編集などのタスクで業界トップレベルを達成。....
アリババの「百霊」が、エージェントワークフロー、エンジニアリング開発、科学研究分析などの複雑なシナリオ向けに設計された、兆パラメータ級の思考モデル「Ring-2.6-1T」を発表。調整可能な推論努力メカニズムを導入し、コストと効率のバランスを最適化。低遅延のhighモードとxhighモードの2つの推論モードを提供する。....
HitPublishの自動化AIコンテンツ作成とWordPress公開、7日間の無料トライアル、クレジットカード不要。
Macに最適な画面録画とビデオ編集アプリで、AI文字起こし、スマートズームなどの機能を備えています。
hiDataは統合型のAIワークスペースで、データ、文書、プレゼンテーションなどのワークフローを統合しています。
HimediaはAI動画と画像生成ツールで、専門的なコンテンツを迅速に制作し、視覚効果を変換することができます。
HIT-TMG
Uni-MoE 2.0-Imageは、Uni-MoE 2.0-Omniをベースに派生したビジュアル生成モデルで、ビジュアル生成データで特別に微調整され、強力な画像生成と編集能力を備えています。
Uni-MoE 2.0-Omniは、ライチ科技(Lychee)が発表した完全オープンソースの全モーダリティモデルで、全モーダリティ3D RoPEと動的容量エキスパート混合アーキテクチャを採用し、言語を中心としたマルチモーダリティ理解、推論、生成能力を大幅に向上させました。このバージョンには、全モーダリティ理解とオーディオおよび画像生成能力が統合されています。
hirundo-io
これは🤗 Transformersに基づくモデルで、HuggingFaceモデルセンターに公開されています。モデルカードの情報が不十分なため、具体的な機能とアプリケーションシナリオはさらに確認する必要があります。
Hikarias
f3rnanda_wan22-loraは、OstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への生成タスクに特化しています。このモデルはWan2.2 - I2V - A14Bをベースモデルとして使用し、ComfyUIやAUTOMATIC1111などの主流のAIツールでの使用をサポートしています。
calcuis
HiggsのGGUF量子化バージョンは、bosonaiベースモデルに基づくテキストを音声に合成するモデルで、複数の言語の音声生成をサポートし、効率的な推論性能と簡便なローカルデプロイ能力を備えています。
bosonai
Higgs Audio V2は強力なオーディオ基礎モデルで、1000万時間を超えるオーディオデータと多様なテキストデータで事前学習され、表现力豊かなオーディオを生成できます。
ControlNetLoRA
HiDream-I1-Fullに基づくControlNet PEFT LoRAモデルで、テキストから画像への変換と画像から画像への変換をサポートします。
mradermacher
これはHIT-TMG/KaLM-embedding-multilingual-mini-instruct-v1.5モデルの静的定量化バージョンで、特徴抽出、文の類似度計算などのタスクに特化しています。複数の定量化バージョンを提供し、効率的な文の埋め込み処理をサポートします。
amd
PARD is a high-performance speculative decoding method that can convert autoregressive draft models into parallel draft models at low cost, significantly accelerating the inference of large language models.
tonyli8623
これは医療分野に特化した対話モデルで、特に中西医結合の診断と治療アドバイスを重視しています。
yamatazen
Orihime-12B は mergekit ツールを使用して統合された事前学習済み言語モデルで、shisa-v2-mistral-nemo-12b と Himeyuri-v0.1-12B モデルを融合したものであり、英語と日本語をサポートしています。
guokee
これはFLUX.1-devテキスト画像生成モデル用にトレーニングされたLoRAアダプターで、diffusersまたはComfyUIを介して呼び出し、特定のスタイルの画像を生成するために使用できます。
Apache-2.0ライセンスに基づく画像テキスト変換モデルで、画像からテキスト情報を抽出し編集可能なテキスト形式に変換できます。
Runware
HiDream-I1は170億パラメータを持つオープンソースの画像生成基盤モデルで、数秒で最先端の画像生成品質を実現します。
HiDream-I1は170億パラメータを持つオープンソースの画像生成基盤モデルで、数秒で業界トップレベルの画像を生成できます。
linoyts
これはHiDream-ai/HiDream-I1-Fullをベースに訓練されたDreamBooth LoRAモデルで、毛糸アートスタイルの犬の画像生成に特化しています。
Transformerアーキテクチャに基づく視覚言語モデルで、画像内容を理解し対応するテキスト記述を生成可能
GoogleのGemma-3 27Bをファインチューニングした大規模言語モデルで、チェイン・オブ・シンキング推論とコード生成タスクに特化し、GPUメモリとシステムメモリ管理を最適化しています。
hiteshsatwani
BLIPは統一された視覚-言語事前学習フレームワークで、画像キャプション生成などの視覚-言語タスクに優れています
city96
HiDream-I1-FastはGGUF量子化を施したテキストから画像を生成するモデルで、高速な画像生成タスクに適しています。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
HiMarketは即座に利用可能な企業向けAIオープンプラットフォームソリューションで、管理バックエンド、開発者ポータル、AIゲートウェイの3つの核心コンポーネントを提供し、モデルサービス、MCP ServerなどのAI機能を標準化されたAPI製品にパッケージ化して公開することをサポートします。
LangCare MCP FHIRサーバーは、企業レベルのMCPサーバーで、FHIR R4電子カルテシステム用に設計されており、AIアシスタントが患者の健康記録に安全にアクセスし管理できるようにします。4種類の汎用FHIR操作ツールを提供し、40種類以上の臨床ワークフローガイドと対話型UIアプリケーションを内蔵し、EPIC、Cerner、GCPなどの複数のバックエンドをサポートし、Go言語で記述されており、企業レベルのセキュリティとHIPAAコンプライアンスを備えています。
Faxbotは、複数のバックエンド(クラウドと自ホスト)とMCP伝送オプションをサポートするオープンソースの自ホスト可能なファックスAPIです。HIPAA準拠のセキュリティ設定を提供し、簡単な関数呼び出しでファックスを送信できます。
ヒッピカンパスは、LangChainベースのCLIおよびMCPサーバーで、OpenAPI仕様の動的ロードとLangflowとの統合をサポートし、可視化ワークフローの作成機能を提供します。
HiveブロックチェーンAIインタラクションサーバー
GitHub MCPサーバーは、Pull Requestから差分を抽出する機能を提供します
USolverはモデルコンテキストプロトコルサーバーで、組合せ最適化、凸最適化、整数計画、非線形最適化問題の求解ツールを提供し、highs、ortools、cvxpy、z3などの複数のソルバーをサポートします。
US Regulations MCP Serverは、AIによるコンプライアンスツールで、MCPプロトコルを通じて、ClaudeなどのAIクライアントから直接米国の連邦および州レベルの規制を照会できます。HIPAA、CCPA、SOX、GLBAなど20以上の規制をカバーし、全文検索、条項比較、および適用性チェック機能を提供し、開発者やコンプライアンス担当者が正確な規制テキストと参考情報を迅速に取得するのを支援します。
AI支援型プログラミング用のMCPサーバーで、開発履歴データ(Gitコミット、テスト結果、Copilot会話)を検索可能なSQLiteデータベースに統合することで、AIアシスタントが開発履歴にアクセスし、分析できるようにします。
HireBase MCPサーバーは、HireBaseの求人情報APIとやり取りするためのツールを提供するサーバーで、求人情報の検索、詳細情報の取得、候補者プロファイルの生成機能をサポートしています。
HideのMCPサーバー実装で、ヘッドレスIDE機能を提供します
ハイブマインドはObsidianのプラグインで、架空世界の構築、研究、知識管理にAIファイアウォール機能を提供します。タイムラインビュー、関係グラフ、正典ワークフローを通じて、AIツールがユーザーのノート内の実際の情報に基づいて協力できるようにし、AIの幻覚を防止します。
Higress OPS MCP Serverは、Model Context Protocol(MCP)に基づくサービス実装で、Higressゲートウェイの構成と管理に使用されます。このプロジェクトは、LangGraphとLangChain MCP Adaptersに基づくMCPクライアントも提供しており、プロキシフローアーキテクチャを通じてHigress MCP Serverとやり取りします。
Higress AI-Search MCPサーバーは、AIモデルにリアルタイム検索エンジンの結果を強化します。
Hive Intelligence MCPサーバーは、AIアシスタントに包括的な暗号通貨とWeb3分析サービスを提供し、統一インターフェイスを通じて200以上の専門ツールを統合し、市場データ、チェーン上分析、ポートフォリオ追跡、セキュリティ分析などの複数の分野をカバーします。
ヒカMCPサーバーは、SSEプロトコルをベースとしたリアルタイムAI知識検索サービスで、多認知パースペクティブのストリーミングによって検索体験を強化します。
Hive MCPサーバーは、AIアシスタントとHiveブロックチェーンを接続するブリッジで、アカウント照会、コンテンツ投稿、暗号化通信などのブロックチェーンインタラクション機能を提供します。
ハイブマインドは複数モデルのAIコンセンサスプラットフォームで、GPT - 5.2、Claude Opus 4.5、Gemini 3 Proを同時にクエリでき、複数ラウンドの協議メカニズムによって信頼性の高い総合的な回答を生成します。
Hi - AIはモデルコンテキストプロトコル(MCP)に基づくAI開発アシスタントで、36個の専用ツールを提供し、自然言語キーワード認識、インテリジェントメモリ管理、コード分析、プロジェクト計画、タスク管理をサポートし、開発者が複雑な開発タスクを効率的に完了できるよう支援します。