Reverie社は、ヒンディ語、英語およびHinglishの混合言語をサポートする新しい音声からテキストへの変換モデルを発表しました。このモデルは、インドの多言語環境に適応しており、300万回以上のAPI呼び出しを処理し、銀行やコールセンターなど業界での高い正確性と迅速な応答能力を示しています。
小红书の内部アプリ「REDcity」が「hi」に改名され、新ロゴを発表。AIアシスタント「hibo」を追加し、要約生成やネット検索に対応、業務効率化を支援。....
最近、腾讯Hunyuanチームは正式にHunyuanImage2.1をオープンソース化した。この17BパラメータのDiT(Diffusion Transformer)テキストから画像生成モデルは、Artificial Analysis Image Arenaのランキングで迅速にトップに立ち、HiDream-I1-DevやQwen-Imageを上回り、オープンソース重みモデルの新しいリーダーとなった。このモデルは2048x2048解像度の出力をネイティブでサポートし、大幅に性能が向上している。
SuperCLUE-VLM多モーダルモデル評価ランキング発表。Gemini-2.5-Proが74.99点で1位、GPT-5(high)が68.59点で2位。中国語シーン向けに設計され、基礎認知・視覚推論・視覚応用の3分野で評価。主要モデルを網羅。....
AI駆動の面接プラットフォームで、スマートな採用と候補者の自動選別を支援し、効率的な採用を実現します。
AIによるデート写真生成。20分で80 - 180枚を提供。Tinder、Bumble、Hingeのプロフィールを最適化します。
AIを使用して長いビデオをすばやくソーシャルメディアに適したショートビデオに変換します。
ChatGPTやGeminiなどの複数のモデルを同時に使用でき、3 - 4倍の時間を節約し、効率を200%向上させます。
HIT-TMG
Uni-MoE 2.0-Imageは、Uni-MoE 2.0-Omniをベースに派生したビジュアル生成モデルで、ビジュアル生成データで特別に微調整され、強力な画像生成と編集能力を備えています。
Uni-MoE 2.0-Omniは、ライチ科技(Lychee)が発表した完全オープンソースの全モーダリティモデルで、全モーダリティ3D RoPEと動的容量エキスパート混合アーキテクチャを採用し、言語を中心としたマルチモーダリティ理解、推論、生成能力を大幅に向上させました。このバージョンには、全モーダリティ理解とオーディオおよび画像生成能力が統合されています。
hirundo-io
これは🤗 Transformersに基づくモデルで、HuggingFaceモデルセンターに公開されています。モデルカードの情報が不十分なため、具体的な機能とアプリケーションシナリオはさらに確認する必要があります。
Hikarias
f3rnanda_wan22-loraは、OstrisによるAIツールキットを基に訓練されたLoRAモデルで、画像から動画への生成タスクに特化しています。このモデルはWan2.2 - I2V - A14Bをベースモデルとして使用し、ComfyUIやAUTOMATIC1111などの主流のAIツールでの使用をサポートしています。
calcuis
HiggsのGGUF量子化バージョンは、bosonaiベースモデルに基づくテキストを音声に合成するモデルで、複数の言語の音声生成をサポートし、効率的な推論性能と簡便なローカルデプロイ能力を備えています。
bosonai
Higgs Audio V2は強力なオーディオ基礎モデルで、1000万時間を超えるオーディオデータと多様なテキストデータで事前学習され、表现力豊かなオーディオを生成できます。
ControlNetLoRA
HiDream-I1-Fullに基づくControlNet PEFT LoRAモデルで、テキストから画像への変換と画像から画像への変換をサポートします。
mradermacher
これはHIT-TMG/KaLM-embedding-multilingual-mini-instruct-v1.5モデルの静的定量化バージョンで、特徴抽出、文の類似度計算などのタスクに特化しています。複数の定量化バージョンを提供し、効率的な文の埋め込み処理をサポートします。
amd
PARD is a high-performance speculative decoding method that can convert autoregressive draft models into parallel draft models at low cost, significantly accelerating the inference of large language models.
tonyli8623
これは医療分野に特化した対話モデルで、特に中西医結合の診断と治療アドバイスを重視しています。
yamatazen
Orihime-12B は mergekit ツールを使用して統合された事前学習済み言語モデルで、shisa-v2-mistral-nemo-12b と Himeyuri-v0.1-12B モデルを融合したものであり、英語と日本語をサポートしています。
guokee
これはFLUX.1-devテキスト画像生成モデル用にトレーニングされたLoRAアダプターで、diffusersまたはComfyUIを介して呼び出し、特定のスタイルの画像を生成するために使用できます。
Apache-2.0ライセンスに基づく画像テキスト変換モデルで、画像からテキスト情報を抽出し編集可能なテキスト形式に変換できます。
Runware
HiDream-I1は170億パラメータを持つオープンソースの画像生成基盤モデルで、数秒で最先端の画像生成品質を実現します。
HiDream-I1は170億パラメータを持つオープンソースの画像生成基盤モデルで、数秒で業界トップレベルの画像を生成できます。
linoyts
これはHiDream-ai/HiDream-I1-Fullをベースに訓練されたDreamBooth LoRAモデルで、毛糸アートスタイルの犬の画像生成に特化しています。
Transformerアーキテクチャに基づく視覚言語モデルで、画像内容を理解し対応するテキスト記述を生成可能
GoogleのGemma-3 27Bをファインチューニングした大規模言語モデルで、チェイン・オブ・シンキング推論とコード生成タスクに特化し、GPUメモリとシステムメモリ管理を最適化しています。
hiteshsatwani
BLIPは統一された視覚-言語事前学習フレームワークで、画像キャプション生成などの視覚-言語タスクに優れています
city96
HiDream-I1-FastはGGUF量子化を施したテキストから画像を生成するモデルで、高速な画像生成タスクに適しています。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
HiMarketは即座に利用可能な企業向けAIオープンプラットフォームソリューションで、管理バックエンド、開発者ポータル、AIゲートウェイの3つの核心コンポーネントを提供し、モデルサービス、MCP ServerなどのAI機能を標準化されたAPI製品にパッケージ化して公開することをサポートします。
Faxbotは、複数のバックエンド(クラウドと自ホスト)とMCP伝送オプションをサポートするオープンソースの自ホスト可能なファックスAPIです。HIPAA準拠のセキュリティ設定を提供し、簡単な関数呼び出しでファックスを送信できます。
ヒッピカンパスは、LangChainベースのCLIおよびMCPサーバーで、OpenAPI仕様の動的ロードとLangflowとの統合をサポートし、可視化ワークフローの作成機能を提供します。
HiveブロックチェーンAIインタラクションサーバー
GitHub MCPサーバーは、Pull Requestから差分を抽出する機能を提供します
USolverはモデルコンテキストプロトコルサーバーで、組合せ最適化、凸最適化、整数計画、非線形最適化問題の求解ツールを提供し、highs、ortools、cvxpy、z3などの複数のソルバーをサポートします。
HideのMCPサーバー実装で、ヘッドレスIDE機能を提供します
HireBase MCPサーバーは、HireBaseの求人情報APIとやり取りするためのツールを提供するサーバーで、求人情報の検索、詳細情報の取得、候補者プロファイルの生成機能をサポートしています。
Higress AI-Search MCPサーバーは、AIモデルにリアルタイム検索エンジンの結果を強化します。
Higress OPS MCP Serverは、Model Context Protocol(MCP)に基づくサービス実装で、Higressゲートウェイの構成と管理に使用されます。このプロジェクトは、LangGraphとLangChain MCP Adaptersに基づくMCPクライアントも提供しており、プロキシフローアーキテクチャを通じてHigress MCP Serverとやり取りします。
Hive Intelligence MCPサーバーは、AIアシスタントに包括的な暗号通貨とWeb3分析サービスを提供し、統一インターフェイスを通じて200以上の専門ツールを統合し、市場データ、チェーン上分析、ポートフォリオ追跡、セキュリティ分析などの複数の分野をカバーします。
ヒカMCPサーバーは、SSEプロトコルをベースとしたリアルタイムAI知識検索サービスで、多認知パースペクティブのストリーミングによって検索体験を強化します。
Hive MCPサーバーは、AIアシスタントとHiveブロックチェーンを接続するブリッジで、アカウント照会、コンテンツ投稿、暗号化通信などのブロックチェーンインタラクション機能を提供します。
Have I Been Pwned APIと統合されたMCPサーバーで、電子メールとパスワードがデータ漏洩事件で暴露されていないかを確認できます。
MCPメモリは、データ集中型アプリケーション向けのメモリサーバーで、効率的なHippoRAG知識グラフを通じてセッションメモリ管理と多ソース情報検索を実現します。
HiveFlow公式のMCPサーバーで、AIアシスタントとHiveFlow自動化プラットフォームを接続し、フロー管理、実行監視などの機能を提供します。
MCPプロトコルに基づくシンプルな天気サービスのサンプルプロジェクト
このプロジェクトは、OpenAPI仕様に基づくMCPサーバーで、NDHM - HIUプロトコルのAPIリクエストを処理し、複数の伝送モードをサポートし、充実した開発ツールチェーンを提供します。
Spring BootベースのMySQLデータベース接続プロジェクトで、HikariCP接続プールを構成し、MCPプロトコルを通じたサービス通信をサポートしています。