前GoogleとMetaのエンジニア3人が設立したMajestic Labsは1億ドルの資金調達を実施し、データセンターコストを削減する高容量AIサーバーの開発に注力しています。特許取得のシリコン構造により、サーバーのメモリ容量が1000倍に向上し、1つのシステムで最大10台の従来型サーバーラックを置き換えることが可能です。
ByteDanceがInfinityStarフレームワークを発表。動画生成効率が大幅向上し、5秒の720p動画生成が58秒に短縮。革新的な時空間分離設計により、画像生成、テキストからの動画生成、動画続き作成など多様な視覚タスクを統一サポート。....
メタがオムニリンガルASR音声認識システムを公開し、1600以上の言語を変換できるようにしました。そのうち500種類の言語はAIによって初めてカバーされました。このシステムは、世界中の7000種類以上の言語の中で多くの言語にAIのサポートがない問題を解決することを目的としています。これまでは数百種類の主要言語に焦点を当てていた制限を乗り越えました。
Google TVにGemini音声アシスタントを導入し、Google Assistantを置き換え。全プラットフォーム統合戦略の一環で、自然な会話による高度なAI機能を提供。複雑なリクエスト(例:異なる好みの映画提案)にも対応。....
リアルタイムSBOM、脆弱性リスク評価、ライセンスコンプライアンス、およびサプライヤーの可視性。最初の5つのリポジトリは無料です。
リアルタイムAI会議アシスタントで、会話の理解や知識の学習をサポートし、個人や組織に最適。
Jet Adminはノーコードでカスタムビジネスアプリケーションを構築し、効率を高め、コストを削減し、簡単に導入可能なツールです。
スクランボールは世界的なソーシャルメディアマーケティングプラットフォームで、AIによるインフルエンサーマーケティングソリューションとデータを提供します。
xai
$21.6
入力トークン/百万
$108
出力トークン/百万
256k
コンテキスト長
minimax
-
1M
google
$0.72
$2.88
reka-ai
128k
openai
$0.36
400k
tencent
$3
$9
8k
sensetime
$2.8
$8.4
alibaba
$0.8
$16
131.1k
mistral
$14.4
nvidia
$1.08
$4.32
anthropic
$5.76
$28.8
200k
$2.16
8.2k
nous-research
32k
ai21-labs
DevQuasar
このプロジェクトは moonshotai/Kimi-K2-Thinking ベースモデルに基づいて、カスタム逆量子化スクリプトを使用して元のINT4モデルをより高品質のテキスト生成モデルに変換し、知識をすべての人に利用可能にすることを目指しています。
inferencerlabs
Qwen3-Coder-480B-A35B-Instructは4800億パラメータの大型コード生成モデルで、8.5ビット量子化をサポートし、MLXフレームワークに基づいて最適化されています。このモデルはコード生成タスクに特化して設計されており、十分なメモリを搭載したデバイス上で効率的に動作します。
Mungert
gpt-oss-safeguard-20bは、GPT-OSS-20bをファインチューニングした安全推論モデルで、大規模言語モデルの入出力フィルタリング、オンラインコンテンツのラベリング、および信頼と安全のユースケースのオフラインラベリングに特化しています。このモデルはApache 2.0ライセンスを採用しており、カスタムポリシーと透明な決定プロセスをサポートしています。
Qwen
Qwen3-VL-2B-Instruct-GGUFは通義千問シリーズのマルチモーダルビジュアル言語モデルのGGUF量子化バージョンで、20億のパラメータを持ち、画像理解とテキスト生成のシームレスな融合をサポートし、CPUやGPUなどのデバイスで効率的に動作します。
moonshotai
Kimi Linearは、短い文脈、長い文脈、強化学習のシナリオのすべてで、従来の全アテンション方式を上回る高効率な混合線形アテンションアーキテクチャです。Kimi Delta Attention (KDA)メカニズムによりアテンション計算を最適化し、性能とハードウェア効率を大幅に向上させ、特に100万トークンに達する長文脈タスクの処理に優れています。
unsloth
GPT-OSS-Safeguard-20Bは、GPT-OSSをベースに構築された210億パラメータのセキュリティ推論モデルで、セキュリティ関連のテキストコンテンツの分類とフィルタリングタスクに特化して最適化されています。このモデルはカスタムセキュリティポリシーをサポートし、透明な推論プロセスを提供し、大規模言語モデルの入出力フィルタリングやオンラインコンテンツのラベリングなどのセキュリティユースケースに適しています。
strangervisionhf
これはDeepSeek - OCRに基づく画像テキスト認識モデルで、最新バージョンのtransformersライブラリでの互換性問題を特別に解決し、モデルがtransformers v4.57.1などの最新バージョンでスムーズに動作できるようにします。
pnnbao-ump
VieNeu-TTSは、個人デバイス上で動作可能な最初のベトナム語のテキスト音声変換モデルで、即時音声クローニング機能を備えています。NeuTTS Airをベースに微調整され、自然でリアルなベトナム語音声を生成でき、CPU上でリアルタイム性能を備えています。
QuantTrio
MiniMax-M2-AWQは、MiniMaxAI/MiniMax-M2モデルをベースとした量子化バージョンで、vLLMフレームワークを通じて効率的なテキスト生成を実現します。このモデルはAWQ量子化技術を採用し、モデルの性能を維持しながら、メモリ使用量を大幅に削減し、推論速度を向上させます。32Kのコンテキスト長とツール呼び出し機能をサポートしています。
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
TheWhisper-Large-V3はOpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォーム(NVIDIA GPUとApple Silicon)のリアルタイム、低遅延、低消費電力の音声テキスト変換推論用に最適化されています。
SamuelBang
AesCoder-4Bは、コードの美学的品質の向上に特化した大規模言語モデルです。インテリジェントな報酬フィードバックメカニズムを通じて、コード生成の美学的表現を最適化し、ウェブデザインやゲーム開発などのビジュアルコーディングタスクで優れた性能を発揮します。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速、高音質のテキスト音声変換モデルです。2段階パイプラインを用いて、大規模言語モデルと高効率オーディオコーデックを組み合わせ、卓越した速度とオーディオ品質を実現します。このモデルはスペイン語をサポートし、4億のパラメータを持ち、サンプリングレートは22kHzです。
electron271
これは精度の分野における最新の最先端モデルで、人工穀物インテリジェンスの実現に取り組んでおり、世界トップレベルの穀物栽培チームの支援を受けて大きな進展を遂げました。このモデルはQwen3 - 0.6Bアーキテクチャに基づいており、RX 9070 XTグラフィックカードとunslothツールを使用してローカルで全量微調整を行っています。
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。独自の2段階アーキテクチャにより、大規模言語モデルと効率的な音声コーデックを組み合わせ、低遅延で高品質な音声合成を実現します。リアルタイムファクターは最低0.2で、リアルタイム速度の5倍の高速合成が可能です。
BR-RMは革新的な2ラウンド推論報酬モデルで、適応的分岐と分岐に基づく反省メカニズムにより、従来の報酬モデルにおける「判断拡散」の問題を解決し、複数の報酬モデリングベンチマークテストで業界をリードする性能を達成しました。
lmstudio-community
Qwen3-VL-2B-Instructは、Qwenチームによって開発された、効率的な画像テキストからテキストへの変換モデルです。このモデルはMLX 8ビット量子化によって最適化されており、特にAppleシリコンチップ搭載のデバイスに適しており、視覚言語タスクを処理し、効率的な解決策を提供することができます。
Tacoin
これはTacoinがNVIDIA GR00Tモデルをベースに、LIBERO libero longベンチマークテストで微調整したロボット操作モデルです。このモデルはデュアルRGBストリームと8自由度の状態入力を採用し、16ステップの関節空間動作を予測でき、長期的な視野のロボット操作タスクに特化しています。
KaniTTS Pretrain v0.3は高速で高忠実度のテキストを音声に変換するモデルで、リアルタイム対話型人工知能アプリケーション向けに最適化されています。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと高効率オーディオコーデックを組み合わせて、超低遅延と高品質の音声合成を実現します。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
MCP GoはGo言語で実装されたモデルコンテキストプロトコル(MCP)サーバーフレームワークで、LLMアプリケーションと外部データソースやツールを接続するために使用されます。リソース管理、ツール呼び出し、プロンプトテンプレートなどの核心機能を提供し、セッション管理とミドルウェア拡張をサポートしています。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
MCP - Frameworkは、TypeScriptに基づくフレームワークで、モデルコンテキストプロトコル(MCP)サーバーをエレガントに構築するために使用されます。すぐに使えるアーキテクチャを提供し、自動ディレクトリ発見ツール、リソース、およびプロンプトをサポートし、複数の伝送方式と型安全な特性を備えています。
エージェンティックレーダーは、エージェントシステムを分析・評価するセキュリティスキャナーで、開発者、研究者、セキュリティ専門家がエージェントシステムのワークフローを理解し、潜在的なホールを特定するのに役立ちます。
Sail は、ストリーム処理、バッチ処理、および計算集約型(AI)ワークロードを統一することを目的としたプロジェクトで、Spark SQL と Spark DataFrame API の代替手段を提供し、シングルマシンと分散環境の両方をサポートします。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
OpikはオープンソースのLLM評価フレームワークで、LLMアプリケーションのトレース、評価、監視をサポートし、開発者がより効率的で経済的なLLMシステムを構築するのを支援します。
FastMCPは、TypeScriptに基づくフレームワークで、クライアントセッションをサポートするMCPサーバーを構築するために使用されます。ツール、リソース、プロンプトの簡単な定義を提供し、認証、セッション管理、画像と音声コンテンツの返却、ログ記録、エラー処理、SSE通信などの機能をサポートし、テストとデバッグ用のCLIツールも含まれています。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
Apple MCPツールセットは、MCPプロトコルに基づくAppleのネイティブツールセットで、メッセージ、メモ、連絡先、メール、リマインダー、カレンダーなどのAppleエコシステムの統合サービスを提供します。
Exa MCP Serverは、AIアシスタント(Claudeなど)にウェブ検索機能を提供するサーバーで、Exa AI検索APIを通じてリアルタイムで安全にウェブ情報を取得できます。
このプロジェクトは、Sonar APIを統合したMCPサーバーの実装で、Claudeにリアルタイムのネットワーク検索機能を提供します。システムアーキテクチャ、ツールの設定、Dockerデプロイ、およびマルチプラットフォーム統合ガイドが含まれています。
デスクトップコマンダーMCPは、Claudeデスクトップアプリケーションがターミナルコマンドを実行し、ファイルシステムを管理できるAIアシスタントツールです。コードの検索、編集、プロセス管理、リモートファイルの読み取りなどの機能をサポートします。
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
Blender MCP VXAIは強力な統合ツールで、ユーザーが自然言語でBlenderを制御し、3Dモデリング、アニメーション、シーンの作成と修正を実現できます。複雑な操作を簡素化し、リアルタイムでプロジェクトにエクスポートすることをサポートします。
Express.jsをベースにしたMCPサーバーで、キーペア生成、共有キー派生、メッセージの暗号化/復号化などの暗号化ツールを提供し、SSEによるリアルタイム通信をサポートします。