バイチュンは自社開発のAIチップ「SeedChip」を加速して開発しており、今年中に少なくとも10万個を量産する予定で、主に推論タスク向けに設計されている。会社側は関連報道が正確ではないと述べたが、今年のAI購入予算はすでに1600億元を超え、その半数が英語ネイティブのチップの購入に使われており、大規模なモデルを開発する際の高い推論コストの問題を示している。
アマゾン、グーグル、Meta、マイクロソフトなどのグローバルハイテク大手がAIインフラ投資競争を激化させ、2026年までにデータセンター建設や高性能チップ調達などに計6600億ドルの資本支出を見込んでいる。....
NVIDIAはクラウドプロバイダーのCoreWeaveに追加で20億ドルを投資し、A種株式を1株あたり87.20ドルで購入。両社は「AIファクトリー」の構築で協力し、2030年までに5ギガワット以上のAI計算能力を新設する目標。新データセンターには、次世代RubinアーキテクチャチップなどNVIDIAの最新技術を統合予定。....
AIチップ設計スタートアップRicursive Intelligenceが3億ドルを調達、評価額は40億ドル。創業者は元Google研究者で、AIを用いてAIチップを自動設計する技術を中核とし、AlphaChip強化学習手法はGoogleチップ設計に応用済み。本ラウンドはLightspeedが主導し、NVIDIAベンチャーズなどが参加。....
中堅?中小規模のチーム向けに設計された AI チャットアプリで、複数のモデルを接続できます。
サンダーネットワークはスタートアップ向けのベンチャーキャピタルプラットフォームであり、創設者がリスク投資家とつながり資金調達や事業売却を計画できるように支援しています。創設者たちはこのプラットフォームを通じて12億ドル以上の資金を集めています。
AI向けに設計されたGPUクラウドプラットフォーム。高性能インフラストラクチャと24時間365日のサポートを提供します。
中小規模チーム向けに設計されたAIチャットアプリケーション。Deepseek、Open AI、Claude、Geminiなど、複数のAIモデルに対応しています。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$7
$35
$17.5
$21
$0.7
Alibaba
$1
$10
256
$4
$16
$2
$3.9
$15.2
64
Bytedance
$0.15
$1.5
Baidu
32
$10.5
Deepseek
$12
128
nvidia
Nemotron-Flash-3Bは、NVIDIAが開発した新しい混合型小型言語モデルで、実際のアプリケーションにおける低遅延のニーズに特化して設計されています。このモデルは、数学、コーディング、一般知識の推論などのタスクで卓越した性能を発揮し、小バッチでの低遅延と大バッチでの高スループットの特性を兼ね備えています。
rand0nmr
Wan2.2は基礎ビデオモデルの大幅なアップグレード版で、混合専門家(MoE)アーキテクチャを導入し、精心設計された美学データを組み込み、より多くのデータで学習させることで複雑な動きの生成能力を向上させています。このモデルは480Pと720Pの解像度の5秒間のビデオ生成をサポートし、ビデオ生成の品質と性能が大幅に向上しています。
mlx-community
IBM Granite - 4.0 - H - Tinyは、Apple Siliconチップで最適化された混合Mamba - 2/Transformerモデルで、3ビット量子化技術を採用し、長文脈、高効率推論、および企業利用向けに設計されています。このモデルはMamba - 2アーキテクチャとエキスパート混合技術を組み合わせ、表現力を維持しながらメモリ使用量を大幅に削減します。
Apriel-1.5-15B-Thinkerは、画像理解と推論のために設計された150億パラメータのマルチモーダルモデルで、中期トレーニング方法を採用し、RLHFトレーニングではありません。このバージョンはAppleチップに適したMLX量子化バージョンで、メモリ使用量が少なく、起動速度が速いという特徴があります。
Mungert
LFM2はLiquid AIによって開発された次世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイメントに特化して設計されており、品質、速度、メモリ効率の面で新しい基準を確立しています。このモデルは革新的なハイブリッドLiquidアーキテクチャを採用し、乗算ゲートと短い畳み込みを備えており、多言語処理をサポートしています。
Guilherme34
Qwen2.5-14B-Instructは140億パラメータの大規模言語モデルで、チャットとテキスト生成シーン向けに設計されています。このモデルはtransformersライブラリに基づいて構築され、内部テストと軽量アプリケーションのデプロイに適しています。
WeightedAI
ペルシア語OCRは、ペルシア語テキストに特化して設計された光学文字認識のディープラーニングモデルです。CNN+トランスフォーマーアーキテクチャを採用し、60万枚の合成ペルシア語テキスト画像を含むデータセットでトレーニングされ、シーケンスの正解率は96%に達しています。
openchs
OpenAI Whisper Large v2をCommon Voice 17.0 スワヒリ語データセットでファインチューニングした音声認識モデルで、タンザニアの子供向けヘルプラインのスワヒリ語音声認識タスクに特化して設計されています。基本モデルと比較して、スワヒリ語の認識精度が大幅に向上しています。
NVIDIA Qwen3-14B FP4モデルは、アリババのQwen3-14Bモデルの量子化バージョンで、FP4データ型を用いて最適化され、TensorRT-LLMによる効率的な推論が可能です。このモデルはNVIDIA GPU加速システム向けに設計されており、AIエージェントシステム、チャットボット、RAGシステムなどの様々なAIアプリケーションシーンに適しており、世界中での商用および非商用利用がサポートされています。
openbmb
MiniCPM4.1-8B-GGUFはMiniCPM4.1-8BモデルのGGUF量子化形式のバージョンで、エッジデバイス向けに設計された効率的な大規模言語モデルです。80億のパラメータを持ち、融合思考をサポートし、典型的なエッジチップで5倍以上の生成速度向上を実現します。
Sci-fi-vy
GPT-OSS-20BはOpenAIが開発したオープンウェイトモデルで、強力な推論、エージェントタスク、多様な開発者ユースケースに特化して設計されています。このモデルは210億のパラメータ(うち36億はアクティブなパラメータ)を持ち、ハイブリッドエキスパートアーキテクチャを採用し、低遅延のローカルデプロイと特定のシナリオでのアプリケーションをサポートしています。
stepfun-ai
Step-Audio 2は、業界レベルの音声理解と音声対話のニーズを満たすために設計されたエンドツーエンドのマルチモーダル大規模言語モデルです。高度な音声と音声理解能力、スマート音声対話機能、ツール呼び出しおよびマルチモーダル検索強化生成能力を備え、複数の音声理解と対話のベンチマークテストでトップクラスの性能を発揮しています。
Marvis-AI
Marvisは、リアルタイムストリーミングテキストを音声合成するために設計された高度な対話式音声モデルです。効率性と使いやすさを重視し、Appleチップ、iPhone、iPad、Macなどの消費者向けデバイスでの高品質なリアルタイム音声合成をサポートします。
onnx-community
Gemma 3はGoogleが開発した軽量で最先端のオープンソースのマルチモーダルモデルファミリーで、140種類以上の言語をサポートし、テキスト生成と画像理解能力を備えています。270Mパラメータバージョンはリソースが制限された環境向けに設計されており、ノートパソコンやデスクトップコンピュータなどのデバイスでデプロイできます。
prithivMLmods
MedScholar-1.5Bはコンパクトな医学質問応答モデルで、Qwen2.5-1.5B-Instructアーキテクチャに基づいており、MIRIAD-4.4Mデータセットの100万個のサンプルを使用して微調整されています。このモデルは臨床知識研究と教育探索に特化して設計されており、UnslothフレームワークとQLoRAトレーニングを採用し、厳密に非臨床の学術用途のみに使用されます。
gabriellarson
Foundation-Sec-8B-Instructは、ネットワークセキュリティアプリケーション向けに設計された80億パラメータの指令微調整言語モデルです。Llama-3.1-8Bアーキテクチャに基づいており、優れた指令追従能力とネットワークセキュリティの専門知識を備え、ローカルデプロイメントをサポートしています。これにより、組織はAIセキュリティツールを構築し、クラウドサービスへの依存を減らすことができます。
lmstudio-community
Qwen3-Coder-30B-A3B-InstructはQwenが開発した30Bパラメータ規模のコード生成モデルで、命令微調整により最適化され、プログラミングタスクに特化して設計されています。このモデルはMLXフレームワークを用いて4ビット量子化され、Appleチップに最適化されており、Macデバイスで効率的に動作します。
Qwen3アーキテクチャに基づいて構築された専門モデルで、科学、人工知能設計、一般的な推論分野に特化しています。このモデルは高難度の科学推論データセットで微調整され、優れた一般的および創造的な推論能力を備え、サイズが小さく、ローカルデバイスとサーバーへのデプロイに適しています。
unsloth
Devstral 1.1は、Mistral AIとAll Hands AIが共同開発したスマート大規模言語モデルで、ソフトウェアエンジニアリングタスク向けに設計されています。このモデルはSWE-benchベンチマークテストで優れた成績を収め、オープンソースモデルのトップにランクインしており、240億のパラメータと128kトークンの長いコンテキストウィンドウを持っています。
Arch-Agent-1.5B GGUFモデルは、高度な関数呼び出しとエージェントベースのアプリケーション向けに設計された最先端の大規模言語モデルセットで、複雑な多段階タスクを出色に処理でき、複雑なシチュエーションで卓越した性能を発揮します。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
Godot MCPは、Godotゲームエンジン用に設計されたモデルコンテキストプロトコルサーバーで、エディター制御、プロジェクト実行、デバッグ出力のキャプチャなどの機能を提供し、AIアシスタントとGodotエンジンのやり取りをサポートします。
napiはNanoAPIによって開発されたツールで、ソフトウェアアーキテクチャの複雑性を自動的に分析し、コードベースから機能モジュールを抽出することをサポートします。CLIとUIの両方の操作方法を提供し、主流のCI/CDプラットフォームと互換性があり、開発者がアーキテクチャ設計を最適化するのを支援します。
Notebook Intelligence (NBI) は、JupyterLab用に設計されたAIコーディングアシスタントおよび拡張可能なAIフレームワークで、GitHub Copilotや他のLLMプロバイダーのモデル(ローカルのOllamaモデルを含む)をサポートします。コード生成、自動補完、チャットインターフェイスなどの機能により生産性を大幅に向上させ、モデルコンテキストプロトコル(MCP)サービスの統合をサポートします。
Seitrace MCPはSeiブロックチェーン用に設計されたモデルコンテキストプロトコルサーバーで、リソース化されたインターフェースツールを提供し、アドレス、トークン、スマートコントラクトなどのブロックチェーンデータの照会をサポートし、自然言語でSeitraceの洞察データにアクセスできます。
Screeny MCP Serverは、macOS用に設計されたプライバシーを重視したスクリーンショットサービスで、AIエージェントが事前に承認されたアプリケーションウィンドウのスクリーンショットを安全にキャプチャでき、開発とデバッグタスクに視覚的コンテキストを提供します。
このプロジェクトは、MCPプロトコルに基づくサーバーで、WHOISクエリを通じてドメインの可用性をチェックするために特別に設計されており、AIアシスタントなどのツールにドメインチェック機能を統合することをサポートしています。
Claude Desktop用に設計されたMCPメモリサーバーで、チャットセッションをまたいだ構造化メモリ管理を提供し、プロジェクト作業に特化しています。
バイブチェックMCPは、AIエージェントにメタ認知的な監督を提供するサーバーです。パターン中断、計画の簡素化、および自己学習のフィードバックループにより、AIが複雑なタスクで誤ったパスに入ったり、過度に設計された解決策を選択したりするのを防ぎます。
このプロジェクトは、DevOpsツールやプラットフォーム向けに設計されたModel Context Protocol (MCP)サーバーの集合で、標準化された方法で大規模言語モデル(LLM)が主要なDevOpsシステムと直接やり取りでき、インフラストラクチャ、デプロイパイプライン、モニタリングなどの操作を自動制御できます。
Windows用に設計されたTCPプロトコルのMCPサーバーで、WSL/Linux環境からClaude Codeを使用して遠隔から.NET Frameworkプロジェクトを構築およびテストし、Windowsの構築ツールチェーンとのブリッジを提供します。
MCP Server SemgrepはModel Context Protocol標準に準拠したサーバーで、Semgrep静的分析ツールとAIアシスタントを統合し、コードのセキュリティ分析、品質向上、ホール検出機能を提供します。プロジェクトはアーキテクチャ設計を簡素化し、マルチプラットフォームでの実行をサポートし、複数の方法でインストールでき、豊富なコード分析機能を提供します。
Agentipy MCP Serverは、Claudeデスクトップ版用に設計されたモデルコンテキストプロトコルサーバーで、標準化されたインターフェースを通じてAIエージェントがSolanaブロックチェーンとやり取りできるようにし、残高照会、トランザクション実行、価格予測、クロスチェーンブリッジなど、豊富なブロックチェーンツール機能を提供します。
GLM-4.6 MCPサーバーは、企業レベルのアーキテクチャコンサルティングプロトコルブリッジサービスです。モデルコンテキストプロトコルを通じてClaude 4.5 SonnetとGLM-4.6を接続し、システム設計、拡張性パターン、技術的な意思決定のサポートを提供します。コードアーキテクチャ分析、システムアーキテクチャ設計、意思決定レビューなどの機能をサポートしています。
コンテキストエンジニアリングMCPプラットフォームは、AIコンテキストの管理と最適化プラットフォームです。体系的な方法でAIモデルの入力情報を設計、管理、最適化し、プロンプトエンジニアリングをエンジニアリング化します。プラットフォームは、インテリジェント分析エンジン、最適化アルゴリズム、テンプレート管理などの機能を提供し、AIの応答品質を大幅に向上させ、APIコストを削減し、マルチモーダルコンテンツの処理をサポートします。
Seitrace MCPはSeiブロックチェーン用に設計されたモデルコンテキストプロトコルサーバーで、リソースベースのインターフェースツールを提供し、アドレス、トークン、スマートコントラクトなどのブロックチェーンデータの照会をサポートし、自然言語でSeitraceの洞察サービスにアクセスできます。
これはCloudflare WorkersとRemix 3に基づくMCPプロトコルのデモプロジェクトで、AIチャット画面に対話型の計算機ウィジェットを埋め込む方法を示しています。プロジェクトには完全なMCPサーバーの実装、状態管理、ウィジェット通信システムが含まれており、トロンスタイルの隠しエasterが特別に設計されています。
OpenManusは招待コードなしで様々なアイデアを実現できるオープンソースプロジェクトで、MetaGPTチームのメンバーによって3時間で構築されました。これは簡単な実装を提供し、ユーザーが独自のインテリジェントエージェントを作成でき、複数の言語と設定をサポートします。このプロジェクトは提案、貢献、フィードバックを歓迎しており、将来的な計画には、より良い計画、リアルタイムデモ、再生機能、RL微調整モデル、および包括的なベンチマークテストが含まれます。
LLM CLIに基づくMCPサーバーテンプレートプロジェクトで、開発、テスト、デプロイツールを提供し、アーキテクチャ設計のフィードバックとローカルデバッグをサポートします。
FastMCP 2.0とクリーンアーキテクチャに基づく、モジュール化設計、クロスプラットフォーム対応、およびクラウドデプロイ機能を備えた、最新のiOS自動化サーバー。