ビーチュートーク傘下のドウバオAIメガネが量産段階に入り、間もなく発売される。製品にはドウバオアプリが必要で、軽量設計、強力なAIインタラクション、スマートフォンとの深い連携を特徴とする。価格は約2000元未満と予想され、2026年の高パフォーマンスで低価格な消費者向けAIメガネとなる可能性がある。
バイトダンス傘下の「豆包」AIメガネが出荷準備段階に入り、受注数は100万台に達した。龍旗科技との共同開発で、軽量設計(50g未満)と独自開発の空間アルゴリズムチップを搭載。....
アマゾンCEOアンディ・ジャシーは、AWSのベテラン幹部ピーター・デサンティスを新AI組織の責任者に任命し、大規模言語モデル、自社開発チップ、量子コンピューティングの3分野を統括すると発表。デサンティスは27年在籍し、AWS上級副社長として世界のインターネットトラフィック約3分の1を支えるクラウド基盤を担当した。....
NVIDIAがNemotron 3シリーズを発表。MambaとTransformerを融合したアーキテクチャで、長文コンテキストを効率的に処理し、リソース消費を削減。複雑なタスクを自律実行するAIエージェント向けに設計され、Nano、Super、Ultraの3モデルをラインアップ。Nanoは現在発売中、SuperとUltraは2026年前半の発売予定。....
中堅?中小規模のチーム向けに設計された AI チャットアプリで、複数のモデルを接続できます。
サンダーネットワークはスタートアップ向けのベンチャーキャピタルプラットフォームであり、創設者がリスク投資家とつながり資金調達や事業売却を計画できるように支援しています。創設者たちはこのプラットフォームを通じて12億ドル以上の資金を集めています。
AI向けに設計されたGPUクラウドプラットフォーム。高性能インフラストラクチャと24時間365日のサポートを提供します。
中小規模チーム向けに設計されたAIチャットアプリケーション。Deepseek、Open AI、Claude、Geminiなど、複数のAIモデルに対応しています。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$7
$35
$17.5
$21
$0.7
Alibaba
$1
$10
256
$4
$16
$2
$3.9
$15.2
64
Bytedance
$0.15
$1.5
Baidu
32
$10.5
Deepseek
$12
128
nvidia
Nemotron-Flash-3Bは、NVIDIAが開発した新しい混合型小型言語モデルで、実際のアプリケーションにおける低遅延のニーズに特化して設計されています。このモデルは、数学、コーディング、一般知識の推論などのタスクで卓越した性能を発揮し、小バッチでの低遅延と大バッチでの高スループットの特性を兼ね備えています。
rand0nmr
Wan2.2は基礎ビデオモデルの大幅なアップグレード版で、混合専門家(MoE)アーキテクチャを導入し、精心設計された美学データを組み込み、より多くのデータで学習させることで複雑な動きの生成能力を向上させています。このモデルは480Pと720Pの解像度の5秒間のビデオ生成をサポートし、ビデオ生成の品質と性能が大幅に向上しています。
mlx-community
IBM Granite - 4.0 - H - Tinyは、Apple Siliconチップで最適化された混合Mamba - 2/Transformerモデルで、3ビット量子化技術を採用し、長文脈、高効率推論、および企業利用向けに設計されています。このモデルはMamba - 2アーキテクチャとエキスパート混合技術を組み合わせ、表現力を維持しながらメモリ使用量を大幅に削減します。
Apriel-1.5-15B-Thinkerは、画像理解と推論のために設計された150億パラメータのマルチモーダルモデルで、中期トレーニング方法を採用し、RLHFトレーニングではありません。このバージョンはAppleチップに適したMLX量子化バージョンで、メモリ使用量が少なく、起動速度が速いという特徴があります。
Mungert
LFM2はLiquid AIによって開発された次世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイメントに特化して設計されており、品質、速度、メモリ効率の面で新しい基準を確立しています。このモデルは革新的なハイブリッドLiquidアーキテクチャを採用し、乗算ゲートと短い畳み込みを備えており、多言語処理をサポートしています。
Guilherme34
Qwen2.5-14B-Instructは140億パラメータの大規模言語モデルで、チャットとテキスト生成シーン向けに設計されています。このモデルはtransformersライブラリに基づいて構築され、内部テストと軽量アプリケーションのデプロイに適しています。
WeightedAI
ペルシア語OCRは、ペルシア語テキストに特化して設計された光学文字認識のディープラーニングモデルです。CNN+トランスフォーマーアーキテクチャを採用し、60万枚の合成ペルシア語テキスト画像を含むデータセットでトレーニングされ、シーケンスの正解率は96%に達しています。
openchs
OpenAI Whisper Large v2をCommon Voice 17.0 スワヒリ語データセットでファインチューニングした音声認識モデルで、タンザニアの子供向けヘルプラインのスワヒリ語音声認識タスクに特化して設計されています。基本モデルと比較して、スワヒリ語の認識精度が大幅に向上しています。
NVIDIA Qwen3-14B FP4モデルは、アリババのQwen3-14Bモデルの量子化バージョンで、FP4データ型を用いて最適化され、TensorRT-LLMによる効率的な推論が可能です。このモデルはNVIDIA GPU加速システム向けに設計されており、AIエージェントシステム、チャットボット、RAGシステムなどの様々なAIアプリケーションシーンに適しており、世界中での商用および非商用利用がサポートされています。
openbmb
MiniCPM4.1-8B-GGUFはMiniCPM4.1-8BモデルのGGUF量子化形式のバージョンで、エッジデバイス向けに設計された効率的な大規模言語モデルです。80億のパラメータを持ち、融合思考をサポートし、典型的なエッジチップで5倍以上の生成速度向上を実現します。
Sci-fi-vy
GPT-OSS-20BはOpenAIが開発したオープンウェイトモデルで、強力な推論、エージェントタスク、多様な開発者ユースケースに特化して設計されています。このモデルは210億のパラメータ(うち36億はアクティブなパラメータ)を持ち、ハイブリッドエキスパートアーキテクチャを採用し、低遅延のローカルデプロイと特定のシナリオでのアプリケーションをサポートしています。
stepfun-ai
Step-Audio 2は、業界レベルの音声理解と音声対話のニーズを満たすために設計されたエンドツーエンドのマルチモーダル大規模言語モデルです。高度な音声と音声理解能力、スマート音声対話機能、ツール呼び出しおよびマルチモーダル検索強化生成能力を備え、複数の音声理解と対話のベンチマークテストでトップクラスの性能を発揮しています。
Marvis-AI
Marvisは、リアルタイムストリーミングテキストを音声合成するために設計された高度な対話式音声モデルです。効率性と使いやすさを重視し、Appleチップ、iPhone、iPad、Macなどの消費者向けデバイスでの高品質なリアルタイム音声合成をサポートします。
onnx-community
Gemma 3はGoogleが開発した軽量で最先端のオープンソースのマルチモーダルモデルファミリーで、140種類以上の言語をサポートし、テキスト生成と画像理解能力を備えています。270Mパラメータバージョンはリソースが制限された環境向けに設計されており、ノートパソコンやデスクトップコンピュータなどのデバイスでデプロイできます。
prithivMLmods
MedScholar-1.5Bはコンパクトな医学質問応答モデルで、Qwen2.5-1.5B-Instructアーキテクチャに基づいており、MIRIAD-4.4Mデータセットの100万個のサンプルを使用して微調整されています。このモデルは臨床知識研究と教育探索に特化して設計されており、UnslothフレームワークとQLoRAトレーニングを採用し、厳密に非臨床の学術用途のみに使用されます。
gabriellarson
Foundation-Sec-8B-Instructは、ネットワークセキュリティアプリケーション向けに設計された80億パラメータの指令微調整言語モデルです。Llama-3.1-8Bアーキテクチャに基づいており、優れた指令追従能力とネットワークセキュリティの専門知識を備え、ローカルデプロイメントをサポートしています。これにより、組織はAIセキュリティツールを構築し、クラウドサービスへの依存を減らすことができます。
lmstudio-community
Qwen3-Coder-30B-A3B-InstructはQwenが開発した30Bパラメータ規模のコード生成モデルで、命令微調整により最適化され、プログラミングタスクに特化して設計されています。このモデルはMLXフレームワークを用いて4ビット量子化され、Appleチップに最適化されており、Macデバイスで効率的に動作します。
Qwen3アーキテクチャに基づいて構築された専門モデルで、科学、人工知能設計、一般的な推論分野に特化しています。このモデルは高難度の科学推論データセットで微調整され、優れた一般的および創造的な推論能力を備え、サイズが小さく、ローカルデバイスとサーバーへのデプロイに適しています。
unsloth
Devstral 1.1は、Mistral AIとAll Hands AIが共同開発したスマート大規模言語モデルで、ソフトウェアエンジニアリングタスク向けに設計されています。このモデルはSWE-benchベンチマークテストで優れた成績を収め、オープンソースモデルのトップにランクインしており、240億のパラメータと128kトークンの長いコンテキストウィンドウを持っています。
Arch-Agent-1.5B GGUFモデルは、高度な関数呼び出しとエージェントベースのアプリケーション向けに設計された最先端の大規模言語モデルセットで、複雑な多段階タスクを出色に処理でき、複雑なシチュエーションで卓越した性能を発揮します。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
Godot MCPは、Godotゲームエンジン用に設計されたモデルコンテキストプロトコルサーバーで、エディター制御、プロジェクト実行、デバッグ出力のキャプチャなどの機能を提供し、AIアシスタントとGodotエンジンのやり取りをサポートします。
napiはNanoAPIによって開発されたツールで、ソフトウェアアーキテクチャの複雑性を自動的に分析し、コードベースから機能モジュールを抽出することをサポートします。CLIとUIの両方の操作方法を提供し、主流のCI/CDプラットフォームと互換性があり、開発者がアーキテクチャ設計を最適化するのを支援します。
Notebook Intelligence (NBI) は、JupyterLab用に設計されたAIコーディングアシスタントおよび拡張可能なAIフレームワークで、GitHub Copilotや他のLLMプロバイダーのモデル(ローカルのOllamaモデルを含む)をサポートします。コード生成、自動補完、チャットインターフェイスなどの機能により生産性を大幅に向上させ、モデルコンテキストプロトコル(MCP)サービスの統合をサポートします。
Claude Desktop用に設計されたMCPメモリサーバーで、チャットセッションをまたいだ構造化メモリ管理を提供し、プロジェクト作業に特化しています。
Screeny MCP Serverは、macOS用に設計されたプライバシーを重視したスクリーンショットサービスで、AIエージェントが事前に承認されたアプリケーションウィンドウのスクリーンショットを安全にキャプチャでき、開発とデバッグタスクに視覚的コンテキストを提供します。
Seitrace MCPはSeiブロックチェーン用に設計されたモデルコンテキストプロトコルサーバーで、リソース化されたインターフェースツールを提供し、アドレス、トークン、スマートコントラクトなどのブロックチェーンデータの照会をサポートし、自然言語でSeitraceの洞察データにアクセスできます。
このプロジェクトは、MCPプロトコルに基づくサーバーで、WHOISクエリを通じてドメインの可用性をチェックするために特別に設計されており、AIアシスタントなどのツールにドメインチェック機能を統合することをサポートしています。
バイブチェックMCPは、AIエージェントにメタ認知的な監督を提供するサーバーです。パターン中断、計画の簡素化、および自己学習のフィードバックループにより、AIが複雑なタスクで誤ったパスに入ったり、過度に設計された解決策を選択したりするのを防ぎます。
MCP Server SemgrepはModel Context Protocol標準に準拠したサーバーで、Semgrep静的分析ツールとAIアシスタントを統合し、コードのセキュリティ分析、品質向上、ホール検出機能を提供します。プロジェクトはアーキテクチャ設計を簡素化し、マルチプラットフォームでの実行をサポートし、複数の方法でインストールでき、豊富なコード分析機能を提供します。
このプロジェクトは、DevOpsツールやプラットフォーム向けに設計されたModel Context Protocol (MCP)サーバーの集合で、標準化された方法で大規模言語モデル(LLM)が主要なDevOpsシステムと直接やり取りでき、インフラストラクチャ、デプロイパイプライン、モニタリングなどの操作を自動制御できます。
Windows用に設計されたTCPプロトコルのMCPサーバーで、WSL/Linux環境からClaude Codeを使用して遠隔から.NET Frameworkプロジェクトを構築およびテストし、Windowsの構築ツールチェーンとのブリッジを提供します。
Agentipy MCP Serverは、Claudeデスクトップ版用に設計されたモデルコンテキストプロトコルサーバーで、標準化されたインターフェースを通じてAIエージェントがSolanaブロックチェーンとやり取りできるようにし、残高照会、トランザクション実行、価格予測、クロスチェーンブリッジなど、豊富なブロックチェーンツール機能を提供します。
GLM-4.6 MCPサーバーは、企業レベルのアーキテクチャコンサルティングプロトコルブリッジサービスです。モデルコンテキストプロトコルを通じてClaude 4.5 SonnetとGLM-4.6を接続し、システム設計、拡張性パターン、技術的な意思決定のサポートを提供します。コードアーキテクチャ分析、システムアーキテクチャ設計、意思決定レビューなどの機能をサポートしています。
コンテキストエンジニアリングMCPプラットフォームは、AIコンテキストの管理と最適化プラットフォームです。体系的な方法でAIモデルの入力情報を設計、管理、最適化し、プロンプトエンジニアリングをエンジニアリング化します。プラットフォームは、インテリジェント分析エンジン、最適化アルゴリズム、テンプレート管理などの機能を提供し、AIの応答品質を大幅に向上させ、APIコストを削減し、マルチモーダルコンテンツの処理をサポートします。
これはCloudflare WorkersとRemix 3に基づくMCPプロトコルのデモプロジェクトで、AIチャット画面に対話型の計算機ウィジェットを埋め込む方法を示しています。プロジェクトには完全なMCPサーバーの実装、状態管理、ウィジェット通信システムが含まれており、トロンスタイルの隠しエasterが特別に設計されています。
Seitrace MCPはSeiブロックチェーン用に設計されたモデルコンテキストプロトコルサーバーで、リソースベースのインターフェースツールを提供し、アドレス、トークン、スマートコントラクトなどのブロックチェーンデータの照会をサポートし、自然言語でSeitraceの洞察サービスにアクセスできます。
OpenManusは招待コードなしで様々なアイデアを実現できるオープンソースプロジェクトで、MetaGPTチームのメンバーによって3時間で構築されました。これは簡単な実装を提供し、ユーザーが独自のインテリジェントエージェントを作成でき、複数の言語と設定をサポートします。このプロジェクトは提案、貢献、フィードバックを歓迎しており、将来的な計画には、より良い計画、リアルタイムデモ、再生機能、RL微調整モデル、および包括的なベンチマークテストが含まれます。
LLM CLIに基づくMCPサーバーテンプレートプロジェクトで、開発、テスト、デプロイツールを提供し、アーキテクチャ設計のフィードバックとローカルデバッグをサポートします。
FastMCP 2.0とクリーンアーキテクチャに基づく、モジュール化設計、クロスプラットフォーム対応、およびクラウドデプロイ機能を備えた、最新のiOS自動化サーバー。