Gemini Liveの音声機能が5つの革新を実現:応答速度の調整、感情表現、アクセント切替、アクセシビリティ向上、マルチモーダル連携。AI音声が「擬人化2.0」段階へ進化し、ChatGPT音声モードに対する優位性を確立。....
2025年世界大会で、百度の沈抖執行副社長が新世代KunlunチップM100、M300と天池256、512スーパーノードを発表。今後5年間、毎年新製品を投入し、高性能コンピューティングクラウド基盤を強化、企業顧客を支援する戦略を明らかにした。....
バイトダンスの研究員が機密情報を複数回漏洩し解雇。8万人のフォロワーを持つZhihuで内部開発情報を頻繁に公開し、社内調査を招く。過度な情報共有がキャリア危機に繋がった。....
ElevenLabsが俳優マイケル・ケインとマシュー・マコノヒーの声をAIで生成し、ハリウッドとAIの関係について新たな議論を引き起こした。業界は規制懸念からストライキも発生したが、一部アーティストはAIの応用可能性を探り始めている。....
強力なDiscord AIボットで、コミュニティの活性化とユーザー満足度を向上させます。
WPTグローバルAIポーカーアシスタントで、リアルタイムの洞察と戦略提案を提供し、教育学習に役立ちます。
gambo AIはユーザーの接続セキュリティを検証する必要があり、JavaScriptとクッキーを有効にして続行する必要があります。
専門的なAI画像および動画生成プラットフォームで、さまざまなAIツールを使用して印象的で視覚的に美しい効果を生み出します。
xai
$21.6
入力トークン/百万
$108
出力トークン/百万
256k
コンテキスト長
openai
$144
$576
200k
google
$9
$72
1M
$14.4
$57.6
$7.92
$31.68
deepseek
$3.6
$15.48
128k
400k
$2.16
$18
anthropic
$540
chatglm
$4.03
$7.99
$0.43
$1.01
131.1k
minimax
-
alibaba
$0.72
$432
Shawon16
これはVideoMAE-Baseアーキテクチャに基づいてWLASLデータセットで微調整された動画動作認識モデルです。200エポックの訓練を経て、評価セットで52.96%のトップ1精度と79.88%のトップ5精度を達成し、手話動作認識タスクに特化しています。
Ali-Yaser
このモデルはmeta-llama/Llama-3.3-70B-Instructをベースに微調整したバージョンで、mlabonne/FineTome-100kデータセットを使用してトレーニングされ、100kトークンのデータを含んでいます。モデルはUnslothとHuggingface TRLライブラリを使用して微調整され、英語の言語処理をサポートしています。
DevQuasar
このプロジェクトは moonshotai/Kimi-K2-Thinking ベースモデルに基づいて、カスタム逆量子化スクリプトを使用して元のINT4モデルをより高品質のテキスト生成モデルに変換し、知識をすべての人に利用可能にすることを目指しています。
Mungert
aquif-3.5シリーズのトップモデルで、高度な推論能力と100万トークンの大規模コンテキストウィンドウを備え、複数のベンチマークテストで卓越した性能を発揮し、AAII総合スコアが60点に達します。
Leohan
MLXライブラリに基づいて開発されたテキスト生成モデルで、自然言語処理タスクに特化し、開発者に効率的なテキスト生成ソリューションを提供します。
inferencerlabs
MLXライブラリに基づいて実装されたテキスト生成モデルで、複数の量子化方式による推論をサポートし、分散計算能力を備え、Appleのハードウェア環境で効率的に動作します。
renderartist
Technically Color WAN 2.2は、クラシック映画スタイルの画像生成用に特別に設計されたLoRAモデルです。鮮やかなパレット、豊かな彩度、劇的な照明効果により、生成される画像にクラシック映画特有の視覚的魅力を与えます。
mlx-community
Kimi-K2-Thinkingは、mlx-communityによってmoonshotaiのオリジナルモデルからMLX形式に変換された大規模言語モデルです。mlx-lm 0.28.4バージョンを使用して変換され、元のモデルの思考過程推論能力が保持されています。
DavidAU
これは、Qwen3-VL-8B-Thinkingモデルをベースにした強化版のマルチモーダルビジュアル言語モデルです。Brainstorm 20x技術を用いて12Bパラメータに拡張され、NEO Imatrixで強化されたGGUF量子化が適用されています。このモデルは、画像理解、テキスト生成、マルチモーダル推論の能力が強く、ビジュアル感知、テキスト品質、クリエイティブなシーンでの性能が著しく向上しています。
AbstractPhil
MM - VAE Lyraは、テキスト埋め込み変換に特化したマルチモーダル変分自己符号化器で、幾何学的融合技術を採用しています。CLIP - LとT5 - baseモデルを組み合わせ、テキスト埋め込みの符号化と復号化タスクを効果的に処理でき、マルチモーダルデータ処理に革新的な解決策を提供します。
geoffmunn
これはQwen/Qwen3-Coder-30B-A3B-Instruct言語モデルのGGUF量子化バージョンで、コード生成とプログラミングタスクに特化して最適化されており、FP32精度で変換され、ローカル推論デプロイに適しています。
Marvis-AI
これはMLXフレームワークに基づいて最適化されたテキスト音声変換モデルで、元のモデルMarvis-AI/marvis-tts-100m-v0.2から変換され、6ビット量子化技術を採用し、Apple Siliconハードウェア用に特別に最適化され、効率的な音声合成能力を提供します。
noctrex
これはMiniMax-M2-THRIFTモデルのMXFP4_MOE量子化バージョンで、元のモデルに基づいて圧縮処理が行われており、25%のエキスパート枝刈り(256から192)が行われ、top_k=8に設定されています。同時に、エンコーディングモデルの特性が保持されており、テキスト生成タスクに使用できます。
JetBrains-Research
これはHugging Face Hubに公開されている🤗 Transformersモデルです。具体的な情報はモデルページから取得する必要があります。このモデルはTransformerアーキテクチャに基づいており、様々な自然言語処理タスクに適しています。
unsloth
aquif-3.5シリーズは2025年11月3日にリリースされた傑作で、PlusとMaxの2つのバージョンがあり、高度な推論能力とこれまでにない100万トークンのコンテキストウィンドウを提供し、それぞれのカテゴリで最先端の性能を実現しています。
これはMoonshot AI技術に基づく量子化バージョンのモデルで、ビジュアル言語の理解と生成タスクに特化しており、知識の取得障壁を低くし、知識を誰もが利用できるようにすることを目指しています。
cemoss17
nutrient-gram-qwen-3-vl-2bはQwen/Qwen3-VL-2B-Instructをベースにした微調整バージョンで、TRLを使用して教師付き微調整トレーニングを行い、主にテキスト生成タスクに使用されます。このモデルは元のマルチモーダル能力を維持したまま、特定のタスクに合わせて最適化されています。
mradermacher
UME-R1-7Bの静的量子化バージョンで、文の類似度、埋め込み、ゼロショット画像分類、ビデオテキストからテキストへの変換などの複数のタスクをサポートします。軽量なQ2_Kから高品質なQ8_0まで、さまざまな量子化タイプを提供し、さまざまなニーズに対応します。
Qwen3-Coder-REAP-363B-A35Bは、REAP手法を用いてQwen3-Coder-480B-A35B-Instructを25%のエキスパート剪定を行った疎な混合エキスパートモデルです。元のモデルに近い性能を維持しながら、パラメータ規模とメモリ要件を大幅に削減し、特にリソースが制限されたコード生成とスマートコーディングのシナリオに適しています。
samwell
NV-Reason-CXR-3B GGUFはNVIDIA NV-Reason-CXR-3Bビジュアル言語モデルの量子化バージョンで、エッジデバイスへのデプロイに最適化されています。これは30億パラメータのモデルで、胸部X線分析に特化しており、GGUF形式に変換され、量子化処理が施されているため、モバイルデバイス、デスクトップデバイス、組み込みシステムで効率的に動作します。
sitemcpは、ウェブサイト全体の内容を取得し、それをMCPサーバーとして使用できるツールで、カスタムマッチングページ、コンテンツセレクターなどの機能をサポートし、ドキュメントやブログサイトの迅速な検索に適しています。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
SupermemoryはAI駆動の記憶エンジンで、個人データを統合することでLLMにコンテキスト知識を提供し、情報のスマートな管理と検索を実現します。
Supabase MCPサーバーはオープンソースのツールで、IDEが安全にSQLを実行し、スキーマ変更を管理し、Supabase管理APIを呼び出し、Auth Admin SDKを使用できるようにします。組み込みのセキュリティ制御があります。
Unreal Engine のモデルコンテキストプロトコル (MCP) の統合に関するドキュメントで、MCP システムの理解、設定、使用を支援します。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
MCP GoはGo言語で実装されたモデルコンテキストプロトコル(MCP)サーバーフレームワークで、LLMアプリケーションと外部データソースやツールを接続するために使用されます。リソース管理、ツール呼び出し、プロンプトテンプレートなどの核心機能を提供し、セッション管理とミドルウェア拡張をサポートしています。
各wikiファイルは、そのパスに対応する追加リソース(画像など)を`.resource`ディレクトリに保存し、git lfsを使用してバージョン管理する必要があります。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
Claude/Cursor用に設計されたOpenAPI仕様探索サーバーで、3ステップのプロセスでユーザーがAPIドキュメントを検索し理解するのを支援します。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
Kubernetesに基づくMCPサーバーで、Kubernetesクラスターの管理および操作に使用します
ElevenLabs公式のMCPサーバーで、テキストを音声に変換し、音声処理APIとのやり取りが可能です。
Solana Agent Kitは、AIエージェントをSolanaプロトコルに接続するためのオープンソースツールキットで、60種類以上のブロックチェーン操作をサポートします。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
MCPプロトコルに基づくKubernetesクラスター管理サーバーで、コマンドラインまたはチャットインターフェイスを通じてKubernetesクラスターとやり取りでき、リソース管理、Helmチャート操作などの機能を提供します。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
WhatsApp MCPサーバーは、WhatsAppのウェブマルチデバイスAPIを通じて個人アカウントを接続するツールです。メッセージの検索、送信、マルチメディア処理をサポートし、ClaudeなどのLLMと統合されます。