アントテクは香港のフィンテックフェスティバルで、多言語マルチモーダル大規模モデルトレーニングフレームワークを発表しました。この技術により、多言語アプリケーションのボトルネックを突破しました。この技術はエジプトアラビア語など小言語を対象とし、言語感知最適化フレームワークを通じて、目的言語で「思考」するメカニズムを実現し、リソースが少ない言語のトレーニング効果を向上させました。
アップルは独自のSiri大規模モデル開発に苦戦し、グーグルと提携してGeminiをカスタマイズした言語モデルを使用してAI処理能力を向上させることにしました。新しい戦略では「エッジクラウド協働」のミックスモードを採用し、クラウドの大規模モデルの利点とローカルデータのプライバシー保護を組み合わせ、ユーザー体験を最適化し、複雑なタスクの弱点を解決することを目指しています。
マイクロソフトAzure ND GB300v6仮想マシンがLlama270Bモデルで110万トークン/秒の推論速度を達成。NVIDIA GB300NVL72システム(72個Blackwell Ultra GPU+36個Grace CPU)を採用し、大規模AI処理における技術力を示した。....
現代自動車とNVIDIAは協力関係を深化させ、Blackwellアーキテクチャに基づくAI工場を共同で建設しています。両社はCESで自律走行やスマート工場、ロボット技術の開発プロジェクトを発表し、韓国政府の支援を受け、2025年のAPEC韓国会議で詳細を説明する予定です。
高品質な動画を1クリックで生成し、クリエイティブを簡単に実現。
AIスマート脚本ツールで、劇本作成効率を10倍向上させます。
AIによる自動メール返信作成機能。GmailとOutlookに対応。毎日2時間以上の時間を節約できます。
複数のAIモデルを統合し、対話を通じて画像、ビデオ、音声を生成し、クリエイティブプロセスを最適化します。
xai
$21.6
入力トークン/百万
$108
出力トークン/百万
256k
コンテキスト長
openai
$144
$576
200k
google
$9
$72
1M
$14.4
$57.6
$7.92
$31.68
deepseek
$3.6
$15.48
128k
400k
$2.16
$18
anthropic
$540
chatglm
$4.03
$7.99
$0.43
$1.01
131.1k
minimax
-
alibaba
$0.72
$432
bartowski
Apollo-V0.1-4B-Thinkingは40億パラメータの大規模言語モデルで、思考過程の推論アーキテクチャを採用し、推論タスクに特化して最適化されています。このモデルは複数の量子化バージョンを提供し、さまざまなハードウェア環境で効率的に動作します。
noctrex
これはQwen3-VL-30Bに基づく量子化バージョンのモデルで、画像テキストからテキストへの変換タスクに特化しています。このモデルは量子化技術を通じて元のモデルを最適化し、より効率的な推論ソリューションを提供します。
これはMistralアーキテクチャに基づく画像テキストをテキストに変換する量子化モデルで、パラメータ規模は24Bで、指令追従タスクに特化して最適化訓練され、マルチモーダル入力処理をサポートしています。
unsloth
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、そして優れたインテリジェントエージェント対話能力を備えています。
これは慧慧Qwen3-VL-8B思考消去モデルの量子化バージョンで、Qwen3-VL-8Bアーキテクチャに基づいて、画像テキスト変換タスクに特化して最適化および量子化処理が行われ、llama.cppツールを通じて効率的に実行できます。
慧慧Qwen3-VL-8B指令アブレーションモデルの量子化バージョンで、画像テキストからテキストへの変換タスクに特化しています。このモデルはQwen3-VL-8Bアーキテクチャに基づいており、指令アブレーション最適化と量子化処理を行っており、性能を維持しながら計算リソースの要求を低減できます。
慧慧Qwen3-VL-4B思考消除モデルの量子化バージョンで、Qwen3-VL-4Bモデルをベースに最適化されており、思考チェーン推論プロセスを排除するように特別に設計されています。最新のllama.cppと組み合わせて使用でき、効率的な画像テキストからテキストへの処理能力を提供します。
これはHuihui-Qwen3-VL-4B-Instruct-abliteratedモデルに基づく量子化バージョンで、画像テキストからテキストへの変換タスクに特化しており、量子化処理によってモデルの性能が最適化され、マルチモーダルアプリケーションをサポートします。
Qwen3-VL-32B-ThinkingはQwenシリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長文脈処理、空間および動画の動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VL-8B-Thinkingは通義千問シリーズで最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェント対話能力を備えています。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、包括的な総合アップグレードが実現されています。これには、卓越したテキスト理解と生成能力、より深いビジュアル感知と推論能力、より長いコンテキスト長、強化された空間およびビデオ動的理解能力、そしてより強力なエージェント対話能力が含まれます。
catalystsec
このプロジェクトでは、MiniMax - M2モデルを4ビット量子化処理し、DWQ(動的重み量子化)方法を使用し、mlx - lmライブラリを介して達成します。このモデルはMiniMax - M2の軽量化バージョンで、良好な性能を維持しながらモデルサイズを大幅に削減します。
MiniMax-M2は、コーディングとエージェントのワークフローを最大化するために構築された小型の混合専門家モデルで、総パラメータは2300億、活性化パラメータは100億です。このモデルは、コーディングとエージェントタスクで卓越した性能を発揮し、同時に強力な汎用知能を維持し、コンパクトで高速かつ経済的に効率的な特徴を持っています。
dinhthuan
NeuTTS - Airベトナム語テキストを音声に変換するモデルは、260万以上のベトナム語オーディオサンプルに基づき、NeuTTS - Air基礎モデルから微調整された高品質のベトナム語音声合成モデルです。このモデルは、自然で流暢なベトナム語音声合成を実現でき、音声クローニング機能をサポートし、生産環境に合わせて最適化されています。
mitegvg
このモデルはVideoMAEアーキテクチャに基づく暴力検出モデルで、Kineticsデータセットで事前学習した後、暴力検出タスクに対して92エポックの微調整を行っています。モデルはVision Transformerアーキテクチャを採用し、ビデオコンテンツ分析に特化しており、ビデオ内の暴力行為を識別することができます。
peteromallet
QwenEdit InScene LoRAsは、QwenEditを微調整したモデルグループで、シーン参照に基づく画像生成能力の強化に特化しています。InSceneメインモデルとInScene Annotateの2つのコンポーネントを含み、キャラクターの一貫性とシーンの連続性を維持しながら、新しいシーンレンズを作成することができます。
mlx-community
これはKimi-Linear-48B-A3B-Instructモデルを変換した6ビット量子化バージョンで、Apple MLXフレームワーク用に最適化されています。このモデルは元のモデルの強力な指令追従能力を保持しながら、量子化技術により格納と計算の要件を大幅に削減し、Appleハードウェアで効率的に動作するのに適しています。
Gelato-30B-A3Bは、GUIコンピュータ使用タスクに対して微調整された最先端(SOTA)モデルで、デプロイ効率を最適化するために量子化バージョンを提供しています。このモデルは、グラフィカルユーザーインターフェース関連のタスクを理解して処理するように特別に設計されています。
Chandra-OCR量子化モデルは、元のChandraモデルを量子化処理したバージョンで、画像をテキストに変換するタスクに特化しており、最新のllama.cppと併用できます。
ycngin2024
これは微調整されたWhisper音声認識モデルで、unsloth/whisper-large-v3-turboアーキテクチャに基づいており、UnslothとHuggingface TRLライブラリを使用して訓練速度を2倍に加速し、訓練効率を大幅に向上させています。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
MCP GoはGo言語で実装されたモデルコンテキストプロトコル(MCP)サーバーフレームワークで、LLMアプリケーションと外部データソースやツールを接続するために使用されます。リソース管理、ツール呼び出し、プロンプトテンプレートなどの核心機能を提供し、セッション管理とミドルウェア拡張をサポートしています。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
Supabase MCPサーバーはオープンソースのツールで、IDEが安全にSQLを実行し、スキーマ変更を管理し、Supabase管理APIを呼び出し、Auth Admin SDKを使用できるようにします。組み込みのセキュリティ制御があります。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
sitemcpは、ウェブサイト全体の内容を取得し、それをMCPサーバーとして使用できるツールで、カスタムマッチングページ、コンテンツセレクターなどの機能をサポートし、ドキュメントやブログサイトの迅速な検索に適しています。
SupermemoryはAI駆動の記憶エンジンで、個人データを統合することでLLMにコンテキスト知識を提供し、情報のスマートな管理と検索を実現します。
Unreal Engine のモデルコンテキストプロトコル (MCP) の統合に関するドキュメントで、MCP システムの理解、設定、使用を支援します。
Kubernetesに基づくMCPサーバーで、Kubernetesクラスターの管理および操作に使用します
Claude/Cursor用に設計されたOpenAPI仕様探索サーバーで、3ステップのプロセスでユーザーがAPIドキュメントを検索し理解するのを支援します。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
Solana Agent Kitは、AIエージェントをSolanaプロトコルに接続するためのオープンソースツールキットで、60種類以上のブロックチェーン操作をサポートします。
各wikiファイルは、そのパスに対応する追加リソース(画像など)を`.resource`ディレクトリに保存し、git lfsを使用してバージョン管理する必要があります。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
ElevenLabs公式のMCPサーバーで、テキストを音声に変換し、音声処理APIとのやり取りが可能です。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
スーパーゲートウェイは、標準入出力ベースのMCPサーバーをSSEまたはWebSocketを通じてアクセス可能なサービスに変換するツールです。リモートデバッグと統合を容易にします。
Scraplingは適応型ウェブページのスクレイピングライブラリで、ウェブサイトの変化を自動的に学習し、要素を再配置します。複数のスクレイピング方法とAI統合をサポートし、高性能な解析と開発者に優しい体験を提供します。
このプロジェクトは、ObsidianのLocal REST APIプラグインを通じてObsidianノートアプリとやり取りするMCPサーバーです。Obsidian内のファイルを操作および管理するためのさまざまなツールを提供し、ファイルのリスト表示、内容の取得、検索、内容の変更、ファイルの削除などが可能です。