百度智能雲の千帆大モデルプラットフォームは、2026年6月25日に「Coding Plan」のAIコード作成サブスクリプションサービスの継続購入を終了する。この製品はリリースから4か月で提供終了となる。かつては複数モデル駆動を強調し、GLM-4.7などの主要モデルへのワンクリック切り替えをサポートし、Cursorなどのプログラミングツールと深い互換性を備えていた。今回の継続購入の停止は、重要な戦略的転換を示している。
钉钉の企業向けAIプラットフォーム「悟空」が、世界初のAI管理システム国際規格ISO/IEC 42001:2023を取得。AI安全・コンプライアンスで業界ベンチマークとなり、企業のデジタル変革に指針を提供。....
【AI日報】へようこそ!ここは毎日人工知能の世界を探求するための番組です。毎日、AI分野の注目すべきニュースを紹介し、開発者に焦点を当て、技術のトレンドや革新的なAI製品の応用について理解を深めるお手伝いをいたします。新しいAI製品についてはクリックしてご覧ください:https://app.aibase.com/zh1、アップルのXcode26.6が正式リリースされ、プログラミングアシスタントにグーグルGeminiという強力な協力者が登場しました。アップル社はXcode26.6の更新を正式に配信しました。GoogleGemのサポートが追加されました。
「メイドゥー小店がAI」行動の初のオフライン体験会が北京で開催され、中小商家のデジタル化アップグレードの段階に入ったことを示しました。専門のエリアがリリースされ、全国の百万の飲食小規模店向けに無料のAI経営カリキュラムが開放されました。小規模飲食の運営コストが高い、意思決定が難しいなどの課題に対し、メイドゥーは「AI小管家」などのAIツールのセットを導入し、コスト削減と効率向上を支援します。
オフラインでRICSレポートを生成できる原生の湿度と木材調査アプリ、露点を計算し、関連するケースをAIで記録
あらゆる建築とインテリア/アウトリアのデザインに使える総合的なAIプラットフォーム。高品質なデザインイメージと3Dフロアプランを秒単位で生成。
Phiniteは複数のスマートエージェントを備えたAIシステムインフラストラクチャープラットフォームで、企業がクロウド間でAI労働力を設計、ガバナンスおよび拡張するのを支援します。
Bloomeは多エージェント協働用のIMプラットフォームで、AIエージェントを追加して協働し成果を出すことができます。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$4
$16
$2
$20
PrimeIntellect
INTELLECT-3は1060億のパラメータを持つ混合専門家(MoE)モデルで、大規模な強化学習によって訓練されています。数学、コーディング、推論のベンチマークテストで卓越した性能を発揮し、モデル、訓練フレームワーク、環境はすべて緩やかなライセンス契約でオープンソース化されています。
MuXodious
Gemma 3n E4B ITは、Googleが開発した軽量マルチモーダルオープンモデルで、Geminiモデルと同じ研究に基づいて構築されています。このモデルは、テキスト、オーディオ、ビジュアル入力をサポートし、様々なタスクに適用できます。MatFormerアーキテクチャを採用して、効率的なパラメータ利用を実現しています。
ExaltedSlayer
Gemma 3はGoogleが開発した軽量オープンソースのマルチモーダルモデルです。このバージョンは12Bパラメータの命令調整量子化感知トレーニングモデルで、MLXフレームワークのMXFP4形式に変換されています。テキストと画像の入力をサポートし、テキスト出力を生成します。128Kのコンテキストウィンドウと140種類以上の言語をサポートしています。
Justin331
SAM 3はMetaが発表した第3世代のプロンプト可能な分割基礎モデルで、画像とビデオの分割タスクを統一的にサポートします。前代のSAM 2と比べて、オープンボキャブラリ概念分割能力を導入し、大量のテキストプロンプトを処理でき、SA - COベンチマークテストで人間の性能の75 - 80%に達します。
MaziyarPanahi
このプロジェクトでは、Qwen3-4B-Thinking-2507モデルのGGUF形式のファイルを提供しています。これは、思考過程推論能力を持つ4Bパラメータの大規模言語モデルで、複数の量子化バージョンをサポートし、さまざまなハードウェアでのデプロイと実行が容易です。
tlennon-ie
QwenEdit2509は、画像の色彩処理に特化した低ランク適応型(LoRA)モデルです。画像の飽和度を下げ、コントラストを低下させ、カメラのログプロファイルに似た扁平で未グレーディングの外観を作り出すと同時に、ハイライトとシャドウの細部を保持します。
mlx-community
VibeThinker-1.5Bの4ビット量子化バージョンで、MLXフレームワークに基づいてAppleチップ向けに最適化されており、15億のパラメータを持つ密集型言語モデルで、数学的推論とアルゴリズムコーディングの問題に特化しています。
ai-sage
GigaChat3-10B-A1.8B-baseはGigaChatシリーズの基礎事前学習モデルで、混合エキスパート(MoE)アーキテクチャを採用し、総パラメータは100億、アクティブなパラメータは18億です。モデルはマルチヘッド潜在的注意機構(MLA)と多トークン予測(MTP)技術を統合し、推論時に高いスループットの利点を持ちます。
DevQuasar
このプロジェクトでは、cerebras/MiniMax-M2-REAP-172B-A10Bモデルの量子化バージョンを提供しており、知識を大衆に利用してもらうことを目指しています。これは1720億パラメータの大規模言語モデルで、最適化と量子化処理が施されており、デプロイコストの削減と推論効率の向上を目的としています。
tencent
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
onnx-community
SAM3は概念ベースの任意分割モデルで、入力された点やボックスなどのプロンプト情報に基づいて、正確な画像分割マスクを生成することができます。このバージョンはONNX形式のSAM3トラッカーモデルで、Transformers.jsライブラリを通じてブラウザ環境で効率的に動作します。
MiroThinker-v1.0-72Bは72Bパラメータの大規模言語モデルの量子化バージョンで、知識を誰もが利用できるようにすることを目指しています。このプロジェクトはオリジナルモデルを最適化し、より効率的な推論性能を提供します。
DakkaWolf
Trouper-12B GGUFは、DarwinAnim8orによってオリジナルモデルを基に開発されたテキスト生成モデルで、ロールプレイングやクリエイティブライティングのシナリオに特化して最適化されています。このモデルはMistral-Nemo-Base-12Bから微調整され、カスタムの「Actors」データセットを使用して訓練されており、生成されるテキストはより自然で、一般的な「AI言語」の特徴を避けています。
prithivMLmods
Jan-v2-VLは80億のパラメータを持つ視覚言語モデルで、ブラウザやデスクトップアプリケーションなどの実際のソフトウェア環境で長周期、多段階のタスクを実行するために設計されています。このモデルは言語推論と視覚認知を密接に結びつけ、複雑な指示に従い、中間状態を維持し、軽度の実行エラーから回復して、安定した持続的なタスク完了を実現します。
Tarka-AIR
Tarka-Embedding-350M-V1は3億5000万のパラメータを持つテキスト埋め込みモデルで、1024次元の密集したテキスト表現を生成することができます。このモデルは、意味的な類似性、検索、および検索強化生成(RAG)などの下流アプリケーションに対して最適化されており、複数の言語をサポートし、長いコンテキストを処理する能力を持っています。
HIT-TMG
Uni-MoE 2.0-Omniは、ライチ科技(Lychee)が発表した完全オープンソースの全モーダリティモデルで、全モーダリティ3D RoPEと動的容量エキスパート混合アーキテクチャを採用し、言語を中心としたマルチモーダリティ理解、推論、生成能力を大幅に向上させました。このバージョンには、全モーダリティ理解とオーディオおよび画像生成能力が統合されています。
facebook
SAM 3はMetaが発表した第3世代のプロンプト可能な分割ベースモデルで、テキストまたはビジュアルプロンプト(点、ボックス、マスク)を利用して、画像とビデオ内のオブジェクトを検出、分割、追跡することができます。前代と比較して、SAM 3はオープンボキャブラリ概念のすべてのインスタンスを詳細に分割する機能を導入し、大量のオープンボキャブラリプロンプトをサポートし、SA - COベンチマークで人間の性能の75 - 80%を達成しています。
samwell
NV-Reason-CXR-3B GGUFはNVIDIA NV-Reason-CXR-3Bビジュアル言語モデルの量子化バージョンで、エッジデバイスへのデプロイに最適化されています。これは30億パラメータのモデルで、胸部X線分析に特化しており、GGUF形式に変換され、量子化処理が施されているため、モバイルデバイス、デスクトップデバイス、組み込みシステムで効率的に動作します。
allenai
Olmo 3は、Allen Institute for AI (Ai2)によって開発された全く新しい32Bパラメータの言語モデルファミリーで、Base、Instruct、Thinkなどのバリエーションが含まれています。このモデルはDolma 3データセットを基に訓練され、65,536の長文脈処理をサポートし、言語モデル科学の発展を推進することを目的としています。モデルは完全にオープンソースで、Apache 2.0ライセンスに従っています。
Tarka-Embedding-150M-V1は1億5000万のパラメータを持つ埋め込みモデルで、768次元の密集したテキスト表現を生成できます。意味の類似性、検索、および検索強化生成(RAG)などのさまざまな下流アプリケーションに対して最適化されており、深いコンテキスト意味を捉えることに焦点を当て、さまざまな分野にまたがる汎用的なテキスト理解をサポートします。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
assistant-uiは、生産レベルのAIチャットインターフェイスを迅速に構築するためのオープンソースのTypeScript/Reactライブラリで、組み合わせ可能なUIコンポーネント、ストリーミング応答、アクセシビリティなどの機能を提供し、複数のAIバックエンドとモデルをサポートしています。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
Apify MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくツールで、AIアシスタントが数千の既成のクローラー、スクレイパー、自動化ツール(Apifyアクター)を通じて、ソーシャルメディア、検索エンジン、電子商取引などのウェブサイトからデータを抽出できるようにします。OAuthとSkyfireプロキシ支払いをサポートしており、HTTPSエンドポイントまたはローカルのstdio方式でClaude、VS CodeなどのMCPクライアントに統合できます。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
Haiku RAGは、LanceDB、Pydantic AI、Doclingを基盤とした高度な検索強化生成システムです。ハイブリッド検索、再ランキング、質問応答エージェント、多エージェント研究プロセスをサポートし、ローカルファーストのドキュメント処理とMCPサーバー統合を提供します。
MCPプロトコルに基づくKubernetesクラスター管理サーバーで、コマンドラインまたはチャットインターフェイスを通じてKubernetesクラスターとやり取りでき、リソース管理、Helmチャート操作などの機能を提供します。
このプロジェクトは、ObsidianのLocal REST APIプラグインを通じてObsidianノートアプリとやり取りするMCPサーバーです。Obsidian内のファイルを操作および管理するためのさまざまなツールを提供し、ファイルのリスト表示、内容の取得、検索、内容の変更、ファイルの削除などが可能です。
セレナは強力なオープンソースのコーディングエージェントツールキットで、大規模言語モデル(LLM)をコードベース上で直接動作するフル機能のエージェントに変えることができます。IDEに似た意味論的なコード検索と編集ツールを提供し、様々なプログラミング言語をサポートし、MCPプロトコルまたはAgnoフレームワークを介して様々なLLMと統合することができます。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
Runnoは、JavaScriptツールキットのセットで、ブラウザやNode.jsなどの環境で複数のプログラミング言語のコードを安全に実行するためのものです。WebAssemblyとWASIを通じてサンドボックス化された実行を実現し、Python、Ruby、JavaScript、SQLite、C/C++などの言語をサポートし、Webコンポーネント、MCPサーバーなどの統合方法を提供します。
FastAPI - MCPは、FastAPIエンドポイントをモデルコンテキストプロトコル (MCP) ツールとして公開するライブラリで、組み込み認証機能を備え、柔軟なデプロイとASGI伝送をサポートします。
codemcpはClaude Desktopをペアプログラミングアシスタントに変えるツールで、ユーザーがClaudeに直接ローカルコードベース上で機能の実装、エラーの修正、コードのリファクタリングを行わせることができます。
Awesome-MCP-ZHは、中国語ユーザー向けに作成されたMCP(モデルコンテキストプロトコル)のリソースコレクションです。MCPの基本的な説明、使い方、クライアント、サーバー、コミュニティリソースが含まれ、ユーザーがすぐにMCPを使い始めるのに役立ちます。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。