【AI日報】へようこそ!ここは毎日人工知能世界を探求するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当てて、技術トレンドや革新的なAI製品の応用を理解にお手伝いします。新鮮なAI製品についてはこちらから確認してください:https://app.aibase.com/zh1、テンセントが登場!8、スマートグラスや腕時計も旧機種を交換する補助金を受けられます!2026年の「二新(新製品・新サービス)」政策にAI製品が新たに加わりました。2026年の「二新」政策が重要なアップグレードを実施し、初めてスマートグラスと
YuanLab.aiはオープンソースのマルチモーダル大モデルYuan3.0Flashを発表しました。パラメータ規模は40Bで、スパースミックス・オブ・エキスパート構造を採用し、推論時には約3.7Bのパラメータのみがアクティブになります。これは効率を顕著に向上させます。モデルには16ビットおよび4ビットの重み、技術報告書およびトレーニング方法が含まれており、二次開発や業界カスタマイズをサポートし、AI技術の普及を促進します。
【AIニュース】へようこそ!ここは毎日人工知能世界を探求するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術のトレンドや革新的なAI製品の応用を理解するお手伝いをします。新鮮なAI製品については以下からご覧ください:https://app.aibase.com/zh1、メタはManusを数十億ドルで買収しました。メタは数十億ドルで人工知能スタートアップ企業Manusを買収し、これは同社史上3番目の買収となります。C
腾讯が開源した混元翻訳モデル1.5版は33言語対応で、モバイル端末向けに最適化。1.8Bと7Bの2バージョンを提供し、1.8B版は量子化後1GBメモリで動作可能。オフラインリアルタイム翻訳を実現し、推論速度に優れる。....
20以上のオープンソースモデルをサポートするプライベートなAIチャットプラットフォームで、会話のプライバシーとコンテキストを保護します。
オートメーションによって自分自身のプラットフォームを構築できる、オープンソースのフルスタックAIウェブアプリジェネレーター。
オープンソースのAIデバッグツールで、AIエージェントに完全なコンテキストを取得させ、バグ修正を10倍速で行えます。
BitterBotはオープンソースのAIアシスタントで、自然な会話を通じて現実のタスクを簡単に完了できます。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$2
$20
$4
$16
$8
$240
52
XiaomiMiMo
米モデルのエンボディメントモデル(MiMo-Embodied)は、強力なクロスエンボディメント視覚言語モデルであり、自動運転とエンボディメントAIタスクの両方で卓越した性能を発揮します。これは、この2つの重要な分野を結合した最初のオープンソースの視覚言語モデルであり、動的な物理環境における理解と推論能力を大幅に向上させました。
allenai
Olmo 3はAllen Institute for AIによって開発されたオープンソースの言語モデルシリーズで、7Bと32Bの2種類の規格があり、指令(Instruct)と思考(Think)の2種類のバリエーションに分かれています。このモデルは卓越した長鎖思考能力を持ち、数学やコーディングなどの推論タスクのパフォーマンスを大幅に向上させることができます。
Olmo 3は、Allen Institute for AI (Ai2)によって開発された全く新しい32Bパラメータの言語モデルファミリーで、Base、Instruct、Thinkなどのバリエーションが含まれています。このモデルはDolma 3データセットを基に訓練され、65,536の長文脈処理をサポートし、言語モデル科学の発展を推進することを目的としています。モデルは完全にオープンソースで、Apache 2.0ライセンスに従っています。
moonshotai
Kimi K2 Thinkingは月の暗面(Moonshot AI)が開発した最新世代のオープンソース思考モデルで、強力な深度推論能力とツール呼び出し機能を備えています。このモデルは混合専門家アーキテクチャを採用し、ネイティブINT4量子化をサポートし、256kのコンテキストウィンドウを持ち、複数のベンチマークテストで優れた性能を発揮します。
SadraCoding
SDXL-Deepfake-Detectorは、AI生成顔を正確に検出するツールで、デジタル世界の真実性を維持することに特化し、視覚的な虚偽情報に対抗するためのプライバシー保護とオープンソースのソリューションを提供します。このモデルは、事前学習モデルを微調整することで、軽量かつ高精度な検出を実現します。
unsloth
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、70億と80億の2種類のパラメータ規模を提供します。このモデルは1000種類以上の言語をサポートし、完全にコンプライアンスでオープンな学習データを使用し、その性能はクローズドソースモデルに匹敵します。Apertusは15Tのトークンで事前学習され、段階的なコース学習方法を採用し、最大65,536トークンのコンテキスト長をサポートします。
redponike
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、パラメータ規模は80億と700億で、1000種以上の言語と長文脈処理をサポートし、完全にコンプライアンスの取れたオープンな学習データのみを使用し、性能はクローズドソースモデルに匹敵します。
Granite-4.0-MicroはIBMが開発した30億パラメータの長文脈指令モデルで、Granite-4.0-Micro-Baseをベースに微調整されています。このモデルはオープンソースの指令データセットと内部合成データセットを使用しており、指令の遵守とツール呼び出し能力が強化されており、多言語タスクをサポートし、各分野のAIアシスタントの基礎モデルとして使用できます。
geoffmunn
これはQwen/Qwen3-0.6B言語モデルのGGUF量子化バージョンで、6億のパラメータを持つコンパクトな大規模言語モデルで、低リソースデバイスでの超高速推論用に設計されています。llama.cpp、LM Studio、OpenWebUI、GPT4Allなどのフレームワークをサポートし、どこでもオフラインでプライベートAIを使用できます。
GeneralAnalysis
GA Guard LiteはGeneral Analysisが開発した軽量級のオープンソース審査モデルで、言語モデルの出力に含まれる違反コンテンツを検出するために特別に設計されています。このモデルは、違法活動、憎悪発言、個人情報漏洩など7種類のセキュリティリスクを識別でき、AIアプリケーションに効率的なコンテンツセキュリティ保護を提供します。
GA Guard CoreはGeneral Analysisが開発したオープンソースの審査モデルで、違法活動、憎悪発言、個人情報漏洩など7種類の違反コンテンツを検出して分類するために専用に設計されており、AIアプリケーションの安全性とコンプライアンスを保障します。
Jackmin108
GLM-4.5-Airは智譜AIが開発した、エージェントに適した基礎モデルです。コンパクトな設計を採用し、推論、コーディング、エージェント機能を統合しており、エージェントアプリケーションの複雑なニーズを満たすことができます。このモデルは適切なパラメータ数と高い効率を兼ね備え、複数のバージョンがオープンソースで公開されており、商用や二次開発に利用できます。
manuelcaccone
Gemma-3 ActuaryEnough2は精算分野に特化したAIモデルで、11,000以上の精算質問と回答のペアを使って微調整学習されており、簡単な保険の質問を厳密な精算専門用語に変換することができます。このモデルはActuaryEnoughをサポートし、オープンソース形式で教育や研究目的で公開されています。
TildeAI
TildeOpen LLMは、オープンソースの基礎言語モデルであり、代表されにくい北欧および東欧の言語をサポートするために特別に設計されています。このモデルは欧州委員会によって資金提供され、LUMIスーパーコンピュータ上で訓練され、300億のパラメータを持ち、既存のAIシステムにおいて19種類の重点言語の使用者が直面する性能の格差問題を解決します。
Devstral 1.1は、Mistral AIとAll Hands AIが共同開発したスマート大規模言語モデルで、ソフトウェアエンジニアリングタスク向けに設計されています。このモデルはSWE-benchベンチマークテストで優れた成績を収め、オープンソースモデルのトップにランクインしており、240億のパラメータと128kトークンの長いコンテキストウィンドウを持っています。
Devstralは、ソフトウェアエンジニアリングタスク用に特別に開発された大規模言語モデルで、Mistral AIとAll Hands AIが共同開発しました。SWE-benchベンチマークテストで優れた成績を収め、1位のオープンソースモデルです。
zai-org
GLM-4.1V-9B-Baseは智譜AIが開発したオープンソースのビジョン言語基礎モデルで、90億のパラメータを持ち、マルチモーダル推論能力に特化し、中英バイリンガルをサポートし、最大4K解像度の画像と64Kの文脈長を処理できます。
deepseek-community
DeepSeek-VLはDeepSeek AIチームによって開発されたオープンソースのビジュアル言語モデルで、テキストと画像情報を同時に処理し、文脈に関連した応答を生成することができます。このモデルは混合ビジュアルエンコーダを採用し、高解像度画像処理をサポートし、現実世界のビジュアル言語理解アプリケーションで優れた性能を発揮します。
Multiverse4FM
Multiverse-32BはMultiverseをベースに構築された最初のオープンソースの非自己回帰型モデルで、AIMEテストで優れた成績を収め、重要な学術的および応用的価値を持っています。
RedHatAI
Granite-3.1-8B-Instructは80億のパラメータを持つ長文脈指令モデルで、Granite-3.1-8B-Baseをベースに微調整されています。オープンソースの指令データセットと内部合成データセットを組み合わせ、長文脈問題を効果的に解決するために特別に設計されており、複数の言語とさまざまなAIタスクをサポートします。
Inbox Zeroは、オープンソースのAIメールアシスタント兼クライアントで、ユーザーが効率的にメールを管理し、受信トレイをゼロにするのを支援します。
Solana Agent Kitは、AIエージェントをSolanaプロトコルに接続するためのオープンソースツールキットで、60種類以上のブロックチェーン操作をサポートします。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
Cogneeは、AIエージェントに記憶機能を提供するオープンソースプロジェクトです。モジュール化されたECLパイプラインを通じて動的な知識グラフを構築し、複数のデータソースと形式をサポートし、幻覚を減らし、コストを削減します。
Cipherは、プログラミングAIエージェント向けに設計されたオープンソースのメモリ層フレームワークです。MCPプロトコルを通じてさまざまなIDEとAIコーディングアシスタントと統合し、自動記憶生成、チーム記憶共有、デュアルシステム記憶管理などの核心機能を提供します。
これはWeb3モデルコンテキストプロトコル(MCP)サーバーの精選リストで、チェーンのやり取り、取引、DeFi、市場データ、ツール、ソーシャルなどの複数のカテゴリをカバーしています。MCPは、アプリケーションがLLMにコンテキストを提供する方法を標準化するオープンプロトコルで、AIアプリケーションのUSB - Cポートのようなものです。DeMCPは最初の分散型MCPネットワークで、エージェントに独自開発およびオープンソースのMCPサービスを提供し、暗号通貨による支払いをサポートし、TEEとブロックチェーンレジストリを組み合わせてMCPのセキュリティと信頼性を再定義しています。
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、ウェブ上で使用できる多機能計算プラットフォーム(MCP)を提供します。非技術ユーザーが簡単にAIワークフローを設定でき、開発者は拡張して構築することができます。
ACI.devはオープンソースのAIエージェントツールインフラストラクチャで、600以上の事前統合ツールのマルチテナント認証、権限管理、動的探索機能を提供し、統合MCPサーバーまたは軽量SDKを通じた呼び出しをサポートし、本番レベルのAIエージェント開発を簡素化します。
Awesome MCP Serversは、包括的なモデルコンテキストプロトコル(MCP)サーバーの集合で、7158個のMCPサーバーがAI統合、アートメディア、ブラウザ自動化、クラウドサービス、データベース、開発者ツール、ファイルシステム、金融、ゲーム、ハードウェア、医療、インフラストラクチャ、知識管理、位置マップ、マーケティング、監視、マルチメディア処理、オペレーティングシステム、プロジェクト管理、科学研究、セキュリティ、ソーシャルメディア、旅行交通、ユーティリティツール、バージョン管理など33のカテゴリに分けられています。
RhinoMCPは、Model Context Protocolを通じてRhino 3DモデリングソフトウェアとAIエージェントを接続するツールで、双方向のやり取りを実現し、3Dオブジェクト操作、ドキュメント検査、およびスクリプト実行をサポートします。
adb - mcpは、MCPプロトコルを通じてLLMにインターフェースを提供し、Adobeツール(PhotoshopやPremiereなど)を制御するAIエージェントを作成する概念実証プロジェクトです。このプロジェクトには、MCPサーバー、Nodeコマンドプロキシサーバー、およびAdobeアプリケーションプラグインが含まれており、自然言語の命令でAdobeソフトウェアを操作でき、画像およびビデオ編集の自動化に適しています。
HiMarketは即座に利用可能な企業向けAIオープンプラットフォームソリューションで、管理バックエンド、開発者ポータル、AIゲートウェイの3つの核心コンポーネントを提供し、モデルサービス、MCP ServerなどのAI機能を標準化されたAPI製品にパッケージ化して公開することをサポートします。
BioMCPはオープンソースの生物医学AIツールキットで、信頼できるデータソースを接続することで、AIシステムに専門的な生物医学知識を提供します。
Postgres MCP ProはオープンソースのMCPサーバーで、AIエージェントにデータベースのインデックスチューニング、実行プラン分析、ヘルスチェック、安全なSQL実行などの包括的なサポートを提供します。
SystemPrompt Coding Agentは、オープンソースプロジェクトで、ローカルワークステーションをMCPプロトコルでリモート制御可能なAIプログラミングアシスタントに変えます。音声コマンドとモバイル端末での操作をサポートし、異なる場所でのプログラミング管理を実現します。
OmniMindはオープンソースのPythonライブラリで、Model Context Protocol(MCP)の統合を簡素化し、AIエージェント、ワークフロー、自動化開発をサポートします。即挿即用機能を提供し、複数のツールが組み込まれており、Google Geminiに基づいたスマートな応答を提供し、開発者や初心者がAIアプリケーションを迅速に構築するのに適しています。