谷歌DeepMind推出Gemma Scope2,這是一個開放的可解釋性工具套件,旨在深入分析Gemma3語言模型從2.7億到270億參數的各層次信息處理。該工具幫助AI安全與對齊團隊追蹤模型內部特徵,以應對“越獄”、幻覺或不當行爲等問題。
谷歌與Kaggle聯合推出FACTS基準套件,旨在標準化評估AI模型的事實準確性。該基準針對法律、金融、醫療等對準確性要求高的行業,將“事實性”分爲“上下文事實性”和“世界知識事實性”兩個場景進行綜合評估,填補了當前AI評估體系的空白。
谷歌FACTS團隊與Kaggle聯合發佈FACTS基準測試套件,旨在評估生成式AI模型在企業任務中的事實性和真實性。該框架彌補了現有基準只關注問題解決能力、忽略輸出信息與真實世界數據一致性的缺陷,尤其針對圖像或圖表中的信息嵌入,對法律、金融等關鍵領域尤爲重要。
Canva推出基於“全球首個”設計AI模型的新數字營銷和視頻編輯工具,升級其視覺套件產品,定位爲營銷團隊的“創意操作系統”。該術語並非傳統操作系統,而是指整合任務工具、AI支持及平臺界面的綜合系統。
端到端開發工具套件,簡化基於LLM的AI應用的開發流程
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
nvidia
Cosmos-Predict2.5是NVIDIA開發的專為物理AI設計的高性能預訓練世界基礎模型套件,基於擴散模型技術,能夠根據文本、圖像或視頻輸入生成具有物理感知的高質量圖像和視頻,為自動駕駛、機器人等應用提供世界模擬能力。
facebook
OPT是由Meta AI開發的大型語言模型套件,包含125M至175B參數的僅解碼器預訓練變換器,旨在對標GPT-3性能並向研究社區開放。
OPT是由Meta AI發佈的開放預訓練Transformer語言模型套件,參數量從1.25億到1750億,旨在對標GPT-3系列性能,同時促進大規模語言模型的開放研究。
Snowfort Circuit MCP是一個全面的模型上下文協議服務器套件,為AI編碼代理提供網頁和Electron桌面應用自動化能力,具有AI優化的快照、智能截圖壓縮和多會話管理等功能。