我國首部《人工智能大模型系列國家標準》正式實施,從性能、安全、服務三大維度爲通用大模型建立統一規範,填補了技術評估與合規的制度空白,推動產業從“野蠻生長”邁向科學規範的新階段。
Mistral AI發佈第二代開源編碼模型Devstral2和Devstral Small2。旗艦模型Devstral2擁有1230億參數,在SWE-Bench Verified基準測試中得分72.2%,性能超越多數開源模型。公司採用差異化許可策略,針對不同規模模型制定相應條款。
OpenAI測試"懺悔"機制,訓練AI在單獨報告中承認違規行爲,即使原始回答存在欺騙性,也能因誠實獲得獎勵,旨在防止模型爲追求獎勵而採取投機取巧或忽視安全規則的行爲。
北京消協聯合8家主流電商平臺簽署《促進AI技術規範應用承諾書》,旨在解決AI應用中消費者知情權保障不足、“虛假營銷”及平臺審覈機制短板三大問題。近九成受訪者呼籲AI生成內容需明確標識。
首個無需注意力機制的7B大規模模型
AI平臺準確檢測和分類API隱私數據,強制執行隱私標準,確保API的安全和合規
Google
$0.7
輸入tokens/百萬
$2.8
輸出tokens/百萬
1k
上下文長度
$2.1
$17.5
Alibaba
$2
-
256
Tencent
$1
$4
32
Openai
$8.75
$70
400
64
$0.63
$3.15
131
Bytedance
$0.8
$8
$1.8
$5.4
16
$3.5
$12
128
$0.3
$3
$9
4
Baidu
Anthropic
$21
$105
200
$14
$56
Prior-Labs
TabPFN是一款基於Transformer架構的表格數據基礎模型,通過先驗數據學習機制,能夠在無需任務特定訓練的情況下,在小規模表格數據集上實現卓越性能。
SteelStorage
L3 - Aethora - 15B 是一款經過精心訓練的對話模型,通過特殊方法調整響應,抑制拒絕機制,專注於提供更合規和有幫助的對話交互。
NDugar
基於解耦注意力機制的增強型BERT解碼模型,在MNLI任務上微調的大規模版本
DeBERTa是基於解耦注意力機制的增強型BERT改進模型,通過160GB訓練數據和15億參數規模,在多項自然語言理解任務中超越BERT和RoBERTa表現。
一個強制AI按結構化流程工作的MCP服務器,通過分階段驗證確保編程規範性
該項目通過Cursor IDE管理AI代理的配置規則,包含規則編輯與同步機制,主要應用於職業代理和開發代理的工作流程。
一個用於軟件開發規劃管理的MCP服務器,提供目標設定、計劃制定和任務跟蹤功能
移動開發MCP驗證工具,通過強制任務規劃、代碼質量檢查和UI/UX規範執行,解決AI助手'隨意編碼'問題,支持Flutter、React Native、iOS和Android平臺
一個MCP服務器工具,用於自動化將代碼庫內容轉儲為適合大型語言模型處理的格式,支持遞歸掃描、忽略.gitignore規則、跳過二進制文件,並支持分塊處理大代碼庫。