DeepSeek研究發現,通過優化神經網絡架構而非單純擴大模型規模,可顯著提升大語言模型推理能力。其“流形約束超連接”技術對現有架構進行微調,爲AI發展提供了不依賴無限增加參數的新路徑。
社交平臺X(原Twitter)宣佈其推薦系統全面升級,由xAI開發的Grok大模型驅動,從傳統規則轉向純AI智能推薦。該變革旨在爲全球用戶提供更精準、個性化的內容體驗,被視爲社交媒體算法演進的重要里程碑。Grok每日處理超過1億條帖子,支撐新系統的核心處理能力。
聖誕節當天,邊緣AI初創公司Liquid AI發佈開源模型LFM2-2.6B-Exp,僅26億參數,卻在多項基準測試中表現優異,指令跟隨能力甚至超越數百億參數的DeepSeek R1-0528,被贊爲“最強3B級模型”。該模型基於第二代LFM2基礎模型,通過純強化學習實現實驗性突破。
OpenAI與博通合作開發定製AI推理芯片,計劃2026年投入使用,未來五年部署10吉瓦算力,旨在結束單純依賴GPU的時代,重塑AI經濟格局。
Rixai AI是一種革命性的圖像生成工具,可以通過純文本輸入創建圖像。
Syntos AI是一種可以純粹通過文本輸入生成圖像的創新技術。
Sora AI 開發的純文本到視頻生成模型
AI自動生成的純淨新聞摘要
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1
unsloth
MedGemma是谷歌開發的專為醫療場景優化的AI模型系列,包含4B多模態和27B純文本兩個版本。基於Gemma 3架構,在醫療文本和圖像理解任務中表現出色,能夠有效支持醫療AI應用開發。
一個基於Cloudflare Workers的MCP服務器,利用WebforAI庫從網頁中提取純文本內容,為AI模型提供網頁數據。