12月18日,火山引擎在FORCE原動力大會上宣佈,豆包大模型日均Tokens使用量已突破50萬億,位居中國第一、全球第三。同時,公司正式發佈了豆包大模型1.8與視頻生成模型Seedance1.5pro。豆包1.8在多模態Agent場景中深度優化,視覺理解能力顯著提升,支持超長視頻分析,並在工具調用和複雜指令遵循方面達到全球領先水平。
馬斯克在xAI全員大會上提出,公司有望在未來兩三年內超越所有對手,成爲全球AI領導者。他強調抓住關鍵窗口期,並分享了行業判斷與挑戰性時間表。
2025年,超過150個匿名YouTube頻道利用廉價AI工具製作大量反工黨虛假視頻,累計觀看超12億次。這些頻道通過煽動性內容從英國政治分歧中獲利,已積累530萬訂閱者,發佈視頻超5.6萬個。其主要攻擊目標爲首相基爾・斯塔默,相關提及達1.56萬次。
優必選科技與國內頭部AI大模型公司簽署超0.5億元銷售合同,將交付全球首款自主換電工業人形機器人Walker S2,年內完成。公司同時開放機器人數據接口,支持合作方將自有AI大模型與機器人本體深度集成,構建“具身智能+垂直模型+數據”閉環。目前產能已超300臺/月,年內將分批交付。
用超300個AI演員,幾分鐘生成專業UGC視頻和靜態廣告
Instories可輕鬆在數分鐘內創建驚豔設計,有超300模板做動畫故事。
提供超過 5000 本書籍的摘要與分析。
i10X AI內容創作工具可在幾分鐘內生成SEO優化的、超越競爭對手的文章。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
Anthropic
$105
$525
$7
$35
Google
$2.1
$17.5
$21
$0.7
Alibaba
$1
$10
256
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
-
$0.8
$2
128
Baidu
32
Tencent
$4
$0.35
400
$8
lightx2v
本倉庫包含為HunyuanVideo-1.5優化的4步蒸餾模型,能夠在不使用CFG(無分類器指導)的情況下實現超快速的4步推理,顯著減少生成時間,同時保持高質量的視頻輸出。
vafipas663
基於Qwen-Image-Edit-2509的圖像超分辨率LoRA模型,專門用於提升低質量圖像的分辨率和視覺效果。該模型在攝影風格的圖像上表現出色,能夠處理多種圖像退化問題。
LeviDeHaan
SecInt是一個針對即時nginx安全日誌分類進行微調的SmolLM2-360M模型,旨在自動檢測Web服務器日誌中的安全威脅、錯誤和正常流量模式,準確率超過99%,可在CPU上實現即時檢測。
unsloth
Apertus是一款由瑞士AI開發的全開放多語言大語言模型,提供70億和80億兩種參數規模。該模型支持超過1000種語言,使用完全合規且開放的訓練數據,性能可與閉源模型相媲美。Apertus在15T標記上進行預訓練,採用分階段課程訓練方法,支持長達65,536個標記的上下文長度。
lmms-lab
LLaVA-OneVision-1.5 是一系列完全開源的大型多模態模型,通過在原生分辨率圖像上進行訓練,以較低的成本實現了先進的性能。該模型在多個多模態基準測試中展現出卓越性能,超越了Qwen2.5-VL等競爭對手。
facebook
MapAnything是一個端到端訓練的Transformer模型,能夠以多種模態作為輸入,直接回歸場景的分解度量3D幾何結構。該模型支持超過12種不同的3D重建任務,包括多圖像SfM、多視圖立體視覺、單目度量深度估計等。
tristan-deep
這是一個基於分數生成擴散模型的醫學圖像處理模型,專門針對心臟超聲圖像進行去霧處理。該模型在DehazeEcho2025數據集上訓練,能夠有效去除超聲圖像中的霧狀干擾,提升圖像清晰度。
DINOv3是Meta AI開發的一系列通用視覺基礎模型,無需微調即可在廣泛的視覺任務中超越專門的先進模型。該模型採用自監督學習方式,生成高質量的密集特徵,在圖像分類、分割、深度估計等多種任務中表現出色。
DINOv3是Meta AI開發的一系列通用視覺基礎模型,無需微調就能在多種視覺任務中超越專門的先進模型。該模型採用Vision Transformer架構,在16.89億張網絡圖像上預訓練,能生成高質量的密集特徵,在圖像分類、分割、檢索等任務中表現出色。
internlm
Intern-S1是目前最先進的開源多模態推理模型,結合了強大的通用任務處理能力和在廣泛科學任務中的卓越性能,可與領先的閉源商業模型相媲美。該模型在5T token數據集上進行持續預訓練,其中超過50%是專業科學數據,具備動態分詞器能夠原生理解分子式、蛋白質序列和地震信號。
atalaydenknalbant
YOLOv13是一種準確且輕量級的目標檢測器,提出了基於超圖的自適應相關性增強機制、全流程聚合與分佈範式,並利用深度可分離卷積替換普通大核卷積,有效提升了複雜場景下的檢測性能,在MS COCO基準測試中實現了最先進的性能。
Lightricks
基於擴散模型的視頻空間分辨率增強工具,專門針對LTX視頻模型生成的潛在視頻表示進行超分辨率訓練
saurabhati
首個超越基於Transformer的音頻分類器的狀態空間模型,在AudioSet音頻分類任務中實現最先進性能,同時顯著減小模型規模。
XiangZ
HiT-SR是一種提升基於變換器的超分辨率方法的通用策略,通過改進現有模型結構,在降低計算負擔的同時實現更優的超分辨率性能。
UW
110億參數大語言模型,採用創新的SuperBPE分詞器訓練,支持超詞單元識別和子詞分詞能力。
80億參數模型,採用創新的SuperBPE分詞器,結合子詞和超詞標記,推理效率比傳統BPE模型高30%。
kcccat
多語言E5大型指令模型,支持超過100種語言的文本嵌入和分類任務
jfkback
Hypencoder是一種用於信息檢索的超網絡模型,包含文本編碼器和Hypencoder兩部分,能夠將文本轉換為小型神經網絡並輸出相關性分數。
Hypencoder是一種用於信息檢索的雙編碼器模型,包含文本編碼器和超網絡(Hypencoder),能夠將文本轉換為小型神經網絡用於計算相關性分數。
OpenGVLab
VideoMAEv2-giant是一個基於自監督學習的超大規模視頻分類模型,採用雙掩碼策略進行預訓練。
MCP Analyst是一個MCP服務器,支持Claude分析本地的CSV或Parquet文件,適用於處理超出上下文窗口限制的大型數據集或需要優化成本的場景。
一個結合Claude Code和Google Gemini AI的MCP服務器,通過多模型協作實現深度代碼分析,Claude擅長本地上下文操作和CLI工作流,Gemini則利用其超大上下文窗口進行分佈式系統調試和長軌跡分析。
非官方的PubChem MCP服務器,提供超過1.1億種化學化合物的全面訪問,包括分子特性、生物測定數據和化學信息學工具。
一個即時監控Hyperliquid平臺上大額交易(超過100萬美元)的MCP服務器,提供鯨魚交易警報和數據分析功能。
這是一個基於Runway API的MCP服務器項目,允許用戶通過Claude Desktop調用Runway的各種AI生成功能,包括視頻生成、圖像生成、視頻編輯和超分辨率等工具。
Optuna MCP Server是一個基於Model Context Protocol (MCP)的服務,利用Optuna自動化優化和分析過程。它支持多種應用場景,如LLM自動超參數優化、通過聊天界面交互分析優化結果以及優化其他MCP工具的輸入輸出。
CryptoAnalysisMCP是一個基於Swift構建的加密貨幣技術分析工具,提供即時價格數據、技術指標、圖表模式識別和交易信號。最新版本v1.1通過DexPaprika集成支持超過700萬種代幣,無需API密鑰即可獲取基礎價格數據。
非官方的PubChem MCP服務器,提供超過1.1億種化合物的全面訪問,包括分子屬性、生物測定數據和化學信息學工具。
一個提供食品價格和營養信息搜索功能的MCP服務器,支持跨超市比價和營養分析