AIBase
首頁
AI資訊
AI產品庫
GEO平台
MCP服务
模型算力廣場
TW

AI資訊

查看更多

美團發佈原生多模態 LongCat-Next:視覺語音實現底層統一

美團發佈原生多模態大模型LongCat-Next,突破傳統“語言基座+插件”架構,通過DiNA技術將圖像、語音與文本統一轉化爲同源離散Token,實現AI原生“看”與“聽”物理世界,完成多模態建模深度統一。

19.9k 48 分鐘前
美團發佈原生多模態 LongCat-Next:視覺語音實現底層統一

模型

查看更多

Dinat Mini In1k 224

shi-labs

D

DiNAT-Mini是基於鄰域注意力機制的分層視覺Transformer模型,專為圖像分類任務設計。

計算機視覺TransformersTransformers
shi-labs
462
1
AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖