“白虎-VTouch”數據集發佈,填補大規模視觸覺數據空白。該數據集包含超6萬分鍾跨本體視觸覺信息,爲全球機器人開發者提供寶貴資源,助力提升機器人觸覺感知能力,推動具身智能發展。
螞蟻集團旗下靈波科技開源高精度空間感知模型LingBot-Depth,基於奧比中光雙目3D相機數據,提升環境深度感知與三維空間理解能力,助力機器人、自動駕駛等智能終端實現更精準可靠的三維視覺,突破行業關鍵難題。
騰訊年會上,馬化騰宣佈AI應用“元寶”將於2月1日啓動春節分10億元現金活動,單人最高可領萬元,意在複製微信紅包的成功。同時,騰訊揭曉了此前保密的社交AI項目“元寶派”,正式將AI融入其核心社交領域。該項目旨在打造AI深度參與的多人社交空間,AI可總結羣聊、擔任健身與閱讀夥伴等角色。
騰訊AI助手“元寶”推出內測社交功能“元寶派”,探索AI在多人社交場景的應用,旨在打造AI與用戶共同娛樂協作的社交空間,標誌着騰訊AI從效率工具向社交互動延伸。
利用AI瞬間改造房間,替換傢俱、更換材質、清理空間或虛擬佈置房產。
輕量級佈局到圖像生成框架,實現精準空間控制。
Dex將瀏覽器變為AI工作空間,瞭解任務與上下文,推動工作進展
專業AI音頻處理工具,可檢測水印、去除雜音、增強空間音頻等。
Google
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
Minimax
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先進的ColPali風格多模態嵌入模型,能夠將文本查詢、視覺文檔(如圖像、PDF)或短視頻映射為對齊的多向量嵌入。該模型結合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的優勢,在ViDoRe基準測試中表現出色,同時顯著減少了嵌入佔用空間。
sensenova
SenseNova-SI是基於多模態基礎模型構建的空間智能增強模型系列,通過精心策劃的800萬樣本數據訓練,在多個空間智能基準測試中取得了優異表現,同時保持了強大的通用多模態理解能力。
sd2-community
Stable Diffusion v2 是一個基於擴散模型的文本到圖像生成模型,能夠根據文本提示生成和修改圖像。該模型在LAION-5B數據集子集上訓練,結合了自編碼器和擴散模型,在潛在空間中進行訓練,支持多種分辨率和任務。
spartan8806
這是一個基於sentence-transformers/all-mpnet-base-v2微調而來的句子轉換器模型,能夠將文本映射到768維的密集向量空間,支持語義相似度計算、語義搜索、文本分類等多種自然語言處理任務。
abr-ai
這是一個由Applied Brain Research(ABR)開發的基於狀態空間模型(SSM)的英文自動語音識別模型,擁有約1900萬參數,能夠高效準確地將英文語音轉錄為文本。該模型在多個基準數據集上表現出色,平均單詞錯誤率僅為10.61%,支持即時語音識別並可在低成本硬件上運行。
SenseNova-SI是基於成熟多模態基礎模型構建的空間智能增強模型系列,通過精心策劃的800萬數據樣本訓練,在多個空間智能基準測試中展現出卓越性能,同時保持強大的通用多模態理解能力。
SenseNova-SI是基於多模態基礎模型構建的空間智能模型系列,專門針對空間理解能力進行優化。通過大規模空間智能數據訓練,在度量估計、空間關係理解、視點變化處理等方面表現優異。
unsloth
Qwen3-VL是通義系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力以及出色的智能體交互能力。
Qwen3-VL-32B-Thinking是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文處理、空間和視頻動態理解能力,以及出色的智能體交互能力。
Qwen3-VL-8B-Thinking是通義千問系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。
Qwen3-VL是通義系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。
Qwen3-VL是通義系列中最強大的視覺語言模型,在文本理解與生成、視覺感知與推理、上下文長度、空間和視頻動態理解以及智能體交互能力等方面全面升級。該模型提供密集架構和混合專家架構,支持從邊緣設備到雲端的靈活部署。
Qwen3-VL是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。
Qwen3-VL是Qwen系列中最強大的視覺語言模型,實現了全方位的綜合升級,包括卓越的文本理解與生成能力、更深入的視覺感知與推理能力、更長的上下文長度、增強的空間和視頻動態理解能力,以及更強的智能體交互能力。
Qwen3-VL是阿里巴巴推出的新一代視覺語言模型,在文本理解、視覺感知、空間理解、長上下文處理和智能體交互等方面全面升級,支持從邊緣設備到雲端的靈活部署。
Qwen3-VL是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及出色的智能體交互能力。該版本為2B參數的思考增強版,專門優化了推理能力。
Qwen
Qwen3-VL-30B-A3B-Thinking是通義系列中最強大的視覺語言模型,具備出色的文本理解和生成能力、深入的視覺感知和推理能力、長上下文支持、強大的空間和視頻動態理解能力,以及智能體交互能力。
Qwen3-VL是通義系列最強大的視覺語言模型,採用混合專家模型架構(MoE),提供GGUF格式權重,支持在CPU、GPU等設備上進行高效推理。模型在文本理解、視覺感知、空間理解、視頻處理等方面全面升級。
Qwen3-VL-2B-Thinking是Qwen系列中最強大的視覺語言模型之一,採用GGUF格式權重,支持在CPU、NVIDIA GPU、Apple Silicon等設備上進行高效推理。該模型具備出色的多模態理解和推理能力,特別增強了視覺感知、空間理解和智能體交互功能。
Qwen3-VL-8B-Thinking是通義千問系列中最強大的視覺語言模型,具備增強推理能力的8B參數版本。該模型在文本理解、視覺感知、空間理解、長上下文處理等方面全面升級,支持多模態推理和智能體交互。
Mapbox MCP服務器是一個Node.js實現的模型上下文協議服務器,為AI應用提供Mapbox地理空間API的訪問能力,包括地理編碼、興趣點搜索、路線規劃、等時線分析和靜態地圖生成等功能。
ClickUp MCP服務器是一個用於將ClickUp任務與AI應用集成的模型上下文協議服務器,支持通過標準化協議管理任務、空間、列表、文件夾等,並提供時間跟蹤、標籤管理等功能。
一個安全的Docker容器代碼沙箱環境,為AI應用提供隔離的執行空間,支持多種編程環境和文件操作。
ClickUp MCP Server是一個用於將ClickUp任務與AI應用集成的模型上下文協議服務器,支持通過標準化協議管理任務、空間、列表和文件夾。
一個基於Docker容器的安全代碼沙箱環境,為AI應用提供隔離的執行空間。
基於MCP協議的地理處理服務器,提供座標系轉換和空間計算功能
GeoServer MCP Server是一個實現模型上下文協議(MCP)的服務端,連接大型語言模型(LLMs)與GeoServer REST API,使AI助手能夠交互地理空間數據和服務。
MCP IPFS Server是一個基於Node.js的服務器,實現了模型上下文協議(MCP),用於通過w3命令行工具與storacha.network平臺交互。它封裝了w3 CLI功能,提供空間管理、數據上傳下載、授權委託等操作,支持語言模型和其他MCP客戶端通過標準化接口訪問IPFS存儲服務。
Multiverse MCP Server是一箇中間件服務器,支持同時運行多個相同類型的MCP服務器實例,每個實例擁有獨立的命名空間和配置,實現完全隔離的運行環境。
TomTom MCP Server是一個簡化地理空間開發的工具,提供對TomTom位置服務的無縫訪問,包括搜索、路線規劃、交通和靜態地圖數據,便於將精確的地理位置數據集成到AI工作流和開發環境中。
實驗性MCP服務器,為LLM提供地理空間上下文服務,集成法國地理平臺數據和服務,支持地理編碼、海拔查詢、行政信息、城市規劃等空間功能
EOxElements是一個由EOX開發的Web組件集合,專注於地理空間用戶界面元素,包含地圖、圖表、繪圖工具、圖層控制、時間控制、表單渲染、搜索過濾等多種組件,用於構建地理空間應用。
一個為MCP客戶端(如Claude Desktop或VSCode的CLine)設計的nREPL服務器,支持通過MCP協議與Clojure nREPL實例交互,實現代碼評估、命名空間檢查等功能。
Earthdata MCP Server是一個基於Model Context Protocol的服務器實現,專為與NASA Earthdata交互而設計,提供高效的地理空間數據集發現和檢索工具。
獲取臺灣各地空氣品質監測站當前及過去24小時數據的MCP服務
ClickUp MCP服務器是一個為AI助手提供標準化接口的服務,使其能夠通過ClickUp API訪問和操作工作區、空間、任務等數據。
Capacities MCP服務器是一個為知識管理平臺Capacities提供無縫集成的服務,支持空間管理、內容搜索、網頁鏈接保存和每日筆記等功能。
Notion MCP服務器是一箇中間件服務,使Claude能夠與Notion工作空間進行交互,提供對Notion區塊、頁面和數據庫的增刪改查等操作功能。
Jupyter Earth MCP Server是一個基於Model Context Protocol (MCP)的服務實現,專為Jupyter筆記本中的地理空間分析提供工具支持。
該項目實現了模型上下文協議(MCP)作為個人智能框架(PIF)的實踐方案,通過結構化工具和漸進式交互模式,為人類與AI之間構建有意義的理解發展空間。