Meta AI發佈Pixio圖像模型,通過改進MAE框架,證明簡單訓練路徑在深度估計和3D重建等任務中性能卓越,挑戰了MAE遜於DINOv2等複雜算法的傳統認知。
Beatoven.ai推出AI音樂模型Maestro,通過與版權方合作確保創作合法性,爲藝術家和權利人提供版稅收入,推動音樂AI在尊重版權前提下的創新發展。
最近,Meta正在測試一種新型的聊天機器人,這些機器人將主動向用戶發送消息,而不僅僅是在用戶發起對話後進行迴應。想象一下,你正在 Facebook Messenger 或 WhatsApp 上與朋友聊天,突然間,一個名爲 “The Maestro of Movie Magic” 的 AI 聊天機器人給你發來了一條消息:“希望你今天過得愉快!我想知道你最近有沒有發現什麼新的電影原聲帶或作曲家?或者,是否需要我爲你推薦一些下一個電影之夜的好片呢?”據泄露的文件顯示,Meta 與數據標註公司 Alignerr 合作,開發出這些可定製的聊天機器人。用
["抖音博主“Mae”創作的AI視頻《大多數普通女孩的一生》引起轟動。","視頻將女孩一生濃縮爲一分鐘,獲得353.8萬點贊,觸動了衆多網友。","儘管AI無法還原生活中的酸甜苦辣,但視頻表現出AI技術的發展。","其他博主也使用AI製作類似視頻,拓展了AI在視頻創作領域的應用。","AI工具的不斷更新讓圖文視頻生成更大衆化,吸引了越來越多的創作者。"]
Maestro是一個簡單的端到端測試工具,適用於移動應用和Web應用。
智能協調子代理的框架
更有效的提示大型多模態模型,釋放潛能
Maestro Cloud上的AI自動化QA和測試
Alibaba
$6
輸入tokens/百萬
$24
輸出tokens/百萬
256
上下文長度
$4
$16
1k
$2
$20
-
Moonshot
Bytedance
$0.8
128
Xai
$1.4
$10.5
Deepseek
$12
Tencent
$1
32
$1.6
Openai
$0.4
$0.75
64
24
Chatglm
$8
maerong3
這是一個基於Mistral架構的24B參數大型語言模型,通過llama.cpp轉換為GGUF格式。模型支持多語言交互,特別優化了指令跟隨能力,適用於各種文本生成和理解任務。
mii-llm
基於 Mistral-7b 的意大利語聊天模型,經過大規模意大利語語料庫預訓練和微調
基於Mistral-7b的意大利語對話模型,經過三階段監督微調和KTO對齊
namangarg110
Hiera是一種高效的分層式Transformer架構,通過MAE訓練優化空間偏置特性,顯著提升參數利用效率
RedRocket
這是一個基於stabilityai/sd-vae-ft-mse微調的VAE解碼器,專門針對e621圖像數據進行優化,採用MAE和MSE混合損失函數,在Oklab色彩空間中計算損失,以提升圖像重建質量。
gaunernst
基於視覺變換器(ViT)的音頻處理模型,通過自監督掩碼自編碼器(MAE)方法在AudioSet-2M上預訓練並在AudioSet-20k上微調
Natooz
這是一個基於Byte Pair Encoding (BPE)技術的古典鋼琴音樂生成模型,在Maestro數據集上訓練得到。該模型採用GPT2架構的自迴歸Transformer,能夠根據音樂提示生成後續的古典鋼琴音樂內容。
mtg-upf
MAEST是基於PASST的Transformer模型系列,專注於音樂分析應用,特別擅長音樂風格分類任務。
MAEST是基於PASST的Transformer模型系列,專注於音樂分析應用,可對400種音樂風格進行分類
MAEST是基於PASST的Transformer模型系列,專注於音樂分析應用,特別是音樂風格分類任務。
MAEST是基於PASST的Transformer模型家族,專注於音樂分析應用,特別擅長音樂風格分類任務。
timm
基於視覺變換器(ViT)的大型圖像特徵提取模型,採用自監督掩碼自編碼器(MAE)方法在ImageNet-1k數據集上預訓練
基於視覺Transformer(ViT)的大規模圖像特徵提取模型,採用自監督掩碼自編碼器(MAE)方法在ImageNet-1k數據集上預訓練
基於視覺Transformer(ViT)的圖像特徵提取模型,採用自監督掩碼自編碼器(MAE)方法在ImageNet-1k數據集上預訓練
MCG-NJU
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,在Something-Something V2數據集上微調用於視頻分類任務。
VideoMAE是基於掩碼自編碼器(MAE)的視頻預訓練模型,通過自監督學習在Kinetics-400數據集上微調,適用於視頻分類任務。
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,通過預測被掩碼視頻塊的像素值學習視頻內部表示。
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,在Something-Something-v2數據集上微調用於視頻分類任務。
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,在Something-Something-v2數據集上進行了800輪預訓練。
VideoMAE是基於掩碼自編碼器(MAE)的視頻自監督預訓練模型,通過預測掩碼視頻塊的像素值學習視頻表徵
Maestro MCP Server是一個基於Maestro API平臺的比特幣區塊鏈交互工具,提供區塊、交易、地址等區塊鏈數據的查詢功能。
Maestro MCP的Python包