谷歌Gemini 3 Pro以1501 Elo創LMArena歷史新高,超越GPT-5.1等模型,成多模態模型榜首。在科學、數學及視頻任務中表現卓越,如“人類終極考試”達37.5%,GPQA Diamond 91.9%。Deep Think模式進一步提升推理能力,通用智能測試ARC-AGI-2得分45.1%。
AI瀏覽器Dia繼承Arc瀏覽器標誌性側邊欄等核心功能,深度融合AI記憶與代理能力,從Arc的激進實驗中汲取經驗,由The Browser Company創始人確認開發,旨在實現更強大的瀏覽器革新。
巨人網絡與清華大學聯合發佈多方言語音合成大模型DiaMoE-TTS,實現技術突破並全面開源數據代碼。該框架旨在解決方言TTS依賴海量專有數據的行業難題,推動方言語音合成的公平普惠發展。
Arc瀏覽器繼任者Dia正式登陸macOS,深度整合AI技術革新網頁瀏覽與任務交互。需M1芯片及以上設備運行,提供免費版和月費20美元Pro版,後者含14天試用期及無限制使用承諾。
AI驅動,秒速生成專業軟件架構、UML和流程圖,無需拖拽
DialLink是一個易於使用的雲電話系統,為中小型企業和初創企業提供AI語音代理功能,自動化電話以提高客戶滿意度和推動增長。
一個可以在一次傳遞中生成超逼真的對話的 TTS 模型。
一鍵生成數據的直觀反射圖
mradermacher
這是基於diabolic6045/Sanskrit-qwen-7B-Translate-v2的量化版本,專門用於梵語翻譯和轉寫任務。提供多種量化類型,支持英語到梵語的翻譯和轉寫,包括IAST和天城文兩種格式。
calcuis
基於nari-labs/Dia-1.6B的文本轉語音模型,支持GGUF量化格式,可通過gguf-connector工具運行。
Lorenzob
Aurora-1.6B是基於Dia-1.6B微調的多語言情感與歌唱語音合成模型,支持多種語言和情感控制,具備零樣本音色克隆能力。
mmwillet2
Dia 1.6B 是一個適用於文本轉語音任務的模型,支持多種量化版本,兼容TTS.cpp框架。
基於Dia-1.6B微調的多語種情感與歌唱語音合成模型,支持音色克隆和情感控制
Alissonerdx
基於Dia 1.6B文本轉音頻模型的微調版本,專門針對巴西葡萄牙語進行優化
RobAgrees
Dia是一款16億參數的開源文本轉語音模型,支持生成高度逼真的對話和非語言表達
mlx-community
Dia是一款開源權重的文本轉對話模型,支持對話文本生成和語音合成。
Dia-1.6B-6bit 是一個基於 Dia-1.6B 的 6 位量化版本,專為 MLX 框架優化的文本轉語音模型。
Dia-1.6B-3bit 是一個基於 mlx-community/Dia-1.6B 轉換的 3 位量化模型,主要用於文本轉語音任務。
Dia-1.6B-4bit 是一個基於 MLX 格式的 4 位量化文本轉語音模型,由 nari-labs/Dia-1.6B 轉換而來。
thepushkarp
Dia 是由 Nari Labs 開發的 16 億參數文本轉語音模型,能夠直接從文本生成高度逼真的對話,支持情感和語調調節以及非語言表達生成。
nari-labs
Dia是由Nari實驗室開發的16億參數文本轉語音模型,能夠直接從文本生成高度逼真的對話,支持情感和語調控制,並能生成非語言交流內容。
Diamantis99
基於PyTorch的Unet圖像分割模型,支持多種編碼器架構和預訓練權重
基於PyTorch的語義分割模型,支持多種編碼器架構,適用於圖像分割任務。
基於PyTorch的Unet圖像分割模型,支持多種編碼器架構,適用於語義分割任務。
AsmaaElnagger
基於 Facebook DINOv2 基礎模型微調的圖像分類模型,專門用於糖尿病視網膜病變檢測,在評估集上準確率達 96.8%。
zackriya
一個專注於從圖像中提取結構化數據(JSON)的視覺語言模型,特別擅長識別圖表中的節點、邊及其子屬性,將視覺信息表示為知識圖譜。
一個將Mermaid圖表轉換為PNG圖像的MCP服務器,支持多種主題和背景色定製。
一個為Google Dialogflow CX設計的MCP服務器實現,提供AI助手與Dialogflow CX之間的無縫集成。
UML-MCP Server是一個基於MCP協議的UML圖表生成工具,支持通過自然語言或PlantUML代碼生成多種類型的UML圖,並集成到支持MCP的客戶端中。