蘋果Safari首席設計師Marco Triverio加入The Browser Company,引發業界關注。他在蘋果期間主導了iOS和macOS版Safari的設計,對隱私控制、標籤頁和導航等核心功能貢獻顯著。此次人才流動被視爲蘋果設計團隊的又一損失。
谷歌Gemini 3 Pro以1501 Elo創LMArena歷史新高,超越GPT-5.1等模型,成多模態模型榜首。在科學、數學及視頻任務中表現卓越,如“人類終極考試”達37.5%,GPQA Diamond 91.9%。Deep Think模式進一步提升推理能力,通用智能測試ARC-AGI-2得分45.1%。
AI瀏覽器Dia繼承Arc瀏覽器標誌性側邊欄等核心功能,深度融合AI記憶與代理能力,從Arc的激進實驗中汲取經驗,由The Browser Company創始人確認開發,旨在實現更強大的瀏覽器革新。
巨人網絡與清華大學聯合發佈多方言語音合成大模型DiaMoE-TTS,實現技術突破並全面開源數據代碼。該框架旨在解決方言TTS依賴海量專有數據的行業難題,推動方言語音合成的公平普惠發展。
AI 驅動的圖表生成器,快速將想法轉化為清晰的圖表和信息圖。
AI驅動的圖表生成器,快速將想法轉化為清晰圖表和信息圖,可定製分享。
AI驅動,秒速生成專業軟件架構、UML和流程圖,無需拖拽
DialLink是一個易於使用的雲電話系統,為中小型企業和初創企業提供AI語音代理功能,自動化電話以提高客戶滿意度和推動增長。
Alibaba
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
Minimax
Stepfun
Chatglm
Sachin-0001
這是一個基於🤗 Transformers庫的雙向自迴歸Transformer模型,已上傳至模型中心。模型卡片由系統自動生成,具體技術細節和應用信息需要進一步補充。
nari-labs
Dia2是由Nari Labs開發的流式對話文本轉語音(TTS)模型,支持即時語音生成,無需完整文本即可開始生成音頻,能夠根據對話上下文進行調整,實現自然流暢的對話體驗。
Dia2是由Nari Labs開發的流式對話文本轉語音(TTS)模型,支持即時語音生成,無需完整文本即可開始生成音頻,專為自然對話場景設計。
mradermacher
這是基於diabolic6045/Sanskrit-qwen-7B-Translate-v2的量化版本,專門用於梵語翻譯和轉寫任務。提供多種量化類型,支持英語到梵語的翻譯和轉寫,包括IAST和天城文兩種格式。
calcuis
基於nari-labs/Dia-1.6B的文本轉語音模型,支持GGUF量化格式,可通過gguf-connector工具運行。
Lorenzob
Aurora-1.6B是基於Dia-1.6B微調的多語言情感與歌唱語音合成模型,支持多種語言和情感控制,具備零樣本音色克隆能力。
mmwillet2
Dia 1.6B 是一個適用於文本轉語音任務的模型,支持多種量化版本,兼容TTS.cpp框架。
基於Dia-1.6B微調的多語種情感與歌唱語音合成模型,支持音色克隆和情感控制
Alissonerdx
基於Dia 1.6B文本轉音頻模型的微調版本,專門針對巴西葡萄牙語進行優化
RobAgrees
Dia是一款16億參數的開源文本轉語音模型,支持生成高度逼真的對話和非語言表達
mlx-community
Dia是一款開源權重的文本轉對話模型,支持對話文本生成和語音合成。
Dia-1.6B-6bit 是一個基於 Dia-1.6B 的 6 位量化版本,專為 MLX 框架優化的文本轉語音模型。
Dia-1.6B-3bit 是一個基於 mlx-community/Dia-1.6B 轉換的 3 位量化模型,主要用於文本轉語音任務。
Dia-1.6B-4bit 是一個基於 MLX 格式的 4 位量化文本轉語音模型,由 nari-labs/Dia-1.6B 轉換而來。
thepushkarp
Dia 是由 Nari Labs 開發的 16 億參數文本轉語音模型,能夠直接從文本生成高度逼真的對話,支持情感和語調調節以及非語言表達生成。
Dia是由Nari實驗室開發的16億參數文本轉語音模型,能夠直接從文本生成高度逼真的對話,支持情感和語調控制,並能生成非語言交流內容。
Diamantis99
基於PyTorch的Unet圖像分割模型,支持多種編碼器架構和預訓練權重
基於PyTorch的語義分割模型,支持多種編碼器架構,適用於圖像分割任務。
基於PyTorch的Unet圖像分割模型,支持多種編碼器架構,適用於語義分割任務。
Dialog是一個AI驅動的Reddit智能研究平臺,通過語義搜索和批量處理功能,幫助用戶進行市場研究、競爭分析和客戶發現,無需Reddit API憑證即可訪問2萬多個活躍社區。
一個將Mermaid圖表轉換為PNG圖像的MCP服務器,支持多種主題和背景色定製。
一個為Google Dialogflow CX設計的MCP服務器實現,提供AI助手與Dialogflow CX之間的無縫集成。
UML-MCP Server是一個基於MCP協議的UML圖表生成工具,支持通過自然語言或PlantUML代碼生成多種類型的UML圖,並集成到支持MCP的客戶端中。