通義實驗室發佈Fun-CosyVoice3.5和Fun-AudioGen-VD兩款語音大模型,支持“FreeStyle”自然語言指令生成,實現“一句話自由生成語音”的深度交互。Fun-CosyVoice3.5新增泰語、印尼語等4個語種支持,提升多語種復刻與精細化表達能力。
阿里通義實驗室推出Fun-CosyVoice3.5和Fun-AudioGen-VD兩款語音生成模型,支持“FreeStyle”指令,用戶通過自然語言描述即可控制聲音風格或構建音頻場景。Fun-CosyVoice3.5專注於多語種復刻與精細化控制,是CosyVoice的升級版。
AI音樂生成平臺Suno付費用戶突破200萬,年收入達3億美元,三個月內增長50%。平臺累計用戶超1億,憑藉“自然語言創作”模式快速改變音樂產業。
蘋果發佈Xcode 26.3正式版,標誌着其開發者工具正式進入“智能體編碼”時代。新版本引入Anthropic與OpenAI的頂級AI技術,使開發者能直接調用全球頂尖AI能力,超越以往僅提供代碼補全的輔助功能。
免費AI圖像生成器,支持文本生成圖像和自然語言編輯照片
AI數據科學平臺,可通過自然語言生成Jupyter筆記本和數據可視化。
一個為Jupyter設計的AI代理,可以通過自然語言生成代碼並運行單元格。
無需編程背景,通過自然語言快速生成應用。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
noname0202
kotodama-1.5b-a0.3b-sft 是一個基於 noname0202/kotodama-1.5b-a0.3b-pt 進行監督微調的大語言模型。該模型使用 TRL 框架進行訓練,專門針對文本生成任務進行了優化,能夠有效解決自然語言處理相關問題。
DakkaWolf
Trouper-12B GGUF是由DarwinAnim8or基於原始模型開發的文本生成模型,專門針對角色扮演和創意寫作場景進行了優化。該模型從Mistral-Nemo-Base-12B微調而來,使用了自定義的'Actors'數據集進行訓練,生成的文本更加自然,避免了常見的'AI語言'特徵。
Leohan
基於MLX庫開發的文本生成模型,專注於自然語言處理任務,為開發者提供高效的文本生成解決方案。
noctrex
Aquif-3.5-Max-42B-A3B是一個420億參數的大型語言模型,經過MXFP4_MOE量化處理,在保持高質量文本生成能力的同時優化了推理效率。該模型基於先進的混合專家架構,適用於多種自然語言處理任務。
mradermacher
Lamapi/next-12b 是一個基於12B參數的大語言模型,通過多語言數據集進行微調,支持50多種語言,具備高效文本生成能力,適用於化學、代碼、生物、金融、法律等多個領域的自然語言處理任務。
Lamapi/next-12b 是一個120億參數的多語言大語言模型,提供了多種量化版本,支持文本生成、問答、聊天等多種自然語言處理任務。該模型在多個領域數據集上訓練,具有高效、輕量級的特點。
EpistemeAI
這是第一代強大的vibe-code大語言模型,經過優化可直接根據結構鬆散的'氛圍編碼'提示生成自然語言和代碼補全。相比早期模型,它具有更低的提示工程開銷、更平滑的潛在空間插值,更容易引導生成可用代碼。
inclusionAI
銘音通是一個創新的統一語音框架,將語音理解、生成和編輯功能整合為一體。它採用統一的連續語音分詞器,能在端到端模型中有效融合語義和聲學特徵,是首個僅通過自然語言指令就能實現通用、自由形式語音編輯的系統。
deepseek-ai
變換器庫是一個強大的自然語言處理工具庫,提供豐富的預訓練模型和便捷的使用接口,廣泛應用於文本生成、分類、翻譯等NLP任務,極大提升開發效率。
nineninesix
KaniTTS是一款高速、高保真的文本轉語音模型,專為即時對話式人工智能應用而優化。該模型採用兩階段處理流程,結合大語言模型和高效音頻編解碼器,在Nvidia RTX 5080上生成15秒音頻的延遲僅需約1秒,MOS自然度評分達4.3/5,支持英語、中文、日語等多種語言。
neuphonic
NeuTTS Air是全球首個具有即時語音克隆功能的超逼真設備端文本轉語音模型,基於0.5B參數的大語言模型骨幹構建,能在本地設備上實現自然語音生成、即時性能和說話人克隆功能。
TIGER-Lab
Qwen2.5-VL-7B-Instruct是阿里巴巴通義千問團隊開發的多模態視覺語言模型,基於70億參數規模,專門針對視覺問答任務進行優化訓練。該模型能夠理解和分析圖像內容,並生成準確的自然語言回答。
KrauthammerLab
CAST 0.7B 是基於0.7B參數Gemma3風格語言模型構建的語音轉語音語言模型,能夠生成自然的語音音頻延續內容。該模型依賴於CAST WavTokenizer進行編碼/解碼操作,專門用於語音生成任務。
tensorblock
Nile-Chat-4B 是 MBZUAI-Paris 開發的一個 40 億參數的多語言對話模型,基於先進的 Transformer 架構構建,專門針對對話場景進行了優化。該模型支持多種語言,能夠進行流暢的自然語言對話,並提供高質量的響應生成能力。
lmstudio-community
Qwen3-30B-A3B-Instruct-2507是阿里巴巴通義千問團隊推出的300億參數大語言模型,專門針對指令跟隨任務進行了優化。該模型支持文本生成、對話交互等多種自然語言處理任務,並通過LM Studio社區模型計劃向開發者開放使用。
mlx-community
這是一個基於Qwen3架構的大語言模型,經過3位數量化處理,專門針對指令跟隨任務進行了優化。該模型具有2350億參數規模,支持多語言處理能力,適用於各種自然語言理解和生成任務。
NoemaResearch
Nous-V1 8B是由Apexion AI開發的80億參數語言模型,基於Qwen3-8B架構構建。該模型專為處理各種自然語言處理任務而設計,在對話式AI、知識推理、代碼生成和內容創作等方面表現出色,在模型能力和實際部署效率之間取得了良好平衡。
這是Qwen3-Embedding-0.6B模型的4位深度量化版本,專為MLX框架優化。該模型提供高效的文本嵌入生成能力,適用於各種自然語言處理任務。
iamseyhmus7
基於GPT2微調的土耳其語文本生成模型,適用於自然語言處理和聊天機器人等場景
unsloth
Cosmos-Reason1是NVIDIA開發的物理AI模型,能夠理解物理常識並通過長鏈思維推理生成具身決策自然語言。
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述幫助開發者快速創建現代化UI組件,支持多種IDE集成。
一個用於通過SQL查詢蘋果健康數據的MCP服務器,基於DuckDB實現高效分析,支持自然語言查詢和自動報告生成。
Tripo MCP Server是一個連接AI助手與Tripo AI的接口項目,支持通過自然語言生成3D資產並導入Blender。
DBCode是一款VS Code數據庫管理插件,支持20+種數據庫連接,提供數據編輯、自然語言查詢、ER圖生成、可視化分析等功能,幫助開發者在IDE內高效完成數據庫操作。
Tripo MCP Server是一個連接AI助手與Tripo AI的接口工具,支持通過自然語言生成3D資產並導入Blender。
Trellis MCP是一個連接AI助手與Trellis 3D生成模型的接口服務,支持通過自然語言快速生成3D資產並導入Blender。該項目基於開源模型,需自行部署API後端,具有快速、免費的特點,但存在穩定性風險。
Magic Component Platform (MCP) 是一個AI驅動的UI組件生成工具,通過自然語言描述快速創建現代化UI組件,支持多款IDE集成和即時預覽。
VibeCheck Web測試工具是一個AI驅動的網頁測試代理,通過MCP協議集成到AI編程助手(如GitHub Copilot、Cursor等)中,實現自動化測試錄製、執行和發現。它利用Playwright控制瀏覽器,支持自然語言描述生成測試腳本,執行迴歸測試,並自動發現潛在測試步驟,提高開發效率和測試準確性。
Archy是一個基於MCP協議的架構圖生成工具,支持通過自然語言或GitHub倉庫自動生成多種Mermaid圖表。
一個MCP服務器項目,允許通過自然語言命令創建和運行Processing草圖,支持生成視覺藝術和遊戲。
Unity AI ProBuilder是一個基於MCP協議的AI驅動3D建模工具,通過自然語言命令在Unity編輯器中創建和編輯可編輯網格,支持快速原型設計和程序化幾何生成。
MS SQL MCP Server是一個無需編碼的橋樑工具,允許AI助手直接查詢和探索Microsoft SQL Server數據庫,支持數據庫發現、表結構查看、安全執行只讀SQL查詢及自然語言生成SQL功能。
AI Humanize MCP Server是一個強大的模型上下文協議服務器,能夠將AI生成的內容優化得更自然、更人性化。它具備AI檢測、自然語言增強、語法修正、可讀性優化等功能,幫助用戶提升文本質量。
一個基於Reablocks設計系統的智能React組件生成MCP服務器,通過自然語言處理生成生產就緒的TypeScript組件,包含響應式佈局和可訪問性支持。
SupaUI MCP服務器是一個基於自然語言交互的UI組件生成與管理服務,支持通過描述創建、獲取和瀏覽React組件。
AutoCAD LT的AutoLISP MCP服務器,通過自然語言控制生成和執行AutoLISP代碼,實現工程圖紙的自動化繪製。
這是一個包含大量開源AI項目的列表,涵蓋了從自然語言處理、圖像生成到自動化工作流等多個領域。這些項目旨在幫助開發者利用AI技術構建各種應用,包括聊天機器人、代碼生成工具、數據處理系統等。
一個基於Python的Azure CLI助手,通過自然語言處理生成Azure命令,依賴Azure MCP服務實現功能。
FOCUS DATA MCP Server是一個將自然語言轉換為SQL語句的AI助手服務,採用兩步生成方案控制LLM幻覺,提升非技術用戶對SQL結果的信任度。
一個支持多平臺的社交媒體內容管理MCP服務器,通過自然語言指令實現跨平臺內容創建與發佈,具備自動研究、內容生成和數據分析功能。