歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://app.aibase.com/zh1、阿里發佈超強語音合成模型Qwen3-TTS,49種音色滿足你的聲音需求!8、ChatGPT躍居蘋果商店下載榜首,成美國用戶最愛應用ChatGPT在2025年成爲蘋果美國市場上下載量最高的免費應用,首次登頂榜首,顯示出人工智能在美國用戶日常生活中的重要性。
商湯科技發佈AI視頻Agent「Seko2.0」,用戶輸入一句話即可一鍵生成最高100集劇情連貫、人物零崩壞的長篇動畫短劇,製作成本極低。該產品採用多劇集記憶與全局一致性架構,確保角色形象、聲音及世界觀在百集內保持穩定,大幅降低AI動畫製作門檻,現已開放測試。
Figma推出AI圖像編輯新功能,包括套索一鍵刪除/隔離對象、背景自動擴邊及無文本提示的光照/色彩調整。套索2.0支持選中目標後直接刪除或拖移,背景保持不變。新工具將首先在Figma Design與Draw中上線,明年覆蓋全平臺。
騰訊將自研大模型品牌“混元”更名爲“Tencent HY”並升級至2.0版本。此舉旨在提升品牌傳播效率,適應全球市場,以簡化名稱更好地服務國際用戶,是騰訊全球化佈局的重要一步。
專業AI圖像生成與編輯器,2-5秒產出2K/4K高質量圖像,支持多語言
Seedance 2.0可將圖像和文本轉化為具有專業品質的電影級AI視頻。
AI郵件營銷工具,可創建郵件、自動化流程、添加互動性以提升轉化率
體驗重新定義的女友關係,與獨特的 AI 女友進行有意義的對話。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$2.8
$7
$35
$17.5
Alibaba
-
$3.9
$15.2
64
Bytedance
$0.8
$2
128
Baidu
Clemylia
Gheya-1是LES-IA-ETOILES生態系統中的新一代基礎語言模型,擁有2.02億參數,是舊版Small-lamina系列的升級版本。該模型專為專業微調而設計,在人工智能、專業語言模型和生物學領域具有針對性訓練。
vanta-research
Atom-Olmo3-7B是基於Olmo-3-7B-Instruct微調的語言模型,專門為協作式問題解決和創造性探索而設計。該模型在處理複雜問題時能提供深思熟慮且結構化的分析,同時保持引人入勝的對話風格,具有Apache 2.0開源許可證。
HIT-TMG
Uni-MoE 2.0-Image 是基於 Uni-MoE 2.0-Omni 派生而來的視覺生成模型,在視覺生成數據上進行了專門微調,具備強大的圖像生成和編輯能力。
Uni-MoE 2.0-Omni 是荔枝科技(Lychee)推出的完全開源全模態模型,採用全模態 3D RoPE 和動態容量專家混合架構,顯著提升了以語言為中心的多模態理解、推理和生成能力。該版本集成了全模態理解以及音頻和圖像生成能力。
allenai
Olmo 3是Allen Institute for AI (Ai2)開發的全新32B參數語言模型家族,包含Base、Instruct和Think等變體。該模型基於Dolma 3數據集訓練,支持65,536的長上下文處理,旨在推動語言模型科學發展。模型完全開源,遵循Apache 2.0許可證。
Mungert
gpt-oss-safeguard-20b是基於GPT-OSS-20b微調的安全推理模型,專門用於大語言模型輸入輸出過濾、在線內容標註以及信任與安全用例的離線標註。該模型採用Apache 2.0許可證,支持自定義策略和透明決策過程。
lefromage
這是Qwen3-Next-80B-A3B-Instruct模型的GGUF量化格式版本,由lefromage提供。該模型是一個800億參數的大型語言模型,採用Apache 2.0許可證,支持文本生成任務。GGUF格式便於在本地設備上部署和運行。
textcleanlm
這是一個基於 unsloth/gpt-oss-20b-BF16 基礎模型的內容保真模型,專門用於將原始文本轉換為簡潔、清晰的Markdown格式。模型採用Apache 2.0許可證,主要支持英語文本處理。
numind
NuExtract 2.0是由NuMind開發的專門用於結構化信息提取的多模態模型,支持文本和圖像輸入,具備多語言處理能力,能夠根據JSON模板從輸入內容中提取結構化信息。
NuExtract 2.0是NuMind公司專門為結構化信息提取任務訓練的一系列多模態模型。該4B版本基於Qwen2.5-VL-3B-Instruct構建,支持文本和圖像輸入,具備多語言處理能力,能夠從非結構化數據中提取結構化信息。
inclusionAI
Ring-mini-2.0是基於Ling 2.0架構深度優化的高性能推理型MoE模型,僅有160億總參數和14億激活參數,卻實現了與100億規模以下密集模型相當的綜合推理能力。在邏輯推理、代碼生成和數學任務方面表現出色,支持12.8萬長上下文處理和每秒300+令牌的高速生成。
Ling 2.0是基於MoE架構的大語言模型家族,首個版本Ling-mini-2.0參數規模緊湊但功能強大,在複雜推理和指令遵循方面表現出色,採用1/32激活率的MoE架構,實現卓越性能與高效運行的完美結合。
Immac
NetaYume Lumina Image 2.0 是一個文本到圖像的擴散模型,經過GGUF格式量化處理,能夠將文本描述轉換為圖像。該模型經過優化,在保持生成質量的同時減少了內存使用和提升了性能。
0xShonen
GPT-OSS-20B是OpenAI發佈的開放權重模型,專為強大的推理、智能體任務和多樣化開發者用例設計。該模型具有21B參數(其中3.6B為活躍參數),支持低延遲推理和本地部署,採用Apache 2.0許可證,可自由用於實驗、定製和商業部署。
giladgd
GPT-OSS-120b-GGUF 是 OpenAI 發佈的 1200 億參數開源文本生成模型,採用 Apache 2.0 寬鬆許可證,支持靈活的推理強度配置和完整思維鏈訪問,具備原生函數調用、網頁瀏覽和代碼執行能力。
GPT-OSS-20b-GGUF 是一個基於 OpenAI GPT-OSS-20b 模型的量化版本,採用 Apache 2.0 許可協議,具有寬鬆的使用條款。該模型支持文本生成任務,具備完整的思維鏈推理能力,並經過原生 MXFP4 量化,可在不同內存條件下高效運行。
lodestones
Chroma1-HD是基於FLUX.1-schnell架構的文本到圖像生成基礎模型,擁有89億參數,採用Apache 2.0開源許可。該模型專為微調設計,為開發者和研究人員提供了強大的圖像生成基礎,支持創建各種專業化的視覺內容。
unsloth
Qwen3-4B-Instruct-2507是阿里雲推出的40億參數大語言模型,基於Unsloth Dynamic 2.0量化技術,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面都有顯著提升。
Qwen3-4B-Instruct-2507是Qwen3-4B非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升。採用Unsloth Dynamic 2.0量化技術,在準確性上表現卓越。
Salesforce
Moirai 2.0 是一個僅含解碼器的通用時間序列預測Transformer模型,在多個高質量數據集上進行了預訓練,包括GIFT-Eval、Chronos數據集子集、合成時間序列和Salesforce內部運營數據。相比第一版本,在損失函數、預測方式、數據處理等方面進行了重大改進。
MaverickMCP是一個基於FastMCP 2.0的個人股票分析服務器,為Claude Desktop等MCP客戶端提供專業級的金融數據分析、技術指標計算和投資組合優化工具。它預置了520只標普500股票數據,支持多種技術分析策略和並行處理,無需複雜認證即可本地運行。
增強版X平臺MCP服務器,支持OAuth 2.0認證、媒體上傳和API限流,提供發推、搜索、刪推等功能。
一個基於Elixir的MCP協議測試服務器實現,支持JSON-RPC 2.0標準,提供可插拔的驗證中間件和模式驅動驗證。
一個封裝V2EX官方API 2.0的服務器,提供通知管理、用戶信息、節點話題等接口功能,支持通過npm全局安裝並配置token使用。
一個基於TypeScript的WordPress模型上下文協議(MCP)服務器,為AI系統提供標準化接口,通過JSON-RPC 2.0實現與WordPress站點的安全程序化交互。
一個基於AWS Lambda、CloudFront和Cognito認證的無服務器MCP協議實現項目,提供完整的雲端MCP服務器基礎設施,支持OAuth 2.0認證、即時流傳輸和可擴展架構。
該項目實現了一個基於pyATS和Genie的MCP服務器,通過JSON-RPC 2.0協議提供結構化、模型驅動的網絡設備交互能力,支持安全執行CLI命令、配置變更及數據採集,適用於容器化或LangGraph集成場景。
一個用於Common Lisp的Model Context Protocol服務器,提供JSON-RPC 2.0通信、REPL評估工具和TCP/stdio傳輸支持
Python Alfresco MCP Server是一個基於FastMCP 2.0框架構建的Alfresco內容服務模型上下文協議服務器,提供全文搜索、文檔管理、元數據操作等15種工具,支持STDIO/HTTP/SSE多種傳輸協議,適用於Alfresco社區版和企業版。
一個基於JSON-RPC 2.0的跨平臺筆記管理服務,支持命令行和後臺服務兩種運行模式,提供線程安全的筆記操作和摘要生成功能。
一個通過JSON-RPC 2.0協議控制微軟畫圖的服務器,支持啟動畫圖程序、繪製圖形、設置顏色和工具屬性等功能。
一個基於TypeScript的MCP服務器實現,通過直接調用Google Gemini API集成Gemini模型,支持最新Gemini 2.0 Flash模型並保持對話上下文。
通過標準OAuth 2.0流程授權訪問Linear,並在MCP客戶端上實現問題的創建、更新和列表功能
一個基於OAuth 2.0認證的生產級Airtable MCP服務器,提供完整的Airtable API覆蓋和標準化MCP接口,支持AI助手與Airtable交互。
一個用Scala 3編寫的MCP協議服務器,支持多種工具功能。
一個功能齊全、可自託管的OAuth 2.0服務器,專為現代AI時代和模型上下文協議(MCP)設計,支持多種框架和數據庫,讓用戶完全掌控自己的數據和認證流程。
該項目提供了一個基於APIMatic的OpenAPI規範驗證服務,通過MCP協議實現與Claude等工具的集成,支持OpenAPI 2.0/3.0文件的JSON/YAML格式驗證。
WordPress MCP服務器,通過JSON-RPC 2.0協議與WordPress REST API交互,支持跨平臺運行。
基於pyATS的MCP服務器,通過JSON-RPC 2.0協議實現結構化網絡設備交互
一個基於FastMCP框架的Google Ads API集成服務器,提供自動OAuth 2.0認證、GAQL查詢和關鍵詞研究功能,支持與Claude Desktop等MCP客戶端無縫連接。