港股市場中,智譜科技和Minimax股價在Deepseek V4發佈後顯著下跌。Deepseek V4是備受期待的深度學習模型,技術升級和功能增強引發關注,但意外導致這兩家大模型概念股回落,引發投資者廣泛討論。
DeepSeek發佈新一代旗艦模型V4,採用細分化策略推出Flash與Pro兩個版本,分別覆蓋輕量高頻應用和複雜推理任務。此舉不僅滿足不同場景需求,還以極具競爭力的定價重塑AI商業化基準,整合了原有deepseek-chat與deepseek-reasoner模型。
騰訊與阿里巴巴正競相參與國產大模型公司DeepSeek的新一輪融資,推動其估值目標從100億美元飆升至超過200億美元。此前DeepSeek尋求以百億美元估值融資3億美元,市場對頭部獨立模型廠商的溢價預期顯著提升。公司預計本月發佈新一代模型DeepSeek v4。
MiniMax 開發商稀宇科技今日開源了 Minimax2.7 大模型,這是繼智譜 GLM-5.1 後又一重要國產開源模型。其編程能力顯著提升,在 SWE-Pro 基準測試中得分達 56.22%,性能接近 Claude Opus 頂尖水平,標誌着國產大模型在編程與性價比上進一步對標國際前沿。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
strangervisionhf
這是一個基於DeepSeek-OCR的圖像文本識別模型,專門解決了在最新版本transformers庫中的兼容性問題,使模型能夠在transformers v4.57.1等最新版本中順利運行。
Clemylia
Lam-2是基於自定義架構Aricate V4開發的第二代小型語言模型(SLM),在問答任務中表現出色,具有卓越的語言連貫性和創造力。相比前代產品,Lam-2在語法正確性和文本生成質量上有顯著提升。
rtr46
meiki.text.detect.v0.1是專門針對視頻遊戲和漫畫文本檢測的高精度、低延遲OCR模型,在日語相關內容上表現優異。該模型基於D-FINE檢測器架構,採用MobileNet v4 small作為骨幹網絡,提供兩種分辨率變體以適應不同應用場景。
bartowski
這是TheDrummer的Cydonia - R1 - 24B - v4.1模型的量化版本,使用llama.cpp工具進行多種精度量化處理,可在不同硬件條件下高效運行,為用戶提供更多選擇。
jinaai
Jina Embeddings v4 是一款專為多模態和多語言檢索設計的通用嵌入模型,特別適用於複雜文檔的檢索,包括包含圖表、表格和插圖的視覺豐富文檔。
Trendyol
Trendyol LLM v4.1.0 是一款基於 Trendyol LLM base v4.0(在130億token上繼續預訓練的Qwen2.5 7B版本)的生成模型,專注於電商領域和土耳其語理解。
yukiarimo
Yuna Ai V4是一款基於LLaMA 3.1 8B架構的多語言文本生成模型,專注於提供智能對話和知識問答體驗。經過3B+令牌訓練,具備量子思維等先進特性,在對話能力和創造力方面表現突出。
hum-ma
CyberRealistic XL v4 是一個高質量的文本生成圖像模型,專注於生成逼真的圖像。
Undi95
Lumimaid與Magnum v4合併的12B參數大語言模型,採用DELLA合併方法並加入針對Claude輸入優化的Nemo模型
strangerzonehf
基於LoRA技術的NFT數字藝術生成模型,專為V4版本NFT設計優化
backyardai
馬格南V4 72B是基於Qwen打造的模型系列中的一員,旨在復刻Claude 3系列模型的散文質量,適用於本地AI聊天應用。
anthracite-org
馬格南v4-22B是基於Mistral-Small-Instruct-2409微調的大型語言模型,專門致力於復刻Claude 3系列模型(尤其是Sonnet和Opus)的文本質量。該模型提供了GGUF量化版本,支持32K上下文長度,在多個高質量數據集上進行訓練。
fluently
Fluently XL V4 是一款高性能的文本生成圖像模型,在imgsys.org競技場排名第四,以其精準的人體結構和藝術與寫實兼備的特點著稱。
Fluently V4.0-LCM 是一個全能任務模型,通過融合多模型和LCM技術實現極速圖像生成,具備精準解剖結構和高藝術表現力。
Fluently V4-inpainting 是一個通過融合多個檢查點和LoRA技術打造的多功能圖像處理模型,特別擅長圖像修復和擴展任務。
TheBloke
Athena v4是一個實驗性的大型語言模型,適用於角色扮演、情感角色扮演及通用場景。使用Alpaca格式提示模板。
CobraMamba
Mamba - GPT - 3B - V4是一款性能卓越的3B參數語言模型,在Open LLM排行榜上表現優異,超越dolly - v2 - 12b,提供高質量的語言處理能力。
shibal1
Anything V4 是一個為二次元愛好者準備的潛在擴散模型,旨在通過簡單的提示生成高質量、高細節的動漫風格圖像。
xyn-ai
Anything V4 是一款面向動漫愛好者的潛在擴散模型,能夠根據少量提示詞生成高質量、高細節的動漫風格圖像。
prompthero
基於12.4萬張Midjourney v4圖像訓練的文本生成圖像模型,使用Stable Diffusion v1.5框架訓練
這是一個為NovelAI圖像生成API提供支持的MCP服務器,支持最新V4.5模型、多種傳輸模式和中文優化,方便集成到Claude、LobeChat等AI助手。