寒武紀公司宣佈,已成功完成對深度求索公司開源AI模型DeepSeek-V4的Day 0適配,實現發佈當天即穩定運行。通過自研融合算子庫Torch-MLU-Ops,對模型中的Compressor、mHC等模塊進行鍼對性加速,大幅提升推理效率。同時採用vLLM推理框架,爲用戶帶來更高效的人工智能體驗。
騰訊與阿里巴巴正競相參與國產大模型公司DeepSeek的新一輪融資,推動其估值目標從100億美元飆升至超過200億美元。此前DeepSeek尋求以百億美元估值融資3億美元,市場對頭部獨立模型廠商的溢價預期顯著提升。公司預計本月發佈新一代模型DeepSeek v4。
國內AI企業DeepSeek正進行首次外部融資,計劃募資至少3億美元,投後估值預計超100億美元。此舉顯示這家技術驅動型公司正積極調整策略,以應對全球大模型競爭。
字節跳動啓動“豆包股”首次回購,價格13.08美元,較授予價上漲約30%。此舉反映其大模型業務估值增長,爲相關技術人員提供收益與退出渠道。該計劃是公司去年10月推出的長期激勵措施。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$4
$16
$2
$20
Baidu
128
Bytedance
$1.2
$3.6
4
merve
Isaac 0.1是感知器公司推出的首個感知語言模型,擁有20億參數,專為現實世界應用設計。該模型在效率方面樹立了新標準,性能達到甚至超越了比它大50倍以上的模型,具備強大的視覺理解和空間推理能力。
PerceptronAI
Isaac-0.1是感知公司推出的首個開源視覺語言模型,擁有20億參數,專為現實世界應用設計。該模型在多模態理解和空間推理方面表現出色,性能達到甚至超越比它大50倍以上的模型,樹立了新的效率標準。
bartowski
Lucy模型是Menlo公司開發的大語言模型,經過量化處理後能在保證性能的同時減少資源需求,提升運行效率。
aisingapore
WangchanLION-v3-IT是由VISTEC和新加坡人工智能公司聯合開發的多語言大語言模型,專門針對泰語進行指令調優。該模型基於Llama3架構,使用約376萬個泰語指令-完成對進行微調,支持英語和泰語處理。
kakaocorp
Kanana 1.5是Kakao公司開發的雙語大語言模型,支持英文和韓文,在編程、數學和函數調用能力方面有顯著提升,原生支持32K tokens上下文長度
future-technologies
DeepSeek-V3-0324是深度求索公司推出的大語言模型,相比前身DeepSeek-V3在推理能力、中文寫作和前端開發等方面有顯著提升。
deepseek-ai
DeepSeek-V2.5 是深度求索公司推出的一款高性能大語言模型,支持多種自然語言處理任務。
elyza
由ELYZA公司訓練的大型語言模型,基於Meta-Llama-3-8B-Instruct增強日語能力
sbintuitions
由SB Intuitions公司訓練的大語言模型,支持日語和英語,基於Llama2架構
stockmark
Stockmark-100B是由Stockmark公司開發的擁有1000億參數的大語言模型,基於約9100億日語和英語語料標記從頭開始預訓練。該模型專注於商業領域應用,在日語商業問題處理方面表現出色。
mit-han-lab
Llama 3 是 Meta 公司推出的下一代開源大語言模型,具有更強的性能和更廣泛的應用場景。
MoaData
由MoAData公司開發的醫療領域大語言模型,使用DPO方法在自制的醫療數據集上訓練。
Minirecord
Mini_synatra_7b_02是由Minirecord公司基於maywell/Synatra-7B-v0.3-dpo模型微調的大語言模型,專注於文本生成任務。
facebook
Meta公司開發的緬甸語文本轉語音模型,屬於大規模多語言語音項目(MMS)的一部分
Meta公司開發的宿務語文本轉語音模型,屬於大規模多語言語音項目的一部分,支持宿務語的高質量語音合成。
Meta公司開發的土庫曼語文本轉語音模型,屬於大規模多語言語音項目的一部分,支持拉丁字母拼寫的土庫曼語語音合成。
Meta公司開發的塔馬哈克語-塔瓦拉馬特方言文本轉語音模型,支持提非納文字,屬於大規模多語言語音項目的一部分。
Meta公司開發的馬安揚語文本轉語音模型,屬於大規模多語言語音(MMS)項目的一部分
Meta公司開發的浪速語(mhx)文本轉語音(TTS)模型,屬於大規模多語言語音研究項目的一部分。
Meta公司開發的隆迪語文本轉語音模型,屬於大規模多語言語音項目(MMS)的一部分
Norman Finance MCP服務器是一個模型上下文協議服務,允許大型語言模型通過標準化協議與Norman Finance基礎API交互,提供會計、發票、公司、客戶、稅務等管理功能。
Model Context Protocol (MCP) 是由Anthropic引入的一種標準化協議,用於大語言模型(LLM)與外部工具和功能的交互,以及向LLM注入上下文。它支持模型請求即時信息、執行外部系統操作、訪問專業知識庫以及與API和服務交互。MCP類似於USB集線器,作為一個標準接口,減少了API變更的風險,因為每個MCP服務器由各自的公司維護,用戶只需集成即可。MCP服務器提供工具、資源和提示三種功能。