艾倫人工智能研究所發佈開源視頻語言模型Molmo2系列,包括基於阿里巴巴Qwen3的4B和8B版本,以及基於Ai2Olmo的完全開源7B版本,並公開訓練數據,彰顯其開源承諾。
高通發佈兩款雲端AI推理芯片AI200和AI250,計劃2026和2027年商用,標誌着從終端芯片向全棧AI基礎設施轉型。消息推動股價單日飆升超20%,創2019年來最大漲幅。與英偉達全能路線不同,高通聚焦大模型推理市場,主打能效與成本優勢。
高通發佈AI200和AI250芯片挑戰英偉達,股價漲超20%。AI200專爲AI推理設計,支持768GB內存,旨在降低總成本並提升性能,適用於大型語言和多模態模型推理。
AI21Labs發佈開源小型語言模型Jamba Reasoning3B,專爲設備端AI計算設計。該模型基於自研混合狀態空間模型-變換器架構,採用Apache2.0許可證,區別於主流大型語言模型,是Jamba系列在特拉維夫開發的最新成果。
一款幫助科研人員發現學術論文的強大工具。
AI21推出的Jamba 1.6模型,專為企業私有部署設計,具備卓越的長文本處理能力。
AI21 Jamba Large 1.6 是一款強大的混合 SSM-Transformer 架構基礎模型,擅長長文本處理和高效推理。
Ai2 OLMoE 是一款可在 iOS 設備上運行的開源語言模型應用
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1
allenai
Olmo 3是由Allen Institute for AI (Ai2)開發的一系列語言模型,包含7B和32B兩種規格,有Instruct和Think兩種變體。該模型基於Transformer架構,具有長鏈思維能力,可有效提升數學和編碼等推理任務的表現。
Olmo 3是Allen Institute for AI (Ai2)開發的全新32B參數語言模型家族,包含Base、Instruct和Think等變體。該模型基於Dolma 3數據集訓練,支持65,536的長上下文處理,旨在推動語言模型科學發展。模型完全開源,遵循Apache 2.0許可證。
bartowski
這是AI21 Labs的Jamba-Mini-1.7模型的量化版本,使用llama.cpp的imatrix技術進行優化,為不同硬件配置提供了多種量化選擇,支持高效推理。
OLMo 2 32B是艾倫人工智能研究院(AI2)推出的開放語言模型系列中規模最大的32B參數模型,基於Apache 2.0許可開源,支持英語語言處理。
ai21labs
AI21 Jamba 1.5是一系列先進的基礎模型,具備強大的長上下文處理能力和高效的推理速度,適用於多種業務場景。
AI21 Jamba 1.5 Mini 是一款先進的混合SSM-Transformer指令跟隨基礎模型,具有高效的長上下文處理能力和快速的推理速度。
Severian
Jamba-Hercules是基於ai21labs/Jamba-v0.1微調的大語言模型,使用Locutusque/hercules-v4.0數據集進行訓練,專注於文本生成任務。
lightblue
基於ai21labs/Jamba-v0.1微調的聊天機器人模型,支持多語言對話,經過數小時QLoRA微調,能在英語及其他語言中進行合理流暢的對話。
Jamba是最先進的混合SSM-Transformer大語言模型,結合了Mamba架構與Transformer優勢,支持256K上下文長度,在吞吐量和性能上超越同規模模型。
cloudyu
Mixtral MOE 2x10.7B是一款基於混合專家架構的大語言模型,結合了Sakura-SOLAR-Instruct和CarbonVillain兩個基礎模型的優勢。該模型在文本生成任務上表現出色,在多個公開數據集上進行了評估,包括AI2推理挑戰、HellaSwag、MMLU等基準測試。
基於go-mcp的MySQL數據庫連接服務,支持通過MCP協議與客戶端通信,提供SQL查詢和數據操作功能,支持權限控制和靈活配置。