艾伦人工智能研究所发布开源视频语言模型Molmo2系列,包括基于阿里巴巴Qwen3的4B和8B版本,以及基于Ai2Olmo的完全开源7B版本,并公开训练数据,彰显其开源承诺。
高通发布两款云端AI推理芯片AI200和AI250,计划2026和2027年商用,标志着从终端芯片向全栈AI基础设施转型。消息推动股价单日飙升超20%,创2019年来最大涨幅。与英伟达全能路线不同,高通聚焦大模型推理市场,主打能效与成本优势。
高通发布AI200和AI250芯片挑战英伟达,股价涨超20%。AI200专为AI推理设计,支持768GB内存,旨在降低总成本并提升性能,适用于大型语言和多模态模型推理。
AI21Labs发布开源小型语言模型Jamba Reasoning3B,专为设备端AI计算设计。该模型基于自研混合状态空间模型-变换器架构,采用Apache2.0许可证,区别于主流大型语言模型,是Jamba系列在特拉维夫开发的最新成果。
一款帮助科研人员发现学术论文的强大工具。
AI21推出的Jamba 1.6模型,专为企业私有部署设计,具备卓越的长文本处理能力。
AI21 Jamba Large 1.6 是一款强大的混合 SSM-Transformer 架构基础模型,擅长长文本处理和高效推理。
Ai2 OLMoE 是一款可在 iOS 设备上运行的开源语言模型应用
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
Baidu
128
$6
$24
256
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
allenai
Olmo 3是由Allen Institute for AI (Ai2)开发的一系列语言模型,包含7B和32B两种规格,有Instruct和Think两种变体。该模型基于Transformer架构,具有长链思维能力,可有效提升数学和编码等推理任务的表现。
Olmo 3是Allen Institute for AI (Ai2)开发的全新32B参数语言模型家族,包含Base、Instruct和Think等变体。该模型基于Dolma 3数据集训练,支持65,536的长上下文处理,旨在推动语言模型科学发展。模型完全开源,遵循Apache 2.0许可证。
bartowski
这是AI21 Labs的Jamba-Mini-1.7模型的量化版本,使用llama.cpp的imatrix技术进行优化,为不同硬件配置提供了多种量化选择,支持高效推理。
OLMo 2 32B是艾伦人工智能研究院(AI2)推出的开放语言模型系列中规模最大的32B参数模型,基于Apache 2.0许可开源,支持英语语言处理。
ai21labs
AI21 Jamba 1.5是一系列先进的基础模型,具备强大的长上下文处理能力和高效的推理速度,适用于多种业务场景。
AI21 Jamba 1.5 Mini 是一款先进的混合SSM-Transformer指令跟随基础模型,具有高效的长上下文处理能力和快速的推理速度。
Severian
Jamba-Hercules是基于ai21labs/Jamba-v0.1微调的大语言模型,使用Locutusque/hercules-v4.0数据集进行训练,专注于文本生成任务。
lightblue
基于ai21labs/Jamba-v0.1微调的聊天机器人模型,支持多语言对话,经过数小时QLoRA微调,能在英语及其他语言中进行合理流畅的对话。
Jamba是最先进的混合SSM-Transformer大语言模型,结合了Mamba架构与Transformer优势,支持256K上下文长度,在吞吐量和性能上超越同规模模型。
cloudyu
Mixtral MOE 2x10.7B是一款基于混合专家架构的大语言模型,结合了Sakura-SOLAR-Instruct和CarbonVillain两个基础模型的优势。该模型在文本生成任务上表现出色,在多个公开数据集上进行了评估,包括AI2推理挑战、HellaSwag、MMLU等基准测试。
基于go-mcp的MySQL数据库连接服务,支持通过MCP协议与客户端通信,提供SQL查询和数据操作功能,支持权限控制和灵活配置。