北京发布《人工智能产业白皮书(2025)》,预计核心产值超4500亿元。白皮书详细介绍了2025年中国人工智能大会在京召开情况,以及北京市科委发布的相关规划,聚焦AI技术趋势与创新应用,为开发者提供洞见。
2025中国人工智能大会在京举行,汇聚超300位中外专家,聚焦AI前沿研究与产业应用。会上发布《北京人工智能产业白皮书(2025)》,分析全球及中国AI发展现状,指出北京核心产业规模正快速扩大。
微软、Anthropic与Nvidia在Ignite大会上宣布450亿美元合作:Anthropic向微软投资300亿美元,换取Nvidia支持的Azure算力;Nvidia和微软各投入100亿美元。虽未达1GW算力目标,但协议包含未来扩展选项。
OpenAI与甲骨文合作,将在美国密歇根州萨林镇建设“星际之门”数据中心园区,容量超1吉瓦,预计2026年初动工。该项目投资数十亿美元,由财团出资,旨在满足AI算力增长需求。建设期将创造超2500个工会建筑岗位,运营阶段提供450个就业机会。
Xai
$1.4
输入tokens/百万
$3.5
输出tokens/百万
2k
上下文长度
Alibaba
$4
$16
1k
Bytedance
-
Tencent
$2.4
$9.6
32
$1.5
$6
128
Google
$0.14
$0.28
131
$0.7
Stepfun
$12
28
$38
$120
16
Minimax
$1
$8
250
01-ai
$0.99
Baidu
Chatglm
aisingapore
Llama-SEA-LION-v3-70B-IT是一款多语言大语言模型,专门针对东南亚语言进行了优化。该模型在约1230万条英语指令-完成对和450万条东南亚语言指令-完成对的数据集上进行了两阶段微调,支持包括缅甸语、中文、英语、菲律宾语、印尼语等13种语言。
apple
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,提升模型准确率。包含270M、450M、1.1B和3B四种参数规模,提供预训练和指令调优版本。
santhosh
MADLAD-400-3B-CT2是基于T5架构的多语言机器翻译模型,在涵盖450多种语言的1万亿个标记的公开数据上训练。该模型支持400多种语言,专注于机器翻译和多语言NLP任务,与更大规模的模型相比也颇具竞争力。
facebook
基于Conformer架构的语音编码器,在450万小时无标注音频数据上预训练,支持143种以上语言
google
MADLAD-400-7B-MT是基于T5架构的多语言机器翻译模型,在涵盖450多种语言的2500亿个标记上训练而成。该模型具有72亿参数,支持400多种语言的机器翻译和多语言NLP任务,性能可与显著更大的模型相媲美。
AIRI-Institute
GENA-LM是一个用于长DNA序列分析的开源基础模型,基于Transformer架构的掩码语言模型,专门针对生物信息学领域设计,能够处理长达4500个核苷酸的DNA序列。
nguyenvulebinh
基于Wav2Vec2架构的大规模英语自动语音识别模型,在4500小时多源语音数据上微调,支持带语言模型的解码