腾讯与阿里巴巴正竞相参与国产大模型公司DeepSeek的新一轮融资,推动其估值目标从100亿美元飙升至超过200亿美元。此前DeepSeek寻求以百亿美元估值融资3亿美元,市场对头部独立模型厂商的溢价预期显著提升。公司预计本月发布新一代模型DeepSeek v4。
国内AI企业DeepSeek正进行首次外部融资,计划募资至少3亿美元,投后估值预计超100亿美元。此举显示这家技术驱动型公司正积极调整策略,以应对全球大模型竞争。
字节跳动启动“豆包股”首次回购,价格13.08美元,较授予价上涨约30%。此举反映其大模型业务估值增长,为相关技术人员提供收益与退出渠道。该计划是公司去年10月推出的长期激励措施。
苹果公司为Siri工程师团队启动“AI编程训练营”,通过系统性再培训提升其大语言模型工程能力,以支持新一代Siri和iOS系统AI功能开发。此举表明苹果已将AI重塑Siri提升至公司战略高度,旨在追赶谷歌和OpenAI在生成式AI领域的进展。培训内容涵盖模型原理到工程部署全链路,重点聚焦Prompt工程。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
merve
Isaac 0.1是感知器公司推出的首个感知语言模型,拥有20亿参数,专为现实世界应用设计。该模型在效率方面树立了新标准,性能达到甚至超越了比它大50倍以上的模型,具备强大的视觉理解和空间推理能力。
PerceptronAI
Isaac-0.1是感知公司推出的首个开源视觉语言模型,拥有20亿参数,专为现实世界应用设计。该模型在多模态理解和空间推理方面表现出色,性能达到甚至超越比它大50倍以上的模型,树立了新的效率标准。
bartowski
Lucy模型是Menlo公司开发的大语言模型,经过量化处理后能在保证性能的同时减少资源需求,提升运行效率。
aisingapore
WangchanLION-v3-IT是由VISTEC和新加坡人工智能公司联合开发的多语言大语言模型,专门针对泰语进行指令调优。该模型基于Llama3架构,使用约376万个泰语指令-完成对进行微调,支持英语和泰语处理。
kakaocorp
Kanana 1.5是Kakao公司开发的双语大语言模型,支持英文和韩文,在编程、数学和函数调用能力方面有显著提升,原生支持32K tokens上下文长度
future-technologies
DeepSeek-V3-0324是深度求索公司推出的大语言模型,相比前身DeepSeek-V3在推理能力、中文写作和前端开发等方面有显著提升。
deepseek-ai
DeepSeek-V2.5 是深度求索公司推出的一款高性能大语言模型,支持多种自然语言处理任务。
elyza
由ELYZA公司训练的大型语言模型,基于Meta-Llama-3-8B-Instruct增强日语能力
sbintuitions
由SB Intuitions公司训练的大语言模型,支持日语和英语,基于Llama2架构
stockmark
Stockmark-100B是由Stockmark公司开发的拥有1000亿参数的大语言模型,基于约9100亿日语和英语语料标记从头开始预训练。该模型专注于商业领域应用,在日语商业问题处理方面表现出色。
mit-han-lab
Llama 3 是 Meta 公司推出的下一代开源大语言模型,具有更强的性能和更广泛的应用场景。
MoaData
由MoAData公司开发的医疗领域大语言模型,使用DPO方法在自制的医疗数据集上训练。
Minirecord
Mini_synatra_7b_02是由Minirecord公司基于maywell/Synatra-7B-v0.3-dpo模型微调的大语言模型,专注于文本生成任务。
facebook
Meta公司开发的缅甸语文本转语音模型,属于大规模多语言语音项目(MMS)的一部分
Meta公司开发的宿务语文本转语音模型,属于大规模多语言语音项目的一部分,支持宿务语的高质量语音合成。
Meta公司开发的土库曼语文本转语音模型,属于大规模多语言语音项目的一部分,支持拉丁字母拼写的土库曼语语音合成。
Meta公司开发的塔马哈克语-塔瓦拉马特方言文本转语音模型,支持提非纳文字,属于大规模多语言语音项目的一部分。
Meta公司开发的马安扬语文本转语音模型,属于大规模多语言语音(MMS)项目的一部分
Meta公司开发的浪速语(mhx)文本转语音(TTS)模型,属于大规模多语言语音研究项目的一部分。
Meta公司开发的隆迪语文本转语音模型,属于大规模多语言语音项目(MMS)的一部分
Norman Finance MCP服务器是一个模型上下文协议服务,允许大型语言模型通过标准化协议与Norman Finance基础API交互,提供会计、发票、公司、客户、税务等管理功能。
Model Context Protocol (MCP) 是由Anthropic引入的一种标准化协议,用于大语言模型(LLM)与外部工具和功能的交互,以及向LLM注入上下文。它支持模型请求实时信息、执行外部系统操作、访问专业知识库以及与API和服务交互。MCP类似于USB集线器,作为一个标准接口,减少了API变更的风险,因为每个MCP服务器由各自的公司维护,用户只需集成即可。MCP服务器提供工具、资源和提示三种功能。