零犀科技通过自研因果大模型,在保险、金融等高门槛销售领域实现技术到业绩的闭环,2025年达成规模化盈利和正现金流。这解决了B端企业此前对大模型落地获得感低的问题,克服了通用模型在专业销售场景中的“幻觉”缺陷,提供了大模型应用的新范式。
腾讯微信AI团队推出新型扩散语言模型WeDLM,旨在提升文本生成效率。该模型结合扩散模型与因果注意力机制,通过拓扑重排技术兼容KV缓存,解决了传统扩散模型因双向注意力导致的推理效率问题,突破了GPT等大模型在并行推理上的限制。
北京智源人工智能研究院发布新一代多模态大模型Emu3.5,实现“世界级统一建模”,突破传统AI在物理理解和因果推理上的短板,让AI从单纯生成图像、文本进化到真正理解物理世界。
Meta首席AI科学家Yann LeCun计划离职创业,专注世界模型研究。这位图灵奖得主、纽约大学教授旨在开发能理解环境、模拟因果关系的AI系统。当前谷歌DeepMind等机构也在推进同类研究,预示该领域竞争加剧。
高性能的7B参数因果语言模型
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
$8
$240
52
Bytedance
$1.2
$3.6
4
JunHowie
Qwen3-8B 是 Qwen3 系列中的一款大语言模型,具备因果语言模型的特性,在推理、多语言支持、智能体能力等方面表现出色,能为用户带来自然、流畅的对话体验。
BanglaLLM
基于LLaMA-2架构优化的13B参数孟加拉语大语言模型,支持孟加拉语和英语的因果语言建模
abhinand
基于LLaMA-2架构的70亿参数泰米尔语大语言模型,支持泰米尔语和英语的因果语言建模
CausalLM
CausalLM/14B-DPO-α是一个基于因果语言模型的大规模语言模型,支持中英文文本生成任务,在MT-Bench评测中表现优异。
Auto Causal Inference是一个利用大型语言模型(LLM)自动进行因果推断的项目,用户只需指定处理变量和结果变量,系统就能自动完成变量角色识别、因果图构建、效应估计和模型验证等全流程分析。项目提供两种代理架构(LangGraph和MCP)来实现这一功能,特别适用于银行场景下的因果问题分析。