谷歌FACTS团队与Kaggle联合发布FACTS基准测试套件,旨在评估生成式AI模型在企业任务中的事实性和真实性。该框架弥补了现有基准只关注问题解决能力、忽略输出信息与真实世界数据一致性的缺陷,尤其针对图像或图表中的信息嵌入,对法律、金融等关键领域尤为重要。
Gartner首份AI开发平台魔力象限发布,火山引擎作为“挑战者”象限首位,落地能力全球第五、中国第一。其优势在于模型-工具-算力-场景闭环完整,已助力消费、金融等多行业头部客户快速构建多模态应用。2025年上半年,火山引擎国内公有云大模型服务市场份额达49.2%,占据中国市场近半壁江山。
蚂蚁数科在香港金融科技节推出“多语种多模态大模型训练框架”,旨在解决大模型在多语言环境的应用瓶颈。传统英文大模型在小语种中易出现语言错乱和推理混乱,限制全球化发展。该框架通过优化多语种处理能力,提升模型在多样化语言环境下的表现,推动AI技术更广泛高效地服务于全球各行业。
人工智能实验室nof1启动Alpha Arena项目,在Hyperliquid平台对GPT-5、Gemini2.5Pro等六款主流模型进行实盘交易测试。各模型在相同提示与数据条件下,分别获得1万美元真实资金,评估其在真实金融环境中的交易决策与风控能力。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Openai
-
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$4
$16
$2
$20
$3.9
$15.2
64
Bytedance
$0.8
256
Moonshot
128
$0.15
$1.5
Baidu
32
Tencent
$1
mradermacher
Lamapi/next-12b 是一个基于12B参数的大语言模型,通过多语言数据集进行微调,支持50多种语言,具备高效文本生成能力,适用于化学、代码、生物、金融、法律等多个领域的自然语言处理任务。
unsloth
Qwen2.5-VL-72B-Instruct是Qwen家族的最新视觉语言模型,具备强大的视觉理解和视频分析能力,适用于金融、商业等多个领域。
NousResearch
这是一个实验性金融分析模型,通过Atropos强化学习框架优化金融基本面预测能力
TIGER-Lab
General-Reasoner是一种大语言模型训练范式,旨在全面增强模型在不同领域的推理能力,涵盖数学、编程、物理、化学、金融、人文等多个领域。该模型基于Qwen2.5-14B训练,通过多样化推理数据和基于模型的验证器提升跨领域推理性能。
cortexso
Deepscaler是一款基于DeepScaleR-1.5B-Preview开发的高级AI模型,专注于提升机器学习任务的效率与可扩展性。该模型提供高质量的预测分析和数据处理能力,适用于自然语言处理、计算机视觉等复杂场景,在金融、医疗和娱乐等行业有广泛应用。
FINGU-AI
FinguAI-Chat-v1是专为金融、投资和法律领域设计的专业对话模型,支持英语、韩语和日语三种语言。该模型在Qwen1.5-0.5B-Chat基础上微调而成,旨在提升使用者的语言能力同时提供深入的金融市场和监管知识。
SYSU-MUCFC-FinTech-Research-Center
ZhiLu是基于中文Alpaca2-13B二次开发的金融大语言模型,通过海量中英文语料增量预训练与高质量指令数据对齐实现能力跃升,重点强化金融领域专业表现。
SALT-NLP
FLANG-BERT是一个针对金融领域优化的预训练语言模型,基于BERT架构,通过金融术语优先掩码策略增强领域表征能力。
Financial Modeling Prep MCP服务器是一个实现模型上下文协议(MCP)的金融数据服务,提供253+种金融工具,覆盖股票信息、公司基本面、市场分析等24个类别。支持动态工具管理、选择性工具加载和多种配置模式,为AI助手提供全面的金融数据访问能力。
Awesome MCP Servers 是一个精心整理的 MCP (Model Context Protocol) 服务器集合,用于扩展大型语言模型(LLM)的能力。该项目按功能分类列出了各种 MCP 服务器实现,涵盖数据库、金融科技、知识记忆等多个专业领域,并提供了开发框架资源。