谷歌向开发者开放新版深度研究代理,可嵌入应用。该代理采用迭代研究方法,能自主搜索、分析并持续优化答案,性能优于前代模型。
中国推出多模态AI模型DeepEyesV2,能分析图像、执行代码和网络搜索。它通过智能利用外部工具,而非依赖训练数据,性能超越大型模型。早期实验显示,仅靠强化学习无法稳定完成多模态任务,模型曾尝试编写Python代码分析图像但效果不佳。
Anthropic内部测试新一代AI模型Claude Opus4.1,代号"claude-leopard-v2-02-prod",主打强化问题解决能力。泄露截图显示其宣传语强调推理性能提升,暗示模型在响应速度和分析能力上有突破。该版本已进入生产环境测试阶段,可能近期发布。当前AI行业正聚焦推理能力竞赛,Opus4.1的推出旨在应对GPT-o1等竞争对手的挑战。豹子代号预示模型将更敏捷精准,满足专业领域复杂任务需求。
谷歌推出医疗AI开发工具包HAI-DEF,包含MedGemma和MedSigLIP两大开放模型。MedGemma27B多模态模型支持医疗文本生成和电子病历分析,MedSigLIP则擅长医学图像分类检索。这些模型可在单GPU运行,支持本地部署和微调,确保数据隐私和定制需求。相比API模型,开放架构让开发者能灵活应对医疗场景的特殊要求,如隐私保护和性能优化。项目提供详细教程,支持Hugging Face和Vertex AI平台部署。
首个全面评估多模态大型语言模型在视频分析中的性能基准。
解锁数据 AI
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
Bytedance
$1.2
$3.6
4
cpatonn
Apriel-1.5-15b-Thinker是ServiceNow开发的150亿参数多模态推理模型,具备文本和图像推理能力,性能可媲美比它大10倍的模型,在人工分析指数上获得52分,在企业领域基准测试中表现优异。
nightmedia
这是一个基于GLM-4.5-Air的文本生成模型,专门针对MLX框架进行了mxfp4量化优化。该模型提供了多种量化版本(mxfp4、qx64和qx5-hi)的性能对比分析,为不同任务场景下的模型选择提供依据。
allenai
Llama-3.1-70B-Instruct-RM-RB2是艾伦人工智能研究所发布的7组奖励模型之一,用于开发基准测试并与下游PPO/Best-of-N性能关联分析。
unsloth
InternVL3-78B是一款先进的多模态大语言模型,具备卓越的多模态感知和推理能力,在工具使用、GUI代理、工业图像分析、3D视觉感知等领域表现出色,整体文本性能也十分优秀。
OpenGVLab
InternVL3-78B是OpenGVLab推出的先进多模态大语言模型,展现卓越的综合性能。相比前代InternVL 2.5,具备更强大的多模态感知与推理能力,并将能力拓展至工具使用、GUI代理、工业图像分析、3D视觉感知等新领域。
yifeihu
基于DocLayNet数据集微调的Florence-2模型,专用于文档布局分析任务,通过类别名称简化提升性能
AutonLab
MOMENT是一系列通用时间序列分析的基础模型,支持多种时间序列任务,具备开箱即用的有效性,并可通过微调提升性能。
MOMENT是一系列通用时序分析基础模型,支持多种时序分析任务,具备开箱即用的有效性,并可通过微调提升性能。
Sharukesh
该模型专注于固态储氢领域的研究,可能用于预测或分析固态储氢材料的性能。
internlm
InternLM2是由上海人工智能实验室开发的开源大语言模型,具有200K上下文窗口、出色的综合性能、代码解释器与数据分析能力以及强大的工具使用能力,能为用户提供高效、准确的文本生成服务。
microsoft
BioViL-T是一个专注于分析胸部X光片和放射学报告的视觉语言模型,通过时序多模态预训练提升性能。
snunlp
面向韩语金融领域的预训练语言模型,通过增量预训练和情感分析微调提升金融文本处理性能
pranaydeeps
首个也是唯一可用的古希腊语子词BERT模型,在词性标注和形态分析任务上达到最先进的微调后性能。
cmarkea
基于DistilCamemBERT微调的法语情感分析模型,推理时间减半且保持相同性能。
Abdou
基于AraBERT大模型微调的阿尔及利亚方言情感分析模型,在YouTube评论数据集上达到最优性能。
Umami Analytics MCP Server是一个增强Claude能力的模型上下文协议服务器,提供对Umami网站分析数据的访问,支持用户行为分析和网站性能跟踪。
Tailpipe MCP服务器是一个AI驱动的日志分析工具,通过模型上下文协议连接AI助手与云端/SaaS日志数据,支持自然语言查询和分析各类云服务日志,提供安全事件调查、成本性能洞察等功能。
Meta Ads MCP是一个基于Model Context Protocol的服务器,用于通过标准化接口与Meta广告API交互,使AI模型能够访问、分析和管理Meta广告活动,包括获取性能数据、可视化广告创意和提供战略建议。
一个提供Google PageSpeed Insights分析的MCP服务器,帮助AI模型通过标准化接口分析网页性能。
Sentry MCP服务器是一个用于与Sentry交互的模型上下文协议服务器,提供工具来检索和分析错误数据、管理项目和监控应用性能。
PageSpeed MCP服务器是一个连接AI助手与谷歌PageSpeed Insights API的桥梁,为AI模型提供网站性能分析功能,包括核心性能指标、SEO评估、可访问性审计和资源优化建议。
Lighthouse MCP Server是一个基于Google Lighthouse的模型上下文协议服务器,提供全面的网站性能审计和分析功能,包括性能评分、可访问性检查、SEO分析和安全评估。
OpenRouter MCP多模态服务器是一个通过OpenRouter.ai提供文本聊天和图像分析功能的协议服务器,支持多种模型选择和性能优化。
一个用于查询New Relic日志的MCP服务器,支持通过NRQL查询语言与LLM模型(如Claude)交互,提供日志查询、错误分析和性能监控功能。
CryptoWeather AI比特币信号是一个通过模型上下文协议(MCP)提供实时比特币价格预测的AI服务,包含交易建议、性能指标和信号分析功能,每小时更新一次数据。
一个基于Model Context Protocol的服务,提供Google PageSpeed Insights网页性能分析功能,使AI模型能通过标准化接口评估网页加载表现。
Sentry MCP服务器是一个用于与Sentry交互的模型上下文协议服务,提供工具来检索和分析错误数据、管理项目和监控应用性能。
Perfetto MCP是一个模型上下文协议服务器,能够将自然语言提示转换为专业的Perfetto跟踪分析,帮助开发者无需编写SQL即可进行性能分析、ANR检测、CPU热点线程识别、锁竞争分析和内存泄漏检测。
一个基于本地Ollama模型的AI代码审计服务器,通过Model Context Protocol (MCP)集成,提供多维度代码分析,包括安全性、完整性、性能、质量、架构、测试和文档检查。