探索AI前沿,掌握行业发展趋势
每日精选AI热点,追踪最新行业动态
精准筛选产品,多维度产品调研
热门AI产品实力、热度、年/月/日排行
提交AI产品信息,助力产品推广和用户转化
一站式AI工具指南,快速找到你需要的工具
涵盖各类AI模型,满足你的开发与研究需求
热门AI大模型性能、热度、年/月/日排行
寻找优质模型提供商,获取可靠模型支持
多维度对比大模型,找到最适合你的模型
精准计算大模型使用成本,合理规划预算
多模型实时评测,模型输出结果快速比对
聚集热门MCP服务,快速找到适合你的服务
轻松接入MCP客户端,调用强大的AI能力
学习MCP使用技巧,从入门到精通
热门MCP服务性能排行,帮你找到最佳选择
发布你的MCP服务,推广你的MCP服务
自由测试MCP服务,线上快速体验
快速测试MCP服务,快速上线
分析并追踪人工智能模型如何引用您的品牌
检测品牌在AI平台中的可见度
通过AI搜索优化服务,让品牌在AI中实现霸屏
一键检测电脑配置,研判运行模型的兼容性
根据算力需求,推荐匹配的服务器配置
发现与 Industry Benchmark 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
开放式多模态实验室姿态估计工具箱和基准测试
OpenCompass是一个大型语言模型(LLM)评估平台,支持Llama3、Mistral、InternLM2、GPT-4、LLaMa2、Qwen、GLM、Claude等100多个数据集和多种模型的评估。
Silero模型:提供预训练的语音转文本、文本转语音和文本增强模型,使用极其简单。
开放式MMLab新一代视频理解工具箱和基准测试
百度智能科技开发的一系列大型语言模型
SWE-bench(多模态):语言模型能解决现实中的 GitHub 问题吗?
FlashRAG:一个用于高效检索增强生成研究的Python工具包(WWW2025资源)
MemU is an open-source memory framework for AI companions—high accuracy, fast retrieval, low cost. It acts as an intelligent "memory folder" that adapts to different scenarios, from different companions senarios.
百度智能科技开发的一款拥有130亿参数的大型语言模型
大型语言模型的统一评估框架
用于基准测试图神经网络的代码库(JMLR 2023)
【NeurIPS 2024】OSWorld:在真实计算机环境中对开放式任务的多模态智能体的基准测试
处理各种非结构化数据,例如反向图片搜索、音频搜索、分子搜索、视频分析、问答系统、自然语言处理等等。
【ECCV 2024】用于多模态理解的视频基础模型与数据
用于日志解析的机器学习工具包(发表在ICSE'19和DSN'16会议上)
关于基于大型语言模型的长文本建模,必读论文和博客
高效的检索增强与生成框架
MLPerf训练基准的参考实现
对大型语言模型生成代码的严格评估——NeurIPS 2023 & COLM 2024
这篇调查论文“大型语言模型的评估综述”的官方GitHub页面。