加州芯片公司Cerebras Systems完成10亿美元融资,估值达230亿美元,一年内增长近三倍。其独创的晶圆级引擎技术突破传统芯片架构,获得硅谷风投Benchmark Capital领投,显示市场对非GPU算力路线的看好。
人工智能初创公司Mercor完成3.5亿美元融资,由Felicis领投,Benchmark等跟投。该公司由三位蒂尔研究员创立,业务重心从招聘决策转向为AI模型训练招募高技能人才。
AI初创公司Mercor完成3.5亿美元融资,估值达100亿美元。本轮由Felicis领投,Benchmark、General Catalyst及Robinhood Ventures参与。资金将用于提升三大核心领域。
AI代码审查初创公司Greptile获3000万美元A轮融资,估值1.8亿美元,由Benchmark领投。该公司由2023年毕业的Dasksh Gupta创立,其AI工具能识别代码错误。但面临Graphite、Coderabbit等强劲对手竞争。Gupta曾因要求员工每天工作14小时引发争议,称"95%的努力等于零"。尽管工作文化受质疑,此次融资或将助力其发展。
用于评估Windows PC或Apple Mac上AI推理引擎性能的基准测试工具。
用于衡量设备 AI 加速器推理性能的基准测试工具。
AI文本生成性能测试工具
专业用户的性能测试基准套件
Tencent
$0.8
输入tokens/百万
$2
输出tokens/百万
32
上下文长度
Baidu
-
$4
$8
28
Baichuan
hazyresearch
M2-BERT-8K是一个8000万参数的长上下文检索模型,基于论文《Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT》提出的架构。
weezywitasneezy
BenchmarkEngineering-F2-7B-slerp是通过融合BenchmarkEngineering-7B-slerp和WestLake-7B-v2模型而创建的7B参数大语言模型,旨在提升原始模型的性能表现。
M2-BERT-128是论文《Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT》中提出的8000万参数检索模型检查点
aiknowyou
这是一个基于MT5-base架构的意大利语复述生成模型,在TaPaCo和STS Benchmark数据集上进行了微调。
一个基于MCP的vLLM交互式性能测试工具原型
benchmark-proxy项目的MCP服务配置示例
AutoGPT是一个开源的AI代理工具包,提供模块化和可扩展的框架,支持用户构建、测试和监控AI代理。项目包含Forge创新实验室、Benchmark测试环境和用户友好的前端界面,采用Agent Protocol标准化通信。社区活跃,定期举办黑客马拉松等活动推动创新。