加州芯片公司Cerebras Systems完成10億美元融資,估值達230億美元,一年內增長近三倍。其獨創的晶圓級引擎技術突破傳統芯片架構,獲得硅谷風投Benchmark Capital領投,顯示市場對非GPU算力路線的看好。
人工智能初創公司Mercor完成3.5億美元融資,由Felicis領投,Benchmark等跟投。該公司由三位蒂爾研究員創立,業務重心從招聘決策轉向爲AI模型訓練招募高技能人才。
AI初創公司Mercor完成3.5億美元融資,估值達100億美元。本輪由Felicis領投,Benchmark、General Catalyst及Robinhood Ventures參與。資金將用於提升三大核心領域。
AI代碼審查初創公司Greptile獲3000萬美元A輪融資,估值1.8億美元,由Benchmark領投。該公司由2023年畢業的Dasksh Gupta創立,其AI工具能識別代碼錯誤。但面臨Graphite、Coderabbit等強勁對手競爭。Gupta曾因要求員工每天工作14小時引發爭議,稱"95%的努力等於零"。儘管工作文化受質疑,此次融資或將助力其發展。
用於評估Windows PC或Apple Mac上AI推理引擎性能的基準測試工具。
用於衡量設備 AI 加速器推理性能的基準測試工具。
AI文本生成性能測試工具
專業用戶的性能測試基準套件
Tencent
$0.8
輸入tokens/百萬
$2
輸出tokens/百萬
32
上下文長度
Baidu
-
$4
$8
28
Baichuan
hazyresearch
M2-BERT-8K是一個8000萬參數的長上下文檢索模型,基於論文《Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT》提出的架構。
weezywitasneezy
BenchmarkEngineering-F2-7B-slerp是通過融合BenchmarkEngineering-7B-slerp和WestLake-7B-v2模型而創建的7B參數大語言模型,旨在提升原始模型的性能表現。
M2-BERT-128是論文《Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT》中提出的8000萬參數檢索模型檢查點
aiknowyou
這是一個基於MT5-base架構的意大利語複述生成模型,在TaPaCo和STS Benchmark數據集上進行了微調。
一個基於MCP的vLLM交互式性能測試工具原型
AutoGPT是一個開源的AI代理工具包,提供模塊化和可擴展的框架,支持用戶構建、測試和監控AI代理。項目包含Forge創新實驗室、Benchmark測試環境和用戶友好的前端界面,採用Agent Protocol標準化通信。社區活躍,定期舉辦黑客馬拉松等活動推動創新。
benchmark-proxy項目的MCP服務配置示例