AIBase
Home
AI NEWS
AI Tools
AI Models
MCP
AI Services
AI Compute
AI Tutorial
Datasets
EN

AI News

View More

京东重磅发布开源安全框架JoySafety,助力AI应用守护安全

京东推出开源大模型安全框架JoySafety,已在AI导购、物流客服、医疗问诊等业务场景广泛应用。该框架旨在为企业提供免费、可靠的安全防护方案,支持日调用超亿次,准确率超95%。

10.1k 1 days ago
京东重磅发布开源安全框架JoySafety,助力AI应用守护安全

OpenAI 发布 HealthBench:评估大型语言模型在医疗领域表现的新标准

近日,OpenAI 发布了一款名为 HealthBench 的开源评估框架,旨在测量大型语言模型(LLMs)在真实医疗场景中的表现和安全性。此框架的开发得到了来自60个国家和26个医学专业的262名医生的支持,旨在弥补现有评估标准的不足,特别是在真实应用、专家验证和诊断覆盖方面。现有的医疗 AI 评估标准通常依赖于狭窄、结构化的形式,如多项选择考试。虽然这些形式在初步评估中有所帮助,但它们无法充分捕捉真实临床交互的复杂性和细微差别。HealthBench 则转向一种更具代表性的评估模式,包含

16.2k 11-14
OpenAI 发布 HealthBench:评估大型语言模型在医疗领域表现的新标准
AIBase
Empowering the future, your artificial intelligence solution think tank
English简体中文繁體中文にほんご
FirendLinks:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
Business CooperationSite Map