OpenAI周四正式推出GPT-Rosalind,一款专为生物学研究场景深度训练的垂直领域大语言模型。有别于谷歌、微软等巨头押注的通用科学模型路线,OpenAI这次选择了一条更聚焦的赛道——直击生物学研究的核心痛点。
生命科学产品负责人王昀昀在发布会上点明了这款模型的使命:帮助研究者突破两道长期横亘在面前的高墙——数十年基因组测序堆积的海量数据,以及高度细分的专业术语壁垒。现实情况是,一位专注于特定基因的遗传学家,面对铺天盖地的神经生物学文献时往往无从下手,信息过载已成为当下生物学研究的普遍困境。

为此,OpenAI在通用大模型底座之上,整合了50种常见生物工作流及主流公共数据库访问能力,让模型具备连接基因型与表型、推断蛋白质结构与功能、进而筛选潜在药物靶点的能力。与此同时,团队还专项调整了模型的"性格"——刻意强化批判性思维,避免一味迎合用户,面对低价值靶点时,模型会选择直接否定。
当然,挑战同样不容回避。幻觉问题至今悬而未决,模型可能生成看似合理却经不起推敲的内容,在严谨的科学研究中风险不小,OpenAI也坦承尚无完整解法,提醒用户保持审慎。生物安全层面的隐患同样不可忽视,一旦被恶意利用于强化病毒传染性,后果将难以想象。为此,OpenAI对访问权限实施严格管控,目前仅向美国本土实体开放申请,功能受限的生命科学插件则将面向更广泛用户逐步开放。
联合创始人Greg Brockman将GPT-Rosalind定位为OpenAI在生命科学领域的前沿探索,朝着"加速科学发展、改善人类福祉"这一目标迈出的重要一步。



