在生物科技领域,人工智能的应用正快速推动蛋白质的发现与设计。近日,加州大学伯克利分校(UC Berkeley)与加州理工学院(Caltech)的研究团队联合开发了一种名为 ProteinDT 的新型多模态框架,旨在利用文本描述来辅助蛋白质设计。这一创新方法不仅结合了蛋白质的序列和结构信息,还整合了大量以文本形式存在的生物知识,开启了蛋白质设计的新篇章。ProteinDT 的工作流程分为三个主要步骤。首先,研究团队利用 “对比性语言 - 蛋白质预训练”(ProteinCLAP)方法,将文本描述与蛋白质序列
["UC Berkeley 研究团队开发的语言模型系统接近人类水平预测能力。","系统利用大规模数据和 LM 的快速处理能力自动化关键预测过程。","研究显示系统平均 Brier 分数 0.179,有望提高预测精度和效率。","该研究为将语言模型整合到预测领域提供强有力论据。"]
评估大型语言模型调用函数能力的排行榜
berkeley-nest
首个基于AI反馈强化学习(RLAIF)训练的开源大语言模型,在MT Bench测试中表现优异