在生命科学的前沿,AI 技术正在引发一场革命。最近,生物计算公司 ProFluent 推出了 ProGen3,一款强大的生成式蛋白质语言模型(PLM),它有望在抗体、工业酶及基因编辑领域带来重大突破。研究显示,ProGen3的规模和设计优化能够生成功能强大的新型蛋白质,甚至重塑我们对生物学的理解。蛋白质是生命体内的关键分子,负责多种生理功能。从催化反应到识别病原体,它们的作用不可小觑。然而,设计新的氨基酸序列以实现未曾出现的功能,如新药物或超稳定的工业酶,面临巨大挑战。Pro
在生物科技领域,利用人工智能加速研究已经成为一种新常态。近日,生物科技公司 Cradle 宣布完成7300万美元的融资,计划进一步扩展其实验室和团队。Cradle 于2022年成立,致力于探索语言模型在生物科技中的应用。创始人兼首席执行官 Stef van Grieken 曾形象地将氨基酸和碱基的组合称为 “外星编程语言”,尽管这种语言 AI 模型也能进行一定程度的解析。图源备注:图片由AI生成,图片授权服务商MidjourneyCradle 的目标是通过 AI 技术加速对大分子(如蛋白质)的测试。蛋白质在医学和工业中有
["欧洲饮料公司 Hell Energy 利用 AI 开发新饮料 HELLAI,包括配方和包装设计。","AI 系统综合各种数据开发优质口味的饮料,包括维生素、氨基酸和草药。","AI 还参与了产品包装设计,使其视觉上更具吸引力且当代化。"]
预计所有可能的人类氨基酸替代和错义变异
nvidia
ESM-2是NVIDIA基于TransformerEngine优化的蛋白质语言模型,能够从氨基酸序列预测蛋白质3D结构。该模型采用掩码语言建模目标训练,在NVIDIA GPU上具有更快的训练和推理速度。
andrewdalpino
ESMC蛋白质功能预测器是基于进化规模模型(ESM)的工具,能够根据氨基酸序列利用基因本体论(GO)预测蛋白质功能。该模型在UniRef、MGnify和联合基因组研究所数据库上预训练,在AmiGO Boost数据集上微调,可预测蛋白质的分子功能、生物过程和细胞位置。
基于进化尺度模型(ESM)的蛋白质功能预测工具,通过氨基酸序列预测蛋白质的分子功能。
oohtmeel
该模型基于Bert-Base-Uncased微调,用于根据蛋白质氨基酸序列预测其功能的多标签分类任务。
NaturalAntibody
nanoBERT是一个纳米抗体特异性转换器,用于预测给定查询序列中特定位置的氨基酸。
qilowoq
AbLang是一种抗体语言模型,专门用于处理抗体序列,特别是重链序列。该模型基于大写氨基酸字母训练,适用于蛋白质特征提取和下游任务微调。
wukevin
TCR-BERT 是一个基于 BERT 架构的预训练模型,专门针对 T 细胞受体(TCR)序列进行优化,通过掩码氨基酸建模任务进行训练。
Rostlab
该模型用于预测给定氨基酸序列的蛋白质质谱数据。