OpenAI发布生命科学专用AI模型GPT-Rosalind,以DNA结构发现者罗莎琳德·富兰克林命名,正式进军生物化学与基因组学领域。该模型针对生物研究需求深度微调,旨在帮助科学家缩短药物研发周期,将数据分析转化为高效智能科研流程,具备卓越科学推理能力。
OpenAI推出生物学专用大模型GPT-Rosalind,旨在解决基因组数据过载和专业术语壁垒两大研究痛点,与通用科学模型形成差异化竞争。
清华大学智能产业研究院联合水木分子开源了生物医药大模型插件集OpenBioMed Skills,将专家决策流程转化为可执行的Agent Skill代码。首批发布的45项核心技能覆盖生物化学与药物研发、蛋白质分析设计、单细胞组学分析及数据检索等五大领域,旨在降低生物医学研发的工程门槛,推动全流程智能化。
OpenClaw是一款以红色龙虾为图标的AI智能体工具,近期在朋友圈走红。它具备强大的“执行力”,能自主识别屏幕并操作鼠标键盘,实现跨系统自动化办公,显著提升工作效率。在生物医药领域,OpenClaw将原本耗时数小时的数据处理工作缩短至分钟级别,正悄然改变行业职场生态。
一款基于生物医学数据的8亿参数大型语言模型
Openai
-
Input tokens/M
Output tokens/M
Context Length
Anthropic
$105
$525
200
$21
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
$8
$240
52
Moonshot
$4
$16
Baidu
32
$8.75
$70
400
$1.75
$14
$0.35
Tencent
24
Xai
Huawei
128
mradermacher
Lamapi/next-12b 是一个基于12B参数的大语言模型,通过多语言数据集进行微调,支持50多种语言,具备高效文本生成能力,适用于化学、代码、生物、金融、法律等多个领域的自然语言处理任务。
OpenMed
专门用于疾病实体识别的模型,能够精准识别来自NCBI数据集的疾病实体,为生物医学领域的研究和临床应用提供有力支持。
这是一款专门用于疾病实体识别的Transformer模型,基于xlm-roberta-base架构,在NCBI疾病数据集上微调而成。该模型能够准确识别生物医学文本中的疾病实体,支持B-Disease和I-Disease两种实体类型识别,为企业级医疗应用提供高精度实体提取能力。
这是一款专门用于化学实体识别的模型,能够精准识别生物医学文献中的化合物和物质,为生物医学研究和临床应用提供有力支持。该模型在BC4CHEMD数据集上训练,具有高精度和特定领域优化的特点。
OpenMed-NER-ChemicalDetect-MultiMed-568M是一款专门用于化学实体识别的生物医学NLP模型,能够在生物医学文献中精准识别化学化合物和物质。该模型基于bge-m3架构,在BC4CHEMD数据集上训练,达到0.9459的F1分数,为生物医学研究和临床应用提供有力支持。
这是一个专门用于生物医学领域物种实体识别的模型,基于BiomedELECTRA架构,在SPECIES800数据集上训练,能够精准识别物种名称,为生物医学研究和应用提供支持。
这是一款专门用于基因实体识别的生物医学命名实体识别模型,基于BiomedBERT架构在GELLUS数据集上微调而成,能够精准识别与基因相关的实体,为生物医学研究和临床应用提供有力支持。
这是一款专门用于临床实体识别的专业模型,专注于慢性淋巴细胞白血病相关的生物医学实体识别。该模型基于multilingual-e5-large-instruct架构,在精心策划的CLL数据集上训练,能够从医疗文本中精准提取生物医学实体,具有高精度和领域特异性。
OpenMed-NER-PharmaDetect-BioPatient-108M是一款专业的化学实体识别模型,专门针对生物医学文本进行优化。该模型在BC5CDR_CHEM数据集上训练,能够精准识别和提取化学实体,适用于药物相互作用检测、患者记录药物提取等多种临床和研究应用场景。
这是一款专门用于化学实体识别的模型,基于xlm-roberta-base架构,在BC5CDR数据集上训练,可识别生物医学文本中的化学实体,在生物医学领域有着广泛应用。
这是一款专门用于疾病实体识别的生物医学模型,基于BiomedELECTRA-large架构,拥有3.35亿参数。该模型在BC5CDR数据集上训练,能够精准识别疾病实体,为临床和研究应用提供高精度的命名实体识别能力。
这是一款专门用于基因实体识别的模型,基于xlm-roberta-large架构,拥有560M参数。该模型在GELLUS数据集上训练,能够精准识别与基因相关的实体,为生物医学和遗传学研究提供有力支持。
专为疾病实体识别设计的Transformer模型,能够从NCBI数据集中精准识别疾病实体,为生物医学领域的研究和临床应用提供支持。
这是一款专门用于基因/蛋白质实体识别的模型,能够精准识别和提取生物医学文本中的基因和蛋白质提及信息。该模型在BC2GM数据集上训练,具有高精度和特定领域优化,为临床和研究应用提供可靠支持。
OpenMed-NER-DNADetect-BioMed-109M 是一款专门用于生物医学命名实体识别(NER)的模型。它基于 BiomedELECTRA 架构微调,擅长从临床文本和研究论文中准确识别蛋白质、DNA、RNA、细胞系和细胞类型等关键生物医学实体。该模型在 JNLPBA 数据集上训练,具有高精度和易于集成的特点,适用于药物发现、临床记录分析和生物医学知识图谱构建等场景。
这是一款专门用于疾病实体识别的生物医学命名实体识别模型,基于PubMed数据训练,能够从NCBI数据集中精准识别疾病实体,为生物医学领域的研究和临床应用提供有力支持。
OpenMed-NER-ProteinDetect-MultiMed-568M是一款专为生物医学实体识别打造的先进模型,基于bge-m3架构,拥有568M参数。该模型在FSU数据集上训练,能够精准识别多种生物医学实体,包括蛋白质、蛋白质复合物、蛋白质家族等,在临床和研究应用中具有极高的实用价值。
这是一款专门用于化学实体识别的生物医学命名实体识别模型,基于BiomedBERT架构在BC4CHEMD数据集上训练,能够精准识别生物医学文献中的化合物和物质,为药物发现和临床研究提供支持。
这是一款专业的化学实体识别模型,能够精准识别生物医学文献中的化合物和物质,为生物医学研究和临床应用提供有力支持。该模型在BC4CHEMD数据集上训练,具有高精度和特定领域优化的特点。
专门用于化学实体识别的模型,能够从BC5CDR数据集中精准识别和提取生物医学实体,在临床和研究应用中具有极高的可靠性。
BioMCP是一个开源生物医学AI工具包,通过连接权威数据源为AI系统提供专业生物医学知识支持。
一个支持溯源和SQLite持久化的Python超图库,用于表示多节点复杂关系,适用于知识图谱、AI代理记忆和生物医学数据等领域。
bioRxiv MCP服务器为AI助手提供访问bioRxiv预印本库的桥梁,支持论文搜索、元数据获取等功能,助力生物科学研究。
一个基于MCP协议的Biomart接口服务器,提供生物数据查询与转换功能。
这是一个用于访问KEGG生物数据库的Model Context Protocol服务器,提供30个生物数据分析工具,支持HTTP传输和LangChain集成,方便LLM调用KEGG数据进行生物信息学分析。
BioMCP是一个基于MCP协议的生物医学研发服务器,通过整合蛋白质数据库和分析工具,增强大语言模型在蛋白质结构分析领域的能力。
非官方的UniProt MCP服务器,提供26种生物信息学工具,支持蛋白质搜索、结构分析、功能注释等高级功能,通过REST API直接访问UniProt数据库。
非官方的Reactome MCP服务器,提供访问Reactome通路和系统生物学数据的模型上下文协议服务,包含8个已验证的功能工具,支持生物通路搜索、详细信息获取、基因关联通路查找等操作。
一个集成了Reactome、KEGG、UniProt、OMIM等14个生物医学数据库API的MCP服务器,提供100多种工具用于基因、蛋白质、通路、疾病、药物和临床试验等研究数据的查询与分析。
非官方的PubChem MCP服务器,提供超过1.1亿种化合物的全面访问,包括分子属性、生物测定数据和化学信息学工具。
非官方的PubChem MCP服务器,提供超过1.1亿种化学化合物的全面访问,包括分子特性、生物测定数据和化学信息学工具。
PubMed MCP服务器是一个基于Model Context Protocol的接口服务,为AI代理和研究工具提供PubMed生物医学文献数据库的全面访问能力。支持文献搜索、元数据获取、引用分析、研究计划生成和数据可视化等功能,通过NCBI E-utilities API实现高效集成。
BioContextAI知识库MCP是一个为生物医学研究设计的模型上下文协议服务器,提供AI系统与生物医学资源之间的标准化连接层,支持多种生物医学数据库和工具的集成访问。
bioRxiv MCP服务器是一个连接AI助手与bioRxiv预印本库的桥梁,通过MCP协议实现生物学预印本的搜索和元数据访问。
PubMed MCP Server是一个通过Model Context Protocol(MCP)为AI助手提供访问PubMed生物医学文献库的桥梁服务,支持文献搜索、元数据获取和深度分析功能。
一个基于Ensembl REST API的全功能MCP服务器,通过10个工具分组提供基因、变异、序列等生物数据查询服务,支持多物种和跨数据库引用。
非官方的Reactome MCP服务器,提供访问Reactome通路和系统生物学数据的模型上下文协议服务,包含8个已验证的功能工具,涵盖通路搜索、细节获取、基因关联、疾病机制等生物信息学分析。
PDB MCP服务器是一个提供蛋白质数据库(PDB)访问的模型上下文协议服务,支持结构搜索、信息获取、文件下载和质量评估等功能。
该项目展示了如何将MCP代理与NASA开放科学数据仓库(OSDR)工具集成,实现生物数据的获取、分析与摘要生成。
bioRxiv MCP服务器是一个连接AI助手与bioRxiv预印本库的桥梁,通过MCP协议实现生物学预印本的搜索和元数据访问功能。