["阿里巴巴CEO吴泳铭:智能化时代才刚开始,AI将改变生活方式","中国移动董事长:算力成为新的基础能源,要统筹运用","拼多多通过数字化实现小农户直连全国市场","生物信息学领域需要依赖互联网处理海量基因数据","乌镇峰会推动网络安全企业发展,及时捕捉行业动向"]
["哈佛、哥大发布开源数据集OpenProteinSet,包含1600万蛋白质多序列对齐和相关数据,为AI模型训练提供支持。","AlphaFold 2的准确性在蛋白质结构预测领域创下里程碑,但其私有数据限制了其他研究者的进展。","OpenProteinSet包括PDB中所有蛋白质的MSAs,为蛋白质机器学习社区提供充足的预计算MSA资源。","该数据集可用于结构生物学各种任务,推动生物信息学和蛋白质机器学习领域的研究。","OpenProteinSet是一个重要的生物信息学资源,为多模态语言模型提供了宝贵的生物知识。"]
70亿参数的元基因组基础模型,用于流行病监测和病原体检测.
探索生命交互的奥秘
利用自然语言进行单细胞分析
基于知识图谱的检索增强生成框架,赋能大型语言模型处理知识密集型任务
Synthyra
Profluent - E1 是对 Profluent Bio 公司 E1 模型的忠实实现,由 Synthyra 发布。它是一个专注于蛋白质序列处理的预训练语言模型,集成了 Hugging Face AutoModel 兼容性,并提供高效的嵌入功能,旨在简化生物信息学任务中的蛋白质序列分析和表示学习。
AIRI-Institute
GENA-LM是一个用于长DNA序列分析的开源基础模型,基于Transformer架构的掩码语言模型,专门针对生物信息学领域设计,能够处理长达4500个核苷酸的DNA序列。
非官方的UniProt MCP服务器,提供26种生物信息学工具,支持蛋白质搜索、结构分析、功能注释等高级功能,通过REST API直接访问UniProt数据库。
SCMCP是一个通过自然语言处理进行单细胞RNA测序分析的MCP服务器
非官方的Reactome MCP服务器,提供访问Reactome通路和系统生物学数据的模型上下文协议服务,包含8个已验证的功能工具,涵盖通路搜索、细节获取、基因关联、疾病机制等生物信息学分析。
非官方GTEx门户MCP服务器,提供对GTEx(基因型-组织表达)项目基因表达和调控数据的全面访问,包含25个专业工具,支持基因表达分析、eQTL关联分析和基因组数据查询。
Bioconda-MCP-Server是一个基于Bioconda的生物信息学工具管理平台,提供MCP(可能指微服务控制平台或类似功能)服务。
为生物信息学家和计算生物学家提供的MCP服务器