腾讯强化大模型战略,重组AI研发体系,新设AI基础设施、数据及计算平台部门,构建全栈能力。战略升级为“基础设施+工程化+场景落地”三位一体,前OpenAI研究员姚顺雨出任首席AI科学家。
腾讯调整大模型研发架构,新设AI Infra部、AI Data部及数据计算平台部,以强化从算力到数据的全链路竞争力。Vincesyao出任首席AI科学家,直接向总裁刘炽平汇报。
日本数据科学家本田崇人推出开源编程语言“Sui”,旨在解决大语言模型生成代码的准确性问题,宣称可实现100%准确率。其设计理念源于日本美学“粋”,强调精炼与去除冗余,核心原则包括保证零语法错误率,并使用数字作为变量。
日本数据科学家本田崇人推出全新编程语言Sui,其设计理念源自日本美学“粋”,追求极致精炼。该语言通过消除语法错误、用数字代替变量名、确保每行代码独立运行,旨在解决大模型生成代码时常见的语法、命名混乱及上下文依赖问题,提升代码生成质量。
为学生和专业人士提供的AI学习助手,可个性化学习编程、数据科学等技能
AI数据科学平台,可通过自然语言生成Jupyter笔记本和数据可视化。
一个为Jupyter设计的AI代理,可以通过自然语言生成代码并运行单元格。
一个旨在推动人工智能民主化的开源项目。
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
-
Anthropic
$105
$525
$21
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
$8
$240
52
Moonshot
$4
$16
Baidu
32
Tencent
$1
$8.75
$70
400
$1.75
$14
$0.35
24
Deepseek
Xai
TeichAI
本模型是基于Qwen3-4B-Thinking-2507基础模型,使用高推理难度的Gemini 3 Pro预览数据集进行蒸馏训练得到的模型。它专注于提升在编码和科学领域的复杂推理能力,通过特定数据集的训练,旨在将大型模型(如Gemini 3 Pro)的推理能力高效地迁移到较小规模的模型中。
这是一个基于Claude Sonnet 4.5推理数据集训练的30B参数大语言模型,专门针对高难度推理任务进行优化,在编码和科学领域表现出色。
这是一个基于Qwen3 30B A3B模型,在Claude Sonnet 4.5高推理难度数据集上训练的蒸馏模型。该模型专门针对复杂推理任务进行优化,在编码和科学领域表现出色,具备较强的逻辑推理能力。
allenai
Olmo 3是Allen Institute for AI (Ai2)开发的全新32B参数语言模型家族,包含Base、Instruct和Think等变体。该模型基于Dolma 3数据集训练,支持65,536的长上下文处理,旨在推动语言模型科学发展。模型完全开源,遵循Apache 2.0许可证。
EpistemeAI
metatune-gpt20b是一个具有自改进能力的大语言模型原型,能够为自身生成新数据、评估自身性能,并根据改进指标调整超参数。该模型在博士后水平的科学和数学理解方面表现出色,同时也可用于编码任务。
Nanbeige
Nanbeige4-3B-Thinking是第四代Nanbeige大语言模型家族中的30亿参数推理模型,通过提升数据质量和训练方法实现了先进的推理能力。该模型在数学、科学、创意写作、工具使用等多个领域表现出色,支持多阶段课程学习和强化学习训练。
gabriellarson
基于Qwen3-4B-Thinking-2507微调的专业数据科学代理模型,专门针对Jupyter笔记本环境优化,能够执行Python代码、分析数据集并提供逐步推理。
Olmo 3是由Allen Institute for AI开发的全新7B参数语言模型系列,基于Transformer架构,在Dolma 3数据集上训练,旨在推动语言模型科学发展。模型提供Base、Instruct和Think等多种变体,支持最长65,536的上下文长度。
facebook
MobileLLM-R1是Meta发布的高效推理语言模型系列,专注于数学、编程和科学问题解决。该模型在参数规模较小的情况下仍能取得优异性能,提供完整的训练配方和数据源支持复现研究。
MobileLLM-R1是专注于数学、编程和科学问题的高效推理模型系列,在较少训练数据下实现出色性能,提供完整的训练配方和数据源。
prithivMLmods
基于Qwen3架构构建的专业模型,专注于科学、人工智能设计和通用推理领域。该模型在高难度科学推理数据集上进行了微调,具备出色的通用和创造性推理能力,体积小巧适合本地设备和服务器部署。
internlm
Intern-S1是目前最先进的开源多模态推理模型,结合了强大的通用任务处理能力和在广泛科学任务中的卓越性能,可与领先的闭源商业模型相媲美。该模型在5T token数据集上进行持续预训练,其中超过50%是专业科学数据,具备动态分词器能够原生理解分子式、蛋白质序列和地震信号。
mlfoundations-dev
基于Qwen/Qwen2.5-7B-Instruct在科学数据集上微调的版本
Danielbrdz
基于google/gemma-3-4b-it模型训练的多模态模型,专注于数学、编程、科学和解谜领域的高质量数据处理。
microsoft
Phi-4推理是基于Phi-4通过监督微调思维链轨迹数据集和强化学习训练的前沿开放权重推理模型,专注于数学、科学和编程技能。
HoangHa
Pensez是一个英法双语推理模型,通过显著减少训练数据来最大化效率。该模型基于Qwen 2.5 Instruct 7B构建,专注于日常推理任务和科学问题,采用简洁推理和扩展推理等优化策略提升性能。
KaiserML
该模型是基于nomic-ai/nomic-embed-text-v1.5在科学文献数据集上微调的句子转换器,专门用于分析学术文本的修辞功能,如总结结果、表达局限性等。
nyamuda
该模型是基于t5-small微调的版本,专为使用PubMed数据集总结科学和医学文本而优化。
nasa-impact
基于INDUS模型微调,用于对NASA通用元数据存储库中的科学关键词进行分类,提升地球观测元数据的可访问性和组织性。
ValiantLabs
Shining Valiant 2是基于Llama 3.1 8B构建的聊天模型,针对友好交流、深刻见解、知识储备和热情互动进行了微调。该模型在多种高质量开源数据上进行训练,专注于科学、工程、技术知识和结构化推理,能为用户提供专业且全面的回答。
这是一个持续更新的MCP服务器精选列表,涵盖了浏览器控制、艺术与文化、云平台、命令行、通信、客户数据平台、数据库、开发者工具、数据科学工具、文件系统、金融与金融科技、游戏、知识与记忆、位置服务、营销、监控、搜索和实用工具等多个类别。每个项目都附带了GitHub链接和星标数量,方便用户快速了解和使用。
Awesome MCP Servers 是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了7158个MCP服务器,分为33个类别,包括AI集成、艺术媒体、浏览器自动化、云服务、数据库、开发者工具、文件系统、金融、游戏、硬件、医疗、基础设施、知识管理、位置地图、市场营销、监控、多媒体处理、操作系统、项目管理、科学研究、安全、社交媒体、旅行交通、实用工具和版本控制等。
这是一个实现MCP代码执行模式的服务器,通过单工具桥接和零上下文发现机制,将MCP工具调用开销从数万token降至约200token,并在根容器中安全执行Python代码,支持数据科学和安全隔离。
bioRxiv MCP服务器为AI助手提供访问bioRxiv预印本库的桥梁,支持论文搜索、元数据获取等功能,助力生物科学研究。
一个通过arXiv API提供科学论文访问的MCP服务器,支持搜索、获取论文元数据和摘要等功能。
Symbolica-mcp是一个科学计算模型上下文协议(MCP)服务器,提供符号计算、数据分析、可视化及量子计算等功能,支持在容器化环境中运行。
MCP-DBLP是一个基于模型上下文协议(MCP)的服务,为大型语言模型提供访问DBLP计算机科学文献数据库的功能,包括搜索、引用处理和BibTeX导出等。
Academia MCP是一个为学术研究设计的MCP服务器,提供搜索、获取、分析和报告科学论文与数据集的工具,支持ArXiv、ACL Anthology、Hugging Face等平台,并包含网页爬取、LaTeX编译、PDF阅读及LLM增强功能。
Adaptive Graph of Thoughts是一个基于Neo4j图数据库的智能科学推理框架,通过图结构实现复杂的科学推理任务,支持与Claude Desktop等AI应用集成。
MCP.science是一个开源项目,提供多种MCP服务器,专为科学研究应用设计,使AI模型能通过标准化协议与科学数据、工具和资源交互。
MCP Server是一个多功能数据探索工具,可作为个人数据科学助手,将复杂数据集转化为清晰可操作的见解。它支持通过Claude桌面应用加载CSV数据,执行Python脚本,并自动生成数据分析报告和可视化图表。
该项目展示了如何将MCP代理与NASA开放科学数据仓库(OSDR)工具集成,实现生物数据的获取、分析与摘要生成。
medRxiv MCP服务器是一个连接AI助手与medRxiv预印本库的桥梁,通过MCP协议提供论文搜索、元数据获取等功能,支持健康科学研究。
MCP.science是一个开源项目,提供多种专为科学研究设计的MCP服务器,使AI模型能够通过标准化协议与科学数据、工具和资源交互。
Neurosift项目提供MCP服务工具,用于神经科学数据的可视化和分析。
medRxiv MCP Server是一个连接AI助手与medRxiv预印本库的桥梁工具,通过Model Context Protocol(MCP)协议实现健康科学领域预印本的搜索、元数据获取和内容访问功能,支持本地存储和论文分析提示。
一个为英国科学博物馆集团API设计的Python MCP服务器,允许LLM获取博物馆数据,支持Claude Desktop集成
medRxiv MCP服务器是一个连接AI助手与medRxiv预印本库的桥梁,通过模型上下文协议(MCP)提供健康科学预印本的搜索、元数据获取和内容访问功能。
MCPy是一个基于Python和Cython的高性能Minecraft服务器引擎,集成了科学计算库和高级优化技术,旨在提供卓越的性能和可扩展性。项目目前处于开发阶段,包含核心模块如服务器引擎、世界生成、网络处理、实体系统和数据持久化。
这是一个全面的Model Context Protocol (MCP)服务器集合,涵盖了AI服务、艺术与文化、浏览器自动化、云平台、云存储、命令行、通信、客户数据平台、数据科学工具、数据库、开发者工具、文件系统、金融、游戏、知识与记忆、位置服务、营销、监控、笔记、其他工具与集成、研究与数据、搜索、安全、社交媒体、系统自动化、旅行与交通、版本控制和工作流自动化等多个类别。