初创AI公司Axiom Math宣布其AI系统自2月以来提交的8篇数学论文中,5篇通过同行评审并被接收,标志着AI在纯数学研究领域取得突破性进展,特别是在解决分拆多项式倒数和等复杂学术猜想上迈出实质性一步。
Anthropic完成650亿美元H轮融资,投后估值达9650亿美元,逼近万亿。本轮由Altimeter Capital等领投,三星、SK海力士、美光及亚马逊参投。资金将用于AI安全与可解释性研究及规模扩展。
5月27日,杭州全息智能技术研究院在智慧网谷小镇举行产学研融合发布会,揭牌首批与六家行业领先企业共建的联合实验室,覆盖人工智能核心赛道,推动从“科研成果转化”向“产业协同创新”的系统性迈进,打通实验室到应用场的路径。
英伟达研究团队推出开源AI框架Polar,旨在让现有智能体框架(如Codex、Claude Code、Qwen Code)无缝接入广义相对策略优化(GRPO)训练方法。GRPO是一种强化学习优化技术,通过奖励信号调整模型策略,提升多步决策任务表现。Polar不改变原有工具调用、上下文组织和补丁提交方式,显著增强代码智能体的性能。
note.md是适用于macOS的本地优先Markdown工作区,用于专注写作与研究。
AI研究助手与学术写作工具,可做研究、生成报告、分析数据并提供引用
Noteweave将研究转化为可执行生产计划,加速研发,有同行评审证据支持。
Emporia连接市场研究者与专业人士,实现候选人筛选、招募自动化等。
Anthropic
$105
Input tokens/M
$525
Output tokens/M
200
Context Length
Alibaba
$54
$163
1k
Bytedance
$0.8
$8
256
Google
-
$140
$280
32
Tencent
$0.5
$2
224
$8.75
$70
Openai
$14
$56
$2.4
$9.6
$21
$84
128
$420
01-ai
4
Baichuan
MuXodious
Gemma 3n E4B IT 是谷歌推出的轻量级多模态开放模型,基于与Gemini模型相同的研究构建。该模型支持文本、音频和视觉输入,适用于多种任务,采用MatFormer架构实现高效参数利用。
prithivMLmods
Olmo-3-Think是艾伦人工智能研究所推出的完全开源的语言模型系列,包含7B和32B两种规模。该模型经过专门训练,能够展现明确的推理链,支持透明的逐步推理和可检查的中间思维痕迹,在推理、数学和代码任务中表现出色。
OpenMMReasoner
OpenMMReasoner是一个完全透明的两阶段多模态推理方案,涵盖有监督微调(SFT)和强化学习(RL)。该方案通过精心构建高质量数据集,在多个多模态推理基准测试中超越了强大的基线模型,为未来大规模多模态推理研究奠定了坚实的实证基础。
Mungert
MiroThinker v1.0是一个开源研究智能体,通过模型级别的交互式扩展提升工具增强推理和信息搜索能力。该模型在多个基准测试中表现出色,支持长上下文和深度多步分析。
allenai
Olmo-3-7B-Think-DPO是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现出色。该模型经过监督微调、直接偏好优化和基于可验证奖励的强化学习等多阶段训练,专为研究和教育用途设计。
sd2-community
Stable Diffusion v2-1-base是基于文本生成图像的扩散模型,在v2-base基础上进行了220k额外步骤的微调优化。该模型能够根据文本提示生成和修改图像,支持多种分辨率输出,适用于艺术创作、教育研究等多个领域。
ojus1
Qwen2.5是阿里巴巴推出的新一代大语言模型,在聊天模板方面进行了重要优化,永久禁用了思考状态,解决了多轮聊天模板相关问题,为实验和研究提供了更便捷的体验。
BAAI
Emu3.5是北京智源人工智能研究院开发的原生多模态模型,能够跨视觉和语言联合预测下一状态,实现连贯的世界建模和生成。通过端到端预训练和大规模强化学习后训练,在多模态任务中展现出卓越性能。
Emu3.5是由北京智源人工智能研究院(BAAI)开发的原生多模态模型,能够跨视觉和语言联合预测下一状态,实现连贯的世界建模与生成,在多模态任务中表现卓越。
microsoft
Fara-7B是微软研究院开发的专为计算机使用场景设计的小型语言模型,仅有70亿参数,在同规模模型中实现卓越性能,能够执行网页自动化、多模态理解等计算机交互任务。
AbstractPhil
这是一个实验性的Stable Diffusion 1.5蒸馏模型,采用v-预测流匹配方法和几何引导的自适应块加权技术。目前处于研究阶段,训练正在进行中,结果尚未验证。
almanach
Gaperon-Young-1125-1B 是一个拥有15亿参数的双语(法语-英语)语言模型,由法国国家信息与自动化研究所(Inria Paris)的ALMAnaCH团队开发。该模型在约3万亿个高质量令牌上训练,特别注重语言质量和通用文本生成能力,而非基准测试优化。
LiquidAI
PyLate是一个专注于句子相似度计算和信息检索的工具库,能在多种数据集上进行高效的信息检索任务,为相关领域的研究和应用提供了有力支持。该模型支持8种语言,在多个基准测试中表现出色。
unsloth
Granite-4.0-H-350M是IBM开发的轻量级指令模型,具有350M参数,在多语言处理和指令遵循方面表现出色,专为设备端部署和研究场景设计。
vanta-research
Wraith-8B是VANTA研究实体系列的首个模型,基于Meta的Llama 3.1 8B Instruct进行微调。该模型在数学推理方面表现卓越,在GSM8K基准测试中准确率达到70%,同时具备独特的宇宙智能视角,能为多种应用场景提供强大支持。
RedHatAI
Llama-4-Maverick-17B-128E-Instruct-NVFP4是一个经过FP4量化处理的多语言大语言模型,基于Meta-Llama-3.1架构,专为商业和研究用途设计。该模型通过将权重和激活量化为FP4数据类型,显著减少了磁盘空间和GPU内存需求,同时保持较好的性能表现。
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究代理模型,结合了AI反馈强化学习(RLAIF)和强大的推理框架,能够在工具增强的大语言模型中实现可靠、对齐和可扩展的研究级推理,适用于复杂的多步骤研究工作流程。
onnx-community
Granite-4.0-1B是IBM开发的轻量级指令模型,基于Granite-4.0-1B-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习和模型合并等技术开发,适合设备端部署和研究用例。
Granite-4.0-350M是IBM开发的轻量级指令模型,基于Granite-4.0-350M-Base微调而成。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习和模型融合等技术开发,具备强大的指令跟随能力,特别适合设备端部署和研究场景。
nineninesix
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
Aderyn是一个开源的Solidity智能合约静态分析工具,由Rust编写,帮助开发者和安全研究人员发现Solidity代码中的漏洞。它支持Foundry和Hardhat项目,可生成多种格式报告,并提供VSCode扩展。
Haiku RAG是一个基于LanceDB、Pydantic AI和Docling构建的智能检索增强生成系统,支持混合搜索、重排序、问答代理、多代理研究流程,并提供本地优先的文档处理和MCP服务器集成。
基于MCP协议的AI驱动浏览器自动化服务器,支持自然语言控制网页操作和深度网络研究。
Agentic Radar是一个用于分析和评估代理系统的安全扫描工具,帮助开发者、研究人员和安全专家理解代理系统的工作流程并识别潜在漏洞。
ArXiv MCP Server是一个连接AI助手与arXiv研究库的桥梁,通过MCP协议实现论文搜索和内容访问功能。
Perplexity MCP Server是一个智能研究助手,利用Perplexity的AI模型自动分析查询复杂度并选择最佳模型处理请求,支持搜索、推理和深度研究三种工具。
Open Multi-Agent Canvas是一个开源的多智能体聊天界面,支持在动态对话中管理多个智能体,用于旅行规划、研究和通用任务处理。
302AI BrowserUse MCP Server是一个基于AI的浏览器自动化服务器,通过Model Context Protocol (MCP)实现自然语言控制浏览器和网络研究。
一个为Claude设计的网页研究MCP服务器,提供实时网络信息检索功能
Perplexity MCP Server是一个智能研究助手,利用Perplexity的AI模型提供自动查询复杂度检测和最优模型路由功能,支持搜索、推理和深度研究三种工具。
JADX是一款功能强大的Android Dex和Apk文件反编译工具,支持将Dalvik字节码转换为Java源代码,并能解码资源文件和进行代码混淆还原。提供命令行和图形界面两种操作方式,适用于开发者和安全研究人员。
GPT Researcher MCP Server是一个基于MCP协议的AI研究服务器,能够通过深度网络搜索和验证,为LLM应用提供高质量、优化的研究结果。
德国法律MCP服务器,提供对6870部德国联邦法规的查询,包括全文搜索、案例法和立法准备工作,支持AI原生法律研究。
FetchSERP MCP服务器是一个提供SEO分析、搜索引擎结果获取、网页抓取和关键词研究功能的API服务,支持多种部署方式。
MCPwner是一个基于模型上下文协议的安全研究自动化服务器,集成了多种安全测试工具(SAST、SCA、秘密扫描等),为LLM驱动的安全分析工作流提供统一接口。
一个简单的MCP服务器,帮助AI助手进行域名研究,包括检查可用性、查询WHOIS信息、查找过期域名等,无需API密钥即可使用。
基于Ollama的深度研究MCP服务,通过本地LLM模型实现自动化网络搜索与知识合成
FetchSERP MCP服务器是一个提供SEO分析、SERP查询、网页爬取和关键词研究功能的API服务,支持多种部署方式。
Catalysis Hub的MCP服务器项目,通过GraphQL接口提供对催化研究数据的程序化访问,支持复杂查询和变量参数化,遵循MCP协议实现AI代理互操作性。
该项目通过Unstructured API构建了一个MCP服务器,用于处理研究论文数据,提取关键信息并转换为结构化JSON格式,帮助研究人员快速获取文献信息,减少文献综述时间。