著名AI科学家Andrej Karpathy揭露针对Python库litellm的供应链投毒攻击。该库月下载量近1亿次,恶意代码通过伪装更新渗透,影响整个AI工具链。攻击机制隐蔽,触发即中招,引发行业对开源软件安全的担忧。
科技巨头联手出资1250万美元,通过Linux基金会提升开源软件安全。资金由Alpha-Omega和OpenSSF管理,专项用于加强开源生态系统安全。
六家科技巨头向Linux基金会项目资助1250万美元,旨在帮助开源软件维护者应对AI自动化工具生成的海量低质安全报告,使其能专注于真正的安全威胁。
香港大学数据智能实验室推出开源项目CLI-Anything,可将任意软件转化为AI Agent可直接调用的命令行工具,解决大模型操控专业软件时UI自动化易崩溃、手动对接耗时的问题,推动实现“Agent-Native”软件生态。
Devstral 2开源编码模型及Mistral Vibe CLI,高效解决软件工程任务
开源编码 LLM,专为软件工程任务设计。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
专为软件改进设计的开源大型语言模型。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
Baidu
128
$2
$20
open-thoughts
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
Kwaipilot
KAT-Dev-72B-Exp是一款用于软件工程任务的720亿参数开源大语言模型,在SWE-Bench Verified基准测试中达到74.6%的准确率,是KAT-Coder模型的实验性强化学习版本。
SWE-bench
SWE-agent-LM-7B是一个专门为软件工程领域设计的开源语言模型,基于Qwen2.5-Coder-7B-Instruct微调训练而成。该模型能够有效解决软件工程相关问题,为开发者提供智能支持,具有重要的实用价值。
unsloth
Devstral 1.1是由Mistral AI和All Hands AI合作开发的智能大语言模型,专为软件工程任务设计。该模型在SWE-bench基准测试中表现出色,位列开源模型榜首,拥有240亿参数和128k tokens的长上下文窗口。
Devstral是一款专为软件工程任务打造的大语言模型,由Mistral AI和All Hands AI合作开发。在SWE-bench基准测试中表现优异,是排名第一的开源模型。
agentica-org
DeepSWE-Preview 是一个完全开源的、先进的编码智能体,通过强化学习训练,在软件工程任务中表现卓越。
moonshotai
Kimi-Dev-72B 是一款用于软件工程任务的开源编码大语言模型,在 SWE-bench Verified 上取得了开源模型中的最优成绩。
Mungert
SWE-agent-LM-32B是一个开源的软件工程语言模型,基于Qwen/Qwen2.5-Coder-32B-Instruct微调,专为软件工程任务设计。
OpenHands LM是一款基于Qwen Coder 2.5 Instruct 32B构建的开源编码模型,通过特殊微调在软件工程任务中表现出色。
stelterlab
OpenHands LM是一个32B参数的开源编程模型,专为软件开发智能体设计,支持本地部署并在软件工程任务中表现优异。
jt360
基于 AFL-3.0 许可证发布的模型(推断信息:可能为开源软件或语言模型)
Litecoin Core是莱特币的开源软件,支持全球即时支付,采用点对点技术去中心化运作。项目包含自动化测试、开发流程规范和多语言支持。
首个开源MCP服务器,实现AI全功能控制远程macOS系统,无需额外安装软件,提供完整桌面操作能力。
一个提供Repology包仓库数据访问的MCP服务器,支持项目搜索、详情查询、问题报告等功能。
mcp-server-suite是一个开源的MCP服务器集合,旨在成为自动化领域的'HuggingFace'。它提供模块化的服务器组件,支持从网页搜索到数据库操作等多种功能,并鼓励社区贡献扩展。项目包含核心服务器和规划中的多种专业服务,涵盖AI/ML、软件开发和非技术场景,目标是通过标准化协议简化自动化流程。