AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

高分辨率 AI 模型 Griffon v2: 文本和视觉引用灵活

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Mar 19, 2024

132

最新的高分辨率 AI 模型 Griffon v2 结合了文本和视觉线索，提供灵活的对象引用。团队采用降采样投影仪增强了多模态感知能力。该模型在引用表达生成、短语定位和引用表达理解任务中表现出色，优于专家模型。具有视觉 - 语言共指结构，在目标检测和对象计数方面表现出优越性。

Griffon AI 模型引用

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Mistral AI 推出新功能 Le Chat，全面追赶 ChatGPT

欧洲AI初创公司Mistral AI推出新产品Le Chat，挑战OpenAI的ChatGPT。该产品具备深度研究模式、语音交互和高级图像编辑等创新功能：1）深度研究模式可快速生成结构化报告；2）基于Voxtral模型的语音模式实现自然流畅的语音交互；3）图像编辑功能表现优异，支持简单指令完成复杂编辑。Mistral AI通过持续发布开源模型展现强大研发实力，Le Chat的推出标志着其在AI领域的重要突破。

2025年7月18号 11:44

270

首个基于 AI 的恶意软件 LameHug 现身，窃取 Windows 设备数据

新型恶意软件LameHug利用阿里Qwen2.5大模型攻击Windows系统，通过邮件附件传播，能动态生成窃取指令。该软件会收集系统信息并窃取敏感文件，已出现多个变种。专家警告这是首个公开的AI恶意软件，建议用户提高警惕、更新防护措施。

2025年7月18号 11:19

290

字节跳动视觉大模型负责人杨建朝宣布暂时休息，周畅接任引发关注

字节跳动视觉大模型团队负责人杨建朝因家庭因素宣布暂时休息，由前阿里通义千问技术负责人周畅接任。此次人事变动正值字节AI部门调整期，引发外界对技术路线稳定性的关注。杨建朝的工作资料仍保留在内部系统，周畅将带领分布全球的Seed团队继续视觉多模态生成等研究。公司强调将持续投入基础研究，期待新负责人带来创新活力。这一变动凸显了科技行业在快速发展中平衡工作与健康的重要性。

2025年7月18号 10:04

720

5.63%错误率创历史新低:NVIDIA AI推出商用级超高速语音识别模型Canary-Qwen-2.5B

NVIDIA发布突破性混合模型Canary-Qwen-2.5B，以5.63%词错率创Hugging Face OpenASR纪录。该模型采用CC-BY许可，支持商业应用，统一语音识别与语言处理功能。核心创新在于FastConformer编码器与Qwen3-1.7B LLM解码器的混合架构，仅25亿参数却实现高效处理。支持多种NVIDIA GPU硬件，适用于云推理和边缘计算。开源特性促进语音AI发展，为企业提供转录服务、知识提取等商业应用场景，推动下一代语音AI发展。

2025年7月18号 9:57

1.1k

ART框架发布！用Python一键训练AI Agent，邮件搜索到游戏操控全能搞定！

开源强化学习框架ART正式发布，为AI Agent训练带来新突破。该框架集成GRPO技术，支持Python开发者便捷训练多步骤任务Agent，如邮件搜索和游戏操控。特点包括：1)支持Qwen2.5-7B等小型模型；2)客户端-服务器分离架构简化部署；3)与主流平台集成提供训练监控。应用场景涵盖邮件自动化、游戏AI开发和多Agent协作。采用GRPO算法确保长期任务稳定性，兼容多种语言模型。项目开源并鼓励社区参与，未来计划扩展多模态支持。

2025年7月18号 9:43

710

Steam 平台 AI 游戏数量飙升800%:生成式 AI 已渗透游戏开发

Steam平台AI游戏数量激增800%，目前已有近8000款游戏披露使用生成式AI技术，占总游戏库7%。这一数字较一年前不足1000款呈现爆发式增长，2025年新游戏中AI应用占比达20%。尽管Steam仅要求自愿披露，实际使用AI的游戏可能更多。这表明生成式AI正快速渗透游戏开发领域，将在内容创作、角色设计等方面发挥更大作用。

2025年7月18号 9:36

780

VSCode的AI编程利器Traycer，处理大型代码库表现出色

Traycer是一款专为VSCode设计的AI编程助手，通过智能任务拆解、代码规划和实时分析提升开发效率。核心功能包括：将高级任务转化为详细编码计划、多代理协作处理复杂项目、实时错误检测和优化建议。与VSCode Agent模式深度集成，支持MCP协议扩展功能。提供14天免费试用和多种付费套餐，在大型代码库处理方面表现突出，相比同类工具更具规划优势。强调用户控制，允许调整AI计划并回滚代码修改。

2025年7月18号 9:35

660

Slack 全面拥抱 AI:可以总结聊天内容、解释术语并实现工作自动化

Slack推出多项AI功能挑战微软Teams，包括智能写作辅助、上下文消息解释和企业级搜索等，旨在深度整合工作流程。Salesforce限制外部AI访问Slack数据，构建封闭生态，强调数据安全。新功能已为企业节省超110万小时，但数据封闭策略可能影响客户选择灵活性。

2025年7月18号 9:30

490

作家集体诉讼 Anthropic：指控其盗用数百万书籍以训练 AI

美国三位作家获准对AI公司Anthropic发起集体诉讼，指控其盗用数百万本受版权保护的书籍训练AI模型。法官裁定虽然部分书籍使用属合理范畴，但涉嫌盗版部分仍需单独审理。此案引发广泛关注，凸显AI发展与版权保护的冲突。近期Reddit等平台也起诉Anthropic未经授权使用内容，反映创作者与科技公司关系日趋紧张。部分创作者选择与AI公司合作分成，但诉讼数量仍在增加，这场关于AI技术边界的法律博弈将持续发酵。

2025年7月18号 9:10

360

朗新科技首发AI能源大模型，电力交易将实现智能化

朗新科技在链博会发布"朗新九功AI能源大模型"，该模型具备两大核心技术：时序预测引擎基于千亿级预训练数据，电力价格预测准确率超90%，可应对冷启动环境；AI智能体引擎支持动态数据融合和秒级响应，能7×24小时自动监控电力市场并生成对冲策略。目前已在广东、山东、浙江等电力现货市场应用，推动电力交易智能化发展，为能源管理提供科学决策支持。

2025年7月18号 9:09

470