AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

大型语言模型及思维链提示技术在NLP任务中取得重大进展

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Jan 26, 2024

大型语言模型及思维链提示技术在NLP任务中取得重大进展。研究揭示了推理链长度在CoT性能中的关键作用。实验结果显示，在一定范围内，推理链的长度与大型语言模型的能力存在明显相关性。

大型语言模型思维链提示技术 NLP

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Memories AI携全球首个人工智能视觉记忆模型亮相，获800万美元种子轮融资

Memories AI发布全球首个大型视觉记忆模型LVMM，获800万美元种子轮融资。该技术突破使AI能像人类一样长期存储和检索视觉信息，处理能力达百万小时级视频，比现有技术提升100倍。应用场景涵盖安防监控、社交媒体分析、自动驾驶等领域。由前Meta专家创立，核心技术模拟人类记忆机制，通过三层架构实现高效视频处理。融资将用于团队扩张和技术商业化，投资者看好其在机器人、企业软件等万亿美元市场的潜力。

2025年7月25号 15:40

1.4k

讯飞星火X1深度推理大模型升级版上线多维度能力显著提升

科大讯飞宣布其基于全国产算力训练的深度推理大模型——讯飞星火X1升级版正式上线。此次升级是一次全面的跃升，不仅在综合能力上对标OpenAI的o3等国内外一流大模型最新版本效果保持领先，还在幻觉治理、多语言能力、语音同传等多个方面取得了显著进步，为用户提供了一个更智能、更可靠、更高效的AI助手。讯飞星火X1升级版在翻译、推理、文本生成、数学等方面的能力大幅提升，特别是在幻觉治理方面取得了显著进步。幻觉问题是大模型落地应用的关键难题之一，而星火X1在事实性幻觉治理和忠实性幻觉治理两方面均取得了明显进步，显著提高了大模型行业落地应用的可靠性。此外，星火X1的多语言能力也得到了极大拓展，现已覆盖130多种语种，为用户提供无障碍跨语言交流的能力。

2025年7月25号 13:33

950

快手开源KAT-V1大模型：自动思考能力显著提升，40B版本性能接近40B 性能逼近 R1-0528

快手开源KAT-V1自动思考大模型，包含40B和200B两个版本。40B版本性能接近DeepSeek-R1，200B版本超越多个旗舰模型。该模型创新性地采用长短思考混合训练范式和Step-SRPO强化学习算法，能根据问题复杂度自动调整思考模式，解决过度思考问题。基于Qwen2.5-32B扩展，通过异构蒸馏框架和1000万示例预训练，在科学、代码等领域表现优异。40B版本已在Hugging Face上线，200B版本仍在训练中。

2025年7月25号 11:29

1.3k

谷歌Lab重磅新品Opal：零代码！用自然语言打造AI应用，解锁未来生产力

谷歌实验室推出实验性AI工具Opal，支持零代码开发AI应用。该工具通过自然语言指令和可视化编辑器，让用户无需编程即可构建AI驱动的迷你应用。核心功能包括自然语言驱动、可视化工作流编辑、谷歌AI生态集成及协作分享。目前仅限美国IP用户公测，未来或向全球开放。Opal降低了AI开发门槛，是谷歌推动AI民主化的重要尝试，有望重塑AI应用开发格局。

2025年7月25号 10:37

2.0k

南洋理工联手上海AI Lab发布PhysX-3D 给AI生成的3D模型注入“物理灵魂”！

南洋理工大学与上海AI Lab联合推出PhysX-3D项目，突破AI生成3D模型的"塑料感"瓶颈。该项目首创包含五大物理维度（尺寸、材质、功能、运动学、描述）的PhysXNet数据集，通过双分支架构PhysXGen模型实现几何外观与物理属性的同步生成。实验显示新系统在材质和功能预测误差上分别降低64%和72%，能准确生成物体的运动特性和材质属性。这项技术将推动3D生成从"虚拟建模"向"物理接地"转变，为机器人、自动驾驶等领域带来革新。

2025年7月25号 10:26

1.1k

谷歌发布构建AI应用工具Opal：无需代码用自然语言即可打造AI应用

谷歌推出革命性无代码AI开发工具Opal，用户通过自然语言描述即可创建AI"迷你应用"。该工具将文字提示自动转换为可视化工作流，调用Gemini模型处理图像、内容创作等任务，大幅降低开发门槛。相比微软Power Platform等工具，Opal更侧重轻量级应用开发，操作简便直观。目前在美国公测，未来计划扩展地区和功能集成。Opal面向技术与非技术用户，支持快速原型设计和应用分享，在教育、营销等领域展现潜力，旨在让AI技术更易获取。

2025年7月25号 10:23

940

Anthropic 推出审计Agent，助力 AI 模型对齐测试

Anthropic公司推出新型AI审计Agent，包含调查、评估和红队测试三种类型，用于提升AI模型对齐测试效率。这些Agent能并行开展大规模审计，识别模型偏差和植入行为，其中调查Agent识别成功率最高达42%。虽然仍存在识别细微行为的局限性，但该技术解决了传统人工审计效率低、覆盖面窄的问题。相关代码已在GitHub开源，为AI安全研究提供新工具。

2025年7月25号 9:49

880

开源AI工具DailiCode横空出世:兼容多LLM模型，重构开发者工作流

开源AI工具DailiCode在GitHub引发关注，作为Gemini CLI的改进版，它支持15款主流大模型，包括Gemini-2.5-pro和Claude Sonnet4等。该工具提供代码查询、PDF处理、PR自动化等多项功能，能快速部署Discord机器人、代码迁移等任务。只需Node.js环境即可通过npx命令安装，支持参数调优，为开发者提供高效的AI编程辅助方案，显著提升开发效率。

2025年7月25号 9:21

890

阿里通义千问AI编程大模型Qwen3-Coder登顶榜首

阿里巴巴Qwen3-Coder登顶Hugging Face大模型排行榜，成为全球最热开源AI编程模型。这款采用MoE架构的代码模型在性能上超越GPT-4.1和Claude4，尤其擅长多Agent任务处理，下载量已突破2000万次。Hugging Face CEO等科技领袖纷纷点赞，标志着中国开源AI模型取得重大突破，有望为全球开发者提供更强大的编程支持。

2025年7月25号 8:58