网易有道词典2025年度热词揭晓,“DeepSeek”以867万次搜索量登顶,成为首个源自国产AI大模型的年度词汇。搜索热度自2月DeepSeek-R1模型发布后迅速攀升,后续技术突破均带动查询高峰。大学生和职场人群为主要搜索群体,用户查词后常延伸浏览“大模型”等相关概念,形成“查词—学习概念”的链条,反映出AI技术普及推动公众认知深化的趋势。
新研究警告:大语言模型持续接触无意义网络内容可能导致性能显著下降,推理能力和自信心受损。多所美国大学团队提出“LLM脑衰退假说”,类比人类过度接触无脑内容造成的认知损害。
Anthropic最新研究颠覆认知:仅需250份投毒文档即可攻破任意规模大语言模型,远低于业界对投毒数据量的预期。该研究由Anthropic联合英国AI安全研究所、艾伦・图灵研究所共同完成,揭示了大模型面临的新型安全威胁。
研究表明,仅需250份投毒文件即可在大型语言模型中植入后门,且攻击效果与模型大小无关。测试涵盖6亿至130亿参数模型,发现即使使用更干净数据训练的大模型,所需中毒文档数量不变,挑战了传统认知。
全模态大模型,拥有更强的认知、理解、创作能力
讯飞星火认知大模型强势助力 | 编程更轻松 创意更自由
多功能智能大模型
nightmedia
这是一个实验性的量化大语言模型,采用Deckard(qx)量化方法,嵌入层为3位量化。该模型通过范数保持双投影消除(NPBA)技术重构,不仅移除了安全限制机制,还增强了模型的认知深度和推理能力。
Qwen3-Next-80B-A3B-Thinking-1M-qx64n-mlx是一个采用混合专家架构和Deckard混合精度量化技术的大语言模型,具有800亿参数和1M标记的上下文长度。该模型在科学技术推理和长文本处理方面表现卓越,相比指令模型在认知基准测试中提升20-35%。