欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、吊打GPT-5.5!Hy-Memory在多个测试集上表现优异,显著提升了记忆密度和处理效率,并提供了多种配置以适应不同需求。
阶跃星辰发布并开源新一代Flash模型Step 3.7 Flash,专为智能体生产化落地设计。该模型采用196B参数的稀疏混合专家架构,针对代码编写、联网搜索及多模态工作流进行系统级优化,最高生成速度达每秒400 Tokens,显著提升高频场景效率,标志着国内大模型赛道取得新突破。
苹果正与谷歌合作,采用一款1.2万亿参数的定制大型语言模型,作为下一代Siri的核心升级。该模型参数规模远超当前主流移动端模型(如Gemini 3.5 Flash的3000亿参数),引发业界高度关注。
谷歌正对搜索引擎进行重大改革,旨在将传统关键词搜索升级为更智能、互动的体验。新推出的“智能搜索框”由Gemini 3.5 Flash模型驱动,支持对话式交互,使搜索平台成为生成式AI工具的入口,类似与聊天机器人交流。
基于谷歌Gemini 2.5 Flash模型的免费AI图像编辑与生成工具
Gemini 2.0 Flash-Lite 是高效的语言模型,专为长文本处理和多种应用场景优化。
FlashVideo 是一个高效的高分辨率视频生成模型,专注于细节和保真度的流动。
Gemini 2.0 是谷歌推出的最新一代生成式 AI 模型,包含 Flash、Flash-Lite 和 Pro 版本。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
TeichAI
本模型是基于Qwen3-4B架构的知识蒸馏模型,通过约5440万个由Gemini 2.5 Flash生成的标记进行训练,旨在整合Gemini-2.5 Flash的行为、推理过程和知识到单一数据集中。
Mungert
基于RWKV-7架构的轻量级语言模型,采用flash-linear attention格式,具备多语言支持和深度思考能力,适用于文本生成任务。
基于RWKV-7架构的多语言文本生成模型,拥有29亿参数,支持英语、中文、日语、韩语、法语、阿拉伯语、西班牙语和葡萄牙语等多种语言,采用flash-linear attention格式,适用于高质量的文本生成任务。
FlashVL
FlashVL是一种优化视觉语言模型(VLMs)以用于实时应用的新方法,旨在实现超低延迟和高吞吐量,同时不牺牲准确性。
基于flash-linear attention格式的RWKV-7模型,支持多语言文本生成任务。
RWKV
采用闪存线性注意力(flash-linear attention)格式的RWKV-7模型,支持英语文本生成任务。
fla-hub
这是一个采用flash-linear注意力格式的RWKV-7模型,参数量为0.45B,支持多种语言的文本生成任务,具有65,536的大词汇量。
nvidia
NVIDIA NeMo Canary Flash 是一个多语言多任务语音模型,支持英语、德语、法语和西班牙语的自动语音识别和翻译任务。
基于Flash线性注意力机制的RWKV-7 g1模型,支持多语言处理并具备深度思考能力
NVIDIA NeMo Canary Flash 是一个多语言多任务模型家族,在多个语音基准测试中实现了最先进的性能。支持四种语言的自动语音识别和翻译任务。
sdadas
基于sdadas/polish-roberta-large-v2改进的波兰语重排序模型,采用RankNet损失函数训练,支持Flash Attention 2加速
timpal0l
基于Mistral-7B-v0.1的预训练延续模型,使用瑞典论坛Flashback的40GB文本数据进行微调,支持多语言生成。
一个基于Gemini Flash 2 AI模型的数据分析与研究MCP服务器,提供数据解析、智能分析、报告生成和邮件自动发送功能。
一个基于Gemini Flash 2 AI模型的数据分析与研究MCP服务器,提供数据解析、统计分析、研究报告生成和邮件自动发送功能。
一个基于TypeScript的MCP服务器实现,通过直接调用Google Gemini API集成Gemini模型,支持最新Gemini 2.0 Flash模型并保持对话上下文。
一个基于Google Gemini模型的AI图像生成MCP服务器,支持智能模型选择(Flash快速生成和Pro高质量4K生成)、多种宽高比控制、文件管理和模板功能,提供生产级图像生成能力。
一个基于Gemini Flash 2 AI模型的数据分析与研究MCP服务器,提供数据解析、AI分析、可视化报告和邮件自动发送功能
LLM Gateway是一个基于MCP协议的服务器,支持高级AI代理(如Claude 3.7)将任务智能委托给成本更低的LLM模型(如Gemini Flash),实现成本优化和性能平衡。