谷歌在2026年I/O大会上发布Wear OS 7,重点解决手表电池续航和智能交互问题。续航方面,从Wear OS 6升级后最高可提升10%,缓解每日充电痛点。智能方面,引入Gemini Intelligence系统,增强手表AI能力。整体升级更注重实用性和日常体验。
阿里云通义千问大模型将于5月20日阿里云峰会上推出全新升级版本,在全能性、模型能力和深度广度上实现全面突破。此举标志着国内AI大模型在算力迭代与应用落地方面迈出关键一步。当前,国产大模型正迎来密集更新潮,技术向垂直领域纵深发展,市场竞争日趋激烈。
快手科技宣布董事会正评估可灵AI资产重组方案,或引入外部融资。可灵是快手自研的视频生成大模型,预计2024年6月上线。今年1月31日发布的可灵3.0系列,包括图片、视频及Omni版本,经技术升级后,提供更丰富内容。
谷歌威胁情报小组首次发现并拦截了AI自主开发的零日漏洞攻击,显示AI已从辅助工具升级为能独立完成漏洞挖掘、编写和执行攻击的“数字黑客”。这一事件标志着网络安全环境面临前所未有的技术冲击,攻击流程实现从漏洞挖掘到恶意代码的一键式生成,使防御方处于更被动境地。
Glia AI 联络中心软件解决方案提供统一平台,升级客户体验,自动化、协助和分析数字和语音互动。
最佳 DVD / 视频增强器,使用 AI 视频升级解决方案,快速将 1080p 升级到 4k
革新学习方式,利用AI智能助手,简化复杂概念,提升学习效果。
Minimax
-
Input tokens/M
Output tokens/M
Context Length
gbcfchc
这是一个基于Qwen/Qwen3-8B-Base微调的版本,使用TRL框架和GKD(On-Policy Distillation)方法进行训练,专门用于文本生成任务。该模型通过自我生成错误进行学习,提升了文本生成的质量和稳定性。
cpatonn
Qwen3-VL-32B-Instruct AWQ - INT4是基于Qwen3-VL-32B-Instruct基础模型的4位量化版本,采用AWQ量化方法,在保持性能的同时显著减少存储和计算资源需求。这是Qwen系列中最强大的视觉语言模型,在文本理解、视觉感知、上下文长度等方面全面升级。
lefromage
这是一个基于Qwen3-Next-80B-A3B-Instruct模型的Q4_0量化版本,通过特定量化技术显著提升了模型在存储和计算方面的效率,同时保持了良好的性能表现。
inclusionAI
Ming-flash-omni 预览版是基于 Ling-Flash-2.0 稀疏专家混合(MoE)架构构建的多模态大模型,总参数达100B,每个token仅激活6B参数。该模型在Ming-Omni基础上进行了全面升级,在多模态理解和生成方面有显著提升,特别是在语音识别、图像生成和分割编辑方面表现突出。
foreverlasting1202
QuestA是一个通过问题增强方法提升大语言模型推理能力的创新框架。它在强化学习训练过程中融入部分解决方案,显著提升了模型在数学推理等复杂任务上的表现,特别是在小参数模型上实现了最优结果。
worstcoder
这是一个基于DiffusionNFT方法对SD3.5-Medium进行微调的LoRA模型,采用创新的在线强化学习范式,在文本到图像生成任务上表现出色,显著提升了生成质量和训练效率。
Barth371
这是基于 unsloth/qwen2.5-vl-72b-instruct-bnb-4bit 模型进行微调的视觉语言模型,使用 Unsloth 和 Huggingface TRL 库进行优化训练,训练速度相比传统方式提升了2倍。
tencent
SRPO是一种针对扩散模型的人类偏好对齐方法,通过Direct-Align技术和语义相对偏好优化,显著提升了FLUX.1-dev模型的真实感和美学质量,解决了多步去噪计算成本高和依赖离线奖励微调的问题。
pytorch
这是由PyTorch团队开发的FP8量化版本Gemma-3-27B模型,基于google/gemma-3-27b-it进行FP8量化处理。该模型通过vLLM和Transformers两种方式支持高效推理,在保持模型质量的同时显著降低了内存使用并提升了推理速度。
SamilPwC-AXNode-GenAI
PwC-Embedding-expr 是基于 multilingual-e5-large-instruct 嵌入模型训练的韩语优化版本,通过精心设计的增强方法和微调策略提升在韩语语义文本相似度任务上的性能。
AbdelrahmanHassan
本模型是基于OpenAI的Whisper Large V3模型,使用LoRA方法在埃及阿拉伯语方言数据集(Egyptian-ASR-MGB-3)上进行微调的自动语音识别模型。它专门优化了对埃及阿拉伯语方言的识别能力,显著提升了在该方言上的词错误率(WER)性能。
Llama-3.3-Nemotron-Super-49B-v1.5是基于Meta Llama-3.3-70B-Instruct衍生的大语言模型,是v1版本的显著升级版。该模型在推理、人类对话偏好和代理任务(如RAG和工具调用)方面表现出色,支持128K令牌的上下文长度,在准确性和效率间实现了良好平衡。
Goedel-LM
哥德尔证明器V2是一个开源语言模型系列,在自动形式证明生成方面树立了新的标杆。它基于专家迭代和强化学习流程构建,融入了脚手架数据合成、验证器引导的自我修正和模型平均三项关键创新,显著提升了证明定理的能力和效率。
Jakala
J-1是基于Gemma 3 4-B模型,使用GRPO方法在意大利语数学和推理问题上进行训练的推理模型。在Invalsi ITA测试数据集上,性能从基础模型的57%提升到了79%,显著提升了意大利语推理能力。
Nellyw888
VeriReason是一种结合强化学习与测试平台反馈的Verilog RTL代码生成方法,显著提升了预训练模型在硬件设计领域的性能。
Delta-Vector
弗朗索瓦-PE是基于密斯特拉尔架构的角色扮演微调模型,通过KTO方法修复了欠拟合问题,提升了连贯性。
unsloth
Qwen3-4B-FP8是Qwen系列大语言模型的最新FP8量化版本,具备40亿参数,支持32K上下文长度。该模型在推理、指令遵循、智能体交互和多语言处理方面表现优异,通过FP8量化在保持性能的同时提升了推理效率。
Video-R1
Video-R1是基于Qwen2.5-7B-Instruct开发的多模态大语言模型,专门针对视频推理任务进行优化。通过提出T-GRPO算法和构建高质量视频推理数据集,显著提升了模型在时间建模和视频理解方面的能力。
ZTE-AIM
基于Qwen2.5-VL通过创新性Curr-ReFT方法微调的多模态大语言模型,显著提升了视觉语言理解与推理能力。
michaelyuanqwq
RoboEngine是首个即插即用的视觉机器人数据增强工具包,用户只需几行代码就能生成具有物理和任务感知能力的机器人场景,解决了现有方法受相机校准或受控环境限制的问题,显著提升了模仿学习的视觉鲁棒性。
一个用于计算地球上任意位置天体(太阳、月亮、行星、恒星和深空天体)高度角、方位角、升起和落下时间的工具,支持光污染分析。