Artificial Analysis发布语音转文字基准测试2.0版,ElevenLabs与谷歌表现突出。其中ElevenLabs的Scribe v2以2.3%的词错率领先,谷歌Gemini3Pro以2.9%紧随其后,且谷歌未对转录任务进行专门训练。
海螺AI推出马年春节系列内容,依托海螺2.3及2.3Fast模型技术升级,提升舞蹈动作性能与画风创作。携手B站、芒果TV及游戏IP打造新春内容矩阵,上线趣味互动功能并发放专属福利,以多元AI体验陪伴用户欢度春节。
埃隆·马斯克旗下AI聊天机器人Grok在九天内生成至少180万张针对女性的性化图片,并大量发布于X平台。反网络仇恨中心报告显示,其生成的约460万张图片样本中,约65%含性暗示内容,涉及男性、女性或儿童,其中约2.3万张可能涉及儿童性暗示。
OpenAI推出ChatGPT Health,首次为隐私敏感的健康领域打造独立交互空间,旨在解决用户健康数据零散、难以复用的问题,帮助高效管理健康指标。目前每周有超2.3亿用户通过ChatGPT寻求健康建议,新功能允许用户安全上传个人健康数据,以提供更精准、个性化的反馈。
LTX 2.3在线生成视频,支持4K、同步音频和9:16竖屏模式
Google
$0.49
输入tokens/百万
$2.1
输出tokens/百万
1k
上下文长度
$0.7
$2.8
$17.5
Alibaba
-
$0.8
$2
128
Baidu
Openai
$0.4
$0.63
$3.15
131
Chatglm
$8
32
$0.75
$0.5
$8.75
$70
briaai
基于BRIA 2.3文本生成图像模型开发的姿态控制扩展,通过文本提示和输入图像的人体姿态估计生成高质量图像
基于BRIA 2.3文本生成图像模型开发的ControlNet扩展,通过色彩网格控制生成图像的色彩风格
基于BRIA 2.3文生图模型开发的ControlNet背景生成模型,通过文本提示和背景掩模生成高质量图像
基于BRIA 2.3文本生成图像模型开发的ControlNet扩展,通过文本提示和灰度图引导实现图像色彩重置与多样化变体生成
BRIA 2.3 ControlNet-Canny是基于BRIA 2.3文本生成图像模型开发的ControlNet版本,能够通过文本提示和输入图像的边缘映射生成高质量图像。
BRIA 2.3极速版是BRIA 2.3的LCM加速版本,代表2.X系列中质量与速度的最佳平衡。该模型基于合法数据专项训练,将技术创新与伦理责任、法律保障完美结合。
BRIA 2.3是基于合法数据专项训练的文本生成图像模型,融合技术创新与伦理责任及法律保障,为AI行业树立新标杆。
internlm
InternLM-20B是由上海人工智能实验室联合商汤科技、香港中文大学和复旦大学发布的200亿参数预训练模型,在超过2.3T高质量中英文及代码token数据上进行预训练,具备卓越的综合性能和强大的工具调用能力。
madlag
基于BERT-base uncased模型在SQuAD v1上微调的问答模型,通过nn_pruning库修剪了66%的线性层权重,推理速度提升2.32倍