阿里通义实验室推出开源工具Qwen-Image-i2L,可将单张图片快速转化为可微调的LoRA模型,大幅降低个性化风格迁移门槛。用户只需上传一张图片,无需大量数据或昂贵算力,即可生成轻量级LoRA模块,并集成到其他生成模型中,实现高效“单图风格迁移”。该技术已在AI社区引发广泛关注。
谷歌推出Google AI Edge Gallery应用,集成Gemma系列端侧模型,支持图像识别、音频对话和文字交互,全离线运行并注重隐私保护,为开发者和用户提供高效AI体验。
Meta AI开源新一代通用图像识别模型DINOv3,采用自监督学习框架,无需人工标注即可实现卓越性能,突破传统依赖大量标注数据的局限,成为AI视觉技术新里程碑。
Claude AI功能升级,新增多格式文件上传能力。最新版本支持PDF、图像、代码等文件类型,实现与AI应用的无缝集成。升级后的系统能进行文档分析、图像识别和代码优化等复杂任务,并优化了用户界面和数据处理流程。该功能依托Claude4、Claude3.7Sonnet等先进AI模型,可精准处理多模态数据。此次更新显著提升了AI与数据的协作效率,为专业和普通用户带来更强大的智能分析能力。
轻松从文案到视频,全网性能卓越的故事AI绘画转视频神器。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
Alibaba
-
$1
$10
256
$2
$20
$3.9
$15.2
64
Bytedance
$0.8
128