Vercel旗下AI平台v0推出设计模式重大更新,支持直接编辑图像元素。用户通过快捷键或点击标签激活设计模式后,可直接在界面中调整图像,无需依赖外部工具,简化了设计师和开发者的迭代流程,实现无缝内置编辑体验。
xAI推出Grok Imagine v0.9视频生成模型,支持静态图像转动态视频,集成背景音乐、对白和唱歌功能,实现原生音画同步与快速生成。该版本从7月v0.1大幅升级,简化专业短片制作,成为科技领域新焦点。
马斯克旗下xAI发布视频生成模型Imagine v0.9,在多模态AI创作领域实现突破。相比v0.1版本,新模型在画质、动作自然度和音频生成方面显著提升:视觉质量接近电影级,动作流畅无断层,并新增原生音频生成功能。
9月26日,滴滴出行宣布开启AI出行助手“小滴Beta v0.8版本”的公测。这一新功能通过智能理解用户需求,为用户提供定制化的用车方案。用户只需将滴滴App升级至最新版本,在目的地栏搜索“AI叫车”并输入口令码,即可体验这一服务。小滴支持语音和文字输入,交互操作简单,能够根据用户的详细需求,结合时间、路况等实时信息,整理出最多3个匹配的车辆选项供用户选择。
Grok Imagine v0.9可快速生成图像和视频,有稳定运动、清晰视觉和音频同步。
一键从网页复制真实组件,添加到Lovable、Bolt或V0,快速构建
停止在混乱的构建中浪费信用。VibeBlocks是一个简单的免费工具,利用人工智能将模糊的应用想法转化为结构化的基于规范的蓝图,您可以复制粘贴到Lovable、Cursor、Bolt.new、v0和Replit中。
V03 AI是基于Google Veo 3 AI技术的视频生成器,支持文本到视频和图片到视频的转换,具备音频功能。
gia-uh
塞西莉亚FT MS v1是基于塞西莉亚2B v0.1微调的古巴语言模型,专门针对古巴西班牙语进行优化,捕捉古巴语言、文化和社会的细微差别。该模型支持西班牙语和英语,主要用于文本生成任务。
lapa-llm
Lapa LLM v0.1.2是基于Gemma-3-12B开发的乌克兰语处理开源大语言模型,专注于乌克兰语的自然语言处理任务,在乌克兰语处理方面表现出卓越性能。
nineninesix
KaniTTS Pretrain v0.3是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用优化,采用两阶段管道架构,结合大语言模型和高效音频编解码器,实现极低延迟和高品质语音合成。
ggml-org
Ultravox v0.5是基于Llama-3 2.1B架构优化的音频文本转文本模型,专注于高效处理语音转写任务。
2121-8
基于sarashina2.2‑0.5b‑instruct‑v0.1训练的日语TTS模型,支持通过提示控制音质
terminusresearch
AuraFlow v0.3 是一个完全开源的基于流的文本生成图像模型,支持多种宽高比,最高可达1536像素。
NAMAA-Space
QARI-OCR v0.3 是一款专注于阿拉伯语结构化文档理解的光学字符识别视觉语言模型,基于 Qwen2-VL-2B-Instruct 构建,擅长保留文档布局和格式。
DevQuasar
OpenHands LM 32B v0.1 是一个32B参数规模的开源大语言模型,致力于知识的自由传播。
matrixportalx
Turkish Llama 8B Instruct v0.1 是一个专门针对土耳其语优化的指令调优语言模型,基于Llama-3架构开发。该模型在土耳其语文本生成和理解方面表现出色,特别擅长处理土耳其文化相关的语境和表达。
sometimesanotion
Lamarck 14B v0.7是一款注重多步推理、散文写作和多语言能力的通用融合模型,14B参数级模型追求全面均衡的表现。
nintwentydo
Razorback 12B v0.2 是一个结合了Pixtral 12B和UnslopNemo v3优势的多模态模型,具备视觉理解和语言处理能力。
EVA-UNIT-01
EVA LLaMA 3.33 70B v0.1 是一个专注于角色扮演和故事写作的专业大语言模型,基于Llama-3.3-70B-Instruct进行全参数微调。通过使用合成数据与自然数据的混合训练集,该模型在通用性、创造性和独特风格方面有显著提升,特别擅长长上下文理解和减少重复内容。
EVA LLaMA 3.33 70B v0.0 是一款专注于角色扮演和故事创作的专业大语言模型,基于 Llama-3.3-70B-Instruct 进行全参数微调,使用了合成数据和自然数据的混合数据集,显著提升了模型的通用性、创造性和独特风格。
Ray2333
该奖励模型在reward-bench上获得了92.6分,是基于GRM-Llama3.1-8B-sftreg模型使用去污染的Skywork偏好数据集v0.2微调而成。
EVA Qwen2.5-72B v0.1是基于Qwen2.5-72B进行全参数微调的专业角色扮演和故事写作模型。该模型在合成数据和自然数据的混合数据集上训练,专注于提升角色扮演和创意写作能力,在指令遵循、长上下文理解和整体连贯性方面表现出色。
dataautogpt3
Proteus v0.6是基于SDXL架构的AI图像生成模型,经过全面重构后专注于提升图像的真实感。这是重构后的首个版本,采用多视角融合技术训练,能够生成高质量的逼真图像。
AIDX-ktds
ktdsbaseLM v0.11 是基于 OpenChat 3.5 的韩语大语言模型,专注于理解韩语及韩国多元文化,适用于多种自然语言处理任务。
v000000
Qwen2.5-Lumen-14B是基于Qwen2.5-14B-Instruct微调得到的文本生成模型,专门针对故事写作和角色扮演场景进行了优化。该模型通过偏好微调实现了更好的指令遵循能力,在文学创作和对话生成方面表现优异。
flowaicom
Flow Judge v0.1 是一款轻量级但功能强大的 38 亿参数模型,可在多个领域对大语言模型(LLM)系统进行定制化评估。
fal
一个用于捕获v0.dev AI生成内容的工具
该项目是基于官方v0.8.1版本修改的MCP Java SDK,主要进行了代码适配和依赖降级,以支持Java 8、Spring Boot 2.x和Solon 3.x等旧版本环境。
一个简易的MCP v0.2客户端和服务端实现项目,用于学习MCP协议,非生产用途。