Mindverse获2000万美元融资,推动AI应用向个性化转型。其个人专属模型通过万亿参数LoRA与强化学习技术,实现从概念到规模化落地的突破。
Jan团队推出30B参数多模态模型Jan-v2-VL-Max,专注解决AI在复杂自动化任务中易中断的痛点。该模型基于Qwen3-VL-30B-A3B-Thinking,引入LoRA-based RLVR技术,旨在提升多步操作的稳定性,实现更可靠的长周期任务执行。
阿里通义实验室推出开源工具Qwen-Image-i2L,可将单张图片快速转化为可微调的LoRA模型,大幅降低个性化风格迁移门槛。用户只需上传一张图片,无需大量数据或昂贵算力,即可生成轻量级LoRA模块,并集成到其他生成模型中,实现高效“单图风格迁移”。该技术已在AI社区引发广泛关注。
MiniMax Speech 2.6发布,语音合成技术实现突破:延迟低于250毫秒,支持Fluent LoRA一键复刻任意音色,推动语音交互进入实时时代,提升AI产品应用体验。
一种用于扩散变换器的上下文LoRA微调技术
AI驱动的图片风格化和艺术效果平台
通过LoRA技术生成现实与插画风格混合的图像。
深灰色调的图像生成模型,专注于东亚女性形象。
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
Alibaba
$8
$240
52
Tencent
-
$0.4
128
Anthropic
$105
$525
Huawei
32
Iflytek
$2
Google
$140
$280
$3
$9
16
$0.7
$1.4
131
Stepfun
Deepseek
8
ostris
这是一个基于LoRA技术的文本到图像转换模型,专门用于生成具有法国印象派画家贝尔特·莫里索艺术风格的图像。该模型在FLUX.2-dev基础模型上训练,能够将普通图像或文本描述转换为莫里索风格的画作。
kirankumarpetlu
这是一个基于Google Gemma-2B-IT基础模型,使用PEFT(参数高效微调)和LoRA技术进行优化的文本生成模型。该模型通过参数高效的方法在保持基础模型能力的同时,针对特定任务进行了优化。
uriel353
Anime2Realism是一个基于Qwen/Qwen-Image基础模型的文本到图像转换模型,专门实现从动漫风格到写实风格的图像转换。该模型利用LoRA和Diffusers技术,能够根据文本描述生成相应的写实风格图像。
dario-mazzola
这是基于Google Gemma-3模型进行专门微调的文本生成模型,经过训练能够利用外部工具生成逐步计划。该模型在rewoo/planner_instruction_tuning_2k数据集上训练,使用LoRA技术进行高效微调。
MERaLiON
MERaLiON-SER-v1 是一个参数高效的多语言语音情感识别模型,能够同时预测7种离散情感类别和连续的情感维度值。该模型基于Whisper-Medium编码器构建,采用LoRA自适应技术,在多语言语音情感识别任务中表现出色。
loyal-misc
svizz 是一个基于 LoRA 技术的文本到图像生成模型,以 LyliaEngine/Pony_Diffusion_V6_XL 为基础模型,能够通过特定触发词生成高质量的图像内容。
mrgant
lans_v1 - lora是基于Qwen/Qwen-Image模型使用AI Toolkit by Ostris训练的文本到图像转换模型,采用LoRA技术进行优化,具备良好的图像生成能力。
BarleyFarmer
pejawan22-lora是一个基于AI技术训练的LoRA模型,专门用于特定图像的生成,可与多种AI工具集成使用,通过触发词'peja'来生成图像。
deadpoolx22
这是一个基于AI技术的文本到视频LoRA模型,专门针对alita角色进行优化训练,可用于图像生成等场景,为相关领域的应用提供了便利。
lichorosario
这是一个基于Qwen-Image模型使用LoRA技术进行微调的文本到图像生成模型,能够将输入的文本描述转化为对应的图像,支持生成人物形象、影视角色和特定场景等多种类型的图像。
piccoli_no_style-lora是一个基于图像到视频、LoRA技术的生成模型,使用AI Toolkit训练,以Qwen/Qwen-Image为基础模型,支持多种图像生成场景。
piccoli_no_style-lora 是一个基于图像到视频技术的LoRA模型,使用AI Toolkit进行训练,主要用于图像生成任务,可与多种主流AI工具配合使用。
trinty2535425
这是一个基于Qwen/Qwen-Image基础模型训练的图像到视频LoRA模型,采用LoRA(Low-Rank Adaptation)技术实现高效微调,可用于AI图像生成等相关任务
dottrmstr-long-captions-lora 是一个基于 LoRA 技术的文本到图像生成模型,通过特定工具训练而成,能够生成风格独特的图像,适用于多种图像生成框架。
julien8082
这是一个基于文本生成图像的项目,使用了LoRA和Diffusers技术,基于tencent/SRPO模型,可通过特定触发词'hannah'生成相关图像。
flymy-ai
这是一个由FlyMy.AI开发的开源LoRA模型,专为Qwen-Image-Edit设计,专注于场景内图像编辑,通过低秩自适应技术增强对场景构图和对象定位的控制能力。
ReportAId
MedWhisper Large ITA是基于OpenAI Whisper Large v3 Turbo的领域适配变体,专门针对意大利语医疗语音识别进行了优化。该模型在精心挑选的意大利语门诊专科就诊录音集上使用LoRA技术进行微调,显著提升了医学术语和临床表达的识别准确率。
adityak74
MEDFIT-LLM-3B是一个专门针对医疗问答优化的语言模型,基于Meta的Llama-3.2-3B-Instruct进行微调。该模型通过LoRA技术在医疗数据集上训练,显著提升了医学领域理解和直接回答能力,适用于医疗聊天机器人、患者教育等应用场景。
gtmepm
simpletuner-lora 是一个基于 stabilityai/stable-diffusion-3.5-medium 的 LyCORIS 适配器,专门用于文生图等图像生成任务。该模型通过 LoRA 微调技术实现,主要使用验证提示为'A photo-realistic image of a cat'进行训练。
llm-semantic-router
这是一个基于bert-base-uncased微调的LoRA模型,专门用于检测文本中的个人身份信息(PII)。该模型采用低秩适应技术优化,是semantic-router项目的一部分,支持Python和Rust环境使用。