Unsloth AI推出开源无代码可视化工具Unsloth Studio,旨在简化大语言模型微调流程,降低开发门槛。该工具通过定制化反向传播内核实现训练速度翻倍和显存节省70%,无需复杂环境配置和高昂硬件成本。
法国AI公司Mistral AI推出Mistral Forge平台,助力企业与政府利用自有数据构建定制化AI模型,发力企业服务市场。平台支持基于开源模型微调,并允许从零训练,突破传统RAG局限,以解决通用模型难以理解特定行业逻辑的问题。
AI仅用两本书微调即可模仿名家写作风格,读者评价甚至超越专业模仿者。研究涉及50位知名作家,包括韩江和鲁西迪。159名参与者(含28名专家)通过Prolific平台评判,结果显示AI生成作品更受青睐。
百度AI短剧生成平台公测上线,提供亿元基金和百亿流量支持,帮助创作者提升内容创作能力并实现IP变现。平台支持自动生成和人机协作模式,可完成80%以上创作任务,创作者仅需微调优化即可快速产出高质量短剧。
一站式大模型微调平台,支持多种主流模型。
与LLaMA-Factory官方合作,一站式低代码大模型微调平台,支持超百种模型。
Radal是一个无代码平台,可使用您自己的数据微调小型语言模型。连接数据集,通过可视化配置训练,并在几分钟内部署模型。
Isahit是一个管理工作人员的平台,专注于LLM微调和数据处理,确保AI代理的高质量和无偏见。
Anthropic
$7
Input tokens/M
$35
Output tokens/M
200
Context Length
Baidu
-
128
Alibaba
$2
256
$15.8
$12.7
64
Bytedance
$15
1k
Huawei
32
Tencent
24
Iflytek
$3.5
$12
$1
$3
$9
16
131
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微调版本,由 TheStage AI 针对多平台实时、低延迟和低功耗语音转文本推理进行优化。支持流式转录、单词时间戳和可扩展性能,适用于实时字幕、会议和设备端语音界面等场景。
TheWhisper-Large-V3是OpenAI Whisper Large V3模型的高性能微调版本,由TheStage AI针对多平台(NVIDIA GPU和Apple Silicon)的实时、低延迟和低功耗语音转文本推理进行了优化。
Ashmotv
animat3d_style_wan-lora是基于AI Toolkit by Ostris训练的LoRA模型,专门用于文本到视频生成,可为图像生成带来独特的3D动画风格效果。该模型基于Wan2.2-T2V-A14B基础模型进行微调,支持多种主流AI平台使用。
TorpedoSoftware
基于DeepSeek-R1-Distill-Qwen-14B微调的Roblox开发专用模型,融入了Roblox平台知识和Luau编程语言专长,为Roblox开发者提供专业的代码生成和问题解答能力。
cja5553
基于xlm-roberta-large微调的推特/X平台垃圾内容分类模型,可识别推文是否为垃圾内容
quadranttechnologies
针对零售产品图像视觉问答任务微调后的BLIP模型版本,基于在线零售平台的图像和产品描述标注的自定义数据集进行了微调。
kumo24
该模型是基于MistralAI 7B架构微调的文本分类模型,专门用于分析Twitter/X平台上关于核能话题的情感倾向,分类准确率达到94%。
HiddenKise
卡维尔是基于roberta-base微调的文本分类模型,专门用于将文本分为六大威胁类别:银行欺诈、恐怖袭击、生命威胁、网络诈骗、信息泄露和日常对话,助力威胁情报平台自动检测和管理威胁。
ilsilfverskiold
基于BART-large微调的关键词提取模型,擅长从文本中提取技术术语、工具名称和平台相关词汇
glaiveai
Glaive-coder-7b是一个拥有70亿参数的代码生成模型,基于CodeLlama-7b模型微调而来。该模型使用约14万个编程相关的问题及解决方案数据集进行训练,这些数据由Glaive的合成数据生成平台产出。在HumanEval测试中达到63.1%的pass@1,在MBPP测试中达到45.2%的pass@1。
lmsys
基于llama-13b微调的开源聊天机器人,支持16k上下文长度,训练数据来自ShareGPT平台用户分享的对话
zaib32
这是一个通过AutoTrain平台微调的DistillBART模型,专门用于摘要生成任务。
vamossyd
基于DistilBERT微调的金融社交媒体情绪分析模型,擅长分析StockTwits等平台的文本情绪