软银与OpenAI本月将合资成立新公司,深化AI领域合作,共同投入资金与技术资源,推动人工智能技术的研发与商业化应用。
OpenAI的Sora视频生成应用上线一个月后,因用户激增和算力成本压力,宣布缩减免费额度,同时推出付费套餐和创作者分成计划,标志着视频生成技术进入商业化深水区。
2025年10月31日,Canva推出免费版Affinity V1.0,整合矢量绘图、图像处理与排版三大核心功能于统一平台。用户仅需一个Canva账户即可使用,无需付费或切换应用。此举标志着专业设计软件市场向免费化转型,可能冲击Adobe等付费平台的商业模式。
OpenAI视频生成应用Sora上线一月引爆全球,因用户激增与算力压力,项目负责人宣布将逐步减少每日30次免费额度,推出付费选项与创作者分成计划,标志其正式迈入商业化阶段。免费额度收缩是GPU资源告急下的必然选择。
AI驱动的即时产品拍摄,从单个上传生成照片、视频和广告创意。
使用自然语言编辑图片的 AI 工具,提供高效、一致的图像处理体验。
V03 AI是基于Google Veo 3 AI技术的视频生成器,支持文本到视频和图片到视频的转换,具备音频功能。
帮助开发者在百度生态获得精准搜索分发流量。
meta
$1.44
Input tokens/M
Output tokens/M
128k
Context Length
snowflake
alibaba
-
1M
reka-ai
01-ai
32k
databricks
32.8k
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
ibm-granite
Granite-4.0-Micro 是 IBM 开发的 30 亿参数长上下文指令模型,具有优秀的指令遵循和工具调用能力,支持多种语言,适用于商业应用和 AI 助手场景。
NVIDIA Qwen3-32B FP4模型是阿里云Qwen3-32B模型的量化版本,使用优化的Transformer架构,通过将权重和激活量化为FP4数据类型实现高效推理。该模型支持商业和非商业用途,适用于各种AI应用场景。
NVIDIA Qwen3-14B FP4模型是阿里巴巴Qwen3-14B模型的量化版本,采用FP4数据类型进行优化,通过TensorRT-LLM进行高效推理。该模型专为NVIDIA GPU加速系统设计,适用于AI Agent系统、聊天机器人、RAG系统等多种AI应用场景,支持全球范围内的商业和非商业使用。
Jackmin108
GLM-4.5-Air是智谱AI推出的适用于智能体的基础模型,采用紧凑设计,统一了推理、编码和智能体能力,能满足智能体应用的复杂需求。该模型参数量适中且效率优越,已开源多种版本,可用于商业和二次开发。
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
QuantStack
这是black-forest-labs/FLUX.1-Krea-dev模型的GGUF格式量化版本,专门用于文本到图像的生成任务。该模型通过GGUF格式优化,可在特定工具和库中使用,适用于非商业用途的图像生成应用。
NVIDIA Qwen3-30B-A3B FP4是阿里巴巴Qwen3-30B-A3B模型的量化版本,采用优化的Transformer架构,通过FP4量化技术将模型大小减少约3.3倍,同时保持较好的性能表现。该模型支持商业和非商业用途,适用于AI代理系统、聊天机器人、RAG系统等应用场景。
IBM开发的30亿参数指令微调语言模型,基于Granite-3.0架构,支持多语言任务和商业应用
stockmark
Stockmark-100B是由Stockmark公司开发的拥有1000亿参数的大语言模型,基于约9100亿日语和英语语料标记从头开始预训练。该模型专注于商业领域应用,在日语商业问题处理方面表现出色。
seedboxai
KafkaLM 8b是基于Llama3 8b模型微调而成的德语大语言模型,专注于德语商业场景应用
pborchert
面向商业应用的行业敏感语言模型,基于商业通信语料库进行预训练,整合行业信息以优化商业相关NLP任务。
h2oai
H2O.ai的h2ogpt-oasst1-512-12b是一个拥有120亿参数的指令跟随大语言模型,可用于商业用途。该模型基于特定基础模型,使用特定数据集微调,具有良好的性能和广泛的应用场景。
Rube是基于Composio平台的MCP服务器,可将AI聊天工具连接到500多个商业和生产力应用程序,通过自然语言命令实现自动化任务执行。
Databutton推出AI驱动的MCP服务器构建工具,支持React和Python应用开发
一个研究检索增强生成(RAG)与多云处理(MCP)服务器集成的开源项目,聚焦免费模型在商业软件中的应用,提供模块化学习路径和实践案例。