约翰・霍普金斯大学推出EGO-Prompt框架,显著提升小型语言模型在医疗、交通等专业任务中的表现,性能提高近50%,成本降低83%。该框架通过优化提示词设计,融入专业知识,使小模型媲美大型推理模型,解决了专业领域AI应用的关键挑战。
IBM推出Granite4.0Nano系列小型AI模型,专为本地和边缘推理设计,含8个模型,分350M和1B两种规模。采用混合SSM与变换器架构,支持基础和指令模式,基于Apache2.0开源许可,兼容vLLM等流行运行时,提升企业控制力。
IBM发布Granite4.0Nano系列AI模型,参数规模350万至15亿,强调高效与可及性。模型可在笔记本电脑或浏览器本地运行,无需依赖云计算,支持开发者在普通硬件或边缘设备构建应用,突破行业依赖云服务的常规趋势。
Anthropic发布小型AI模型Claude Haiku4.5,以低成本实现接近前沿性能,专为实时低延迟任务设计,如聊天助手和客户服务。Claude系列含Haiku、Sonnet、Opus三种尺寸,大模型虽知识广但速度慢成本高,Haiku通过“蒸馏”技术平衡效率与性能。
AI技术驱动的小型企业落地页构建工具,无需编码技能,自动优化转化率。
Quick Hub通过AI技术帮助小型企业和营销团队自动化他们的营销工作。
StayModernAI提供行业特定解决方案和专业指导,帮助中小型企业迈入AI时代。
Mysite.ai是一款面向小型企业的AI网站构建工具。
mistral
$0.5
输入tokens/百万
$1.01
输出tokens/百万
128k
上下文长度
$1.44
$4.32
32.8k
tensoropera
Fox-1-1.6B是由TensorOpera AI开发的16亿参数小型语言模型,采用分组查询注意力机制,训练数据达3万亿文本和代码。
个人学习项目,通过集成X API与MCP服务器构建小型AI代理,探索后端集成与AI工作流,注重安全与伦理实践。