約翰・霍普金斯大學推出EGO-Prompt框架,顯著提升小型語言模型在醫療、交通等專業任務中的表現,性能提高近50%,成本降低83%。該框架通過優化提示詞設計,融入專業知識,使小模型媲美大型推理模型,解決了專業領域AI應用的關鍵挑戰。
IBM推出Granite4.0Nano系列小型AI模型,專爲本地和邊緣推理設計,含8個模型,分350M和1B兩種規模。採用混合SSM與變換器架構,支持基礎和指令模式,基於Apache2.0開源許可,兼容vLLM等流行運行時,提升企業控制力。
IBM發佈Granite4.0Nano系列AI模型,參數規模350萬至15億,強調高效與可及性。模型可在筆記本電腦或瀏覽器本地運行,無需依賴雲計算,支持開發者在普通硬件或邊緣設備構建應用,突破行業依賴雲服務的常規趨勢。
Anthropic發佈小型AI模型Claude Haiku4.5,以低成本實現接近前沿性能,專爲實時低延遲任務設計,如聊天助手和客戶服務。Claude系列含Haiku、Sonnet、Opus三種尺寸,大模型雖知識廣但速度慢成本高,Haiku通過“蒸餾”技術平衡效率與性能。
AI技術驅動的小型企業落地頁構建工具,無需編碼技能,自動優化轉化率。
Quick Hub通過AI技術幫助小型企業和營銷團隊自動化他們的營銷工作。
StayModernAI提供行業特定解決方案和專業指導,幫助中小型企業邁入AI時代。
Mysite.ai是一款面向小型企業的AI網站構建工具。
mistral
$0.5
輸入tokens/百萬
$1.01
輸出tokens/百萬
128k
上下文長度
$1.44
$4.32
32.8k
tensoropera
Fox-1-1.6B是由TensorOpera AI開發的16億參數小型語言模型,採用分組查詢注意力機制,訓練數據達3萬億文本和代碼。
個人學習項目,通過集成X API與MCP服務器構建小型AI代理,探索後端集成與AI工作流,注重安全與倫理實踐。