最好的Minitron AI工具模型_精選Minitron資訊

AI資訊

英偉達開源新突破：新模型訓練算力節省1.8倍！

英偉達開源了兩款新型大模型Nemotron-4-Minitron-4B和Nemotron-4-Minitron-8B，採用結構化剪枝和知識蒸餾高效訓練方法，顯著降低訓練需求，減少數據和算力消耗。與傳統方法相比，新模型的訓練token數據減少40倍，算力成本節省1.8倍。通過優化Llama-3.18B，結構化剪枝簡化模型結構，知識蒸餾提升性能，Minitron-4B和Minitron-8B在MMLU上的評分提升16%，性能媲美Mistral7B等知名模型。這一開源舉措展示了英偉達在AI領域的領導地位，併爲AI社區提供了寶貴資源，推動AI技術向更高效、更智能方向發展。

14k 3 天前

英偉達推出 Minitron 小型語言模型：訓練速度提高 40 倍

英偉達(NVIDIA)近期推出Minitron系列小型語言模型，包含4B和8B版本，顯著提升訓練速度至40倍，並大幅降低資源和數據需求，實現成本節省。通過結合“修剪”和“知識蒸餾”技術，Minitron模型在保持性能的同時，縮小規模，使得開發者能以更低成本利用先進技術進行翻譯、情感分析和對話AI等應用。Minitron模型的開源，讓更多人能輕鬆獲取和使用，加速AI技術的普及。

13.2k 1 天前