最好的Megatron AI工具模型_精选Megatron资讯 - AIBase

AI资讯

微软因未经授权使用盗版书籍训练 AI 面临版权诉讼

近日，微软公司遭到多位知名作家的控告，指控其在训练人工智能模型 Megatron 时，未经许可使用了大量盗版书籍。起诉的作家包括凯・伯德、贾・托连蒂诺和丹尼尔・奥克伦特等，他们在纽约联邦法院提出诉讼，认为微软利用他们作品的盗版电子版进行 AI 训练，从而使 AI 能够根据用户的文本指令生成回应。这起诉讼的核心争议在于，AI 训练过程中是否构成对版权的侵犯。除了微软，Meta、Anthropic 和 OpenAI 等科技公司也被列为被告。这些公司都声称，使用受版权保护的内容属于 “合理使用

微软因未经授权使用盗版书籍训练 AI 面临版权诉讼

淘天集团联合爱橙科技开源大模型训练框架 Megatron-LLaMA

["淘天集团联合爱橙科技开源大模型训练框架 Megatron-LLaMA","框架能够提升大语言模型训练性能","降低训练成本","保持和 LLaMA 社区的兼容性","在 32 卡训练上能够取得 176% 的加速"]

淘天集团联合爱橙科技开源大模型训练框架 Megatron-LLaMA

AI产品

Megatron-LM

Megatron-LM

大规模训练 Transformer 模型的持续研究

模型

Bert 1.3b

retrieva-jp

基于Megatron-LM预训练的Transformer编码器，专为日语场景设计

自然语言处理

Transformers

Transformers支持多种语言

PULI GPT 2

NYTK

PULI GPT-2是一个匈牙利语文本生成模型，基于GPT-2架构，使用Megatron-DeepSpeed训练，训练数据包含363亿词。

自然语言处理

Transformers

Transformers其他

Megatron Bert Large Swedish Cased 165 Zero Shot

KBLab

基于Megatron-BERT-large-165k架构的瑞典语零样本分类模型，先后在QNLI和MNLI任务上进行微调

自然语言处理

Transformers

Transformers其他

Bloom Tiny Random

Muennighoff

这是一个用于测试Megatron-LM与transformers之间转换功能的小型GPT-2类模型，主要用于集成测试和调试脚本

自然语言处理

Transformers

Transformers英语

Erlangshen MegatronBert 1.3B Sentiment

IDEA-CCNL

基于MegatronBert架构的中文情感分析模型，在多个情感分析任务上微调后的版本

自然语言处理

Transformers

Transformers中文

Bigscience Small Testing

bigscience

这是一个用于测试Megatron-LM与transformers之间转换的小型GPT-2类似模型，主要用于集成测试和调试脚本。

自然语言处理

Transformers

Transformers英语

Bert Large Swedish Cased

AI-Nordics

基于Megatron-LM框架实现的瑞典语Bert Large模型，包含3.4亿参数，在85GB瑞典语文本上预训练

自然语言处理

Transformers

Transformers其他

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2026AIBase

商务合作网站地图