字节跳动开源360亿参数大模型Seed-OSS-36B,具备512K超长上下文窗口,远超主流开源模型的128K限制,引发行业关注。
字节跳动Seed团队发布开源大模型Seed-OSS-36B,支持51.2万tokens超长文本处理,推理能力突出且开发者友好。该系列含三个版本,包括使用合成数据的基础版、无合成数据的基础版和指令调优版。
字节跳动Seed团队于2025年8月20日推出开源大语言模型Seed-OSS系列,专为国际化应用设计,具备长文本理解、推理能力和开发者友好特性。该系列采用先进架构技术,最新发布的Seed-OSS-36B模型拥有360亿参数和512K长上下文处理能力。
magiccodingman
这是一个实验性的混合量化模型,采用MXFP4_MOE混合权重技术,在保持接近Q8精度的同时,实现了更小的文件大小和更高的推理速度。模型探索了MXFP4与高精度嵌入/输出权重的组合,在密集模型上取得了精度近乎无损的优化效果。
catalystsec
这是一个基于ByteDance Seed-OSS-36B-Instruct模型通过DWQ量化为4位的轻量化版本,使用mlx-lm 0.27.1从BF16教师模型中蒸馏而来,支持中英双语文本生成任务。
giladgd
这是ByteDance-Seed/Seed-OSS-36B-Instruct模型的静态量化版本,提供了多种量化级别的GGUF格式文件,帮助开发者在不同硬件配置下更高效地使用该模型。
lmstudio-community
Seed-OSS-36B-Instruct是由ByteDance-Seed开发的大型语言模型,参数量达360亿,采用Apache-2.0开源许可证。该模型基于transformers库构建,支持vllm和mlx技术优化,特别针对苹果Silicon芯片进行了8位量化处理,提供高效的文本生成能力。
Seed-OSS-36B-Instruct是由字节跳动Seed团队开发的360亿参数指令调优大语言模型,基于Transformer架构构建,经过MLX量化处理,专门针对Apple Silicon芯片进行了优化,可在LM Studio中高效运行。
bartowski
这是ByteDance-Seed的Seed-OSS-36B-Instruct模型的量化版本,通过llama.cpp工具进行多种精度量化处理,提供了从BF16到IQ2_XXS等20多种量化选项,旨在提升模型在不同硬件上的运行效率和性能。
gabriellarson
Seed-OSS是由字节跳动Seed团队开发的开源大语言模型系列,具备强大的长上下文处理、推理和智能体交互能力。仅使用12T token训练,在多个公开基准测试中表现出色,支持高达512K的原生长上下文处理。
RDson
Seed OSS 36B Instruct是字节跳动开发的大规模语言模型,拥有360亿参数,专门针对指令跟随任务进行了优化。基于llama.cpp框架构建,支持高效的文本生成能力。
yarikdevcom
Seed-OSS-36B-Instruct是由ByteDance开发的360亿参数大型语言模型,基于Apache-2.0许可证开源。该模型专门针对指令跟随任务进行了优化,支持文本生成和对话功能,具有强大的理解和生成能力。
dnakov
Seed-OSS-36B-Instruct是字节跳动开发的文本生成模型,基于36B参数规模的大语言模型架构,专门针对指令跟随任务进行优化。该模型支持中英文双语,采用Apache-2.0开源许可证,可通过vllm和mlx推理框架进行高效部署。
Seed-OSS-36B-Instruct是由ByteDance开发的大规模语言模型,参数量达360亿,专注于文本生成任务。该模型基于MLX框架实现,支持中英文双语,具备强大的指令跟随和文本生成能力。
Seed-OSS-36B-Instruct是由字节跳动开发的360亿参数大型语言模型,基于MLX框架优化,专注于文本生成任务。该模型支持中英文双语,采用Apache-2.0开源许可证,具备强大的指令跟随和内容生成能力。
QuantTrio
Seed-OSS-36B-Instruct-AWQ 是字节跳动 Seed 团队开发的 36B 参数大语言模型的量化版本,具备强大的长上下文处理能力、推理能力和智能体功能,支持高达 512K 的上下文长度和灵活的思考预算控制。
ByteDance-Seed
Seed-OSS是由字节跳动Seed团队开发的开源大语言模型系列,具备强大的长上下文处理、推理、智能体交互能力和通用性能。该模型仅使用12T token训练,在多个公开基准测试中表现出色。