字節跳動開源360億參數大模型Seed-OSS-36B,具備512K超長上下文窗口,遠超主流開源模型的128K限制,引發行業關注。
字節跳動Seed團隊發佈開源大模型Seed-OSS-36B,支持51.2萬tokens超長文本處理,推理能力突出且開發者友好。該系列含三個版本,包括使用合成數據的基礎版、無合成數據的基礎版和指令調優版。
字節跳動Seed團隊於2025年8月20日推出開源大語言模型Seed-OSS系列,專爲國際化應用設計,具備長文本理解、推理能力和開發者友好特性。該系列採用先進架構技術,最新發布的Seed-OSS-36B模型擁有360億參數和512K長上下文處理能力。
magiccodingman
這是一個實驗性的混合量化模型,採用MXFP4_MOE混合權重技術,在保持接近Q8精度的同時,實現了更小的文件大小和更高的推理速度。模型探索了MXFP4與高精度嵌入/輸出權重的組合,在密集模型上取得了精度近乎無損的優化效果。
catalystsec
這是一個基於ByteDance Seed-OSS-36B-Instruct模型通過DWQ量化為4位的輕量化版本,使用mlx-lm 0.27.1從BF16教師模型中蒸餾而來,支持中英雙語文本生成任務。
giladgd
這是ByteDance-Seed/Seed-OSS-36B-Instruct模型的靜態量化版本,提供了多種量化級別的GGUF格式文件,幫助開發者在不同硬件配置下更高效地使用該模型。
lmstudio-community
Seed-OSS-36B-Instruct是由ByteDance-Seed開發的大型語言模型,參數量達360億,採用Apache-2.0開源許可證。該模型基於transformers庫構建,支持vllm和mlx技術優化,特別針對蘋果Silicon芯片進行了8位量化處理,提供高效的文本生成能力。
Seed-OSS-36B-Instruct是由字節跳動Seed團隊開發的360億參數指令調優大語言模型,基於Transformer架構構建,經過MLX量化處理,專門針對Apple Silicon芯片進行了優化,可在LM Studio中高效運行。
bartowski
這是ByteDance-Seed的Seed-OSS-36B-Instruct模型的量化版本,通過llama.cpp工具進行多種精度量化處理,提供了從BF16到IQ2_XXS等20多種量化選項,旨在提升模型在不同硬件上的運行效率和性能。
gabriellarson
Seed-OSS是由字節跳動Seed團隊開發的開源大語言模型系列,具備強大的長上下文處理、推理和智能體交互能力。僅使用12T token訓練,在多個公開基準測試中表現出色,支持高達512K的原生長上下文處理。
RDson
Seed OSS 36B Instruct是字節跳動開發的大規模語言模型,擁有360億參數,專門針對指令跟隨任務進行了優化。基於llama.cpp框架構建,支持高效的文本生成能力。
yarikdevcom
Seed-OSS-36B-Instruct是由ByteDance開發的360億參數大型語言模型,基於Apache-2.0許可證開源。該模型專門針對指令跟隨任務進行了優化,支持文本生成和對話功能,具有強大的理解和生成能力。
dnakov
Seed-OSS-36B-Instruct是字節跳動開發的文本生成模型,基於36B參數規模的大語言模型架構,專門針對指令跟隨任務進行優化。該模型支持中英文雙語,採用Apache-2.0開源許可證,可通過vllm和mlx推理框架進行高效部署。
Seed-OSS-36B-Instruct是由ByteDance開發的大規模語言模型,參數量達360億,專注於文本生成任務。該模型基於MLX框架實現,支持中英文雙語,具備強大的指令跟隨和文本生成能力。
Seed-OSS-36B-Instruct是由字節跳動開發的360億參數大型語言模型,基於MLX框架優化,專注於文本生成任務。該模型支持中英文雙語,採用Apache-2.0開源許可證,具備強大的指令跟隨和內容生成能力。
QuantTrio
Seed-OSS-36B-Instruct-AWQ 是字節跳動 Seed 團隊開發的 36B 參數大語言模型的量化版本,具備強大的長上下文處理能力、推理能力和智能體功能,支持高達 512K 的上下文長度和靈活的思考預算控制。
ByteDance-Seed
Seed-OSS是由字節跳動Seed團隊開發的開源大語言模型系列,具備強大的長上下文處理、推理、智能體交互能力和通用性能。該模型僅使用12T token訓練,在多個公開基準測試中表現出色。