12月3日,2025全球独角兽企业500强大会在青岛崂山区举行。大会发布了《2025全球独角兽企业500强报告》,评选标准包括估值超70亿元、具备独特技术和商业模式等。报告显示,2025年全球独角兽企业总估值达39.14万亿元,较去年实现增长。
罗永浩点赞字节跳动“豆包手机”工程样机,称技术革命势不可挡,AI助手将遍地开花并深刻改变生活。他认为尝试本身已值得赞扬,未来或成历史性时刻。
快手可灵AI推出2.6版本,实现“音画同出”功能,可一次性生成画面、语音、音效及环境氛围,提升内容创作效率。
字节跳动Seed团队推出Seedream4.5,主打多图场景一致性与美学指令遵循,解决了多图生成中角色、服饰、光影等元素不统一的“精神分裂”问题,实现高度统一。
Goku AI 是由字节跳动技术驱动的免费 AI 视频生成工具,可将文字或图片快速转化为高质量视频。
Tarsier 是由字节跳动推出的用于生成高质量视频描述的大型视频语言模型。
字节跳动打造的AI模型分享社区
字节跳动自研大模型,提供多模态能力
Bytedance
$1.2
Input tokens/M
$3.6
Output tokens/M
4
Context Length
$0.8
$2
256
-
128
$0.15
$1.5
$8
$4
$16
$3.5
$12
$0.5
$0.3
$0.6
32
$3
$9
$5
ByteDance
Ouro-1.4B是由字节跳动开发的具有14亿参数的循环语言模型,通过迭代共享权重计算实现了卓越的参数效率,仅用14亿参数就达到了30-40亿标准Transformer模型的性能水平。
ce-lery
这是一个基于Mistral 300M架构的日语预训练语言模型,使用维基百科和cc100数据集进行训练,采用了SentencePiece分词器中的字节回退技术来抑制未知词生成。
lmstudio-community
Seed-OSS-36B-Instruct是由字节跳动Seed团队开发的360亿参数指令调优大语言模型,基于Transformer架构构建,经过MLX量化处理,专门针对Apple Silicon芯片进行了优化,可在LM Studio中高效运行。
gabriellarson
Seed-OSS是由字节跳动Seed团队开发的开源大语言模型系列,具备强大的长上下文处理、推理和智能体交互能力。仅使用12T token训练,在多个公开基准测试中表现出色,支持高达512K的原生长上下文处理。
RDson
Seed OSS 36B Instruct是字节跳动开发的大规模语言模型,拥有360亿参数,专门针对指令跟随任务进行了优化。基于llama.cpp框架构建,支持高效的文本生成能力。
dnakov
Seed-OSS-36B-Instruct是字节跳动开发的文本生成模型,基于36B参数规模的大语言模型架构,专门针对指令跟随任务进行优化。该模型支持中英文双语,采用Apache-2.0开源许可证,可通过vllm和mlx推理框架进行高效部署。
Seed-OSS-36B-Instruct是由字节跳动开发的360亿参数大型语言模型,基于MLX框架优化,专注于文本生成任务。该模型支持中英文双语,采用Apache-2.0开源许可证,具备强大的指令跟随和内容生成能力。
QuantTrio
Seed-OSS-36B-Instruct-AWQ 是字节跳动 Seed 团队开发的 36B 参数大语言模型的量化版本,具备强大的长上下文处理能力、推理能力和智能体功能,支持高达 512K 的上下文长度和灵活的思考预算控制。
ByteDance-Seed
Seed-OSS是由字节跳动Seed团队开发的开源大语言模型系列,具备强大的长上下文处理、推理、智能体交互能力和通用性能。该模型仅使用12T token训练,在多个公开基准测试中表现出色。
speakleash
这是一个基于Bielik-1.5B-v3.0-Instruct模型的FP8动态量化版本,适配vLLM或SGLang推理框架,通过AutoFP8量化技术将参数字节数从16位降至8位,显著降低磁盘空间和GPU显存需求。
stanfordnlp
MrT5是基于ByT5改进的高效字节级语言模型,通过动态令牌合并技术缩短输入序列长度约50%
SamsungSAILMontreal
ByteCraft是全球首款通过提示词条件生成SWF视频游戏和动画的字节级生成模型。
DevQuasar
字节跳动研究团队发布的72B参数规模的多模态基础模型,专注于图像文本转文本任务
basharalrfooh
基于字节级微调模型的阿拉伯语精确标音系统,通过微调预训练模型实现阿拉伯文本发音符号的自动补全。
togethercomputer
Evo是一个能够进行长上下文建模和设计的生物基础模型,使用StripedHyena架构,能以单核苷酸、字节级分辨率对序列进行建模。
dataautogpt3
基于字节跳动Lightning技术优化的文本生成图像模型,在保持高质量的同时实现快速推理
Evo是一款能够进行长上下文建模与设计的生物基础模型,采用条纹鬣狗架构,可在单核苷酸字节级分辨率下建模序列。
alayaran
这是一个基于RoBERTa架构的博多语配置模型,包含博多语的字节级BPE分词器和RoBERTa基础配置。
google
ByT5是谷歌T5的无分词器版本,直接处理原始UTF-8字节,支持多语言文本处理,对噪声文本具有鲁棒性。
deepmind
基于BERT的掩码语言建模任务预训练,支持处理UTF-8字节输入的多模态Transformer模型
JADX是一款功能强大的Android Dex和Apk文件反编译工具,支持将Dalvik字节码转换为Java源代码,并能解码资源文件和进行代码混淆还原。提供命令行和图形界面两种操作方式,适用于开发者和安全研究人员。
一个能够精确计算文字数量的MCP服务器,支持多字节字符和多种使用方式