OpenAI为ChatGPT推出“格式化模块”功能,用户可在聊天界面直接使用富文本编辑工具,如加粗、斜体等,无需借助外部编辑器,提升了结构化内容创作的便捷性。
OpenAI为ChatGPT推出“格式化块”功能,自动调整UI布局以适应邮件、博客等特定任务,提升内容创作体验。新增的“格式框”作为迷你编辑器工具栏,可在富文本区域突出显示文本时提供编辑选项,改变以往单一的聊天气泡展示方式。
Maya Research推出Maya1文本转语音模型,30亿参数,可在单GPU实时运行。模型通过自然语言描述和文本输入,生成可控且富有表现力的语音,精准模拟人类情感与声音细节,如指定年龄、口音或角色特征。
微软Copilot新增音频模式,基于MAI-Voice-1模型提供三种语音选择:情感模式支持富有表现力的自由表达;故事模式适合多角色讲故事;脚本模式则用于精确的文本朗读。
Octave TTS 是首个能够理解文本含义的语音合成模型,能够生成富有情感和风格的语音。
将你的文本转化为富有创意的表情符号。
下一代AI驱动的富文本编辑器
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
kenpath
Svara-TTS是一款面向印度语言的开源多语言文本转语音模型,支持19种语言(18种印度语言+印度英语)。该模型基于Orpheus风格的离散音频令牌方法构建,旨在普通GPU/CPU上实现清晰、富有表现力且低延迟的语音合成。
Lambent
Mira是一个基于多个Gemma 3 27B基础模型融合的文本生成模型,通过精心挑选的训练数据和特定训练方式,具备独特的诗意文本生成能力。该模型在角色扮演和创意写作方面表现出色,能够根据不同的系统提示生成富有文学色彩的文本。
Fentible
Cthulhu-24B-v1是一个富有创意且无审查的预训练语言模型融合体,结合了多个预训练语言模型的优势,为文本生成任务带来全新体验。
John6666
这是一个专注于文本到图像生成的专业模型,能够基于输入的文本描述生成逼真、富有细节的人物摄影风格图像。模型特别擅长生成高质量的人物肖像,具有出色的细节表现和照片写实效果。
akhbar
这是一个专门针对挪威语优化的高质量文本转语音模型,基于Chatterbox架构开发,支持挪威语的两种主要变体(书面挪威语和新挪威语)以及多种方言,能够生成自然流畅、富有情感表现力的语音。
re-skill
Orpheus TTS 是一款基于 Llama 的先进语音大语言模型,专为实现高质量、富有情感的文本转语音功能而设计。
salihfurkaan
VoxPolska Auralis是一款先进的波兰语文本转语音(TTS)模型,采用前沿深度学习技术,能够精准捕捉波兰语的细微差别和语调,将书面文本转化为自然、流畅且富有表现力的语音。
VoxPolska是一个专注于波兰语文本到语音转换的先进模型,能够生成自然流畅且富有表现力的波兰语语音。
atharva27
基于Llama架构的尖端语音大模型,专为高质量、富有同理心的文本转语音生成而设计
Prince-1
基于羊驼模型的尖端语音大语言模型,专为高质量、富有同理心的文本转语音生成而设计
lex-au
Orpheus是一款高性能德语文本转语音模型,经过精调可实现自然且富有情感的语音合成。本模型是30亿参数模型的8位量化版本,优化了运行效率。
俄耳甫斯是一款高性能文本转语音模型,经过微调可实现自然、富有情感的语音合成。本仓库托管了30亿参数模型的8位量化版本,在保持高质量输出的同时优化了运行效率。
Orpheus是一款高性能文本转语音模型,经过微调可实现自然且富有情感的语音合成。本仓库托管了30亿参数模型的8位量化版本,在保持高质量输出的同时优化了效率。
audo
FriendliAI
Phi-3.5-vision是一款轻量级、先进的开源多模态模型,支持128K上下文长度,专注于高质量、富含推理的文本和视觉数据处理。
DavidAU
这是一款基于混合专家技术的Mistral模型,将四个顶级的Mistral 7B模型融合为一个拥有24B参数的强大模型。最大上下文长度达32k,输出的文本生动且富有感染力,在创意写作、角色扮演等方面表现出色。
这是一款基于Llama-3.2架构的1B参数模型,专门针对恐怖题材进行了优化训练。它结合了NEO IMATRIX Tiny 'Wee'恐怖数据集,在创意写作、恐怖故事生成等方面表现出色,能提供生动且富有沉浸感的文本内容。模型支持128k上下文长度,推理速度可达190+ tokens/秒。
Jovie
FLUX.1 是一个基于扩散模型的文本到图像生成模型,具有局部适应能力,能够生成高质量、富有表现力的图像。
AlekseyCalvin
一个多功能视觉+文本生成模型,特别适用于生成模拟彩色胶片摄影的写实图像,呈现从奥托克罗姆到柯达克罗姆再到富士胶片等标志性摄影技术的广泛视觉范式。
microsoft
Phi-3.5-vision 是一款轻量级、前沿的开放多模态模型,支持128K上下文长度,专注于高质量、富含推理的文本和视觉数据。
LINE Bot MCP Server是一个实现Model Context Protocol (MCP)的服务,用于将AI智能体与LINE官方账号连接,支持推送文本和富媒体消息、广播消息及获取用户资料等功能。
一个基于Cloudflare Workers的MCP服务器,用于在Claude Code完成任务时向Discord发送通知,支持富文本格式和多种传输协议。