国内首个全模态实时交互视觉语言模型VisualGPT在青岛发布,用户可上传图片视频并直接圈选提问,模型秒级返回答案、代码或3D场景,同步开放智能体训练平台及算力资源,推动AI交互进入视觉界面即时互动新阶段。
B站推出"AI原声翻译功能",解决国际版与国内版合并后的内容互通问题。该功能支持英语翻译,具备两大核心能力:视觉上实现字幕替换、弹幕翻译和界面转换;音频上保留UP主原声特征,突破传统机器翻译的生硬感。技术团队采用大语言模型和对抗式强化学习,针对游戏、二次元等专业内容优化翻译。该功能是B站国际化战略的重要支撑,未来将扩展更多语言支持,推动中国原创内容的海外传播。
Ollama推出桌面客户端,告别单一命令行模式,支持macOS系统。新版本提供图形化界面、多模态识别和文档拖拽功能,简化模型管理流程,支持Llama3等本地大语言模型。客户端强化本地运行优势,保障数据隐私,优化性能表现。开源社区积极扩展生态,未来计划推出跨平台版本。这一升级使本地AI工具更易用,为开发者及普通用户提供更丰富的应用场景。
字节跳动开源AI开发工具Trae-Agent核心组件,这是一个基于大语言模型的智能体,可通过自然语言指令执行软件工程任务。该项目仍处alpha测试阶段,具备命令行界面,能连接多种工具和LLM服务商。字节跳动希望通过开源吸引开发者共建智能体生态系统,推动AI技术在软件开发领域的应用创新。目前代码已在GitHub发布,公司期待更多开发者参与项目发展。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$1
$10
256
Baidu
128
$6
$24
$2
$20
Bytedance
$1.2
$3.6
4
一个基于语言服务器协议(LSP)和模型上下文协议(MCP)的无界面代码编辑器服务,提供语言智能支持和AI辅助代码操作功能。
NetBrain MCP是一个开源网络运维平台,通过Model Context Protocol连接大型语言模型与网络设备,实现AI驱动的网络配置、诊断和管理,并提供专业的Web终端界面和网络拓扑可视化功能。